竞价排名:莆田系的温床,还是健康市场的激励?

在中文互联网语境中,魏泽西等事件之后,“竞价排名”,似乎是过街人人喊打的东西。我们来考量一下这种机制背后的原理。理论上来说,一家更优质的企业理应能赚更多钱,因此能给出更高的竞价,从而投放更好的广告。但是,随便在百度上搜索一个医疗相关的名词,都能看到四五条看起来像是野鸡小医院(下称“莆田系医院”;该词在此文中指代所有这类医院,与具体的莆田系无关),而那些知名三甲医院根本就不见踪影。为什么呢?

Part A

我们来考虑如下的一个模型。现在有两个投资机构,第 \(0\) 个是公立医院,第 \(1\) 家是莆田系医院。我们设第 \(i\) 家医院收受每个患者能拿到的收入 (revenue) 是 \(q_i\)。我们考虑每个上百度搜索的人,如果看到了第 \(i\) 家医院的广告,那么有 \(p_i\) 的概率 (popularity) 点进去。我们假设每个点进网页的搜索者都会到那个医院中去就医。我们再假设,有一个常数 \(c\),表示医院愿意把总收入的 \(c\) 倍拿来做广告宣传。

我们再来看看搜索引擎的竞价排名是怎么实现的。事实上,有两种相对普遍的竞价方式:

  • 按点击量竞价:每个医院定一个价格 \(x_i\),每次搜索,搜索引擎会选择 \(x_i\) 最高的进行展示。如果用户点击了广告,那么医院付给搜索引擎不超过 \(x_i\) 的钱。(实际上会使用一个二价拍卖之类的东西,但在此无需关心)
  • 按展出量竞价:每个医院定一个价格 \(y_i\),每次搜索,搜索引擎会选择 \(y_i\) 最高的进行显示,此时医院付给搜索引擎不超过 \(y_i\) 的钱。

考虑如果 \(p_i,q_i,c\) 给定,每家医院会怎么定自己的竞价呢?

  • 如果是按点击量竞价,那么很显然 \(x_i=c\cdot q_i\) 是一个非常明显的策略:每次点击能获得 \(q_i\) 的收益,其中 \(c\) 的比例作为宣传成本,那么 \(c\cdot q_i\) 就是每次点击的宣传成本。
  • 如果是按展出量竞价,那么每次点击的宣传成本依然是 \(x_i\),但是平均每次展出只有 \(p_i\) 次点击,因此每次展出所对应的宣传成本就是 \(y_i=p_ix_i=c\cdot p_iq_i\),这也是竞价中这家医院的理论标价。

那么,竞价排名选择了标价最高的广告,在这两种模式下,实际上筛选出了两批不一样的广告。按点击竞价筛选出了 \(q_i\) 最大的那些医院,而按展出竞价选出了 \(p_iq_i\) 最大的那些医院。真实世界中,这两个变量意味着什么呢?同一个病人同一个病,展出广告之后,公立医院显然会有更大的点击率 \(p_i\),但莆田系医院显然有办法在一个病人身上榨取更多的钱 \(q_i\)。事实上,医院不止两家,但整体上来看 \(q_i\)\(p_i\) 应该是负相关的关系。越公益的医院,\(p_i\) 就越高,而 \(q_i\) 也就越低。因此,按点击量竞价选择的 \(q_i\) 高的医院,恰恰是那些不认真吸引客户、而仅仅只是在他们身上捞钱的那些医院。而展出量竞价,选择 \(p_i q_i\) 最高的医院,选择的才是盈利能力最高的医院。

事实上,这个模型定义的这两个变量——revenue 和 popularity,是普适的,而不仅限于医疗、搜索这个场景。如果有一家电话营销机构(假设存在的话),采用竞价的方法选择其营销的产品,那么正常产品会有正常的 \(p_i,q_i\),而诈骗产品会有较高的 \(q_i\)(毕竟是诈骗,来钱快)和较低的 \(p_i\) (因为被诈骗的人大概不会很多吧,hopefully)。那么对电话营销机构而言,按拨出量计价和按有效接听量计价就会筛选出两种不同的产品类别,而按有效接听量计价可能就会导致电话诈骗横行。

那么,真实世界的广告,是按点击还是按展出竞价的呢?我们来看看一篇往年的新闻

一般而言,搜索引擎广告的价格决定是‘底价’与‘竞价’决定的。每家搜索引擎对关键词都有一个底价,比如神马的底价是0.45元一次点击,若该关键词竞争不充分,广告主只要支付底价即可。但如果有多个广告主竞争同一个关键词,则是谁出价高谁的可以放在前面,对一些热门行业来说,推广的价格由此水涨船高。

根据该文章,多家广告联盟的计价都是按点击量来算的,因此根据上文的分析,就会导致莆田系医院和诈骗集团这种垃圾被当成金子筛选出来。

我们还有理由相信,之所以广告联盟或者搜索引擎会选择按点击量这样的模式,是因为这对于他们来说利润更高。

Part B

利用这一模型,我们还可以回答另一个问题,即为什么互联网滋生了这么多垃圾产品和诈骗。

对于同一个机构/产品/医院来说,\(p_i\)\(q_i\) 其实并非恒定,而是可以通过其策略来改变的。显然,天上不会掉馅饼,因此 \(p_i\)\(q_i\) 之间明显是负相关的。我们假设每个 \(i\) 都可以在 \(p_i\)\(q_i\) 之间做一个 trade-off,即每个 \(i\) 有一个私有的函数单调递减的函数 \(f_i\) 使得 \(p_i \leq f_i(q_i)\) 总要成立。

那么还是在刚才的那个拍卖的环境下,我们考虑机构/产品/医院的数量不断增多会发生什么。注意到,不管有多少产品,广告位总是一样多的,那么为了在这些产品中脱颖而出,每个产品需要做一些最大化。

如果是按展出量竞价(前面我们认为这是一种健康的方式),我们可以发现每个人会试图最大化 \(p_i q_i\),那么上述的这个 trade-off 过程和其他产品是没有影响的,即其决策是固定的。

但是,如果竞价是按点击量决定的,那么每个人会希望让自己的 \(q_i\) 尽可能大,这样在产品数量增多的过程中,这些产品会不断内卷。之所以说这是内卷,是因为这整个过程是一个比烂大赛:只有最烂的、\(p_i\) 最小的产品,才有可能整个群体中最大的 \(q_i\)。因此,每个产品为了能在整个广告拍卖的过程中占有一席之地,都会让自己 \(p_i\) 更小、\(q_i\) 更大,换言之,变得更烂。这样的机制,成功地让整个市场往不健康的方向发展。

那为什么互联网环境下这一问题会更为显著呢?传统设定下的产品,往往有多样的宣传途径,某些途径是最大化 \(q\) 的,有些途径是最大化 \(pq\) 的,还有比如说监管、或者如果要品牌塑造的话可能会要最大化 \(p\),那么整体就会变成一个最大化 \((p+A)(q+B)\) 的过程,因此不太会变成一个单调比烂的过程。但是,互联网生态下,每个产品大约只有五秒钟的寿命,没有监管,并且就像上面那篇新闻所展示的一样,不管你要在什么平台上推广,很可能这些平台全部都是按点击量的、因此要求你最大化 \(q\),因此在互联网设定下,反而是鼓励了垃圾产品、垃圾医院的产生。

所以,有什么教训呢?首先我们知道按展出量竞价比按点击量竞价更健康;由于搜索引擎选择了按点击量竞价,我们可以相信按点击量竞价对搜索引擎来说利润更高,因此我们可以把这一现象理解为搜索引擎/广告联盟通过剥削整个社会的市场健康来牟利。监管机构有可能通过设定这样的机制来维持整个系统的健康。

Ref

Ostrovsky, M. (2021) ‘Choice Screen Auctions’, in Proceedings of the 22nd ACM Conference on Economics and Computation. ACM EC ’21, Budapest Hungary: ACM, pp. 741–742. doi:10.1145/3465456.3467526.