在英文互联网也时常会看到对于 Google 搜索体验变得糟糕的吐槽,尤其是广告。造成这种情况的一部分原因,我想也可以用你提到的「纯粹」来解释。
期望 Google 这样体量的产品保持所谓「纯粹」,既不现实,也不不公平——商业巨头的每一次决策,早已不只是单纯靠技术理想驱动。它是从车库里诞生,但它早已不属于「两个程序员的梦想」这个叙事。
“Don't be evil” 也更多用于嘲讽 Google 丑闻(比如跟踪用户行为)的批评中。
我想再提供一个视角:搜索质量的变差是否也与用户的「不再纯粹」行为有关呢?
因为搜索引擎是一种强交互的产品类型,它索引的数据就来自用户的生产。那么用户在互联网生产的内容有变化吗?单说中文互联网。宏观上,自 2018 开始的提速降费,移动互联网渗透率接近饱和,信息的生产门槛降低到村头二大爷都能信手拈来;微观举例,我曾在某社区首页信息流刷到一篇「关于 Google 中文搜索结果中内容农场的吐槽」——这并不稀奇,有意思的是,第二天就出现了另一篇热帖,作者在分享自己利用爬虫搭建内容农场站点收益的情况——收益还挺可观,于是评论区一水的「兄弟求带」。你看吧,在利益面前,人是可以 180 度大转弯去拥抱自己昨天还所不齿的事物。就像训练数据的质量对于基座大模型的重要,互联网内高质量内容比例的急速下滑,也就促成了搜索引擎屎里淘金的局面,反映到输出质量,自然也会受影响。
再说 Google 那么多尝试后的失败产品,有一个网站叫 Killed by Google,记录了 297 个被 Google 扫进坟墓的产品。我想这依旧摆脱不了体量和利益的叙事逻辑。批评者可以说这是不够专注,东一榔头西一锤子。不过我个人还是挺欣赏这种「玩儿」一样的创新姿态。况且,有些产品的失败是局限于当时的软硬件技术和市场,但失败的探索或许正是未来某项技术的能够落地的「巨人的肩膀」,这方面的例子很多,比如李飞飞搞的那个 ImageNet,当年只是一个给图片打标签的项目,很多人不理解它的意义,甚至觉得只是低成本的众包苦力活。但正是这个庞大、结构化的数据集,为后来深度学习的发展提供了燃料。Google 之于 AI 也有类似的叙事——那篇著名的论文《attention is all you need》。
你提到的 kagi,不可否认它有一些实用且高效的特性,但这其实也是两种不同的商业模式促成的。kagi 是付费使用,自然不用再考虑广告问题。而 Google 的广告分成模式,加之其体量巨大,大家都想从它身上获利,也就会有针对性 SEO,包括垃圾 SEO。打个比方,kagi 可能就像山姆,针对一类客群提供会员提供较高品质、较低干扰、精挑细选的「会员制」搜索体验,付费用户享受的是一种被过滤后的「信息超市」,干净、高效、无推销。而 Google 更像是沃尔玛或者淘宝,流量巨大、琳琅满目、覆盖的国家、地区和语言众多,同时也充满了营销博弈、真假难辨的信息混战。
最后说 AI 搜索,它仍旧依赖搜索引擎的技术,只是只是把「找到信息」这一步,从用户自己点选变成了模型帮你整合总结。它并没有改变信息的来源,而是改变了信息的呈现方式和交互流程。传统搜索给你的是入口,AI 搜索给你的是答案。但问题也随之而来:模型生成的答案依赖于背后的搜索质量。如果源信息就有偏差、过时或被 SEO 污染,再智能的模型也会胡说八道。
并且那些包含幻觉的回答还有一个更「致命的诱惑」——信息垄断,这个我在教程里专门还聊过。即如果它只给你了一个答案,但是没有更多的信息入口,那么你直觉上会更愿意相信它,因为你没有其它选择。从这个意义上讲,我个人更喜欢目前 Google 搜索的 AI Mode,overview + link 的信息组织形式。
最后再叠个甲:鉴于曾经有一位虫友给我贴了张「奉 Google 为黄金律」的标签,加之我回看这篇跟帖,可能还真会被有的人端详出「给 Google 洗地」的奇葩脑回路结论。我在此说明:如果进行一场 Google 吐槽大会,我自觉至少能拿个亚军;我不炒股,更谈不上持有 Google 的股票;在虫部落,获取信息的优先级永远高于争论观点。