AI搜索，已经在污染互联网了

星空天蝎 · 发表于 2024-6-1 20:04:08

让用户吃石头，给披萨涂胶水，Google AI 搜索翻车的事情还近在眼前。
号称要颠覆 Google 的 Perplexity，紧接着也出了状况。
AI 搜索比起 ChatGPT，能联网，引用信源，不那么容易胡说八道了。
但如果，信源本身就是垃圾呢？
AI搜索，已经在引用另一个AI搜索了

「林黛玉倒拔垂杨柳」的梗很多人都听过，最近在重温水浒传，我灵机一动，用中文问 Perplexity，「林黛玉的性格和鲁智深的性格有什么相似之处」。
回答得平平无奇，但引用来源出现了一个意想不到的角色：字节豆包，抖音旗下的 AI 助手。

这难道是什么新奇的商战形式吗？点进去发现，内容就是用户和豆包的聊天记录，AI 回复得还很八股文。如果质量写得比营销号好就罢了，写成这样是罪加一等。

当我直接在 Google 搜索同一个问题，豆包又来刷存在感了，并且高居第二，和 Perplexity 引用的不是同一条，但点进去还是「首先」「其次」打头的废话连篇。
之前 The Information 报道过，Perplexity 使用 API 访问有关 Bing 和 Google 搜索排名的数据，这些数据决定了网页的相关性、质量和权威性。
换言之，如果豆包容易被 Google 搜到，可能也就更容易被 Perplexity 引用。这就让人好奇了，为什么豆包可以出现在搜索引擎？
等我登录豆包网页版的最新版本，答案出现了，它默认勾选了一个选项：允许分享内容被搜索引擎收录，在搜索结果页显示。

以上体验发生在 5 月 31 日下午 2 点。6 月 1 日 19 点，字节回应爱范儿，豆包已更新，内容分享到搜索引擎，不是默认勾选，是用户主动选择可以被搜索引擎抓取。
同时，字节表示，针对一些问答内容被搜索收录，实际是有人使用虚拟账号创建的高质量问答内容，不是真实用户。目前已经 clean，现在 Google 搜索时，只有 5 条站内结果。
让用户和 AI 的聊天记录被索引，豆包似乎是开了先例。Perplexity、天工、秘塔、360 AI 都可以将聊天记录以链接形式分享，但没有看到类似豆包的选项。
ChatGPT 也支持以链接分享对话，但承诺只是用于个人之间的共享，不会出现在互联网的公共搜索结果。

早年的「内容农场」，盗取或拼凑他人文章，快速生产内容，凭借关键词优化、频繁更新等 SEO（搜索引擎优化）策略，抢占搜索页面的前排，赚取流量和广告费。
那时候，内容贡献者还是真人，每天生产数篇文章，但现在轮到了 AI，复制、粘贴、洗稿、批量产出的战斗力完全不在一个量级。
「林黛玉倒拔垂杨柳」「鲁智深唱葬花吟」本不是事实，说的人多了，权重高了，也就成了 AI 搜索眼中的事实，引用的信源，是知乎、抖音、简书用户编造出来的有鼻子有眼的故事。
如果信源成了 AI，结果只会更加惨烈。想象一下，更多 AI 生成内容被 Google 收录，AI 搜索参考 Google 的搜索排名，然后最终呈现在用户面前的，就是 AI 叠加 AI 的垃圾结果。
被投喂的人类，只能修炼得更加火眼金睛，从废话里挑出有用的干货。
80分的AI搜索

平心而论，我仍然很喜欢 Perplexity 等 AI 搜索产品，它们在 ChatGPT 之后，再次提高了我的生产力。
人类提出问题，它们搜索、摘要、成文，自己已经是一个成熟的工作流，我们付出更少，但效率更高。
大部分的情况下，AI 搜索的表现还是相当不错的。Google AI 翻车，一部分原因应该是急于推出功能，只顾着提高 Reddit 在搜索中的权重，没能让 AI 反思结果是否符合常识。
当我把让 Google AI 搜索翻车的同款问题输入 Perplexity，结果就比较让人满意。
关于「人一天吃多少石头」，Perplexity 能够准确地找到洋葱新闻的信源，再解释这是胡说八道，不像 Google AI 搜索把洋葱新闻当成圭臬。

还有「披萨的奶酪容易滑落怎么办」，Google AI 搜索之前建议加点胶水，Perplexity 显然更加聪明，先给出一些合理的办法，在我追问能不能加胶水之后，精准地找到了误导 Google AI 搜索的 Reddit 帖子，说这是在开玩笑。
为了让结果更严谨，Perplexity 甚至跑去亚马逊搜索了一番，表示它只搜到各种无毒胶水产品，没说这些胶水能用于食品。

相比 Perplexity，Google 显然不差在模型能力，而是差在后续的工程和产品化。
AI 搜索从原理上来说，是先搜索再总结，比起不联网的聊天机器人幻觉更少，核心技术之一是 RAG（检索增强生成）。
RAG 结合了信息检索和生成模型，信息检索根据用户查询，从庞大的文档库中找到相关信息；生成模型则将这些检索到的文档作为上下文，生成更加准确和详细的回答。
这里的文档库，可以是传统搜索引擎的索引库，也可以是法律等专有数据库、社交媒体等用户生成内容。

如果网页上充斥着大量 AI 生成的低质量内容，就会对 AI 搜索的 RAG 产生负面影响。
那么，面对气势汹汹的 AI 生成内容，AI 搜索的下半场，可能就是继续比拼模型之外的工程能力，较量数据源质量和搜索能力，包括能不能搜到更多网页，搜到更权威的网页，或者整合财报等专有信息。
现状就是，我们渐渐已经离不开 AI 搜索，如果说靠关键词和手工打开链接的传统搜索是 40 分，容易胡说八道的大模型是 60 分，联网的 AI 搜索把标准提到了 80 分。尽管还会出错，但体验过就回不到过去了，不必全然否定。
花样引用信源，AI搜索的商战

除了司空见惯的网页，AI 搜索产品们，似乎有一个不约而同的想法：提供多模态的信源。
360 AI 可以找到视频，秘塔可以找到播客和学术论文，Perplexity 可以搜索 Reddit 和 YouTube。
但 AI 搜索更多是提供一个引子，想要更多的详情内容，还是不能偷懒，要到信源的出处去看。

同时，还有一个有趣的现象，App 们正在推出内嵌的 AI 搜索功能，比如小红书内测的「搜搜薯」、微信读书的「AI 问书」，在既有的生态上发掘 AI 的落地点。从这个意义上说，它们也是 AI 搜索产品。

2 天前横空出世的腾讯元宝App，基于混元大模型，集成 AI 搜索、AI 总结、AI 写作等功能，更是一开始就被看好。
因为它坐拥了微信公众号平台、腾讯新闻平台等资源，而公众号算是中文互联网质量较高的内容集合。

再结合豆包让 AI 内容在搜索结果页显示的操作，我们似乎又被提醒了一次移动互联网的内容分布情况。
移动互联网时代，不像之前的门户网站时代，App 之间彼此孤立，也很难被搜索引擎爬取。比如，输入公众号文章的标题，搜索引擎找不到原文，只能看到分发渠道。
同时，在传统搜索引擎上，广告等干扰项很多、低质量的营销号内容也很多，我们渐渐习惯了，系统看教程上 B 站，生活琐事提问用小红书，找文章用微信搜一搜。

而在 AI 搜索产品、AI 生成内容越来越多以后，以后可能又出现这样的局面——网页内容越来越良莠不齐，以数量取胜，而高质量的内容一如既往地保持封闭，变成了垂直 AI 搜索的护城河。
除了大而全的多模态 AI 搜索，可能也会有越来越多优秀的垂直 AI 搜索涌现。
比如，学术搜索引擎 Consensus 口碑较好，2 亿多篇论文的优质信源，再集合 AI 驱动的分析能力，答案总是会引用某个研究。
向 Consensus 提问「锻炼能提高认知能力吗」，它不忙下结论，而是写了个摘要，给了个表格，没有当作简单的「是否」问题来答。
我们对于 AI 搜索的期待是，在用人话交流的交互过程中，更快地提供更好、更多样、更可视化、更个性化的内容，回答更加复杂和具体的问题。
然而，与此同时，搜索的内容和生态也正在被 AI 破坏，仿佛隐喻了 AI 的一体两面。
未来，AI 生成的内容肯定会越来越多。正反拉扯之中，找到更有用的信息，究竟是更难还是更简单，还是一个悬而未决的问题。拿来就用的美梦还未成真，把 AI 当作工具，再发挥自己的主观能动性，人类才不容易伤心和失望。

上一篇：4月份MPV销量出炉：别克GL8，跌出前三了
下一篇：增加4.02分！中国女排领先日本世联赛最新排名：升至第五

鸡毛飞上天 · 发表于 2024-6-1 21:58:00

要让ai本身有基本的判断能力

老实人中二 · 发表于 2024-6-1 22:02:02

讨厌大数据，一点隐私都没有了，

葆米花 · 发表于 2024-6-1 22:24:18

让ai搜索到的信源，局限到正规媒体、杂志、文献上不行吗？但这个又涉及到知识产权吧…难搞…

中级会员	积分	兔币	帖子
中级会员, 积分 417, 距离下一级还需 83 积分	417	234	183
在线时间：0 小时	最后登录：2024-6-28

中级会员	积分	兔币	帖子
中级会员, 积分 377, 距离下一级还需 123 积分	377	215	162
在线时间：0 小时	最后登录：2024-7-2

中级会员	积分	兔币	帖子
中级会员, 积分 390, 距离下一级还需 110 积分	390	217	173
在线时间：0 小时	最后登录：2024-6-26

中级会员	积分	兔币	帖子
中级会员, 积分 451, 距离下一级还需 49 积分	451	249	202
在线时间：0 小时	最后登录：2024-7-1

[科技] AI搜索，已经在污染互联网了

关联主题

精彩评论3

好惨！上市公司高管被撕票，为出海业务拼掉

揭秘中国新质生产力500强：五大成长性产业

鲍威尔最新表态：降通胀取得显著进展美国

舆论旋涡中的“体育特长生读名校”：国家一

谁说电车没有油车耐用？开了32万公里的极氪

夺冠后太激动砸坏外设！电竞选手奖金全赔，

余承东说享界S9能超越迈巴赫，看完内饰，这

水泥建材都已上舰，滞留仙宾礁近3月后，菲

“借的钱还需要还吗？”贷款APP大排查，剑

救出“困”在网贷里的年轻人，需要各方共同

森林北穿深V装小秀性感，新疆街头被偶遇，

地球班故事：中东22国军官赴华参加研讨班，

浙大女学霸卖螺丝刀，雷军“代言”

白军方：若主权受威胁，将使用核武器

落地25万，现款“奔驰C200L”价格触底，想

脑子有坑！勇士拿维金斯+库明加+保罗+首轮

房地产双轨制，会让穷人买房更加困难

好惨！上市公司高管被撕票，为出海业务拼掉

真打疼了？俄罗斯可能开放图们江出海口，中

这3种情况下分手，千万不要跟前任复合

董军就台海划红线不到48小时，美27家军火商

森林北穿深V装小秀性感，新疆街头被偶遇，

苹果迟迟不入局，折叠屏手机能否成为手机厂

TES沙特杯迎来地狱难度赛程！BLG大概率保送

地球班故事：中东22国军官赴华参加研讨班，

浙大女学霸卖螺丝刀，雷军“代言”

白军方：若主权受威胁，将使用核武器

莫迪连任还没等到中国贺电，先收到了中方的

《怦然4》男五段炼太下头！融入不了集体，

诸茅的黄昏

财神驾到

绿林道的

一抹伤

哇哇的哭

冷香丸