AI大模型
报告显示(G-G)搜索AI准确率约90%易受虚假信息影响
《纽约时报》昨日(4 月 7 日)发布博文,报道称(G-G) AI 概览(AI Overviews)的准确率约为 90%,但基于每年超 5 万亿次的搜索量,这意味着每小时可能产生超过 5700 万条错误答案,相当于每分钟近 100 万条。
AI 初创公司 Oumi 使用 SimpleQA 基准评估(G-G)搜索,在分析 4326 次搜索后,发现 Gemini 2 在 10 月的准确率为 85%,至今年 2 月,Gemini 3 将这一数据提升至 91%。然而,Oumi 的评估依赖 AI 工具,可能存在误差,且(G-G)对同一查询有时会生成不同概览。

此外数据显示,AI 概览与来源不符的比例已从 Gemini 2 时期的 37% 升至 Gemini 3 的 56%。具体表现包括:错误概览后紧接着正确链接,或准确概览引用了错误信息。研究人员还发现 AI 概览易被操纵,有记者发布虚假博客后,(G-G)次日便在概览中引用了相关内容。
用户斯蒂芬 · 潘瓦西在查询摔跤手胡克 · 霍根(Hulk Hogan)的死讯时,AI Overviews 明确回复“没有可信报告显示霍根已去世”,但页面下方展示的文章标题却写着“霍根之死谜团加深”。这种自相矛盾的现象引发了用户对 AI 生成内容可靠性的质疑。
(G-G)发言人质疑 Oumi 的测试方法,认为其未能反映真实搜索行为。
相关阅读
-
AMD 发布 EPYC 8005“Sorano”系列处理器 专为电信与边缘计算优化
AMD今日发布公告,宣布推出最新一代面向电信与边缘场景的EPYC8005系列服务器CPU(代号“Sorano”),规格信息暂未公布,主打在开放式与虚拟化无线接入网(vRAN)规模化部署阶段实现更优的“能
-
Vocci Ring 智能戒指发布199 美元内置录音与 AI 联动功能
制造商GygesLabs宣布推出一款名为VocciRing的智能戒指,号称是“全球首款AI笔记戒指”,其内置录音功能,可联动AI智能体进行会议记录转写等操作,定价为199美元(IT人网注:现汇率约合1370元(
-
OpenAI低调收购GPT.com域名以强化品牌布局
据DomainInvesting昨天报道,OpenAI似乎已经收购GPT.com域名。目前访问该网站会被重定向至ChatGPT.com。据报道,OpenAI曾在去年收购Chat.com,该域名现在同样是重定向至ChatGPT官网。目前
-
海信推出新一代 RGB-Mini LED 技术首创玲珑 4 芯真彩背光
CES2026前夕,海信举办CES展前发布会,正式发布全新一代RGB-MiniLED技术,并同步推出全球首款搭载该技术的超旗舰电视海信UX。海信表示,新一代RGB-MiniLED在色域、色准、高亮色、低蓝光、低功耗


