C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

亚星游戏官网-yaxin222  中校

注册:2015-11-1412
发表于 2025-6-18 11:20:02 |显示全部楼层


亚星游戏官网-yaxin222


智东西AI前瞻(公众号:zhidxcomAI)

编辑 | 江宇

编辑 | 漠影

智东西AI前瞻6月17日报道,本周,一个叫FactSnap的浏览器插件登上了AI Base流量榜的第13名,周访问量达到5303.56万。

亚星游戏官网-yaxin222

根据Similar Web数据,这款功能简单的插件,在流量上一度压过了多个明星级AI产品,紧随其后的,是Meta系的Tailor by Threads和马斯克的Grok。

FactSnap并非新模型的“大而全”代表,它专注一个简单场景:当浏览网页时,如果对某段文字产生怀疑,可以高亮选中并进行快速查证。

该插件定位为网页内的事实核查工具,由Studio NAND开发,是AI4Democracy项目的一部分。当前版本无需登录,免费且无数据上传,强调“即装即用”。

不过,当前版本还不支撑中文。

一、多模型分工,搭建“三段式”判断法

FactSnap的工作机制分为三个步骤,分别由不同模型与服务承担任务


  • 初步分析:插件通过Groq平台调用LLaMA 3.3模型,对用户高亮的语句生成快速初判结果,通常在1秒内完成。
  • 资料检索:同步调用exa.sh搜索引擎,查找与该主张(claim)相关的网络资料。相关链接不会马上呈现,而是作为下一步判断的输入。
  • 详细验证:FactSnap利用GPT-4o-mini对claim与找到的文献或网页内容进行比对分析,生成“Explanation”部分的详细文本,并附上引用来源,作为补充说明。

整个过程中,用户最早看到的是初步判断,随后插件会自动刷新为更完整的比对结果。从模型分工上看,FactSnap采用了“初判-检索-细节验证”结构,在性能和信息深度之间做了一定权衡

二、体验:响应迅速,字面判断准确,但语境理解和跨语言支撑仍有限

一个只有查错能力的小插件,Factsnap真能在大模型云集的浪潮中脱颖而出吗?

带着这个疑问,智东西选取了三条近期热度较高或争议较大的内容,包括资讯、社交网络热帖和被后续辟谣的跨语言合作报道。

Factsnap的判断输出结果涵盖:正确(Correct)、错误(Incorrect)、怀疑(Suspicious)。

1、Meta收购Scale AI股权,判定为属实,逻辑链准确完整。

智东西截选了The Information关于Meta投资Scale AI的报道中一句核心陈述:

“Meta has agreed to take a 49% stake in data labeling firm Scale AI for $14.8 billion, two people familiar with the matter said.”(“知情人士透露,Meta已同意以148亿美金收购数据标注企业Scale AI49%的股份。”)

FactSnap的核查结果为属实,并给出了详细说明,指出该声明已被多家主流媒体证实,金额、股权比例与估值数据一致,且还补充了Alexandr Wang可能在Meta担任角色的信息。

此外,底部来源列举了包括路透、彭博、The Information等多个来源,属于较为完整的核查逻辑

亚星游戏官网-yaxin222

2、X平台关于Falcon 9的趋势热帖,被识别为错误

这条测试内容选自X平台一则广泛转发的“梗帖”,原文为:

“Falcon 9 Costa Mesa to Santa Clarita Valley 3 minutes”(猎鹰9号火箭从科斯塔梅萨到圣克拉丽塔谷,3分钟)

这句内容在视觉震撼视频下迅速传播,有用户调侃火箭“刷地”飞过了南加州多个地标城市,引发大量转发与围观。

亚星游戏官网-yaxin222

FactSnap判定该语句为错误,并给出理由:SpaceX的Falcon 9是轨道级发射火箭,飞行轨迹为垂直升空加曲线加速,不可能用于地面两点间的运输。

它还补充了火箭发射现场、视觉可见性的相关资讯链接。

亚星游戏官网-yaxin222

但值得注意的是,FactSnap对这条语句的处理仅采取了“字面解读”,可能忽视了发帖人在社交语境下的非字面意图。

此类表达常见于网络调侃,这也暴露了FactSnap在识别非结构化语言和隐喻方面的短板。

3、字节跳动联手老凤祥推AI眼镜,被判为属实,但该消息已遭辟谣

第三条测试内容来自南华早报6月初的报道,其核心句为:

“Social media giant ByteDance is helping the 177-year-old Chinese jewellery company Lao Feng Xiang develop a new generation of smart glasses, powered by artificial intelligence (AI), that feature real-time voice navigation and translation functions.”(字节跳动正与177年历史的中国珠宝品牌老凤祥合作,共同开发新一代人工智能智能眼镜。该产品搭载实时语音导航与翻译功能。)

亚星游戏官网-yaxin222

FactSnap判定为属实,给出的说明为:该合作计划符合近期中国科技企业在可穿戴设备上的布局趋势,并列举了多个英文资讯报道作为支撑。

亚星游戏官网-yaxin222

但这与火山引擎随后发布的辟谣声明相矛盾,说明FactSnap当前对于中文信息源中的后续变更尚未完全捕捉,其在非英文信息源更新处理方面仍存在延迟或盲区。



4、用AI核查AI,AIGC被判断为属实,一定程度可摆脱AI“幻觉”

第四条测试语句是来自Gemini关于“截止到目前,有哪些已经开源的AI 3D模型?”的回答内容。

亚星游戏官网-yaxin222

“Roblox也推出了用于3D和4D生成式AI的Cube 3D基础模型,并且开源了该模型的一个版本。它旨在帮助创编辑在Roblox平台内外创建3D对象和场景。”

对于该细节,FactSnap给出的判断是属实,说明指出:Roblox已发布Cube 3D模型,可实现基于文本的3D对象生成,并作为开源工具提供。

其列举的相关信息,也包括Roblox官方文档与多家科技媒体分析。

亚星游戏官网-yaxin222

虽然起初信息来自Gemini回答,但FactSnap依赖搜索引擎检索到了多篇官方报告与权威报道,并调用其他大模型进行比对,而后做出判断。

即使信息起点是AI,核查过程也可脱离AI“幻觉”的影响,实现一定程度上事实校验的闭环。

结语:从“主动查证”到“页面提示”,信息验证的新尝试

从实际体验,FactSnap提供了一种轻便的信息查证方式,在页面中提供额外的信息和线索,帮助用户自己判断。

它通过多模型“联动”,在快速响应与内容说明之间做了合理分工,适合在用户浏览网页时“信不过一句话”时快速查验。

当然,它仍存在一些重要局限:如对社交语境、非字面语言、非英文内容的理解偏弱。未来若能补齐语境建模、多语言支撑与跨浏览器兼容等能力,FactSnap有望成为一个重要的“AI辅助判断工具”。

来源:智东西

举报本楼

您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

GMT+8, 2025-6-19 08:33 , Processed in 0.331035 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部
XML 地图 | Sitemap 地图