最近一直在关注 @recallnet 的 Predict 平台,让大家去预测 GPT-5 的能力,结果是人们普遍高估 了AI。
比如大家觉得 GPT-5 在各领域的胜率会有72.4%,实际只有 66%。
在欺骗类任务里,人们预测会有 72%,结果只有 24%。这告诉我们,我们想象里的 AI,往往比现实更神化。
其他 AI 模型的表现也各有差异,有些在特定任务上比 GPT-5 更弱,有些在逻辑推理上稍强,但整体差距比想象的小。
#Recall 提供了详细排行榜👉https://t.co/4Tg03LqDED
但 Recall 并没有停在揭示偏差这一步,它更像是在做一个完整的 AI 生态。
最近公布的最新数据显示目前 Recall 拥有👇
1️⃣14.5 万个 AI 被收录
2️⃣120 万用户在用
3️⃣870 万次整理和筛选
看到这个数字,我第一反应是AI 已经多到我们根本没法靠个人去一一验证了。
模型太多、能力太杂,我们必须要有人来整理。
而 Recall 的做法是把这些交给社区,并以公正公开的方式评估 AI的实力,最终以 Agentrank 的模式排出来让大家看。
这点我挺认同的,因为光靠几家大公司,AI 世界永远是个黑箱。
只有让更多人去预测、去筛选、去打分,才能形成一个比较真实的排名。
在这个过程中,我们看到的不只是 AI 的能力,更是一种全新的生态方式。
Recall 通过开放,透明和社区驱动让AI 的评价不再是少数人的判断,而是被放进了一个动态和可验证的系统里。
#Recall #SNAPS @cookiedotfun @cookiedotfuncn


From X
Disclaimer: The above content reflects only the author's opinion and does not represent any stance of CoinNX, nor does it constitute any investment advice related to CoinNX.