太不容易了,@PortaltoBitcoin 终于第二季空投了,以为反撸了,能领取百分之三十还可以, @Infinit_Labs 今天 @ningfan_a 宁总说第三季也开了后面卷一下,不知道 @UXLINKofficial 这个今天快照以后会怎么发,毕竟币价不值钱了, $Goat 也是持续九个月继续做个
来看看今天的AI又有新东西了
今天看到 @SentientAGI 拿下 Minsky Awards 的「AI Startup of the Year」,我是真替他们开心一把🙌
这团队从一开始就不按套路走。别人忙着卷参数,他们忙着卷「推理能力」。
结果 ROMA Search 一出手,直接在行业基准上打出 81.7% 的多步推理准确率,稳居第一。
更离谱的是,在 SEAL-0 这个复杂多源推理测试上,ROMA 拿到 45.6%,
而 Google 的 Gemini 2.5 Pro 才 19.8%。
直接翻倍!要知道这个测试拼的不是数据量,而是真智能。
现在 ROMA 已经开源在 GitHub 上了(是真开,不是那种「登记后领个模型链接」那种)。
想试就能试,代码摆在那儿,学术和工程两头都能跑。
我一直觉得 Sentient 的节奏很稳,它不是搞一堆噱头,而是用实打实的研究成果让人信服。
从去年发布 GRID,到现在在 NeurIPS 2025 推出《LiveCodeBench Pro》,
他们一步步把「可验证的开源智能网络」这事落在地上。
LiveCodeBench Pro 这篇论文其实挺有意思的——
他们和 NYU、Princeton、UCSD 联合做了个全新的编程基准,
用奥赛级难度的题目去测大模型的逻辑极限。
结果显示:
模板题,大模型还凑合;
一旦进阶逻辑题,pass@1 直接掉到 53%;
碰上“困难题”,更是 0%。
而 Sentient 的 ROMA 模型,用 20% 定制数据、10 倍小的参数量,
性能反而逼近主流模型的 80%。
这不是在堆算力,而是在造“聪明的智能”。
现在很多人还在纠结大模型谁更大、更贵,
而 Sentient 已经在干「更真实、更高效、更开源」的活儿。
这可能就是开源 AGI 真正的起点。
#SentientAGI #Goat #uxlink #apt

来自推特
免责声明: 以上内容仅为作者观点, 不代表CoinNX的任何立场, 不构成与CoinNX相关的任何投资建议。

