$Goat
+0.61%
太不容易了,@PortaltoBitcoin 终于第二季空投了,以为反撸了,能领取百分之三十还可以, @Infinit_Labs 今天 @ningfan_a 宁总说第三季也开了后面卷一下,不知道 @UXLINKofficial 这个今天快照以后会怎么发,毕竟币价不值钱了, $Goat 也是持续九个月继续做个 来看看今天的AI又有新东西了 今天看到 @SentientAGI 拿下 Minsky Awards 的「AI Startup of the Year」,我是真替他们开心一把🙌 这团队从一开始就不按套路走。别人忙着卷参数,他们忙着卷「推理能力」。 结果 ROMA Search 一出手,直接在行业基准上打出 81.7% 的多步推理准确率,稳居第一。 更离谱的是,在 SEAL-0 这个复杂多源推理测试上,ROMA 拿到 45.6%, 而 Google 的 Gemini 2.5 Pro 才 19.8%。 直接翻倍!要知道这个测试拼的不是数据量,而是真智能。 现在 ROMA 已经开源在 GitHub 上了(是真开,不是那种「登记后领个模型链接」那种)。 想试就能试,代码摆在那儿,学术和工程两头都能跑。 我一直觉得 Sentient 的节奏很稳,它不是搞一堆噱头,而是用实打实的研究成果让人信服。 从去年发布 GRID,到现在在 NeurIPS 2025 推出《LiveCodeBench Pro》, 他们一步步把「可验证的开源智能网络」这事落在地上。 LiveCodeBench Pro 这篇论文其实挺有意思的—— 他们和 NYU、Princeton、UCSD 联合做了个全新的编程基准, 用奥赛级难度的题目去测大模型的逻辑极限。 结果显示: 模板题,大模型还凑合; 一旦进阶逻辑题,pass@1 直接掉到 53%; 碰上“困难题”,更是 0%。 而 Sentient 的 ROMA 模型,用 20% 定制数据、10 倍小的参数量, 性能反而逼近主流模型的 80%。 这不是在堆算力,而是在造“聪明的智能”。 现在很多人还在纠结大模型谁更大、更贵, 而 Sentient 已经在干「更真实、更高效、更开源」的活儿。 这可能就是开源 AGI 真正的起点。 #SentientAGI #Goat #uxlink #apt
来自推特

免责声明: 以上内容仅为作者观点, 不代表CoinNX的任何立场, 不构成与CoinNX相关的任何投资建议。