CoinNX | 鬼谷研选（爆仓黑化逆袭版）

5.9万关注者

3791关注

鬼谷研选（爆仓黑化逆袭版）

@guiguziben

币安广场交易员 | 土狗先锋 | 撸毛达人| kaito top50 |商务tg @guiguziben 币安https://t.co/1ikuWq7lXr

鬼谷研选（爆仓黑化逆袭版）

$Goat

-3.55%

太不容易了，@PortaltoBitcoin 终于第二季空投了，以为反撸了，能领取百分之三十还可以， @Infinit_Labs 今天 @ningfan_a 宁总说第三季也开了后面卷一下，不知道 @UXLINKofficial 这个今天快照以后会怎么发，毕竟币价不值钱了， $Goat 也是持续九个月继续做个来看看今天的AI又有新东西了今天看到 @SentientAGI 拿下 Minsky Awards 的「AI Startup of the Year」，我是真替他们开心一把🙌 这团队从一开始就不按套路走。别人忙着卷参数，他们忙着卷「推理能力」。结果 ROMA Search 一出手，直接在行业基准上打出 81.7% 的多步推理准确率，稳居第一。更离谱的是，在 SEAL-0 这个复杂多源推理测试上，ROMA 拿到 45.6%，而 Google 的 Gemini 2.5 Pro 才 19.8%。直接翻倍！要知道这个测试拼的不是数据量，而是真智能。现在 ROMA 已经开源在 GitHub 上了（是真开，不是那种「登记后领个模型链接」那种）。想试就能试，代码摆在那儿，学术和工程两头都能跑。我一直觉得 Sentient 的节奏很稳，它不是搞一堆噱头，而是用实打实的研究成果让人信服。从去年发布 GRID，到现在在 NeurIPS 2025 推出《LiveCodeBench Pro》，他们一步步把「可验证的开源智能网络」这事落在地上。 LiveCodeBench Pro 这篇论文其实挺有意思的—— 他们和 NYU、Princeton、UCSD 联合做了个全新的编程基准，用奥赛级难度的题目去测大模型的逻辑极限。结果显示：模板题，大模型还凑合；一旦进阶逻辑题，pass@1 直接掉到 53%；碰上“困难题”，更是 0%。而 Sentient 的 ROMA 模型，用 20% 定制数据、10 倍小的参数量，性能反而逼近主流模型的 80%。这不是在堆算力，而是在造“聪明的智能”。现在很多人还在纠结大模型谁更大、更贵，而 Sentient 已经在干「更真实、更高效、更开源」的活儿。这可能就是开源 AGI 真正的起点。 #SentientAGI #Goat #uxlink #apt