AI降智的实锤数据 claude Opus 4.5 这是Marginlab团队,每日使用claude code的Opus 4.5 对SWE-Bench-Pro 的50到题目进行通过性测试。 从数据看到,从1月初的60%,下降到现在54%。降智率为10%。
来自推特

免责声明: 以上内容仅为作者观点, 不代表CoinNX的任何立场, 不构成与CoinNX相关的任何投资建议。

6