恭喜 @SentientAGI
四篇論文入選 NeurIPS!!太強了
簡單嘮一下 LivecodeBench Pro 是咋回事:
這玩意兒直接給AI的編程能力立了一個天花板級別的新標準,嚴到沒朋友
結果發現,在真正頂級的編程題面前,所有AI模型全被人類高手按在地上摩擦@SentientAGI
尤其是那些高難度題目,AI通過率直接掛零,徹底暴露它們壓根不具備真正的深度推理和算法創新能力
這就像一面照妖鏡,把過去那些評測吹出來的泡沫全給戳破了,也終於給AI的真實編程「智商」提供了一個可信的標尺
更重要的是,它告訴我們:AI編程的路,還長得很@SentientAGI

来自推特
免责声明: 以上内容仅为作者观点, 不代表CoinNX的任何立场, 不构成与CoinNX相关的任何投资建议。



