中文
中文
English
登录
7.5万
关注者
7435
关注
Mr Panda
@PandaTalk8
熊老板 | AI 创业者 | X 增长教练 | 商业技术观察 | 公众号:PandaTalk8
订阅
Mr Panda
能把看起来这么高级的概念说的这么简单直接, 只有响马老师了
响马
@xicilion
·
为什么大家会觉得大模型的不确定性很神秘呢?什么浮点数误差,模型的计算,等等。 真相其实很低级,就是 transformer 在调用 gpu 的时候,塞进去了个随机数。 想要重复确定再现很容易,你把 python 随机数种子锁死,结果就是可复现的了。 不过这是前年我的测试,现在的架构不确定。
来自推特
免责声明: 以上内容仅为作者观点, 不代表CoinNX的任何立场, 不构成与CoinNX相关的任何投资建议。
0
0
Post
讨论最多