今天看了一堆讲解DeepSeek的文章,忽然发现一个问题 - 绝大多数分析讲的都是训练阶段的创新,包括直接的RL取代了传统的SFT,训练费用只有500万等等,很少有提到为什么R1的推理费用可以做到OpenAI的1/10甚至更低…… 毕竟对于接API的应用以及C端用户来讲,他们不是很在意你花了500万还是5000万训练的这个模型,他们真正在意的是我做一次推理查询一个Token的费用是多少 Google了一圈竟然没有得到系统的答案,于是乎我直接去问Deepseek了,首先我跟他确认了下直接RL是不是主要作用于训练阶段,得到了肯定的答复,然后我问了推理费用的这个问题,它想了1分多钟后给我了如下的答案,看上去总是让我感觉有点怪,哪位懂的老铁给我讲讲他说的对不?还是有哪些Miss掉的点😂
From X

Disclaimer: The above content reflects only the author's opinion and does not represent any stance of CoinNX, nor does it constitute any investment advice related to CoinNX.