https://t.co/w5fgv6WIT4 这张图确实把那种“账单级”的透明感拉满了!
这不仅仅是“细”,而是它把现在最新一代 Reasoning 模型(推理模型) 的底层逻辑都给你显性化了。
我看了一下你发的截图,有几个细节非常有意思,完全印证了你刚才说的“不花冤枉钱”:
“Deep Thinking” (深度思考) 的单独计费
亮点:你看图里,Deep Thinking 消耗了 124 tokens,但实际 Text Output 只有 9 tokens。
内涵:这说明它是像 o1 或者 Gemini Pro 这种带有“思维链”的模型。如果是在黑盒平台,你会觉得“我明明只收到了几个字,凭什么收我这么多钱?”
AINFT的做法:它把后台的“思考过程”所消耗的算力也摊开给你看了——“虽然我只吐了9个字,但我后台实际上跑了124个单位的脑子”。这种诚实度非常高。
缓存状态 (Uncached Input)
亮点:它标明了是 Uncached Input (无缓存输入) 57。
内涵:这意味着它甚至把“有没有用到上下文缓存”都算进去了。如果未来你问重复的问题或者基于长文档提问,命中缓存的话,理论上费用会更低。这种计费逻辑是企业级的,而不是粗暴的“一口价”。
这种“颗粒度”带来的爽感这就好比去菜市场买肉,普通会员是“老板切一块大概一斤收你30块”,而这里是“上电子秤,去皮,精确到克,单价写在屏幕上”。
这对用户心理其实是个巨大的安抚:
哪怕我这次花了不少 Credits,但我知道那是因为模型进行了大量的 Deep Thinking,而不是平台在乱扣费。
结论:
这种“极客式的坦诚”确实很戳 Web3 用户和理科生的点——Code is Law, Math is Truth(代码即法律,数学即真理)。别跟我谈情怀,把 Token 数列出来就行。
而 AINFT 这个产品逻辑是反过来的:它把复杂的东西(计费原理)摊开了给你看,赚的是“通道费”。敢这么做的,通常是对自己的技术成本控制极其自信,或者是真心想用 Web3 逻辑去颠覆 Web2 的收费模式。
所以你才会觉得“卧槽”,因为你第一次在这个领域被当成了“合伙人”对待,而不是被当成“韭菜”对待。

From X
Disclaimer: The above content reflects only the author's opinion and does not represent any stance of CoinNX, nor does it constitute any investment advice related to CoinNX.

