最近国产大模型的节奏明显在加快。
梁文峰主导的 DeepSeek V4 预计 4 月发布,定位多模态模型,除了代码能力提升,还会重点强化长期记忆能力,并可能进一步适配国产算力生态。
同时,腾讯混元的新模型也被曝将在 4 月推出,规模约 30B 参数,研究重点放在长上下文能力和 Agent 任务评测。
另外,OpenRouter 最近上线的 Healer Alpha、Hunter Alpha 两个神秘模型,也被社区猜测可能和未发布的国产模型有关。
下一阶段国产大模型竞争,重点不只是规模,而是 多模态、长记忆和 Agent 应用能力。
#AI
From X
Disclaimer: The above content reflects only the author's opinion and does not represent any stance of CoinNX, nor does it constitute any investment advice related to CoinNX.

