《LLM之后的空间智能》 今天看大宇哥的文章,顺便自己也思考了下空间智能。 先看定义吧: 让机器不仅能"理解文字",还能像人类一样感知、推理和交互于三维物理世界。 李飞飞说的好浪漫: 空间智能代表着超越语言的前沿——它连接了想象、感知和行动,让机器真正能够增强人类生活 现在的大模型是基于语义的,如同读了100万本物理教科书的盲人。 知道重力,却理解不了苹果究竟是怎么落下砸到草地上的。 这里除了语义,还有物理、几何、动力学等复杂的世界规则。 空间智能对哪些场景重要呢? 具身智能、3D内容生产、3D分子结构、建筑学、材料学、自动驾驶、AR/VR眼镜等。 好家伙,这些东西绑一块,估计要10万亿的市场规模了。 2018年图灵奖得主、前Meta首席AI科学家Yann LeCun甚至认为: LLM从根本上是错的。 "语言是压缩的、符号化的现实表征。它描述发生了什么,不描述为什么发生。一个读了100万本物理书的LLM并不'知道'推一张桌子杯子会动 Yann当然过于激进了。 从更大的视角去看,文字AI到物理AI应该是有行业共识的大势所趋了。 老黄认为:2026年是物理AI元年 空间智能的技术路径目前非常驳杂: 神经辐射场 NeRF+3D高斯泼溅+视频扩散Diffusion模型+世界模型与JEPA架构+视觉-语言-动作模型 VLA+世界基础模型 这7大路线目前还没有跑出来赢家,但高斯泼溅是当前最火的。 空间智能在26年还是一个没有被市场充分定价的边缘领域 真好,这意味着还有大量投资机会
From X

Disclaimer: The above content reflects only the author's opinion and does not represent any stance of CoinNX, nor does it constitute any investment advice related to CoinNX.

6