《LLM之后的空间智能》
今天看大宇哥的文章,顺便自己也思考了下空间智能。
先看定义吧:
让机器不仅能"理解文字",还能像人类一样感知、推理和交互于三维物理世界。
李飞飞说的好浪漫:
空间智能代表着超越语言的前沿——它连接了想象、感知和行动,让机器真正能够增强人类生活
现在的大模型是基于语义的,如同读了100万本物理教科书的盲人。
知道重力,却理解不了苹果究竟是怎么落下砸到草地上的。
这里除了语义,还有物理、几何、动力学等复杂的世界规则。
空间智能对哪些场景重要呢?
具身智能、3D内容生产、3D分子结构、建筑学、材料学、自动驾驶、AR/VR眼镜等。
好家伙,这些东西绑一块,估计要10万亿的市场规模了。
2018年图灵奖得主、前Meta首席AI科学家Yann LeCun甚至认为:
LLM从根本上是错的。 "语言是压缩的、符号化的现实表征。它描述发生了什么,不描述为什么发生。一个读了100万本物理书的LLM并不'知道'推一张桌子杯子会动
Yann当然过于激进了。
从更大的视角去看,文字AI到物理AI应该是有行业共识的大势所趋了。
老黄认为:2026年是物理AI元年
空间智能的技术路径目前非常驳杂:
神经辐射场 NeRF+3D高斯泼溅+视频扩散Diffusion模型+世界模型与JEPA架构+视觉-语言-动作模型 VLA+世界基础模型
这7大路线目前还没有跑出来赢家,但高斯泼溅是当前最火的。
空间智能在26年还是一个没有被市场充分定价的边缘领域
真好,这意味着还有大量投资机会
From X
Disclaimer: The above content reflects only the author's opinion and does not represent any stance of CoinNX, nor does it constitute any investment advice related to CoinNX.

