李飞飞空间智能首秀：AI靠单图生成3D世界，可探索，遵循基本物理几何规则。我前段时间的预测成真了！

时间：2026-01-22 15:46:56

最佳回答

李飞飞团队发布的“空间智能”首个项目，实现了通过单张普通图片生成可交互的3D世界，用户可在其中自由漫游、控制视角、调整光影及操控物体细节，且场景遵循基本物理几何规则。技术核心突破该技术并非简单的图像处理，而是通过深度学习模型预测整个三维场景，从单张图片生成可互动的3D世界，实现了“深度”的突破。例如，无论用户站在场景的哪个角度，环境和物体都不会改变，场景在用户移开视线再回来时也不会发生变化，呈现出“持久现实”的效果，这在以往的生成模型中是无法实现的。团队在模型设计中加入了实时控制功能，用户可以像玩游戏一样，通过键盘或鼠标自由控制摄像机，还能使用电影中常见的“希区柯克变焦”效果，让场景产生意想不到的视觉冲击。空间智能概念李飞飞提出的“空间智能”概念，旨在让AI通过视觉感知理解3D空间，并与空间互动。她认为视觉能力是智能的重要组成部分，视觉不仅是被动感知世界，更是引导行动和学习的工具。这一技术对于机器人、无人驾驶、虚拟现实等领域意义重大。例如，机器人不仅能“看到”周围物体，还能理解物体在三维空间中的相对位置、运动方式和物理特性，极大提升AI的认知能力，使AI从图像识别工具转变为能“理解”和“行动”的智能体。艺术创作应用该技术为艺术创作带来巨大冲击。团队通过AI模型，能将经典二维艺术作品（如梵高的《夜晚露天咖啡座》）转化为3D场景，还能根据输入图像补全原画空白部分，构建完整3D世界。这为艺术家、设计师、电影制作人等创意工作者提供了新工具，未来他们可将传统艺术与虚拟现实、游戏设计等结合，打造前所未有的艺术作品，也可能助力国漫更快捷创作。3D生成优势2D图像生成虽能传递信息，但缺乏空间感和深度感，无法给人“立体”感受。而3D世界能精确控制空间元素，调整位置、大小、颜色等。在游戏设计中，3D技术能让玩家有更真实沉浸感；在电影制作中，能让导演更精准控制镜头，呈现理想画面效果。World Labs的目标客户包括视频游戏开发商、电影制片厂及创造虚拟3D场景的创作者，未来广告设计、建筑设计、教育培训等领域也可能利用该技术创新。VR是这项技术的重要应用方向，传统VR技术要求用户佩戴设备在虚拟空间操作，而此技术或许能让用户无需设备，直接通过图片进入可交互3D世界，推动虚拟现实技术普及应用。创业情况李飞飞成立“World Labs”前是斯坦福大学教授，致力于计算机视觉和人工智能研究。如今带领团队推出颠覆性技术，公司成立仅几个月便获超10亿美元估值，成为新晋独角兽企业，背后有a16z、NEA等知名投资机构支持。她的创业目标不仅是让AI更强大，更希望通过“空间智能”解决现实世界复杂问题，为AI发展开辟新天地。李飞飞的空间智能首秀是人工智能领域的重大突破，尽管目前处于“早期预览”阶段，但已展现出巨大潜力和可能性。随着时间推移，空间智能有望成为AI发展下一波浪潮，改变人们对图像和3D世界的理解，推动多个行业变革。官网博文中有多个可试玩demo，大家可通过直通链接“Generating Worlds”亲自体验。

时间：2026-01-22 15:46:59

本类最有帮助

网问答为提供知识和解答各类疑难的平台,目标是做到有问必答解决您遇到的各类问题.本站内容均为网友发表,并不代表本站立场!

投诉邮箱：