网问答>>李飞飞空间智能首秀:AI靠单图生成3D世界,可探索,遵循基本物理几何规则。我前段时间的预测成真了!
问题
已解决

李飞飞空间智能首秀:AI靠单图生成3D世界,可探索,遵循基本物理几何规则。我前段时间的预测成真了!

时间:2026-01-22 15:46:56
李飞飞空间智能首秀:AI靠单图生成3D世界,可探索,遵循基本物理几何规则。我前段时间的预测成真了!
最佳回答
李飞飞团队发布的“空间智能”首个项目,实现了通过单张普通图片生成可交互的3D世界,用户可在其中自由漫游、控制视角、调整光影及操控物体细节,且场景遵循基本物理几何规则。技术核心突破该技术并非简单的图像处理,而是通过深度学习模型预测整个三维场景,从单张图片生成可互动的3D世界,实现了“深度”的突破。例如,无论用户站在场景的哪个角度,环境和物体都不会改变,场景在用户移开视线再回来时也不会发生变化,呈现出“持久现实”的效果,这在以往的生成模型中是无法实现的。团队在模型设计中加入了实时控制功能,用户可以像玩游戏一样,通过键盘或鼠标自由控制摄像机,还能使用电影中常见的“希区柯克变焦”效果,让场景产生意想不到的视觉冲击。空间智能概念李飞飞提出的“空间智能”概念,旨在让AI通过视觉感知理解3D空间,并与空间互动。她认为视觉能力是智能的重要组成部分,视觉不仅是被动感知世界,更是引导行动和学习的工具。这一技术对于机器人、无人驾驶、虚拟现实等领域意义重大。例如,机器人不仅能“看到”周围物体,还能理解物体在三维空间中的相对位置、运动方式和物理特性,极大提升AI的认知能力,使AI从图像识别工具转变为能“理解”和“行动”的智能体。艺术创作应用该技术为艺术创作带来巨大冲击。团队通过AI模型,能将经典二维艺术作品(如梵高的《夜晚露天咖啡座》)转化为3D场景,还能根据输入图像补全原画空白部分,构建完整3D世界。这为艺术家、设计师、电影制作人等创意工作者提供了新工具,未来他们可将传统艺术与虚拟现实、游戏设计等结合,打造前所未有的艺术作品,也可能助力国漫更快捷创作。3D生成优势2D图像生成虽能传递信息,但缺乏空间感和深度感,无法给人“立体”感受。而3D世界能精确控制空间元素,调整位置、大小、颜色等。在游戏设计中,3D技术能让玩家有更真实沉浸感;在电影制作中,能让导演更精准控制镜头,呈现理想画面效果。World Labs的目标客户包括视频游戏开发商、电影制片厂及创造虚拟3D场景的创作者,未来广告设计、建筑设计、教育培训等领域也可能利用该技术创新。VR是这项技术的重要应用方向,传统VR技术要求用户佩戴设备在虚拟空间操作,而此技术或许能让用户无需设备,直接通过图片进入可交互3D世界,推动虚拟现实技术普及应用。创业情况李飞飞成立“World Labs”前是斯坦福大学教授,致力于计算机视觉和人工智能研究。如今带领团队推出颠覆性技术,公司成立仅几个月便获超10亿美元估值,成为新晋独角兽企业,背后有a16z、NEA等知名投资机构支持。她的创业目标不仅是让AI更强大,更希望通过“空间智能”解决现实世界复杂问题,为AI发展开辟新天地。李飞飞的空间智能首秀是人工智能领域的重大突破,尽管目前处于“早期预览”阶段,但已展现出巨大潜力和可能性。随着时间推移,空间智能有望成为AI发展下一波浪潮,改变人们对图像和3D世界的理解,推动多个行业变革。官网博文中有多个可试玩demo,大家可通过直通链接“Generating Worlds”亲自体验。
时间:2026-01-22 15:46:59
本类最有帮助
Copyright © 2008-2013 www.wangwenda.com All rights reserved.冀ICP备12000710号-1
投诉邮箱: