产经观点网

手机站 | 产经观点首页 | 产经 | 观察 | 深度 | 公司 | 股市| 调查| 评论| 观点

产经观点网 > 产经广角 > > 正文

字号:  

李飞飞领航:World Labs发布实时持久的全新3D世界模型RTFM

  在10月16日的线上发布会上,斯坦福大学计算机视觉先驱李飞飞及其创业团队World Labs正式推出全新世界模型RTFM(Real‑Time Frame Model),标志着生成式AI在三维空间构建领域实现了关键突破。该模型能够在单张NVIDIA H100 GPU上实现交互级帧率的实时推理,极大降低了硬件门槛,使普通科研团队和创意工作者也能轻松使用。

  RTFM的核心特性包括实时运行、持久性和3D一致性。用户只需提供一张图片或简短文字提示,即可生成一个可无限探索、永久保存的三维虚拟世界。生成的场景在视角切换时保持几何结构不变,避免了传统方法中常见的形变和漂移问题。

  模型在视觉风格上表现出高度多样性。无论是卡通、赛博朋克还是写实风格,RTFM都能精准还原并在三维空间中保持统一的艺术风格。团队演示了将不同风格的二维素材无缝转化为3D场景的过程,展示了其在游戏、影视预制和虚拟现实创作中的广阔应用前景。

  持久性是RTFM的另一大亮点。生成的3D世界会被永久保存,用户可以随时返回同一场景继续探索或进行二次编辑,而无需重新渲染或重新训练模型。这一特性为长期项目的协同创作提供了可靠的技术支撑。

  在可扩展性方面,RTFM支持将多个独立生成的场景无缝拼接,构建更大规模的虚拟环境。通过统一的几何表示和一致的光照模型,拼接后的世界在视觉上保持连贯,用户可以在同一浏览器窗口中自由漫游,体验几乎无限的空间扩展。

  技术实现上,RTFM采用端到端的通用架构,从海量视频数据中自主学习空间结构和运动规律,无需显式的3D表征或额外的几何标注。该方法突破了传统三维重建对深度传感器或多视角图像的依赖,实现了“一键生成”式的空间智能。

  发布会现场,李飞飞强调,RTFM的推出不仅是学术研究的里程碑,更是AI生成内容(AIGC)进入实用阶段的重要标志。她指出,随着模型效率的提升和硬件成本的下降,未来的创意产业、教育培训以及工业仿真都将受益于这种实时、持久且易于部署的三维世界生成技术。

  目前,RTFM已开放Beta预览版,用户可通过World Labs官方平台申请体验。团队计划在后续版本中进一步提升模型的细粒度控制能力,并探索与大语言模型的深度融合,以实现更自然的人机交互和场景编辑功能。

  • 作者:佚名
  • 编辑:杨磊

ico热图一览

信息服务

关于网站 | 保护隐私权 | 网站声明 | 业务合作 | 联系方式 | 友情链接
京ICP备05004402号-8