腾讯混元世界模型1.1版开源:多模态输入重构3D创作范式,消费级显卡即可运行

2025年10月22日,腾讯混元实验室对外发布重磅消息,旗下3D生成式AI模型——混元世界模型(WorldMirror)1.1版本正式上线并同步开放源代码。该版本突破性实现多视图图像与视频流输入支持,首次将专业级3D内容创作门槛降至消费级硬件水平,用户可在单张GPU上完成部署,实现秒级生成可交互的三维虚拟空间。

回溯今年7月,腾讯混元世界模型1.0版本的推出已在行业引发震动,作为全球首个兼容传统计算机图形学(CG)工作流的开源可漫游世界生成模型,其轻量版(lite)已成功实现在消费级显卡上的本地化运行,为开发者提供了低成本的3D内容生产工具。此次1.1版本的迭代,进一步夯实了腾讯在三维生成式AI领域的技术领先地位。

作为业界首创的全链路(any-to-any)前馈式3D重建大模型,混元世界模型1.1版本重点突破了前代产品仅支持文本描述或单张图像输入的技术瓶颈。通过创新的多模态先验融合架构,该模型可同时接收文本、图像序列、视频流等多元输入,并实现从点云数据、深度图、相机参数到表面法线向量的全要素3D几何信息输出,构建起端到端的三维内容生成闭环。这种技术突破使得传统需要专业团队数周完成的3D场景建模工作,现在可通过普通用户上传的手机拍摄视频自动完成。

为推动3D创作生态的普及发展,腾讯已将混元世界模型1.1版本完整开放源代码。开发者可通过克隆Gitcode仓库获取全部技术资源,根据配套文档实现一键式本地化部署。针对非技术背景用户,腾讯同步在HuggingFace平台上线交互式体验空间,支持直接上传多视角拍摄的图像或短视频素材,实时预览基于3D高斯 splatting(3DGS)技术渲染的高质量三维场景。

此次开源资源包包含完整的模型权重、训练代码及技术文档,具体获取渠道如下:项目官方主页提供详尽的技术解析与应用案例;Gitcode代码仓库地址为https://gitcode.com/hf_mirrors/tencent/HunyuanWorld-Mirror;HuggingFace模型库包含预训练权重文件;在线演示空间支持零代码创作体验;技术白皮书则系统阐述了模型架构创新点与性能评估数据。

随着混元世界模型1.1版本的开源,3D内容创作正迎来从专业工具向大众创作的范式转移。该技术不仅将深刻影响游戏开发、影视制作等传统领域,更将加速元宇宙教育、虚拟会展、数字孪生等新兴业态的落地进程,为普通用户构建起"拍摄即建模、视频即世界"的全新创作体验。未来,随着模型对动态场景生成、物理引擎融合等技术的持续优化,三维数字内容的生产效率与创意边界有望得到进一步拓展。

Logo

立足具身智能前沿赛道,致力于搭建全球化、开源化、全栈式技术交流与实践共创平台。

更多推荐