首页 > 软件资讯 > 支持消费级显卡部署:腾讯混元 3D 世界模型宣布推出 Lite 版本,推理速度提升 3 倍以上且精度损失 <1%

支持消费级显卡部署:腾讯混元 3D 世界模型宣布推出 Lite 版本,推理速度提升 3 倍以上且精度

时间:2025-08-19 10:06:01

今天,腾讯混元团队发布Lite版本,利用动态FP化技术显著降低了模型显存需求,从原来的B降至B以内,完美适应了消费级显卡环境,极大地提升了设备的运行效率和性能。

FP意力算子的引入,让混元团队成功将Q、K、V矩阵在INT化下实现了Transformer架构的推理速度提升超过三倍,且精度损失仅为千分之一。此外,该技术结合了动态平滑和硬件优化,显著减少了模型运行所需的显存。

除了显存的限制外,混元团队还采用了Cache算法,并且通过对冗余时间步进行优化,有效提高了推理的速度,使得模型运行更加流畅。借助自动化搜索参工具,可以精准识别出关键的时间步和块,进而显著提升模型的效率。

除了清晰的视觉质量和更低的推理成本,混元世界模型仅能够生成“可看”的场景,还实现了对场景中天空、地面、植被和物体等不同组件的分层建模。此外,该模型还能将生成的世界导出为网格格式文件,从而在游戏开发、影视制作和物理仿真等领域无缝应用。这使得其具备了更广泛的应用前景。

腾讯混元世界模型作为业界首个开源可编辑的世界生成模型,只需输入一句话或上传一张图片,即可生成一个完整且可漫游的世界。这一创新显著降低了内容创作门槛,为游戏开发、VR及数字内容创作等领域开拓了全新可能。

通过融合全景生成与层次化重建技术,混元世界模型现了对文字或图片输入的支持,并支持可交互、可编辑且高质量的漫游场景生成。该模型的一大亮点在于其全方位的场景生成能力和高度的可编辑性。它采用了层次化场景表征及生成算法,能够导出 Mesh,同时保证生成的场景逼真和沉浸感,并兼容现有CG管线进行二次开发,如游戏开发、物理仿真和场景编辑等。

自发布以来,混元 3D 世界模型 1.0 在社区中备受关注,其卓越的世界生成能力为用户带来了全新 AI 体验。然而,显存开销大的问题是用户反馈的最大痛点,即使开启 pipeline offloading(流水线卸载)技术,仍需 26GB 以上显存,大多数消费级显卡无法运行。

为了让更多中小企业和个人开发者轻松使用混元世界模型我们特别推出了混元世界模型Lite版本。现在消费者可以借助最低配置的显卡快速运行这个强大的工具了。

下面是混元世界模型 1.0-Lite 消费级显卡运行效果:

可漫游场景效果(消费级显卡运行):

量化前后效果对比:

原始效果(HYWorld1.0)

量化后效果(HYWorld 1.0-Lite)

原始效果(HYWorld1.0)

量化后效果(HYWorld 1.0-Lite)

xiayx附官方地址:

官网地址:https://3d.hunyuan.tencent.com/sceneTo3D

Github 项目地址:https://github.com/ Tencent-Hunyuan / HunyuanWorld-1.0

Hugging Face 模型地址:https://huggingface.co/ tencent / HunyuanWorld-1

技术报告地址:https://arxiv.org/abs / 2507.21809

热门推荐