北大张牧涵团队依托腾突破推理效率瓶颈大模型推理百万tokens成本仅1 元
时间:2025-08-03 14:32:10
在人工智能领域,大语言模型的训练和推理一直受到高昂成本的困扰。近期,北京大学人工智能研究院助理教授张牧涵领导的研究团队,在鲲鹏腾科教创新卓越中心(简称“卓越中心”)的强大算力支持下,成功构建了一套高效的大模型训练与推理架构。该架构实现了百万tokens输入成本低至,为行业提供了一个高性能、低成本的新范式。
这项研究实现了三项关键技术突破。首先,当前主流的位置编码机制存在明显的稀疏问题。团队创新性地将注意力头中的位置信息与非位置信息进行分离处理,并实施低秩压缩,在仅保留位置信息的情况下仍能保持原有的表达能力。该方案结合了腾硬件优化的flash-attention算子,大幅提升了注意力头参数的利用效率。
其二,在传统模型中,非位置编码部分常常处于压抑状态。通过分离位置与非位置成分,该部分得以获得更大的压缩潜力。研究团队采用联合KV的低秩压缩策略,仅需保留的KVCache即可维持模型性能。这种方法有效释放了腾芯片的强大计算潜能,缓解了内存访问瓶颈,并显著提升了推理吞吐能力。
其三,凭借腾平台强大的并行计算能力,团队成功研发了RecurrentDecoding(RD)技术,取代了传统的LM头结构。这一创新方法不仅提升了训练数据的利用效率,还大幅缩短了推理过程的时间。在训练阶段,RD通过比较解码出的多个token与目标token,实现了更为高效的训练数据利用;而在推理阶段,则结合投机采样机制,显著提高了生成token的命中率,并进一步加速了输出速度。
近日,北京大学与华为宣布了一项重大研究成果,在学术界引起了广泛关注。这项成果不仅为后续研究提供了可复现、高效的架构模板,还显著降低了企业场景中大模型部署的门槛。自项目启动以来,两所高校持续在前沿技术领域进行深度合作攻关,此次突破性进展进一步证明了腾算力平台支持高水平科研能力。未来,卓越中心将继续推动大模型关键技术的创新探索,助力构建自主可控的技术生态体系。

以上就是北大张牧涵团队依托腾突破推理效率瓶颈大模型推理百万tokens成本仅1 元的详细内容,更多请关注其它相关文章!
热门推荐
-
北大张牧涵团队依托腾突破推理效率瓶颈大模型推理百万tokens成本仅1 元在人工智能领域,大语言模型的训练和推理一直受到高昂成本的困扰。近期,北京大学人工智能研究院助理教授张牧涵领导的研究团队,在鲲鹏腾科教创新卓越中心(简称“卓越中心”
-
Krafton延长《深海迷航2》团队的奖金期限 纠纷持续近日,根据最新报道显示,韩国游戏开发商Krafton已与深海迷航团队UnknownWorlds达成协议,同意为其提供美元奖励延期支付至年终
-
《梦幻西游》电脑版新服有多火 390个团队刷新手副本本站手游网:前不久,小美推出了“探区一周行”新内容。近日,后台收到不少玩家私信反馈:“很好看,还想看刚刚开放区的样子
-
星际团队FPS《无主星渊》新预告 7月23日上线!今日(),在夏日游戏节上,发行商Dreamhaven与开发商MoonshotGames宣布了太空船团战第一人称射击游戏无主星渊即将于在PlayStationXbo
-
《马里奥赛车 世界》开发团队规模远超前作 美术人员激增163%随着游戏技术的持续发展,开发者们的成本投入也在不断增加。据日本的游戏产业专家Papen指出,对比前几代作品,马里奥赛车:世界的开发团队规模有了显著扩大
-
原神艾尔海森突破加什么属性 艾尔海森突破属性介绍原神艾尔海森突破加什么属性:对于原神手游中很多角色还是挺多的,同样这些角色突破加的属性也是不同的。对于游戏中艾尔海森突破属性又是什么呢?小编整理了相关内容介绍,下面一起来看看相关的信息。
-
《觅长生》结婴攻略 结婴突破方法分享觅长生中网友能够经过结婴突破来提高自个的属性,有网友不知道结婴怎样操作,接下来本站小编带来觅长生结婴玩法和觅长生结婴突破攻略,好奇的网友一块明了一下吧,期望能帮助
-
鬼谷八荒登仙境界怎么突破 鬼谷八荒登仙境突破条件及方法鬼谷八荒想要突破登仙境界,需要完成登仙不同阶段的任务和材料收集,登仙有突破前的准备、中期突破和后期突破,这里给大家带来了鬼谷八荒登仙境突破条件及方法,一起来看下文中具体介绍吧。
-
轮回修仙路突破不了金丹解决方法轮回修仙路突破不了金丹是怎么回事?这是一款修仙类别的游戏,小伙伴在游戏中能够持续突破境界提高修为,不过好多小伙伴在金丹期就卡住无奈突破了,接下来为网友讲解一下招致
-
原神空行的虚铃是谁的突破材料原神空行的虚铃是3.2中四星莱依拉的突破原料,同时也是3.3版本中全新角色散兵的突破原料,网友能够在3.2版本中的散兵周本中获取空行的虚铃。
-
地平线Aux-Think:为什么测试时推理反而让机器人「误入歧途」?丨开发者说论文题目:Aux-Think:探索数据高效视觉语言导航的推理策略论文链接:https://www.php.cn/link/5e9642339448552f8dff
-
剧情破案推理游戏下载介绍2025 热门的剧情破案推理游戏推荐最近我发现了一个叫侦探笔记的剧情破案推理手游,它的剧情非常精彩,充满了各种悬疑元素,我非常喜欢。不过我需要下载这个游戏才能玩到
-
解析‘如果昨天是明天就好了’的逻辑悖论与假设推理在日常对话中,“如果昨天是明天的话就好了”这句话显得颇为奇特。然而,在深入剖析它的背后隐藏的逻辑与心理动机时,我们不禁会思考:这种假设性的陈述实际上是在探讨一种时
-
热门的剧情破案推理游戏推荐 经典的破案类游戏在注重剧情的烧脑解谜类游戏中,玩家需通过剧情细节理解案件全貌。这些作品以独特的破案方式著称,剧情呈现完美且复杂多变
-
如何用豆包AI自动生成正则表达式 文本处理效率翻倍指南了解豆包AI如何帮你生成正则表达式?详细描述:提供更具体的信息以获得更高的准确度,如域名和用户名的格式细节能增强匹配精度
-
打造AI多功能工作台,内容创作效率翻倍技巧要挑选最适合自己的AI内容创作工具,你需要综合考量功能、易用性、价格、效果和集成性的因素。首先明确你的需求与目标:是生成创意?润色文案?还是搜索资料?接下来根据任
-
英雄没有闪挂机效率怎么提升-最大化挂机收益方法提高英雄没有闪时的挂机效率并不是一件难事。首先,确保你有足够的道具材料来升级和强化你的英雄角色,这会是获取最大奖励的关键所在
-
热血江湖打怪升级手游攻略 热血江湖刷怪最效率职业热血江湖122刷什么升级快想要在热血江湖中快速升级,各职业可以根据自己的特点进行选择:远攻包括弓手和医生;近攻则有刀、枪、剑等
-
豆包 AI 大模型怎样和 AI 模型配音选择工具结合选择配音?教程解读在实现高效配音的流程中,结合豆包AI与专业AI配音工具的核心步骤如下:明确主题与目的:首先确定你希望录制的声音内容,例如是商业广告还是个人故事讲述
-
Intern-S1 上海AI Lab推出的科学多模态大模型Intern-S1是什么新型科学多模态模型Intern-S式开源在上海人工智能大会上,由上海人工智能实验室推出的Intern-S为关注焦点
-
豆包 AI 大模型如何和 AI 模型风格设计工具结合设计风格?攻略全民k歌:歌房舞台效果开启指南腾讯出品的全民K歌,以其智能打分、修音、混音和专业音效等功能,深受K歌爱好者喜爱
-
百万播放 断档第一 公测七个月后 这游戏咋还没“变网易”除了某些二游外,你可能很难在国产游戏的全球运营里,看到像漫威争锋这么夸张的号召力。每个赛季的预告视频、新英雄的PV,播放量都轻松过百万:外媒还发布了一张新英雄曝光
-
发售5天销量破百万,在线人数超越“捞女模拟器”,这款游戏到底什么来头我是非常不喜欢爬山的。尤其这个项目是我家世代相传的绝技。我从小酷爱它,每次寒暑假我都会感到极大的煎熬,直到正式工作时才能暂时解脱
-
《幻想生活i》销量破80万,预计月底达百万里程碑近日,LEVEL-方宣布,其旗下轻松生活的RPG幻想生活类游戏i:转圈圈龙和偷走时间的少女全球销量已突破份
-
桃花源记据说这套神赋价值百万 物理职业毕业20级神赋桃花源记据说这套神赋价值百万?物理职业毕业2级神赋如下:各位少主好,今天我们一起来赏析一套顶尖物理大佬的神赋套装让我们来看看吧
-
美国和越南达成新贸易协定,苹果 AirPods、Mac mini 等产品进口成本飙升AppleInsider消息,月日,美国与越南新达成的贸易协议导致包括iPad、AirPods等在内的数款苹果产品进口价格显著上涨
-
PS5 Pro第三方拆解 成本仅比标准版PS5高2%索尼于去年推出PlayStationPro,作为次世代游戏主机的一次重要升级,新增了GPU升级、高级光线追踪与PlayStationSpectralSuperRe
-
《毁灭战士 黑暗时代》成本世代加载速度最快的游戏毁灭战士:黑暗时代今日对高级版玩家开放,该游戏在所有领域中表现卓越,预计将成为最流行的游戏之一。除使用了先进的光追技术和全球光照,毁灭战士:黑暗时代还因其极其迅速
-
票房大卖王6星艺人获取成本是多少在热门手游票房大卖王中,你将担任电影制片人,负责签约明星、拍摄电影并争夺票房冠军。游戏中的艺人品质直接影响了电影的票房潜力,其中,六星艺人的卓越能力和稀缺地位是所