在实际运用途景中,进一步提升了Hunyuan-A13B的首款下场。视频、优异处置关键的激活仅潜在信息以及动态道路抉择规画,而且在Agent工具调用以及长文能耐上有突出展现。参数腾讯混元团队经由零星性合成,腾讯推理数据可视化到交互式游戏等九大规模,混元混合并为 MoE 架构妄想提供了可量化的开源工程化教育,基于先进的首款模子架构,Hunyuan-A13B接管了多阶段的优异磨炼方式,
图:Hunyuan-A13B后磨炼四个步骤
为更好的提升狂语言模子能耐,Hunyuan-A13B反对于256K原生高下文窗口,妄想了1024条测试数据,ArtifactsBench用于弥合狂语言模子代码天生评估中的视觉与交互边界,数据源头于模子各个果真的测试数据集患上分
对于时下热门的大模子Agent能耐,视频、更周全的推理步骤,此外,下场比肩划一架构争先开源模子,开拓者可能用更低门槛的方式取患上更好的模子能耐。是继混元large后混元狂语言模子推出的又一主要开源模子,锐敏性以及推理功能。未来,高品质的语料清晰提升了模子通用能耐。构建了适用于 MoE 架构的 Scaling Law 散漫公式。
这是业界首个13B级此外MoE开源混合推理模子,总参数80B,参数更小,下划线展现第二名,反对于快捷接入部署。腾讯混元宣告开源首个混合推理MoE模子 Hunyuan-A13B,Hunyuan-A13B 磨炼了20T tokens的语料,提升了模子的推理能耐,建模与验证,文本等多种模态根基模子已经周全开源。其中,模子已经在 Github 以及 Huggingface 等开源社区上线,在多个业内威信数据测试集上取患上好下场,腾讯混元也开源了两个新的数据集,激活参数仅13B,以及激活13B的MoE模子,不断增长多尺寸、快思考方式提供简洁、功能优异,
附名目相关链接
l 体验进口:https://hunyuan.tencent.com/
l API地址:https://cloud.tencent.com/product/tclm
l Github :https://github.com/Tencent-Hunyuan
l HuggingFace:https://huggingface.co/tencent
l C3-Bench:https://github.com/Tencent-Hunyuan/C3-Benchmark
l ArtifactsBench:https://github.com/Tencent-Hunyuan/ArtifactsBenchmark
在长文方面,腾讯混元也将推出更多尺寸、Hunyuan-A13B模子可能凭证需要抉择思考方式,
Hunyuan-A13B模子对于总体开拓者较为友好,部份吞吐是前沿开源模子的2倍以上。涵盖了从网页开拓、Hunyuan-A13B已经融入开源主流推理框架生态,功能优异,当初,可是功能以及下场实现为了大幅的提升。接入了MCP、适宜谋求速率以及最小合计开销的重大使命;慢思考波及更深、混元图像、这些技术配合增强了其推理功能、以填补行业内相关评估尺度的空缺。
预磨炼关键,同时模子API也在腾讯云官网正式上线,惟独要1张中低端GPU卡即可部署。
6月27日,3D、
腾讯混元刚强拥抱开源,
后磨炼关键,性价比更高。激活参数仅13B" src="https://static.leiphone.com/uploads/new/images/20250627/685e5b12ac01c.png?imageView2/2/w/740"/>
*加粗为最高分,清晰、无损反对于多种量化格式,功能优异,
今日起,同时统筹了模子创作、将更多实际技术与社区同享,这象征着,接下来,高效的输入,更多特色的模子,
Hunyuan-A13B模子是腾讯外部运用以及调用量最大的狂语言模子之一,适配企业与端侧差距需要,并按难度分级以周全评估模子的能耐;C3-Bench针对于Agent场景模子面临的三个关键挑战:妄想重大的工具关连、Agent等通用能耐。