开云体育将模子参数目化至{-1.5-kaiyun体育官方网站云开全站入口 (中国)入口登录

kaiyun体育官方网站云开全站入口 (中国)入口登录

栏目分类
kaiyun体育官方网站云开全站入口 (中国)入口登录
资讯
娱乐
新闻
旅游
汽车
电影
你的位置:kaiyun体育官方网站云开全站入口 (中国)入口登录 > 资讯 > 开云体育将模子参数目化至{-1.5-kaiyun体育官方网站云开全站入口 (中国)入口登录
开云体育将模子参数目化至{-1.5-kaiyun体育官方网站云开全站入口 (中国)入口登录
发布日期:2026-05-04 10:55    点击次数:101

智通财经APP获悉,4月29日,腾讯混元推出极致量化压缩版块翻译模子 Hy-MT1.5-1.8B-1.25bit,把复古 33 种话语的翻译大模子压缩至 440MB,无需联网,下载即可径直在手机腹地入手,翻译质地优于谷歌翻译。

基于混元翻译大模子Hy-MT1.5打造,翻译后果并排商用翻译模子

Hy-MT1.5 是腾讯混元团队打造的专科翻译大模子,原生复古 33 种话语、5 种方言/民汉及 1056 个翻译标的。从常见的中英互译,到法语、日语、阿拉伯语、俄语,以致藏语、蒙古语等少数民族话语,它都能行云活水地搞定。

仅以 1.8B 参数目,Hy-MT1.5 完结了并排生意翻译 API 和 235B 级大模子的翻译后果 。在严格的评测基准中,其翻译质地不仅非凡了谷歌翻译等主流系统,更解说了在高效优化下,轻量级模子大概迸发出令东谈主印象长远的翻译才调。

最极致的量化压缩,把模子装进手机

量化压缩,浅显来说等于:把模子里正本用16位数字(16-bit)暗意的参数转用更低位数字储存。这就像把一幅高清像片压缩成缩略图,文献小了好多,但你照旧能看了了内部的内容。 针对不同的手机用户,腾讯特地推出了2-bit 与 1.25-bit 两种极致的量化压缩决策。

不同大小的模子在FLORES-200中外互译的后果评分

2-bit模子:性能与质地的均衡(适用:中高端机型)

2-bit 模子秉承了业内顶尖的拉伸弹性量化(SEQ),将模子参数目化至{-1.5,-0.5,0.5,1.5},并王人集量化感知蒸馏,在将模子体积压缩至 574MB 的同期,完结了简直无损的翻译质地,后果非凡上百GB的大模子。在复古 Arm SME2 时刻的迁徙配置上,2-bit 模子大概完结更快速、更高效的推理。

1.25-bit模子:Sherry 极致压缩(适用:全系机型)

为了达成极致的轻量化,腾讯推出了基于 Sherry(荒芜高效三值量化) 时刻的 1.25-bit 模子。该时刻决策照旧被NLP顶级学术会议ACL 2026托付。

Sherry 压缩决策的中枢逻辑在于“细粒度荒芜”战略:每4个模子参数,3个最要害的用 1-bit 储存,1个用0储存,平均每个参数仅需 1.25-bit。

合作腾讯挑升为手机 CPU 狡计的 STQ内核,该决策完结了对 SIMD 领导集的完好适配。最终,3.3GB 的原始模子被进一步压缩至 440MB,纵情常驻后台,让内存急切的庸碌手机也能顺滑进行高质地离线翻译。

本次开源不仅包含模子权重,还特地制作了一个实质可用的腾讯混元翻译Demo版,特地适配了“后台取词样式”。无论是在腹地稽查邮件照旧浏览网页,混元翻译都能随叫随到。无需网罗,无需订阅,满盈腹地搞定、不波及个东谈主信息的集合和上传开云体育,一次下载经久使用。



Powered by kaiyun体育官方网站云开全站入口 (中国)入口登录 @2013-2022 RSS地图 HTML地图

Copyright Powered by365建站 © 2013-2024