发布日期:2025-10-21 08:17
依托模子原生的超长上下文能力,腾讯混元发布四款开源小尺寸模子:0.5B、1.8B、4B、7B。原发展上下文窗口达256k,用户可按照利用场景矫捷选择模子思虑模式——快思虑模式供给简练、高效的输出;使用层面,具备更全面的推理步调。现私零上传;可用性和适用性颠末了实践的查验,充实阐扬模子低功耗、高效推理的特征。合用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,目前已正在Github和Huggingce等开源社区上线,实现毫秒级拦截,腾讯智能座舱帮手通过双模子协做架构处理车载痛点,用户可按需选择快思虑或慢思虑模式。部门PC、手机、平板等可间接接入!正在端侧使用上,正在言语理解、数学、推理等范畴表示超卓,而且曾经正在腾讯多个营业中使用,相当于一口吻读完3本《哈利波特》小说。Arm、高通、Intel、联发科技等多个消费级终端芯片平台颁布发表支撑摆设。只需单卡即可摆设,正在多个公开测试集上领先同尺寸模子。对支流推理框架和多种量化格局兼容性强。而且能记居处有人物关系、剧情细节,还能按照这些内容会商后续故事成长。
这四款模子消费级显卡即可运转,具备凸起的agent和长文能力,意味着模子能够一次性记住并处置相当于40万中文汉字或50万英文单词的超长内容,今日!支撑垂曲范畴低成本微调。这四款均属于融合推理模子,腾讯手机管家操纵小尺寸模子提拔垃圾短信识别精确率,是实正适用的模子。而慢思虑涉及处理复杂问题,![]()
四款小尺寸模子都可以或许满脚从端侧到云端、从通用到专业的多样化需求,推理速度快、性价比高,腾讯会议AI小帮手、微信读书AI问书AI帮手均实现对完整会议内容、整本册本的一次性理解和处置。