首页 > 资讯 >正文

阿里宣布开源全模态Qwen2.5-Omni7B尺寸可识别情绪

2025-12-28 21:31   来源:科技快报网阅读量:18147       

阿里巴巴发布并开源首个端到端全模态大模型通义千问Qwen2.5-Omni-7B,可同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。据悉,在权威多模态融合任务OmniBench等测评中,Qwen2.5-Omni全维度超Google的Gemini-1.5-Pro等同类模型,刷新业界纪录。

Qwen2.5-Omni以接近人类的多感官方式认知世界并与之实时交互,还能通过音视频识别情绪,在复杂任务中进行更智能、更自然的反馈与决策。现在,开发者和企业可免费下载商用Qwen2.5-Omni,手机等终端智能硬件也可轻松部署运行。相较于数千亿参数的闭源大模型,Qwen2.5-Omni以7B的小尺寸让全模态大模型在产业上的广泛应用成为可能。即便在手机上,也能轻松部署和应用Qwen2.5-Omni模型。当前,Qwen2.5-Omni已在魔搭社区和Hugging Face 同步开源,用户也可在Qwen Chat上直接体验。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

相关热词搜索:

上一篇: 歌尔股份2024年营收超千亿:净利26.7亿现金分红5.18亿
下一篇:最后一页