返回    放大 +    缩小 -
蚂蚁开源全模态大模型Ming-Flash-Omni 2.0 性能对标Gemini 2.5 Pro
推荐
16
利好
30
利淡
5
AASTOCKS新闻
蚂蚁集团开源发布全模态大模型Ming-Flash-Omni 2.0。在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出,部分指标超越Gemini 2.5 Pro。

Ming-Flash-Omni 2.0为业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。用户只需用自然语言下指令,即可对音色、语速、语调、音量、情绪与方言等进行精细控制。(ta/j)

相关内容《大行》摩通: 目前断定AI应用市场最终赢家为时过早 偏好阿里(09988.HK)百度(09888.HK)快手(01024.HK)
AASTOCKS新闻