返回    放大 +    縮小 -
螞蟻開源全模態大模型Ming-Flash-Omni 2.0 性能對標Gemini 2.5 Pro
推薦
14
利好
25
利淡
5
AASTOCKS新聞
螞蟻集團開源發布全模態大模型Ming-Flash-Omni 2.0。在多項公開基準測試中,該模型在視覺語言理解、語音可控生成、圖像生成與編輯等關鍵能力表現突出,部分指標超越Gemini 2.5 Pro。

Ming-Flash-Omni 2.0為業界首個全場景音頻統一生成模型,可在同一條音軌中同時生成語音、環境音效與音樂。用戶只需用自然語言下指令,即可對音色、語速、語調、音量、情緒與方言等進行精細控制。(ta/j)

相關內容《大行》摩通: 目前斷定AI應用市場最終贏家為時過早 偏好阿里(09988.HK)百度(09888.HK)快手(01024.HK)
AASTOCKS新聞