<匯港通訊> 內地《科創板日報》報道,字節跳動火山引擎初步確定,周六(14日)發布豆包大模型的一系列重要升級,涉及豆包大模型2.0、音視頻創作模型Seedance 2.0、圖像創作模型Seedream 5.0 Preview。升級後的豆包大模型2.0,基礎模型能力和企業級Agent能力將大幅提升。
報道指,豆包視頻生成模型Seedance升級要點包括,複雜交互和運動生成可用率高,業界最佳級別;多模態能力全面,支持音、視、圖全模態輸入;可控性強,指令遵循表現好;深度適配影視、廣告及行銷場景,輸出質量對齊工業交付標準。
至於豆包圖像創作模型Seedream升級要點包括,首次引入實時檢索增強能力,可以獲取最新的知識和資訊,精準回應具有時效性的創作需求;世界知識與多語種能力增強,模型內置科技與人文領域豐富的世界知識;理解與生成表現全面提升,可以通過簡短、模糊的文本和圖像輸入理解用戶意圖,主體一致性和圖文對齊的表現也有進步。
此前,騰訊(00700)旗下騰訊混元0.3B端側模型已上線;智譜(02513)已開源GLM-OCR,而其Pony Alpha新一代大模型據報亦已上線。阿里巴巴(09988)千問新一代基座模型Qwen3.5據報亦將於春節期間開源。 (ST)
新聞來源 (不包括新聞圖片): 滙港資訊