2月25日|據全天候科技,阿里雲旗下視覺生成基座模型萬相2.1(Wan)開源,此次開源採用最寬鬆的Apache2.0協議,14B和1.3B兩個參數規格的全部推理代碼和權重全部開源,同時支持文生視頻和圖生視頻任務。
據介紹,14B萬相模型在指令遵循、複雜運動生成、物理建模、文字視頻生成等方面表現突出,在權威評測集VBench中,萬相2.1以總分86.22%的成績大幅超越Sora、Luma、Pika等國內外模型,穩居榜首位置。1.3B版本測試結果不僅超過了更大尺寸的開源模型,甚至還接近部分閉源模型,同時能在消費級顯卡運行,僅需8.2GB顯存就可以生成高質量視頻,適用於二次模型開發和學術研究。
新聞來源 (不包括新聞圖片): 格隆匯