首頁 > 科技 > 正文

騰訊開源視頻模型HunyuanVideo 1.5,消費級顯卡可運行

騰訊於11月21日開源視頻生成模型HunyuanVideo 1.5,參數規模8.3B,支持5-10秒高清視頻生成,硬件需求降至14GB顯存。該模型已接入騰訊元寶,旨在推動AI視頻技術普惠化。

2025年11月21日,騰訊混元大模型團隊正式發佈並開源輕量級視頻生成模型HunyuanVideo 1.5。該模型基於Diffusion Transformer(DiT)架構,參數量為8.3B,支持生成5至10秒的480p或720p高清視頻,並可通過超分技術提升至1080p畫質。目前,該能力已集成至騰訊元寶應用,用戶可通過文字描述或“圖生視頻”方式體驗。  

HunyuanVideo 1.5的核心創新包括SSTA稀疏註意力機制與多階段漸進式訓練策略,在運動連貫性、語義遵循等關鍵維度達到商用水平。其硬件需求顯著低於行業同類模型,僅需14GB顯存的消費級顯卡(如RTX 4070)即可運行,而傳統開源SOTA模型需50GB以上顯存。模型已上傳至Hugging Face和GitHub社區,採用Apache 2.0協議,允許商業使用。  

新時空聲明: 本內容為新時空原創內容,復制、轉載或以其他任何方式使用本內容,須註明來源“新時空”或“NewTimeSpace”。新時空及授權的第三方信息提供者竭力確保數據準確可靠,但不保證數據絕對正確。本內容僅供參考,不構成任何投資建議,交易風險自擔。

×
分享到微信

打开微信,使用 “扫一扫”,分享到我的朋友圈