NVIDIA開源Audio2Face模型及SDK

2025-09-25

9月25日，NVIDIA將開源Audio2Face模型與SDK，讓所有遊戲和3D應用開發者都可以構建並部署帶有先進動畫的高精度角色。NVIDIA將開源Audio2Face的訓練框架，任何人都可以針對特定用例對現有模型進行微調與定製。

NVIDIA Audio2Face通過生成式AI驅動的實時面部動畫與嘴形同步，加速寫實數字角色的創作流程。Audio2Face利用AI根據音頻輸入生成逼真的面部動畫。這項技術通過分析音素、語調等聲學特徵，創建動畫數據流，並映射至角色的面部表情。這些動畫數據既可用於離線渲染預設的資產，也可實時傳輸到動態的、由AI驅動的角色，實現準確的嘴形同步與情感表達。

Audio2Face模型已廣泛應用於遊戲、媒體娛樂以及客戶服務等行業。眾多獨立軟體廠商ISV與遊戲開發商都在其應用中採用了Audio2Face。遊戲開發者包括Codemasters、GSC Game World、網易、完美世界。ISV包括Convai、Inworld AI、Reallusion、Streamlabs和UneeQ。

以下是開源工具的完整列表，更多詳情請查看面向遊戲開發的 NVIDIA ACE。

NVIDIA開源Audio2Face模型及SDK

關於NVIDIA

NVIDIA(NASDAQ: NVDA)是加速計算領域的全球領導者。

獲得更多的電玩狂人最新消息

按讚加入粉絲團