生成式影片的「漂移」難題
所有現代AI影片生成系統——無論是Sora、Runway還是Kling——都面臨一個共同的挑戰:影片越長,品質越差。這被稱為「漂移」(drift)問題。在自回歸生成過程中,每一幀都基於前幾幀生成,微小的誤差會像滾雪球一樣累積。到了第15-30秒,影片可能已經面目全非——物體變形、顏色失真、運動不連貫。
這就是為什麼當前的AI影片生成工具大多限制在5-15秒以內。即便是剛發布的Kling 3.0也只支持最長15秒的影片。製作更長的影片需要「分段生成再拼接」,但這會引入明顯的不連續性。
誤差回收再訓練:讓模型學會自我修復
EPFL團隊的創新方法名為「誤差回收再訓練」(Retraining by Error Recycling)。核心思想出奇地優雅:將模型自己生成的錯誤反饋回訓練過程中,讓模型學會從自身的不完美中恢復。
誤差回收再訓練方法
- 核心問題:生成式影片的漂移(越長品質越差)
- 解決方案:將模型生成的錯誤反饋回訓練
- 效果:模型學會從自身缺陷中恢復
- 結果:理論上無時間限制的影片生成
- 發表:ICLR 2026(4月)
傳統訓練中,模型只在「乾淨」的真實數據上學習。但在實際生成時,模型面對的是自己之前生成的(不完美的)輸出。這種「訓練分佈」和「推理分佈」之間的差距是漂移的根本原因。誤差回收再訓練通過在訓練階段就讓模型接觸自己的錯誤輸出,消除了這一差距。
對AI影片產業的意義
如果這項技術被商業化,影響將是深遠的。目前的AI影片工具最適合製作短片、廣告和社交媒體內容。但如果漂移問題真正被解決,AI影片生成就能延伸到電影製作、電視劇集和長篇內容創作——這些領域需要幾分鐘到幾小時的連續影片。
這也解釋了為什麼Runway在融資3.15億美元後轉型「世界模型」、為什麼AI影片的恐慌正在打擊Disney和Netflix的股價——如果AI能生產無限長度的高品質影片,傳統影視製作的經濟學將被徹底改寫。
從實驗室到產業
這篇論文將在2026年4月的ICLR(International Conference on Learning Representations)上正式發表,這是機器學習領域最頂級的會議之一。從學術突破到商業應用通常需要一段時間,但考慮到AI影片市場的巨大需求和資本投入,這項技術的產業化速度可能會超出預期。