當前,AI技術和產品的快速迭代升級,特別是AI+視頻生成,正成為當前AI產業發展的關鍵節點,更受到業界關注。
近日信達證券在發布的研究報告中認為,視頻雜糅了文本、語音、圖像等多維度內容,其訓練的難點也往往在于視頻數據對數量和質量的不足、算法架構需要優化、物理規律性較差等等,但隨著AI+視頻的技術和產品升級迭代,眾多行業有望受益,諸如電影、廣告、視頻剪輯、視頻流媒體平臺、UGC創作平臺、短視頻綜合平臺等,而目前正處在AI+視頻發展的關鍵性時刻。
信達證券還具體提到,市場主流的AI視頻生成技術迭代路徑經歷了早期的GAN+VAE、Transformer 、 DiffusionModel以及Sora采用的DiT架構(Transformer+Diffusion),技術迭代升級帶來視頻處理質量上的飛躍性提升。其中,Transformer在并處處理、長時間序列數據處理、多注意力處理上有著強大的優勢,通過預訓練和微調可提高模型性能;Sora采用的DiT架構有效進行結合,利用Transformer處理潛在空間中的圖像數據塊,模擬數據的擴散過程以生成時長更長、質量更高的圖像和視頻。
信達證券還認為,國內AI+視頻產品單條價格低于海外產品,其中RunwayGen-3 Alpha和快手可靈為目前AI視頻生成的全球第一梯隊,在視頻分辨率、生成速度、物體符合物理規律、提示詞理解、視頻時長等諸多維度上表現均較為優秀。
目前,AI+視頻大多數用于創意內容生成,直接用于ToB商業化較少。追溯原因,首先生成視頻的人物一致性、所需時長、畫面質量尚且不滿足立即商業化水準;其次目前主流AI視頻工具還處在視頻生成競爭的階段,且大多數為單一功能產品。在視頻生成之后,諸如準確的提示詞生成、修改視頻片段、添加字幕、腳本生成、轉場銜接、背景音樂添加等眾多細節功能暫未集成,因此現今階段還需要多種不同的視頻創作工具串聯使用才能達到直接輸出可商業化視頻的效果,環節繁瑣、多工具之間的格式也可能存在不兼容的可能性,給用戶帶來使用上的不便。
據此信達證券認為,后續需要持續關注能夠一站式提供視頻生成+編輯等功能的企業,了解用戶痛點,打磨產品細節,才能真正將技術用于生產工作、娛樂等眾多環節,帶來商業化變現的潛在空間;一站式AI視頻生成+剪輯+UGC創作,有望解決市場一直在質疑的“AI+視頻缺少實質作用問題”。