5月31日消息,快手自研大模型產品“可圖”(Kolors)正式對外開放,支持文生圖和圖生圖兩類功能,已上線20余種AI圖像玩法。目前,用戶可以通過“可圖大模型”官方網站和微信小程序,免費使用各項AI圖像功能。值得注意的是,可圖只需一張圖片和幾秒鐘時間,便可生成一套AI圖像。
在2024年一季度財報電話會上,快手首席執行官程一笑介紹,今年一季度,快手穩步推進自研大模型各項性能的迭代提升,并且加快大模型在各業務場景的應用。
從具體功能上看,一方面,可圖提供AI形象定制功能,即圖生圖功能,通過人像保持技術,可保留人像的自然特征,一鍵生成各種風格的人像作品。目前,可圖已上線10余種AI形象定制風格玩法。另一方面,快手可圖大模型也提供AI創作功能,即文生圖,支持用戶自由輸入文本,生成風格多樣、創意十足的繪畫作品。用戶也可以上傳參考圖,可圖將根據參考圖像的風格、主題和細節等內容,生成既符合創意描述又與參考圖相關的圖像作品。
可圖文生圖作品。圖|受訪者供圖
快手大模型團隊的技術能力為產品提供了支撐。據官方介紹,“可圖”大模型的參數規模達十億級,這些數據來自于開源社區、快手內部構建和自研AI技術合成,覆蓋了常見的千萬級中文實體概念,還引入強化學習和獎勵模型技術(RLHF),解決了文生圖大模型在長文本和復雜語義文本輸入下的效果問題。
在畫質提升方面,可圖模型通過優化擴散模型的加噪去噪理論,以實現對高質量、細節豐富的圖像生成的訓練和推理的精準適配,引入了經過優質專家標注的圖文數據集,以提升模型性能表現。
去年9月,“可圖”大模型平臺已在快手開啟內測,快手在App評論區推出的“AI玩評”和“AI小快”等多種創新互動玩法,集合了文生圖、圖生圖、擴圖等功能,也是基于可圖大模型能力。