在落后同行們近兩年后,蘋果終于在本周WWDC大會發布AI功能。
“不拼AI技術,靠的是OpenAI大模型,AI功能沒有新意......”以“重新定義AI”開啟新征程的蘋果似乎并沒讓大家滿意,本次大會蘋果也幾乎并沒有提“人工智能”,而稱之為“蘋果智能”(Apple Intelligence)。
然而,資本市場卻買單了,蘋果周三扭轉跌勢,一夜暴漲7%,市值攀升2000億美元。
那么是什么讓市場扭轉態度?所謂“蘋果智能”到底意味著什么?蘋果AI戰略僅靠OpenAI?
貫穿蘋果生態場景的AI
與大模型公司蜂擁推出獨立的聊天機器人不同,蘋果做出的選擇是,將AI功能整合到用戶正在使用的APP和產品中,融入用戶日常使用場景中。
這樣一來,蘋果AI的功能遠比獨立聊天機器人能做的要多,可以智能照片編輯、生成筆記和短信摘要、自動轉錄語音備忘錄等等。
蘋果利用自研內部模型實現較為簡單的AI功能,依靠更為強大的外部模型,如GPT來實現更高級、復雜的AI功能。以全新siri、寫作工具的演示為例:
全新Siri:蘋果公司展示了如何用Siri幫忙填寫PDF表格,Siri還能找到用戶駕照的照片,提取駕照上的號碼并輸入表格。在另一個演示中,Siri可以在短信和郵件中搜索朋友發送的食譜。
真正讓Siri功能得到提升的是ChatGPT。當要求Siri做一些它不知道怎么做的事情時,比如根據最近的購物清單安排出一頓晚餐菜譜,Siri就會在征求用戶允許后,直接調用GPT接口,向ChatGPT征詢意見。用戶不必是ChatGPT Plus的用戶,就可以享受Siri這種功能。
寫作工具:蘋果將為備忘錄、郵件、Pages文稿等應用添加總結、改寫和校對的AI功能,集成寫作工具還可以針對短信和電子郵件提出回復建議和不同語氣的回復。
但至于更有創意的功能,比如寫一首關于iPhone的詩,將交給ChatGPT來完成。同樣的這個寫作工具會先征求用戶同意,然后才會去咨詢ChatGPT。
蘋果表示,Apple Intelligence、iOS 18、iPadOS 18和MacOS Sequoia將在秋季整合一系列AI功能,但一些更強大的AI功能可能要到2025年才會亮相。
場景背后的三層大模型架構
支撐以上場景功能背后的內部、外部模型,可以進一步細分為端側小模型(Apple On-Device),自研云端模型(Apple Server),以及ChatGPT等外部大模型。
第一層架構是蘋果端側小模型,其中一個參數量為3B,可以直接在手機等終端設備上運行。
此前文章指出,這其實是綜合考慮了運行速度、算力需求的結果,大部分蘋果端側模型根據用戶個人習慣和個人數據,針對不同的任務預先進行了訓練,因此各種需求響應速度也很快。
第二層是蘋果自研的更大語言模型,該模型通過私有云計算在蘋果芯片服務器上運行。
性能方面,有分析指出該模型雖然沒有明確參數量,但其性能可以與GPT-4對標。在真實世界提示評估中,大模型Apple Server性能強于GPT-3.5-Turbo,略遜于GPT-4-Turbo,該模型也針對蘋果用戶的日常行為進行微調訓練。
蘋果強調隱私是第一位,內部模型運行過程中這些數據不會被保存,不會被其他人獲取。
此前文章提到過,這些服務器都內置使用Swift語言編寫的安全工具,蘋果AI“只發送完成任務所需的相關數據”到這些服務器,不會給予對設備上下文信息的完全訪問權限。
第三層架構就是和OpenAI合作,接入GPT大模型。
根據蘋果演示,當需要實現更復雜AI功能,且在獲得用戶同意后,可以調用GPT接口。
而且可以確定的是,OpenAI可能不會是蘋果唯一的外部合作伙伴。蘋果負責軟件工程的高級副總裁Craig Federighi表示:
蘋果計劃以后讓用戶選擇自己喜歡的大模型,其中包括谷歌的Gemini等。