9 月 25 日消息,科技媒體 The Decoder 昨日(9 月 24 日)發布博文,報道谷歌升級旗下 Gemini 1.5 AI 模型,推出了 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002,相比較此前版本成本更低、性能更強、響應更快。
成本更低
谷歌下調了 token 輸入和輸出費用,Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 最高降幅 50%,提高了兩種模型的速率限制,并減少了延遲。
新定價于 2024 年 10 月 1 日生效。
性能更強
IT之家援引新聞稿內容,附上新款模型的性能情況如下:
-
在更具挑戰性的 MMLU-Pro 基準測試中,模型的性能提高了約 7%。
-
在 MATH 和 HiddenMath 基準測試中,數學性能顯著提高了 20%。
-
視覺和代碼相關任務也有所改進,在視覺理解和 Python 代碼生成評估中提高了 2-7%。
谷歌聲稱,這些模型現在能在保持內容安全標準的同時,提供更有幫助的回復。該公司根據開發人員的反饋意見,改進了模型的輸出風格,旨在實現更精確、更經濟高效的使用。
其它改進
谷歌還升級了 8 月發布的 Gemini 1.5 實驗模型,推出了
Gemini-1.5-Flash-8B-Exp-0924 升級版,進一步增強了文本和多模態應用。
用戶可以通過 Google AI Studio、Gemini API 和 Vertex AI(面向 Google Cloud 客戶)訪問新的 Gemini 模型。針對 Gemini Advanced 用戶的 Gemini 1.5 Pro-002 聊天優化版即將推出。