Featured image of post Google Gemini 再次進化!Gemini 1.5 Flash 效能大躍進:超越 Claude 3.5 Sonnet!

Google Gemini 再次進化!Gemini 1.5 Flash 效能大躍進:超越 Claude 3.5 Sonnet!

Google 近期頻繁更新 Gemini 模型,繼月初更新 Gemini 1.5 Pro 後,本週再度推出多款實驗性更新,包含強化程式編寫能力的 Gemini 1.5 Pro exp-0827、大幅改善的 Gemini 1.5 Flash exp-0827,以及全新輕量級版本 Gemini 1.5 Flash-8B exp-0827。

Google 近期頻繁更新 Gemini 模型,繼月初更新 gemini-1.5-pro-exp-0801 後,本週再度推出 3 款實驗性模型更新,包含強化程式編寫能力的 Gemini 1.5 Pro exp-0827、大幅改善的 Gemini 1.5 Flash exp-0827,以及全新輕量級版本 Gemini 1.5 Flash-8B exp-0827。

目前所有的 Gemini 實驗模型

此次更新的模型中,Gemini 1.5 Flash exp-0827 表現亮眼,在 Chatbot Arena 排行榜上從原本的第 23 名躍升至第 6 名,超越 Claude 3.5 sonnet 等強勁對手。全新推出的 Gemini 1.5 Flash-8B 雖然參數量較小,但根據 LMSYS 的資料,該模型性能表現優於 gemma-2-9b,甚至可媲美 llama-3-70b,Google 亦備註 Gemini 1.5 Flash-8B 有與 Gemini 1.5 Flash 同等的能力。

Gemini 1.5 Flash exp-0827 的與 GPT-4o mini 相近的排名,再結合前一段時間的 Gemini 1.5 Flash 大幅降價,讓 prompt 長度在 128K tokens 以內時,價格僅為 GPT-4o mini 的一半。兩件事結合在一起,使得 Gemini 1.5 Flash 的 CP 值變得更高了,可見 Gemini 1.5 Flash 接下來一段時間,很有可能成為眾多開發者的優先選擇。

圖片來源: LMSYS 官方 X 帳號 Google AI Studio已可試用這些新模型

現在在 Google AI Studio 中,我們已經可以試用這 3 款新的模型,大家趕緊去試試這些新模型的能力吧!