Googleは最近、大規模言語モデルであるGeminiシリーズのメジャーアップデートをリリースしました。特に注目すべきは、速度と効率性が大幅に向上したGemini 2.5 FlashとFlash Liteのリリースです。メジャーリリース間の継続的な最適化の一環として実施されているこれらの改善は、GoogleのAIにおける継続的なイノベーションへのコミットメントを示しています。
サードパーティの分析会社であるArtificial Analysisによると、Gemini 2.5 Flash Liteは、同社のウェブサイト上で「最速の独自モデル」となり、毎秒887トークンを出力しました。これは以前のバージョンから40%の増加です。K2Thinkのオープンソースモデル(毎秒2,000トークン)には依然として及ばないものの、この速度は独自モデルの中で既にトップクラスです。Gemini 2.5 Flashはマルチステップタスク処理にも優れており、SWE-Bench Verifiedベンチマークで54%のスコアを達成しています。
どちらの新モデルも、出力品質とコスト効率が大幅に向上しています。 Flash Lite版では、トークン出力が50%削減されるため、高スループットアプリケーションの導入コストが大幅に削減されます。また、Googleは開発者向けに新しいエイリアスを提供し、最新モデルとの統合を容易にすることで、開発エクスペリエンスをさらに向上させています。言語モデルのアップデートに加え、GoogleはGemini Liveリアルタイムオーディオモデルも強化しました。この新バージョンでは、関数呼び出しの信頼性と自然な会話処理が向上し、開発者はより応答性の高い音声アシスタントを構築できます。ユーザーは、プレビューを通じてアップデートされたGemini Liveモデルを直接体験できます。