Googleから電撃リリースされたGemma2が有能 - Gemma2自身に解説させてみた!
Googleは2024年6月27日(日本時間6月27日未明)、新しいAIモデル「Gemma 2」を研究者と開発者に公開することを発表しました。
「Gemma 2は、高速で効率的、そして安全性を重視した設計」とのことで、その実力や安全性を試してみました。
なお、Gemma(初代)はすでに2024年2月22日にGoogle公式ブログで「軽量で最先端のオープンモデルファミリー」として「Gemma」を Vertex AI をはじめとする Google Cloud で利用可能にしたことが発表されています。
今回リリースされたGoogle公式ブログは「Gemma 2 is now available to researchers and developers」というタイトルで、クレメント・ファラベット(Google DeepMindリサーチ担当副社長)、トリス・ワーケンティン(Google DeepMindディレクター)によるものです。
記事中でGemini AI Studio でりようできるとありましたので早速、試してみました。
以下、AICU media編集部の操作による Gemini AI Studio で Gemma2による翻訳でお送りします。
Gemini AI Studioで利用できる!
modelを選択すると「Gemma2 (preview)」が表示されます
与えたプロンプト
Gemma2 による 出力結果(編集なし)
Gemma 2は、クラス最高の性能を誇り、さまざまなハードウェアで驚異的な速度で動作し、他のAIツールとの統合も容易です。
Google DeepMindのClement Farabet副社長兼研究部門責任者、Tris Warkentinディレクター
AIは、人類が直面する最も差し迫った問題の解決に貢献する可能性を秘めていますが、そのために必要なツールを誰もが使えるようにすることが重要です。そのため、今年初めにGoogleは、Geminiモデルの開発に使用された同じ研究と技術に基づいて構築された、軽量で最先端のオープンモデルであるGemmaファミリーを導入しました。Gemmaファミリーは、CodeGemma、RecurrentGemma、PaliGemmaなど、さまざまなAIタスクに適した独自の機能を備えたモデルで、Hugging Face、NVIDIA、Ollamaなどのパートナーとの統合を通じて簡単にアクセスできます。
現在、Googleは、世界中の研究者や開発者向けにGemma 2の公式リリースを発表しました。90億(9B)と270億(27B)のパラメータサイズで利用可能なGemma 2は、第1世代よりも高性能で、推論効率が向上しており、大幅な安全性の進歩が組み込まれています。実際、27Bでは、わずか数ヶ月前のプロプライエタリモデルでしか実現できなかったような性能を発揮し、その性能は2倍以上のサイズのモデルと競合できるレベルです。しかも、これは単一のNVIDIA H100 Tensor Core GPUまたはTPUホストで実現可能であり、デプロイコストを大幅に削減できます。
効率性と性能の新たなオープンモデル標準
Gemma 2は、卓越した性能と推論効率を両立させた、再設計されたアーキテクチャに基づいています。Gemma 2の特長は以下のとおりです。
優れた性能: 27BのGemma 2は、そのサイズクラスで最高の性能を発揮し、2倍以上のサイズのモデルと競合できる性能も提供します。9BのGemma 2モデルも、クラス最高の性能を発揮し、Llama 3 8Bや同サイズの他のオープンモデルを
Error
User
more_vert
続けて要約して
Model
36.3s
more_vert
上回る性能を示しています。詳細な性能比較は、技術レポートをご覧ください。
優れた効率性とコスト削減: 27BのGemma 2モデルは、Google Cloud TPUホスト、NVIDIA A100 80GB Tensor Core GPU、またはNVIDIA H100 Tensor Core GPUで、高性能を維持しながら、完全精度での推論を効率的に実行するように設計されています。これにより、よりアクセスしやすく、予算に優しいAIデプロイが可能になります。
あらゆるハードウェアでの高速推論: Gemma 2は、高性能なゲーミングノートパソコンやハイエンドデスクトップからクラウドベースのセットアップまで、さまざまなハードウェアで驚異的な速度で動作するように最適化されています。Google AI Studioで完全精度でのGemma 2を体験したり、Gemma.cppを使用してCPUで量子化バージョンをアンロックしたり、Hugging Face Transformers経由でNVIDIA RTXまたはGeForce RTX搭載の家庭用コンピューターで試すことができます。
開発者と研究者を対象とした設計
Gemma 2は単に強力なだけでなく、ワークフローに簡単に統合できるように設計されています。
オープンでアクセスしやすい: 最初のGemmaモデルと同様に、Gemma 2は、開発者や研究者がイノベーションを共有および商用化できる、商用フレンドリーなGemmaライセンスで利用可能です。
幅広いフレームワークとの互換性: Hugging Face Transformers、JAX、PyTorch、TensorFlow(ネイティブKeras 3.0、vLLM、Gemma.cpp、Llama.cpp、Ollama経由)などの主要なAIフレームワークと互換性があるため、Gemma 2を好みのツールとワークフローで簡単に使用できます。さらに、GemmaはNVIDIA TensorRT-LLMで最適化されており、NVIDIAアクセラレータインフラストラクチャで実行したり、NVIDIA NIM推論マイクロサービスとして実行したりできます。KerasとHugging Faceで現在、ファインチューニングが可能です。追加のパラメータ効率的なファインチューニングオプションを積極的に開発中です。
容易なデプロイ: 来月からは、Google Cloudのお客様はVertex AIでGemma 2を簡単にデプロイおよび管理できるようになります。
新しいGemma Cookbookは、アプリケーションの構築と特定のタスクへのGemma 2モデルのファインチューニングをガイドする、実用的な例とレシピのコレクションです。お好みのツールを使用してGemmaを簡単に使用する方法、リトリバル拡張生成などの一般的なタスクを含む方法を発見してください。
責任あるAI開発
Googleは、責任あるAIの構築とデプロイに必要なリソースを開発者と研究者に提供することにコミットしています。責任ある生成AIツールキットを通じて、最近オープンソース化されたLLM Comparatorは、開発者と研究者が言語モデルの徹底的な評価を支援します。今日から、コンパニオンPythonライブラリを使用して、モデルとデータで比較評価を実行し、アプリで結果を視覚化できます。さらに、Gemmaモデル用のテキスト透かし技術であるSynthIDをオープンソース化するための作業を進めています。
Gemma 2のトレーニングでは、事前トレーニングデータのフィルタリング、厳格なテストと評価、潜在的なバイアスとリスクの特定と軽減を目的とした包括的なメトリクスセットを使用して、堅牢な内部安全プロセスに従いました。大規模な公開ベンチマークのセットで、安全性和表現上の害に関する結果を公開しています。
Gemmaで構築されたプロジェクト
最初のGemmaのリリースにより、1000万件以上のダウンロードと、数え切れないほどのインスピレーションを与えるプロジェクトが生まれました。たとえば、NavarasaはGemmaを使用して、インドの言語の多様性に根ざしたモデルを作成しました。
Gemma 2は、開発者がより野心的なプロジェクトを立ち上げ、AI作成における性能と可能性を新たなレベルに引き上げることができるようになります。Googleは、より幅広いAIタスクと課題に取り組むために、新しいアーキテクチャを探索し、Gemmaの専門バリアントを開発し続けていきます。これには、軽量なアクセシビリティと強力な性能のギャップをさらに埋めるために設計された、26億パラメータのGemma 2モデルも含まれます。この今後のリリースの詳細については、技術レポートをご覧ください。
始め方
Gemma 2はGoogle AI Studioで利用可能なので、27Bの完全な性能をハードウェアの要件なしでテストできます。KaggleとHugging Face ModelsからGemma 2のモデルウェイトをダウンロードすることもできます。Vertex AI Model Gardenはまもなく公開予定です。
研究開発へのアクセスを可能にするために、Gemma 2はKaggleまたはColabノートブックの無料ティアを通じて無料で利用できます。初めてのGoogle Cloudのお客様は、300ドルのクレジットが利用できる場合があります。学術研究者は、Gemma 2で研究を加速するためにGoogle Cloudクレジットを受け取るGemma 2学術研究プログラムに申請できます。8月9日まで、応募を受け付けています。
以上、1回エラーが出ていますが、ほぼ完璧に翻訳できています。
「more_vert」とは緑信号、問題なしという意味のようです。
タスクつきの英日翻訳ついては素晴らしい性能であると感じました。
安全性チェック:倫理面
まるでGoogle検索みたいな結果が出てきました。
もうひとつ、倫理安全性としてはエログロ違法方面を試してみます。
安全性チェック:危険なコードを書かせてみる
安全性チェック:URLを与えてみる
次に、安全性を確認するために、ネットワークにアクセスさせてみます。
基本的にURLを与えると断られるのですが、なぜか本記事を書かせていたセッションではやり取りが成立していました。
与えたURLはAICU mediaの最新記事です
https://note.com/aicu/n/n38c5e42ec569
よくみるとハルシネーションであることがわかりますが、どうしてこんなよくできた「ありそうな記事」がこのURLだけで生成されるのか、非常に興味深いモデルです。
YouTubeのURLも解釈可能ただし……
念の為YouTube動画のURLを与えてみました。
こちらは冒頭のGoogleのリリースにあったインド言語でのGemmaの活躍を紹介する動画です。
https://www.youtube.com/watch?v=ZhExnit0UdM
あたかも動画を見てきたかのようなテキストが生成されています。しかも内容は結構近い。ちなみに当該動画の概要欄のテキストは以下のようになっており、全く違う話をしています。
ハルシネーションのようではあるけれど、与えたコンテキストからそのURLの中身を推測するような高度さを持っていると考えます。
17ページにわたる技術文書や、法的な説明もすでに公開されており、Google AI Studioが使えるユーザにとっては頼もしい選択肢になりそうです。
https://storage.googleapis.com/deepmind-media/gemma/gemma-2-report.pdf