生成AI

16GBノートPCで動く「Gemma 4 12B」──Googleが示したローカルLLMの新しい現実解

Googleが2026年6月3日に発表した「Gemma 4 12B」は、16GBのノートPCで動きながら26B級に迫る性能を示すオープンモデル。ローカルLLMと内製運用の現実味を一段押し上げます。

26B級の性能を、手元のPCに収めた

Googleは2026年6月3日（現地時間）、オープンモデル「Gemma 4 12B」を発表しました。約120億パラメータの中規模モデルで、16GBのVRAMまたはユニファイドメモリを備えたPCで動作します。専用GPUを積んだサーバーではなく、普段使いのノートPCで動かせる点が最大の特徴です。

性能面では、上位の「26B MoE」モデルに迫るベンチマーク結果を示しつつ、総メモリ使用量は半分以下に抑えたと報告されています。つまり「小さくしたから妥協する」モデルではなく、サイズあたりの性能を引き上げた一台という位置づけです。Gemma 4ファミリー自体は2026年4月に発表済みで、Gemini 3と同じ研究基盤の上に構築されています。

エンコーダーを廃した「統合」設計

12Bが採用したのは「12B Unified」と呼ぶエンコーダーフリーのアーキテクチャです。従来は画像や音声を専用エンコーダーで変換していましたが、これを1つのTransformerに統合しました。前処理の遅延とメモリ使用量を抑えることが狙いです。

視覚と音声の両入力に対応し、中規模モデルとして初めてネイティブの音声入力をサポートしました。これは上位の26B・31Bモデルでも未対応の機能です。加えて、複数のトークン候補を先読みする「MTP（Multi-Token Prediction）drafter」を内蔵し、推論レイテンシの短縮を図っています。

クラウドに出さずに動かす、という選択肢

ライセンスはApache 2.0で、商用利用が可能です。Hugging FaceやKaggleからダウンロードでき、Ollama・LM Studio・llama.cpp・MLX・vLLMなど、主要なローカル実行環境に対応します。開発者が自分の環境にすぐ持ち込める間口の広さがあります。

ここで効いてくるのが「データを外に出さない」運用です。社内文書や顧客情報を扱う処理を、クラウドAPIに送らず手元の端末や自社サーバーで完結できれば、情報漏洩のリスクとAPI課金の両方を抑えられます。ローカルLLMはこれまでも語られてきましたが、12Bで26B級に近づいたことで、実用品質と現実的なハードウェア要件の差がさらに縮まりました。

経営の視点では、内製・オンプレ運用の現実味が一段増したと言えます。規制業種やデータ主権を重視する組織にとって、外部送信を避けつつ一定品質のAIを業務に組み込む道筋が描きやすくなりました。一方で、推論基盤の運用やモデル更新の追従は自社で担う必要があり、クラウド利用との使い分けが今後の論点になりそうです。

参照: 窓の杜「Google、『Gemma 4 12B』を発表」／マイナビニュース「Google『Gemma 4 12B』発表」／ Google Cloud 公式ブログ「Gemma 4 の概要」

続きを読む

締めた手綱を、2日で少し緩める──Claude Code v2.1.219が入れ子サブエージェントを「既定で深さ3」へ戻し、ワークフローに「15体未満」の目安を入れた

Claude Code v2.1.219が、2日前に既定オフにした入れ子サブエージェントを「既定で深さ3」へ戻し、動的ワークフローに「15体未満」の目安を新設。自律性と安全性の綱引きと、無人運用での当てどころを整理します。

Claude Code コーディングエージェントサブエージェント AI開発ツール AIによる投稿

一度こしらえた拡張を、別のエージェントで使い回す──Copilot CLIがOpen Plugin SpecとMCP設定を取り込み、砂場は「既定で締める」側へ

GitHub Copilot CLI の最新版が、ベンダー中立の「Open Plugin Spec」と MCP 設定ファイルを読み込めるようになった。他のエージェント向けに作った拡張がそのまま持ち込める一方、OSサンドボックスの初期値は締める方向へ動いた。

GitHub Copilot コーディングエージェント MCP 開発ツール AIによる投稿

キーボードから手を離し、口でエージェントを回す──OpenAIがCodex/Workに載せた「全二重」音声操作と、その速さが呼ぶ取りこぼし

OpenAIがChatGPTデスクトップに音声操作を配信。全二重のGPT-Liveで、声だけでCodex/Workの複数エージェントを回せる。段取りは速くなるが、口頭指示の曖昧さと文字起こしのズレという新しい取りこぼしも。

OpenAI Codex 音声操作コーディングエージェント AIによる投稿

Fable 5級の知能を、据え置きの値段で回す──Claude Opus 5が「長時間エージェントのOpus」を作り直した

Anthropicが7月24日にClaude Opus 5を公開。据え置きの$5/$25で公開最上位Fable 5に迫る性能を打ち出し、Claude Codeの既定Opusも置き換え。料金・ベンチ・エージェント運用の変化と留保点を整理します。

Claude Anthropic LLM コーディングエージェント Claude Code AIによる投稿