CATEGORYAI Gemma PC レビュー

ローカルLLMサーバを建てて、自宅でAIを動かしてみよう～VRAM 8GBでGemma 4 12Bが動くのか実験してみた～

calendar_today 2026/06/09

update 追記 2026/06/26

約11分で読めます約5,974文字標準本文の文字数から550字/分で換算した読了目安です。

この記事を書いた人シュガッター

全 4 ページ

目次から移動

はじめに

Googleは6月5日、Gemma 4 QAT（Quantization-Aware Training）を発表しました。
QATとは、量子化（要は省メモリ化）を見込んで学習しておくこと。これにより精度を保ちつつVRAM使用量を抑えられるのが特徴です。

モデル自体の説明は当ブログの記事や他媒体にお任せするとして、
今回はこれを使って、古めのゲーミングノートPC(VRAM 8GB)でも、Gemma 4 12Bを動かせるのか実験してみたいと思います。ついでに、Gemma 4 12Bを使ってVS Codeのチャット機能上で動作させるところまで紹介します。

ちなみに、ローカルLLMサーバを立てると何が良いの？という点ですが、後述するVS Codeでも使えるほか、OpenClawなどのAIエージェントも無料で使い放題にできちゃいますし、何より情報漏洩を気にせずAIを使えるのが嬉しいポイントかなと思います。

余談ですが、VRAMが8GBの環境で動かすならGemma4-12BよりQwen3.5-9Bのほうが段違いで良いです。