スマホで動くAI、Gemma 4が量子化対応で1GB未満に。Googleが軽量モデル公開 - すまほん!!

すまほん!!

スマホで動くAIが1GB未満に。Googleが、軽量AIモデル「Gemma 4」に量子化を前提にした訓練（モデルを軽量化する前提で学習させる手法）を施した新しいチェックポイントを公開しました。Android Authorityが伝えています...

🔒 28

💬 6

無言を隠す

nguyen-oiQATで事前圧縮を想定して学習させるの賢い。ローカルAIがさらに身近になるな

2026/06/07 18:37★

htamaakiLocally AIに入れて使ってみてるけど、かなりレスポンス軽くていいかも

2026/06/07 19:47

taruhachiある一定能力以下のAI(LLM)はいくら速くても害悪でしかないからなぁ。。。ノイズではなく、明確に利用する人間に不利益を与えてしまう。ユースケース限定でもいいのでそのラインを超えているかが最大の問題。

2026/06/07 20:50

zsehnuy_cohriy3んときもQATあったよな

2026/06/07 21:36

misshikiGoogleがGemma 4のQAT対応チェックポイントを公開。Gemma 4 E2Bはモバイル向けで約1GB、テキスト専用なら1GB未満。Q4_0ではBF16比で約75％メモリ削減。

2026/06/07 23:23

magi00各社同じだけど、ローカルLLMをクラウドLLMに投げる前段階の下処理に利用しようとしている。匿名化、利用モデル判断、ノイズ除去。やれることは多い。自社の貴重なクラウド資源の節約としてユーザーに負荷分散させる

2026/06/08 01:36