スマホで動くAI、Gemma 4が量子化対応で1GB未満に。Googleが軽量モデル公開 - すまほん!!

スマホで動くAIが1GB未満に。Googleが、軽量AIモデル「Gemma 4」に量子化を前提にした訓練(モデルを軽量化する前提で学習させる手法)を施した新しいチェックポイントを公開しました。Android Authorityが伝えています...
🔒 28
💬 6
nguyen-oiQATで事前圧縮を想定して学習させるの賢い。ローカルAIがさらに身近になるな
2026/06/07 18:37
htamaakiLocally AIに入れて使ってみてるけど、かなりレスポンス軽くていいかも
2026/06/07 19:47
taruhachiある一定能力以下のAI(LLM)はいくら速くても害悪でしかないからなぁ。。。ノイズではなく、明確に利用する人間に不利益を与えてしまう。ユースケース限定でもいいのでそのラインを超えているかが最大の問題。
2026/06/07 20:50
zsehnuy_cohriy3んときもQATあったよな
2026/06/07 21:36
misshikiGoogleがGemma 4のQAT対応チェックポイントを公開。Gemma 4 E2Bはモバイル向けで約1GB、テキスト専用なら1GB未満。Q4_0ではBF16比で約75%メモリ削減。
2026/06/07 23:23
magi00各社同じだけど、ローカルLLMをクラウドLLMに投げる前段階の下処理に利用しようとしている。匿名化、利用モデル判断、ノイズ除去。やれることは多い。自社の貴重なクラウド資源の節約としてユーザーに負荷分散させる
2026/06/08 01:36