谷歌推出最强手机端开源模型Gemma4
分类:AI资讯 浏览量:8
Google DeepMind 首席执行官 Demis Hassabis 仅在 X 上发布了一条简短的消息。随后,一个名为 Gemma 4 31B Dense 的中量级模型,以惊人的斜率杀入全球开源前三。
2026年4月2日凌晨,Arena AI 的开源模型排行榜在沉寂数周后突然刷新。这天没有硅谷惯有的盛大发布会,Google 以一种近乎"冷启动"的方式,宣告对开源高地的重夺。
每参数智能
在 Google 的战略里,这场战争的关键词不是"规模",而是"每参数智能"(Intelligence-per-parameter)。
Gemma 4 E2B 和 E4B 虽然总参数量分别为 5.1B 和 8B,但它们采用了逐层嵌入(PLE)实际激活的"有效参数"仅为 2.3B 和 4.5B,极大降低了手机和笔记本电脑的内存和运行门槛。
在带有原生多模态能力的端侧极小尺寸区间,业界认为 Llama 4 和 Qwen 3.5 目前都没有能与 Gemma 4 E2B/E4B 直接对标的产品。
技术突破
这种"反向进化"的核心支撑是 TurboQuant 压缩算法。这项技术能将 KV 缓存压缩至 3 比特,在 H100 GPU 上实现 8 倍的注意力计算加速,且在 MMLU Pro 等核心指标上实现"零精度损失"。
Gemma 4 31B 的 MMLU Pro 得分达到 85.2%,在 AIME 2026 测试中跑出了 89.2% 的高分。相比之下,前代 27B 模型的这一数字仅为 20.8%。
Apache 2.0 协议
Google 此次不仅交出了权重,还交出了控制权。Gemma 4 全系采用了商业友好的 Apache 2.0 协议,彻底终结了此前版本在商用授权上的扭捏。
通过 AICore 开发者预览版,Gemma 4 E2B 和 E4B 被直接集成进 Android 系统级接口。在 Pixel 手机和 Raspberry Pi 上,新模型的推理速度提升了 4 倍,电池消耗则降低了 60%。
竞争格局
这场竞争形成了微妙的"中式合围":
- DeepSeek 占据了"深思熟虑"的智力高地
- Qwen 占据了"开箱即用"的工程低地
- Gemma 4 确立了端侧生态位的统治力
未来展望
2026年,端侧 AI 的全球渗透率预测将首次突破 35%。大模型的上半场在云端云雾缭绕,而下半场,正悄无声息地落进每一个人的口袋里。
来源:钛媒体