谷歌推出最强手机端开源模型Gemma4

发布时间：2026-04-03 分类：AI资讯浏览量：8

Google DeepMind 首席执行官 Demis Hassabis 仅在 X 上发布了一条简短的消息。随后，一个名为 Gemma 4 31B Dense 的中量级模型，以惊人的斜率杀入全球开源前三。

2026年4月2日凌晨，Arena AI 的开源模型排行榜在沉寂数周后突然刷新。这天没有硅谷惯有的盛大发布会，Google 以一种近乎"冷启动"的方式，宣告对开源高地的重夺。

每参数智能

在 Google 的战略里，这场战争的关键词不是"规模"，而是"每参数智能"（Intelligence-per-parameter）。

Gemma 4 E2B 和 E4B 虽然总参数量分别为 5.1B 和 8B，但它们采用了逐层嵌入（PLE）实际激活的"有效参数"仅为 2.3B 和 4.5B，极大降低了手机和笔记本电脑的内存和运行门槛。

在带有原生多模态能力的端侧极小尺寸区间，业界认为 Llama 4 和 Qwen 3.5 目前都没有能与 Gemma 4 E2B/E4B 直接对标的产品。

技术突破

这种"反向进化"的核心支撑是 TurboQuant 压缩算法。这项技术能将 KV 缓存压缩至 3 比特，在 H100 GPU 上实现 8 倍的注意力计算加速，且在 MMLU Pro 等核心指标上实现"零精度损失"。

Gemma 4 31B 的 MMLU Pro 得分达到 85.2%，在 AIME 2026 测试中跑出了 89.2% 的高分。相比之下，前代 27B 模型的这一数字仅为 20.8%。

Apache 2.0 协议

Google 此次不仅交出了权重，还交出了控制权。Gemma 4 全系采用了商业友好的 Apache 2.0 协议，彻底终结了此前版本在商用授权上的扭捏。

通过 AICore 开发者预览版，Gemma 4 E2B 和 E4B 被直接集成进 Android 系统级接口。在 Pixel 手机和 Raspberry Pi 上，新模型的推理速度提升了 4 倍，电池消耗则降低了 60%。

竞争格局

这场竞争形成了微妙的"中式合围"：

DeepSeek 占据了"深思熟虑"的智力高地
Qwen 占据了"开箱即用"的工程低地
Gemma 4 确立了端侧生态位的统治力

未来展望

2026年，端侧 AI 的全球渗透率预测将首次突破 35%。大模型的上半场在云端云雾缭绕，而下半场，正悄无声息地落进每一个人的口袋里。

来源：钛媒体

标签：AI , deepseek , Gemma4 , Google , Qwen , 人工智能 , 开源模型 , 端侧AI

上一篇： 查看详情 +国内最强生图模型Wan2.7-Image来了
下一篇： 查看详情 +飞书 CLI 安装部署与 Claude Code 集成实战指南

Aoyii

谷歌推出最强手机端开源模型Gemma4

每参数智能

技术突破

Apache 2.0 协议

竞争格局

未来展望

站内搜索

Ai快讯

2026 AI Agent落地战：应用层的爆发前夜

OCR与大模型的化学反应：文档智能的下一站

AI编程助手终极对决：Claude Code vs Cursor vs Windsurf

中国开源崛起：GitHub Star背后的中国力量

2026端侧AI爆发年：手机端开源模型大战开打

飞书 CLI 安装部署与 Claude Code 集成实战指南

热门标签

谷歌推出最强手机端开源模型Gemma4

每参数智能

技术突破

Apache 2.0 协议

竞争格局

未来展望

分享：

相关AI工具

example-ai-tool.com

Uni-1 Luma Ai Image

BanaGen: Nano Banana Free AI Image Generator

AI SVG Generator

ClipMake AI

Seedance 2.0 - AI Video Generator

Animate Image AI

万兴智演

相关AI资讯

站内搜索

Ai快讯

2026 AI Agent落地战：应用层的爆发前夜

OCR与大模型的化学反应：文档智能的下一站

AI编程助手终极对决：Claude Code vs Cursor vs Windsurf

中国开源崛起：GitHub Star背后的中国力量

2026端侧AI爆发年：手机端开源模型大战开打

飞书 CLI 安装部署与 Claude Code 集成实战指南

热门标签