四种型号
Gemma 4 模型家族
从移动设备到开发者工作站 —— 针对每种部署目标优化的专属型号。
Gemma 4 E2B
移动端 · 边缘端针对边缘设备最大内存效率而设计。激活有效 2B 参数以节省 RAM 和电池。可在无网络环境下完全离线运行。
- Params
- 有效激活参数 2B
- Context
- 128K tokens
- Hardware
- 手机、树莓派、Jetson Nano
原生音频输入近零延迟完全离线运行
Gemma 4 E4B
移动端 · 边缘端更强大的边缘模型,支持音频和视觉理解。与 Android AICore 开发预览版和 ML Kit GenAI Prompt API 深度集成,适用于生产环境。
- Params
- 有效激活参数 4B
- Context
- 128K tokens
- Hardware
- Android、iOS、边缘 GPU
音频 + 视觉AICore 预览ML Kit GenAI API
Gemma 4 26B MoE
工作站 · 全球开源 #6混合专家模型,推理时仅激活 3.8B 参数,实现极高的 tokens-per-second 吞吐量。在 Arena AI 排行榜位列开源模型第 6 名。
- Params
- 总参数 26B,激活 3.8B(MoE)
- Context
- 256K tokens
- Hardware
- 消费级 GPU,单张 H100
超快推理速度低延迟MoE 高效架构
Gemma 4 31B Dense
工作站 · 全球开源 #3极致的原始质量和能力。微调和研究的首选模型。可在单张 80GB H100 GPU 上运行。目前是 Arena AI 文本排行榜全球第 3 名的开源模型。
- Params
- 31B 密集型
- Context
- 256K tokens
- Hardware
- 单张 80GB H100(fp16)
最高质量输出微调首选Arena AI #3
基准测试性能
在行业标准数据集上进行评估,完整基准数据请查看模型卡片。
| 基准测试 | 任务 | 31B Dense | 26B MoE | Gemma 3 27B(上一代) |
|---|---|---|---|---|
| Arena AI(文本) | 人类偏好评分 | 1452 | 1441 | 1365 |
| MMMLU | 多语言问答 | 85.2% | 82.6% | 67.6% |
| MMMU Pro | 多模态推理 | 76.9% | 73.8% | 49.7% |
| AIME 2026 | 数学 | 89.2% | 88.3% | 20.8% |
| LiveCodeBench v6 | 竞技编程 | 80.0% | 77.1% | 29.1% |
| GPQA Diamond | 科学知识 | 84.3% | 82.3% | 42.4% |
| τ2-bench 智能体 | 智能体工具使用 | 86.4% | 85.5% | 6.6% |