四种型号

Gemma 4 模型家族

从移动设备到开发者工作站 —— 针对每种部署目标优化的专属型号。

Gemma 4 E2B

移动端 · 边缘端

针对边缘设备最大内存效率而设计。激活有效 2B 参数以节省 RAM 和电池。可在无网络环境下完全离线运行。

Params
有效激活参数 2B
Context
128K tokens
Hardware
手机、树莓派、Jetson Nano
原生音频输入近零延迟完全离线运行

Gemma 4 E4B

移动端 · 边缘端

更强大的边缘模型,支持音频和视觉理解。与 Android AICore 开发预览版和 ML Kit GenAI Prompt API 深度集成,适用于生产环境。

Params
有效激活参数 4B
Context
128K tokens
Hardware
Android、iOS、边缘 GPU
音频 + 视觉AICore 预览ML Kit GenAI API

Gemma 4 26B MoE

工作站 · 全球开源 #6

混合专家模型,推理时仅激活 3.8B 参数,实现极高的 tokens-per-second 吞吐量。在 Arena AI 排行榜位列开源模型第 6 名。

Params
总参数 26B,激活 3.8B(MoE)
Context
256K tokens
Hardware
消费级 GPU,单张 H100
超快推理速度低延迟MoE 高效架构

Gemma 4 31B Dense

工作站 · 全球开源 #3

极致的原始质量和能力。微调和研究的首选模型。可在单张 80GB H100 GPU 上运行。目前是 Arena AI 文本排行榜全球第 3 名的开源模型。

Params
31B 密集型
Context
256K tokens
Hardware
单张 80GB H100(fp16)
最高质量输出微调首选Arena AI #3

基准测试性能

在行业标准数据集上进行评估,完整基准数据请查看模型卡片。

基准测试任务31B Dense26B MoEGemma 3 27B(上一代)
Arena AI(文本) 人类偏好评分 1452 1441 1365
MMMLU 多语言问答 85.2% 82.6% 67.6%
MMMU Pro 多模态推理 76.9% 73.8% 49.7%
AIME 2026 数学 89.2% 88.3% 20.8%
LiveCodeBench v6 竞技编程 80.0% 77.1% 29.1%
GPQA Diamond 科学知识 84.3% 82.3% 42.4%
τ2-bench 智能体 智能体工具使用 86.4% 85.5% 6.6%