四种型号

Gemma 4 模型家族

从移动设备到开发者工作站 —— 针对每种部署目标优化的专属型号。

Gemma 4 E2B

移动端 · 边缘端

针对边缘设备最大内存效率而设计。激活有效 2B 参数以节省 RAM 和电池。可在无网络环境下完全离线运行。

原生音频输入近零延迟完全离线运行

移动端 · 边缘端

更强大的边缘模型，支持音频和视觉理解。与 Android AICore 开发预览版和 ML Kit GenAI Prompt API 深度集成，适用于生产环境。

音频 + 视觉AICore 预览ML Kit GenAI API

工作站 · 全球开源 #6

混合专家模型，推理时仅激活 3.8B 参数，实现极高的 tokens-per-second 吞吐量。在 Arena AI 排行榜位列开源模型第 6 名。

超快推理速度低延迟MoE 高效架构

工作站 · 全球开源 #3

极致的原始质量和能力。微调和研究的首选模型。可在单张 80GB H100 GPU 上运行。目前是 Arena AI 文本排行榜全球第 3 名的开源模型。

最高质量输出微调首选Arena AI #3

在行业标准数据集上进行评估，完整基准数据请查看模型卡片。

基准测试	任务	31B Dense	26B MoE	Gemma 3 27B（上一代）
Arena AI（文本）	人类偏好评分	1452	1441	1365
MMMLU	多语言问答	85.2%	82.6%	67.6%
MMMU Pro	多模态推理	76.9%	73.8%	49.7%
AIME 2026	数学	89.2%	88.3%	20.8%
LiveCodeBench v6	竞技编程	80.0%	77.1%	29.1%
GPQA Diamond	科学知识	84.3%	82.3%	42.4%
τ2-bench 智能体	智能体工具使用	86.4%	85.5%	6.6%