Chapter 02

选模型:四大模型
语言能力对比

第二章 · 不同模型在英语学习场景下能力差异巨大,选错相当于花钱买错教材。

一、为什么不能"哪个流行用哪个"

到 2026 年中,主流大模型在英语任务上已经各自分化出明显的人格。如果你随便挑一个用,会出现很奇怪的现象:用某模型写的作文每次都"AI 味"很重,用另一个模型解释语法每次都不到位,用第三个模型练口语永远卡顿。这不是你 Prompt 写得不好,是你选错了引擎。

下面是 2026 年 6 月这个时间点对四大主力模型在"英语陪练"场景的直觉判断。AI 行业每三个月会变一次,所以本章观点会随时被新版本刷新——但思路不会过期:用任务匹配模型。

二、四大模型横评

模型 / 当代版本语言风格口语对话写作改稿语法解释价格 (2026.6)
ChatGPT (GPT-4o / GPT-5)地道、活泼、口语化★★★★★ 含 Voice★★★★ 偏 美式★★★★$20/月
Claude (Opus 4 / Sonnet 4.5)谨慎、文学性、长上下文★★★ 仅文本★★★★★ 改稿首选★★★★★$20/月
Gemini (2.5 Pro / Live)百科式、信息丰富★★★★★ Live 模式★★★★★★★★$19.99/月
DeepSeek (V3 / R1)中性、推理强★★ 无原生语音★★★★ 中译英好★★★★ 推理过程透明API 极便宜

ChatGPT —— 口语对练首选

GPT-4o 起,语音模式就是 OpenAI 的杀手锏。它能听你的口音,能用 native 的节奏回答,能在对话中加入笑声、停顿、语气词。GPT-5 (2025 年下半年发布) 进一步把"角色一致性"做强,让你和它扮演面试官、客户、餐厅服务员都不会跳戏。

它的英语风格是地道的美式口语:很多 like, you know, I mean。如果你的目标是托福口语、日常对话、出差英语,首选 ChatGPT。

Claude —— 写作改稿首选

Anthropic 的 Claude (Opus 4 / Sonnet 4.5) 在写作任务上的口碑稳居第一。原因有三:

Claude 的弱点是没有原生语音,需要走 API + 第三方包装才能口语对话。

Gemini —— 信息密度王者

Gemini 2.5 Pro 与 Google 搜索/Workspace 深度集成。当你想问 "这个谚语的来源",Gemini 会附上溯源。Gemini Live 是它的语音模式,2025 年起加入了多语种实时切换,你说一句中文它能直接给英语版本。

Gemini 在解释词源、文化背景、近义词差异方面比另外三个更扎实。如果你做学术英语 (essay / research),Gemini 是不错的搭档。

DeepSeek —— 性价比之王

对中国用户来说,DeepSeek V3 / R1 是最容易获得且最便宜的高质量模型。它在中译英上表现超出预期,因为训练数据里中文密度高。但语音、长上下文、产品体验都不及前三家。最适合的场景是:用 API 跑批量任务 (例如批改一年的写作素材),或者你完全不想付月费的人。

直觉规则

口语用 ChatGPT 或 Gemini Live;写作用 Claude;答疑用 Gemini;批量处理用 DeepSeek API。一个学习者同时订两家是常态。

三、订阅、API 还是 Web

Web 订阅 ($20/月)

适合大部分学习者。配额够用 (Claude Pro 每 5 小时 ~50 条;ChatGPT Plus 每 3 小时 GPT-5 ~80 条)。免去 API key 管理,直接打开就用。

API + 第三方客户端

适合重度用户。可以接到 Anki 自动出卡、接到本地 Whisper 自动转写、可以让多个模型互相评分。代价是要写一些代码,处理 token 计费。常用客户端:Cherry Studio、ChatBox、Open WebUI。

本地模型 (Ollama + Llama 3.x)

2026 年家用 M3 Pro 或 RTX 4070 已经能跑 Llama 3 70B 量化版。优点:不联网、不漏数据、零边际成本。缺点:语言能力比 GPT-5 / Claude 4 差一档,口语对练不如商业模型自然。适合数据敏感场景或者纯练写作。

# 在 Mac 上 30 秒装好本地模型
brew install ollama
ollama pull llama3.1:70b-instruct
ollama run llama3.1:70b-instruct
# 或者更小的型号
ollama run llama3.2:3b
ollama run qwen2.5:14b
AI 陷阱

本地模型的英语水平和云端模型差 1-2 个等级。如果你刚学英语,不要用本地模型练——它的"地道度"会拖累你的语感。等你 B2 之后再考虑。

四、何时用谁?12 个具体场景

场景推荐模型原因
口语对话练 30 分钟ChatGPT Voice / Gemini Live原生语音,延迟低
批改一篇 800 字英语作文Claude Sonnet 4.5保留语气,解释细致
解释 "could have done" 时态Claude / Gemini讲解条理
把整本英文小说总结成 chapter 笔记Claude Opus 4 (200K)长上下文
查 idiom "kick the bucket" 的来源Gemini能附 source
每天自动出 50 道托福听力题DeepSeek API便宜,可批量
面试英语模拟 (Case interview)ChatGPT GPT-5角色一致性强
写商务邮件改稿Claude Sonnet 4.5不抢你的语气
把 PDF 论文翻译成中文Gemini / DeepSeek结构化输出强
背单词出例句任意 (推荐 Claude Haiku)速度快,例句多
语法专项练习题Claude / GPT-5题目质量高
纯随手对话练胆ChatGPT VoiceApp 原生支持

五、本章 Prompt 模板

模板 1 · 让 ChatGPT/Claude 自我介绍

你是一个英语老师。请用 100 字简单介绍你自己:
- 你最适合教我什么(口语/写作/语法/词汇/阅读 选 1-2 个)。
- 你不擅长什么。
- 给我 1 个示范例子,展示你最擅长的能力。
请保持诚实,不要假装全能。

模板 2 · 同一题问两个模型对比

(分别在 ChatGPT 和 Claude 里发同一段 Prompt)

请扮演面试官,用英语问我下面这道行为面试题,
然后等我回答,再给我反馈和改写建议。
题目:Tell me about a time you disagreed with your manager.

模板 3 · API 批量任务(伪代码)

# Python + DeepSeek API 自动批改
from openai import OpenAI
client = OpenAI(api_key="sk-xxx", base_url="https://api.deepseek.com")

essays = [...]  # 你今年写的 50 篇英语
for essay in essays:
    rsp = client.chat.completions.create(
        model="deepseek-chat",
        messages=[
            {"role":"system","content":"You are a strict English teacher."},
            {"role":"user","content": f"Mark this essay with diff format:\n{essay}"}
        ]
    )
    save(rsp.choices[0].message.content)

模板 4 · 本地模型快速口语

# 终端里和 Llama 3.1 70B 用英语对话
ollama run llama3.1:70b-instruct
>>> Let's have a 5-minute English conversation.
    You play a barista at Starbucks. I will order coffee.
    Correct any grammar mistakes I make at the end of the conversation,
    not during. Start.

模板 5 · 让模型自动选模型

这是我接下来 4 周的英语学习计划:
- 每天早上 20 分钟口语
- 每周 1 篇 500 字写作 + 改稿
- 每天 10 道语法选择题
- 每周 1 次 podcast 精听

我目前订阅了 ChatGPT Plus 和 Claude Pro。
请帮我把每个任务分配给"最合适的工具",
并说明为什么。如果你觉得我应该退订其中一个,直接说。
实操建议

第一个月先订 ChatGPT Plus 一家用,熟悉之后再加 Claude Pro。绝对不要一开始就同时开 4 家——你只会全部搁置。