上下文窗口与 Token:你需要知道的

为什么长文档会被截断、为什么 API 按 token 计费、上下文塞满会怎样。

June 16, 2026 AI 1 分钟阅读

和 LLM 打交道,token 和上下文窗口是绕不开的两个概念。

模型按 token 计量,不是按字。粗略换算:

API 计费按 输入 token + 输出 token,所以长 prompt 和长回答都花钱。

模型一次能”看到”的 token 上限(输入+输出之和)。现在常见 128K,部分到 1M。超出会:

记住:上下文不是越多越好,相关、精炼比堆量更有效。

Token