上下文与对话历史

理解上下文的工作原理，可以帮助你更有效地与 AI 对话，并优化使用成本。

什么是上下文窗口

上下文窗口（Context Window）是 AI 模型能够"记住"的对话内容范围。你可以把它想象成 AI 的"短期记忆"。

每个模型都有上下文窗口大小限制，但具体数值会随着模型版本和提供方更新而变化。

可以先按以下规律理解：

如需精确数值，请以对应模型在官方文档或定价页面中的说明为准。

上下文包括：

这是很多用户忽略的重要概念：每次发送消息时，整个上下文都会重新发送给 AI。

假设每轮对话平均 500 Token：

对话轮次	当轮内容	实际发送 Token	累计消耗
第 1 轮	500	500	500
第 2 轮	500	1,000	1,500
第 3 轮	500	1,500	3,000
第 4 轮	500	2,000	5,000
第 5 轮	500	2,500	7,500

可以看到：5 轮对话实际消耗了 7,500 Token，而不是 2,500 Token！

这就是为什么长对话会快速消耗 Token 配额。

Chatbox 允许你设置发送给 AI 的历史消息数量限制。

当满足以下条件时，建议开启新对话：

Chatbox 提供对话分叉功能，你可以：

使用场景：

将重要的背景信息放在系统提示词中，而不是每次都在对话中重复说明：

❌ 每次都说："记住，我是一个 Python 开发者，请用 Python 回答..."

✅ 在系统提示词中设置："你是一个 Python 编程助手，
   所有代码示例都使用 Python 语言。"

如果对话很长但你还想继续，可以让 AI 总结之前的内容：

"请总结一下我们目前讨论的要点，然后我们继续讨论..."

然后开启新对话，将总结作为开场。

可能原因：

可能原因：