模型与能力

AI 模型是你与 AI 对话时实际工作的"大脑"。不同的模型有不同的能力和特点。

什么是 AI 模型

AI 模型是经过大量数据训练的程序,能够理解和生成人类语言。你可以把它想象成一个拥有海量知识的助手,但每个"助手"的专长和能力各不相同。

模型的核心能力

文本对话

所有模型都具备的基础能力,包括:

  • 回答问题
  • 撰写文章
  • 翻译文本
  • 代码编写

视觉能力 (Vision)

部分模型支持"看图说话":

  • 理解图片内容
  • 分析图表数据
  • 识别文字(OCR)
  • 描述图像细节

支持视觉的模型:GPT 5.2、Claude 4.5 Sonnet、Gemini 3 Pro 等

推理能力 (Reasoning)

高级模型具备的深度思考能力:

  • 解决复杂数学问题
  • 多步骤逻辑推理
  • 代码调试和优化
  • 科学问题分析

推理增强模型:o3、o4-mini(OpenAI)、Claude 4.5 Sonnet 等

工具调用 (Tool Use)

让 AI 能够执行外部操作:

  • 搜索网络信息
  • 执行代码
  • 调用 API
  • 操作文件

注意:工具调用功能需要应用支持,Chatbox 目前支持部分工具功能。

模型参数说明

在使用模型时,你可以调整一些参数来控制输出效果:

Temperature(温度)

控制回答的"创造性"程度:

效果适用场景
0最确定,最保守代码、数学、事实问答
0.7平衡创造与准确日常对话(推荐)
1.0较有创意创意写作、头脑风暴
1.5+高度随机需要意外灵感时

建议:大多数情况使用默认值(0.7 左右)即可。

注意:目前较新的模型(如 o 系列推理模型、部分 Claude 模型等)不支持 Temperature 参数。如果设置后遇到错误,请在 Chatbox 设置中将 Temperature 设为「未设置」。

Top P(核采样)

另一种控制随机性的方式,通常与 Temperature 二选一使用:

  • Top P = 1:考虑所有可能的词
  • Top P = 0.1:只考虑最可能的 10% 的词

建议:保持默认值,除非你有特定需求。

注意:与 Temperature 类似,许多较新的模型也不支持 Top P 参数。如果遇到错误,请将 Top P 设为「未设置」。

Max Tokens(最大输出长度)

限制 AI 回答的最大长度:

  • 较小值(如 500):简短回答
  • 较大值(如 4000):详细回答
  • 不设置:由模型自行决定

注意:这只是上限,AI 会根据问题自然结束回答。

如何选择模型

按使用场景选择

场景推荐模型原因
日常对话GPT 5-mini, Claude Haiku 3.5快速、便宜、够用
写作创作Claude 4.5 Sonnet, GPT 5.2文笔好,理解力强
代码编程Claude 4.5 Sonnet, GPT 5.2, DeepSeek V3代码能力强
复杂推理o3, o4-mini, Claude 4.5 Sonnet深度思考能力
图片理解GPT 5.2, Claude 4.5 Sonnet视觉能力出色
长文档处理Claude 4.5 Sonnet, Gemini 3 Pro超长上下文支持

按预算选择

预算推荐模型
免费本地模型(Ollama + Llama 3)
低预算GPT 5-mini, DeepSeek V3
中等预算GPT 5.2, Claude 4.5 Sonnet
不限预算o3, Claude 4.5 Sonnet, Gemini 3 Pro

模型能力速查

模型文本视觉推理速度价格
GPT 5.2★★★★★★★★★★★★★★★
GPT 5-mini★★★★★★★★★★★★很快
o3★★★★★-★★★★★
Claude 4.5 Sonnet★★★★★★★★★★★★★★★
Claude Haiku 3.5★★★★★★★★★★★很快
Gemini 3 Pro★★★★★★★★★★★★★★
DeepSeek V3★★★★★-★★★★很低