七牛云大模型推理服务
  1. AI模型接口
七牛云大模型推理服务
  • AI模型接口
    • 七牛云 AI 大模型推理服务
    • 常见问题 FAQ
    • 关键概念与术语表
    • 本文档站使用方式
    • 如何获取API-KEY
    • 模型
      • 模型列表
    • 聊天
      • gemini-3.0-pro-preview
        • gemini-3.0-pro-preview 思考
        • gemini-3.0-pro-preview qfile
      • gemini-2.5-pro
        • gemini-2.5-pro思考
      • openai/gpt-5
        • openai/gpt-5 思考
      • openai/gpt-5.2
        • openai/gpt-5.2 思考
      • openai/gpt-5.2-codex
        • openai/gpt-5.2-codex
      • gemini-2.5-flash
        • gemini-2.5-flash 思考
      • claude-4.5-sonnet
        • claude-4.5-sonnet 思考
      • claude-4.6-opus
        • claude-4.6-opus 思考
      • deepseek/deepseek-v3.2-251201
        • deepseek/deepseek-v3.2-251201 思考
      • deepseek-v3
        • 聊天
      • claude-3.7-sonnet
        • 聊天完成
      • doubao-seed-1.6
        • doubao-seed-1.6
      • qwen3-max-2026-01-23
        • 聊天完成
      • moonshotai/kimi-k2.5
        • 聊天完成
      • 聊天完成
      • Anthropic协议
      • Response API
    • 视频
      • sora-2
        • 创建视频生成任务
        • 查询视频生成状态
        • 视频 Remix
      • sora-2-pro
        • 创建视频生成任务
        • 查询视频生成状态
        • 视频 Remix
      • kling-v2-1
        • 创建视频任务
        • 查询视频生成状态
      • kling-v2-5-turbo
        • 创建视频任务
        • 查询视频生成状态
      • kling-v2-6
        • 创建视频任务
        • 查询视频生成状态
      • kling-v3
        • 创建视频任务
        • 查询视频生成状态
      • kling-video-o1
        • 创建视频任务
        • 查询视频生成状态
      • kling-v3-omni
        • 创建视频任务
        • 查询视频生成状态
      • viduq1
        • 创建文生视频任务
        • 创建参考生视频任务-非主体调用(视频生成)
        • 创建参考生视频任务-主体调用(支持音视频功能)
        • 查询任务状态
        • 查询任务结果
      • viduq2
        • 创建文生视频任务
        • 创建参考生视频任务-非主体调用(视频生成
        • 创建参考生视频任务-主体调用(支持音视频功能)
        • 查询任务状态
        • 查询任务结果
      • viduq2-pro
        • 创建图生视频任务
        • 创建首尾帧生视频任务
        • 查询任务状态
        • 查询任务结果
      • viduq2-turbo
        • 创建图生视频任务
        • 创建首尾帧生视频任务
        • 查询任务状态
        • 查询任务结果
      • Veo
        • 创建视频生成任务
        • 查询视频生成任务
    • 图像生成
      • kling-v1
        • 创建文生图或单图生图任务
        • 查询任务状态
      • kling-v1-5
        • 创建文生图或单图生图任务
        • 查询任务状态
      • kling-v2
        • 创建文生图或单图生图任务
        • 创建多图生图任务
        • 查询任务状态
      • kling-v2-new
        • 创建单图生图任务
        • 查询任务状态
      • kling-v2-1
        • 创建文生图或单图生图任务
        • 创建多图生图任务
        • 查询任务状态
      • gemini-2.5-flash-image
        • 对话接口 - 支持文生图、图生图和纯对话
        • 文生图接口 - 根据文本描述生成图像
        • 图生图接口 - 基于输入图像生成新图像
      • gemini-3.0-pro-image-preview
        • 对话接口 - 支持文生图、图生图和纯对话
        • 文生图接口 - 根据文本描述生成图像
        • 图生图接口 - 基于输入图像生成新图像
      • gemini-3.1-flash-image-preview
        • 对话接口 - 支持文生图、图生图和纯对话
        • 文生图接口 - 根据文本描述生成图像
        • 图生图接口 - 基于输入图像生成新图像
      • kling-image-o1
        • 创建图像生成任务
        • 查询图像生成任务
        • 获取结果
    • 文件
      • 创建文件上传任务
      • 查询文件状态
      • 列出用户文件
    • 数据模型
      • 聊天
        • ChatCompletionRequest
        • ChatCompletionRequestMessage
        • MessageContent
        • ImageUrl
        • VideoUrl
        • File
        • FileUrl
        • InputAudio
        • CacheControl
        • ThinkingBlock
        • Image
        • ImageUrlObject
        • ToolObject
        • ToolFunction
        • ToolParameters
        • ToolCall
        • ToolCallFunction
        • FunctionCall
        • ChatTemplateKwargs
        • ThinkType
        • ReasoningType
        • ImageConfig
        • SafetySetting
      • 视频
        • Sora
          • SoraVideoTask
          • SoraVideoTaskRemix
        • kling-v2-1
          • KlingV21CreateRequest
          • KlingV21CreateResponse
          • KlingV21StatusResponse
        • kling-video-o1
          • KlingVideoO1CreateRequest
          • KlingVideoO1CreateResponse
          • KlingVideoO1StatusResponse
        • kling-v2-5-turbo
          • KlingV25TurboCreateRequest
          • KlingV25TurboCreateResponse
          • KlingV25TurboStatusResponse
        • kling-v3-omni
          • KlingV3OmniCreateRequest
        • kling-v3
          • KlingV3CreateRequest
        • kling-v2-6
          • KlingV26CreateRequest
          • KlingV26CreateResponse
          • KlingV26VideoStatusResponse
        • Veo
          • CreateVideoGenerationRequest
          • Instance
          • ImageInput
          • LastFrameInput
          • VideoInput
          • ReferenceImage
          • Parameters
          • CreateVideoGenerationResponse
          • VideoGenerationJobInfo
          • VideoGenerationData
          • VideoResult
          • ErrorResponse
        • VideoCreateResponse
        • VideoStatusResponse
        • Veo31ImageToVideoInput
        • Veo31ImageToVideoOutput
        • File
      • 图像生成
        • kling-v1
          • KlingV1CreateImageRequest
          • KlingV1EditImageRequest
        • kling-v1-5
          • KlingV15CreateImageRequest
        • kling-v2
          • KlingV2CreateImageRequest
          • KlingV2EditImageRequest
        • kling-v2-new
          • KlingV2NewCreateImageRequest
        • kling-v2-1
          • KlingV21CreateImageRequest
          • KlingV21EditImageRequest
        • gemini-2.5-flash-image
          • Gemini25FlashImageChatCompletionRequest
          • Gemini25FlashImageGenerationRequest
          • Gemini25FlashImageEditRequest
          • Gemini25FlashImageConfig
        • gemini-3.0-pro-image-preview
          • Gemini30ProImageChatCompletionRequest
          • Gemini30ProImageGenerationRequest
          • Gemini30ProImageEditRequest
          • Gemini30ProImageConfig
        • KlingImageTaskResponse
        • KlingImageTaskStatusResponse
        • ChatMessage
        • ChatCompletionResponse
        • ImageGenerationResponse
        • FalOmniImageRequest
        • Gemini31FlashImageChatCompletionRequest
        • CreateOmniImageResponse
        • Gemini31FlashImageGenerationRequest
        • ImageTaskInfoResponse
        • Gemini31FlashImageEditRequest
        • Gemini31FlashImageConfig
      • CreateFileRequest
      • QueueStatus
      • FileResponse
      • FileListResponse
      • FileDeleteResponse
      • ChatMessage
      • KodoSource
      • ChatCompletionResponse
      • FileError
      • ImageGenerationResponse
      • ErrorResponse
  • 管理接口
    • 管理接口的认证方式
    • API Key 管理
      • 批量创建 API Key
    • 日志导出
      • 导出请求日志
      • 导出请求日志为文件
    • 数据模型
      • StatLogOKResp
      • BatchCreateApiKeysRequest
      • StatLogResp
      • ErrorResponse
      • BatchCreateApiKeysSuccessResponse
      • BatchCreateApiKeysData
      • ApiKeyInfo
      • ErrorDetail
  1. AI模型接口

关键概念与术语表

📚

关键概念与术语表#

帮助您快速理解 AI 大模型相关的专业术语
提示
本文档采用通俗易懂的语言解释各类技术术语,即使没有技术背景也能轻松理解。

核心概念#

🤖 大模型(Large Language Model, LLM)#

💡
通俗解释:大模型就像一个"超级聪明的AI大脑",通过学习海量的文本数据,能够理解和生成人类语言,完成各种智能任务。
大模型的特点:
✓ 规模庞大:包含数十亿甚至数万亿个参数(可以理解为"知识点")
✓ 能力全面:可以处理文本、代码、翻译、问答等多种任务
✓ 持续学习:通过训练不断提升智能水平
常见的大模型:GPT、Claude、Kimi、通义千问、文心一言等

🔤 Token(令牌)#

📊
通俗解释:Token 是 AI 处理文本的最小单位,类似于文本的"计量单位"。

Token 计算方式#

语言Token 计算方式示例
中文通常 1-2 个汉字 = 1 个 Token"你好世界" ≈ 4 个 Token
英文通常 1 个单词 = 1-2 个 Token"Hello World" ≈ 2 个 Token
代码根据字符和结构计算print("Hello") ≈ 4-5 个 Token
信息
为什么要了解 Token?
因为 AI 服务的计费通常基于 Token 使用量。输入和输出的文本越长,消耗的 Token 越多,费用也就越高。
实际例子:如果您向 AI 提问"今天天气怎么样?"(约8个Token),AI 回答"今天天气晴朗,气温25度,适合外出。"(约20个Token),那么这次对话总共消耗约 28 个 Token。

🔗 API(应用程序接口)#

🔌
通俗解释:API 是软件之间沟通的"桥梁",让您的应用程序能够调用七牛云的 AI 服务。

类比理解#

🏪 API 就像餐厅的"菜单"
您(应用程序)通过菜单(API)向厨房(AI服务)点餐(发送请求),然后获得菜品(AI响应)。

实际作用#

通过 API,您可以在自己的网站、APP 或软件中集成 AI 功能,而无需自己开发复杂的 AI 系统。
七牛云支持的 API 类型:
OpenAI API:兼容 OpenAI 的接口标准
Anthropic API:兼容 Anthropic(Claude)的接口标准
标准 REST API:通用的网络接口协议

🧠 推理(Inference)#

🔮
通俗解释:推理是指 AI 模型根据输入的问题或指令,经过"思考"后给出答案的过程。

推理过程示例#

问题:"帮我写一封感谢信"
1.
输入阶段 → 用户提交问题
2.
推理阶段 → AI 分析请求,生成内容
3.
输出阶段 → 生成完整的感谢信文本
备注
推理服务 就是提供这种 AI"思考"和"回答"能力的云端服务。

🎯 Prompt(提示词)#

✍
通俗解释:Prompt 是您给 AI 的"指令"或"问题",也就是您输入的内容。
Prompt 的质量直接影响 AI 的回答质量!

对比示例#

类型示例评价
❌ 不好的 Prompt"写点东西"太模糊,AI 不知道写什么
✅ 好的 Prompt"请帮我写一篇300字的产品介绍,产品是智能手表,重点突出健康监测功能"清晰明确,AI 能准确理解需求
提示
撰写好 Prompt 的技巧:
明确任务目标
提供足够的背景信息
指定输出格式或风格
给出具体的约束条件

高级特性#

🤖 MCP(Model Context Protocol,模型上下文协议)#

🔧
通俗解释:MCP 是一种让 AI 获得"超能力"的技术,通过它可以为 AI 添加各种工具能力。

类比理解#

如果把 AI 比作一个聪明的助手,那么 MCP 就是给这个助手配备各种"工具箱":
🔍 搜索工具箱:让 AI 能够上网查找最新信息
📊 数据工具箱:让 AI 能够分析和处理数据
📁 文件工具箱:让 AI 能够读取和编辑文件
📧 通讯工具箱:让 AI 能够发送邮件或消息
实际应用场景:
AI 可以实时获取股票价格(使用金融数据工具)
AI 可以帮您预订餐厅(使用预订系统工具)
AI 可以生成并保存文档(使用文件处理工具)

🔧 Agent(智能体)#

🤹
通俗解释:Agent 是一个能够自主完成复杂任务的"AI 助手",它不仅能回答问题,还能主动使用工具解决问题。

普通 AI vs Agent 的区别#

对比项普通 AIAgent(智能体)
工作方式被动回答问题✅ 主动执行任务
能力范围文本生成为主✅ 可使用多种工具
任务复杂度单步简单任务✅ 多步复杂任务
自主性需要明确指令✅ 能够自主规划步骤

Agent 工作示例#

任务:"帮我整理上周的销售数据并发送报告给老板"
执行步骤:
1.
从数据库读取上周销售数据
2.
分析数据并生成图表
3.
撰写分析报告
4.
通过邮件发送给老板
5.
✅ 任务完成!

🌐 联网搜索#

🔍
通俗解释:让 AI 能够访问互联网,获取最新的实时信息。

对比示例#

❌ 没有联网功能
问:"今天北京的天气如何?"
答:"抱歉,我无法获取实时天气信息..."
✅ 有联网功能
问:"今天北京的天气如何?"
答:"今天北京晴,气温 15-25℃,空气质量良好。"
适用场景:
查询实时信息(天气、新闻、股票等)
获取最新资料(最新技术文档、政策法规等)
验证事实信息(核对数据、确认消息真伪等)

💭 深度思考(Chain of Thought)#

🧩
通俗解释:让 AI 像人类一样"一步步思考",而不是直接给出答案,从而提高复杂问题的回答质量。

示例对比#

问题:"小明有 15 个苹果,吃了 3 个,又买了 8 个,送给朋友 5 个,他还剩多少个?"
❌ 普通模式
"小明还剩 15 个苹果。"(直接回答,容易出错)
✅ 深度思考模式
让我一步步计算:
1.
初始:15 个苹果
2.
吃了 3 个:15 - 3 = 12 个
3.
买了 8 个:12 + 8 = 20 个
4.
送给朋友 5 个:20 - 5 = 15 个
5.
最终答案:15 个苹果
优势:
减少计算错误
逻辑推理更严谨
答案过程更透明

💬 上下文记忆(Context Memory)#

🧠
通俗解释:AI 能够"记住"之前的对话内容,实现连贯的多轮对话。

对话示例#

第一轮
👤 您:"我想去日本旅游"
🤖 AI:"日本是个美丽的国家!您打算什么时候去呢?"
第二轮
👤 您:"明年春天"
🤖 AI:"春季去日本非常合适,可以欣赏樱花!推荐您去东京、京都和大阪。"
第三轮
👤 您:"需要准备什么?"
🤖 AI:"去日本旅游需要准备:1. 护照和签证 2. 适合春季的衣物 3. 日元现金 4. 翻译软件..."
💡 注意:AI 记住了"去日本"和"明年春天"的上下文信息
应用价值:
更自然的对话体验
无需重复说明背景
支持复杂的多轮交互

计费相关术语#

💰 按量计费#

含义:根据实际使用的资源量(Token 数量)来收费,用多少付多少。
类比:就像水电费一样,用了多少度电就交多少钱,不用就不收费。
优势:
✓ 成本可控,适合使用量不稳定的场景
✓ 无需预付费,降低使用门槛
✓ 灵活扩展,按需使用

📦 资源包#

含义:预先购买一定量的 Token 额度,享受折扣优惠。
类比:就像办理健身卡年卡一样,一次性购买比每次单独付费更优惠。
适合人群:
✓ 使用频率较高的用户
✓ 追求性价比的用户
✓ 有稳定使用需求的企业

🔀 融合 Token#

含义:一种通用的 Token 额度,可以在多个不同的 AI 模型之间共用。七牛云的AI大模型融合资源包 Token 数是以 DeepSeek-V3.1 基准的数量,在使用其他模型时扣减 Token 数将基于不同价格按比例抵扣(即用越贵的模型扣除倍数高、输出上下文比输入更长时扣除倍数高、用越便宜的模型扣除系数越低)。通过统一的抵扣标准,让您能够在不同价位的 AI 模型间自由切换,享受便捷的计费体验。请登录七牛云小程序或主站控制台及时查看 Token 消耗数、请求记录,也可以通过 API 查询 Token 实时用量。
类比:就像充值了一张"通用购物卡",可以在多个商店使用,不局限于某一家。
优势:
✓ 灵活切换不同模型
✓ 避免单一模型额度浪费
✓ 简化账户管理

技术架构术语#

🔐 端到端加密#

🔒
通俗解释:数据在传输过程中全程加密,只有发送方和接收方能看到内容,中间任何人都无法窃取。
保护内容:
API 密钥
用户输入的问题
AI 返回的答案
所有敏感业务数据

📡 REST API#

🌐
通俗解释:REST API 是一种网络通信标准,让不同的软件系统能够通过互联网进行交互。

工作原理(简化版)#

1.
您的应用发送请求 → "请帮我生成一篇文章"
2.
七牛云 AI 服务接收请求并处理
3.
AI 返回响应 → 生成的文章内容
4.
您的应用展示结果给用户
特点:
标准化:遵循统一的规范
简单易用:容易理解和实现
跨平台:支持各种编程语言

📚 SDK(软件开发工具包)#

🛠
通俗解释:SDK 是官方提供的"工具箱",包含了各种现成的代码和工具,让开发者更方便地使用 AI 服务。

对比示例#

❌ 不使用 SDK
需要编写大量代码处理网络请求封装
需要处理数据格式转换
需要实现错误处理逻辑
需要完成认证授权流程
⏱️ 开发时间长,容易出错
✅ 使用 SDK
只需几行代码:
⚡ 快速开发,稳定可靠
支持的语言:Python、Java、JavaScript、Go 等

模型相关术语#

🎛️ 参数(Parameters)#

🔢
通俗解释:参数是构成 AI 模型的"知识单元",参数越多,模型通常越"聪明"。
模型规模参数量能力特点
小模型几亿响应快,成本低,适合简单任务
中模型数十亿平衡性能与成本
大模型数百亿~数万亿能力最强,适合复杂任务
备注
参数越多的模型,通常计算成本也越高,调用费用也相应增加。

🔄 微调(Fine-tuning)#

🎯
通俗解释:在通用大模型的基础上,针对特定领域或任务进行专门训练,使其更擅长处理特定问题。

类比理解#

就像一个全科医生(通用模型),经过专门培训后成为心脏病专家(微调模型),在心脏疾病领域更加专业。
应用场景:
📝 企业客服:训练成专门回答公司产品问题的AI
⚖️ 法律助手:训练成精通法律条文的专业AI
🏥 医疗顾问:训练成熟悉医疗知识的辅助AI

🌡️ 温度(Temperature)#

🎲
通俗解释:温度参数控制 AI 回答的"创意程度"或"随机性"。

温度对比#

温度范围特点适用场景
低温度(0-0.3) 🧊回答稳定、保守、准确数据分析、代码生成
中温度(0.5-0.7) 🌤️回答平衡、自然日常对话、问答
高温度(0.8-1.0) 🔥回答创意、多样、随机创意写作、头脑风暴
修改于 2025-12-26 05:29:48
上一页
常见问题 FAQ
下一页
本文档站使用方式
Built with