七牛云大模型推理服务
  1. AI模型接口
七牛云大模型推理服务
  • AI模型接口
    • 七牛云 AI 大模型推理服务
    • 常见问题 FAQ
    • 关键概念与术语表
    • 本文档站使用方式
    • 如何获取API-KEY
    • 模型
      • 模型列表
    • 聊天
      • gemini-3.0-pro-preview
        • gemini-3.0-pro-preview 思考
        • gemini-3.0-pro-preview qfile
      • gemini-2.5-pro
        • gemini-2.5-pro思考
      • openai/gpt-5
        • openai/gpt-5 思考
      • openai/gpt-5.2
        • openai/gpt-5.2 思考
      • openai/gpt-5.2-codex
        • openai/gpt-5.2-codex
      • gemini-2.5-flash
        • gemini-2.5-flash 思考
      • claude-4.5-sonnet
        • claude-4.5-sonnet 思考
      • claude-4.6-opus
        • claude-4.6-opus 思考
      • deepseek/deepseek-v3.2-251201
        • deepseek/deepseek-v3.2-251201 思考
      • deepseek-v3
        • 聊天
      • claude-3.7-sonnet
        • 聊天完成
      • doubao-seed-1.6
        • doubao-seed-1.6
      • qwen3-max-2026-01-23
        • 聊天完成
      • moonshotai/kimi-k2.5
        • 聊天完成
      • 聊天完成
      • Anthropic协议
      • Response API
    • 视频
      • sora-2
        • 创建视频生成任务
        • 查询视频生成状态
        • 视频 Remix
      • sora-2-pro
        • 创建视频生成任务
        • 查询视频生成状态
        • 视频 Remix
      • kling-v2-1
        • 创建视频任务
        • 查询视频生成状态
      • kling-v2-5-turbo
        • 创建视频任务
        • 查询视频生成状态
      • kling-v2-6
        • 创建视频任务
        • 查询视频生成状态
      • kling-v3
        • 创建视频任务
        • 查询视频生成状态
      • kling-video-o1
        • 创建视频任务
        • 查询视频生成状态
      • kling-v3-omni
        • 创建视频任务
        • 查询视频生成状态
      • viduq1
        • 创建文生视频任务
        • 创建参考生视频任务-非主体调用(视频生成)
        • 创建参考生视频任务-主体调用(支持音视频功能)
        • 查询任务状态
        • 查询任务结果
      • viduq2
        • 创建文生视频任务
        • 创建参考生视频任务-非主体调用(视频生成
        • 创建参考生视频任务-主体调用(支持音视频功能)
        • 查询任务状态
        • 查询任务结果
      • viduq2-pro
        • 创建图生视频任务
        • 创建首尾帧生视频任务
        • 查询任务状态
        • 查询任务结果
      • viduq2-turbo
        • 创建图生视频任务
        • 创建首尾帧生视频任务
        • 查询任务状态
        • 查询任务结果
      • Veo
        • 创建视频生成任务
        • 查询视频生成任务
    • 图像生成
      • kling-v1
        • 创建文生图或单图生图任务
        • 查询任务状态
      • kling-v1-5
        • 创建文生图或单图生图任务
        • 查询任务状态
      • kling-v2
        • 创建文生图或单图生图任务
        • 创建多图生图任务
        • 查询任务状态
      • kling-v2-new
        • 创建单图生图任务
        • 查询任务状态
      • kling-v2-1
        • 创建文生图或单图生图任务
        • 创建多图生图任务
        • 查询任务状态
      • gemini-2.5-flash-image
        • 对话接口 - 支持文生图、图生图和纯对话
        • 文生图接口 - 根据文本描述生成图像
        • 图生图接口 - 基于输入图像生成新图像
      • gemini-3.0-pro-image-preview
        • 对话接口 - 支持文生图、图生图和纯对话
        • 文生图接口 - 根据文本描述生成图像
        • 图生图接口 - 基于输入图像生成新图像
      • gemini-3.1-flash-image-preview
        • 对话接口 - 支持文生图、图生图和纯对话
        • 文生图接口 - 根据文本描述生成图像
        • 图生图接口 - 基于输入图像生成新图像
      • kling-image-o1
        • 创建图像生成任务
        • 查询图像生成任务
        • 获取结果
    • 文件
      • 创建文件上传任务
      • 查询文件状态
      • 列出用户文件
    • 数据模型
      • 聊天
        • ChatCompletionRequest
        • ChatCompletionRequestMessage
        • MessageContent
        • ImageUrl
        • VideoUrl
        • File
        • FileUrl
        • InputAudio
        • CacheControl
        • ThinkingBlock
        • Image
        • ImageUrlObject
        • ToolObject
        • ToolFunction
        • ToolParameters
        • ToolCall
        • ToolCallFunction
        • FunctionCall
        • ChatTemplateKwargs
        • ThinkType
        • ReasoningType
        • ImageConfig
        • SafetySetting
      • 视频
        • Sora
          • SoraVideoTask
          • SoraVideoTaskRemix
        • kling-v2-1
          • KlingV21CreateRequest
          • KlingV21CreateResponse
          • KlingV21StatusResponse
        • kling-video-o1
          • KlingVideoO1CreateRequest
          • KlingVideoO1CreateResponse
          • KlingVideoO1StatusResponse
        • kling-v2-5-turbo
          • KlingV25TurboCreateRequest
          • KlingV25TurboCreateResponse
          • KlingV25TurboStatusResponse
        • kling-v3-omni
          • KlingV3OmniCreateRequest
        • kling-v3
          • KlingV3CreateRequest
        • kling-v2-6
          • KlingV26CreateRequest
          • KlingV26CreateResponse
          • KlingV26VideoStatusResponse
        • Veo
          • CreateVideoGenerationRequest
          • Instance
          • ImageInput
          • LastFrameInput
          • VideoInput
          • ReferenceImage
          • Parameters
          • CreateVideoGenerationResponse
          • VideoGenerationJobInfo
          • VideoGenerationData
          • VideoResult
          • ErrorResponse
        • VideoCreateResponse
        • VideoStatusResponse
        • Veo31ImageToVideoInput
        • Veo31ImageToVideoOutput
        • File
      • 图像生成
        • kling-v1
          • KlingV1CreateImageRequest
          • KlingV1EditImageRequest
        • kling-v1-5
          • KlingV15CreateImageRequest
        • kling-v2
          • KlingV2CreateImageRequest
          • KlingV2EditImageRequest
        • kling-v2-new
          • KlingV2NewCreateImageRequest
        • kling-v2-1
          • KlingV21CreateImageRequest
          • KlingV21EditImageRequest
        • gemini-2.5-flash-image
          • Gemini25FlashImageChatCompletionRequest
          • Gemini25FlashImageGenerationRequest
          • Gemini25FlashImageEditRequest
          • Gemini25FlashImageConfig
        • gemini-3.0-pro-image-preview
          • Gemini30ProImageChatCompletionRequest
          • Gemini30ProImageGenerationRequest
          • Gemini30ProImageEditRequest
          • Gemini30ProImageConfig
        • KlingImageTaskResponse
        • KlingImageTaskStatusResponse
        • ChatMessage
        • ChatCompletionResponse
        • ImageGenerationResponse
        • FalOmniImageRequest
        • Gemini31FlashImageChatCompletionRequest
        • CreateOmniImageResponse
        • Gemini31FlashImageGenerationRequest
        • ImageTaskInfoResponse
        • Gemini31FlashImageEditRequest
        • Gemini31FlashImageConfig
      • CreateFileRequest
      • QueueStatus
      • FileResponse
      • FileListResponse
      • FileDeleteResponse
      • ChatMessage
      • KodoSource
      • ChatCompletionResponse
      • FileError
      • ImageGenerationResponse
      • ErrorResponse
  • 管理接口
    • 管理接口的认证方式
    • API Key 管理
      • 批量创建 API Key
    • 日志导出
      • 导出请求日志
      • 导出请求日志为文件
    • 数据模型
      • StatLogOKResp
      • BatchCreateApiKeysRequest
      • StatLogResp
      • ErrorResponse
      • BatchCreateApiKeysSuccessResponse
      • BatchCreateApiKeysData
      • ApiKeyInfo
      • ErrorDetail
  1. AI模型接口

常见问题 FAQ

❓

常见问题解答#

汇总用户最关心的问题,快速找到答案

🚀 入门使用#

如何开始使用七牛云 AI 服务?#

开始使用非常简单,只需 4 个步骤:
步骤1:注册账号
访问 七牛云官网
点击"注册"按钮,填写基本信息
验证邮箱或手机号
步骤2:实名认证(可选)
个人用户:提供身份证信息
企业用户:提供营业执照等资料
认证后可享受更高配额
步骤3:获取 API 密钥
登录控制台
进入"密钥管理"页面
创建新的 API Key:如何获取API-KEY
步骤4:开始调用
参考文档示例代码
或直接使用在线对话功能体验
提示
新用户注册即送免费额度,可以先体验再决定是否购买资源包!

我不懂编程,能使用七牛云 AI 吗?#

当然可以! 七牛云 AI 提供多种使用方式:

✅ 无需编程#

在线对话:直接在网页使用,像聊天一样简单
第三方客户端:使用 ChatBox、Cherry Studio 等工具
预设模板:选择场景模板,一键使用

💻 懂编程更好#

API 集成:将 AI 集成到自己的应用
自定义开发:打造专属 AI 助手
批量处理:自动化处理大量任务

免费额度有多少?能用多久?#

免费额度说明:
✓ 新用户注册即可获得免费 Token 额度
✓ 具体额度以官网最新活动为准
✓ 免费额度通常有有效期限制(如30天)
✓ 额度用完后需购买资源包或按量付费
能用多久取决于:
使用频率:每天使用几次还是几百次
对话长度:简单问答还是长文档生成
模型选择:不同模型消耗 Token 不同
💡
参考示例:如果每天进行 10 次简单对话(每次约 100 Token),免费额度可能够使用数周到一个月。

支持哪些 AI 模型?#

七牛云提供丰富的模型选择:
模型系列代表模型特点
Claude 系列Claude opus 4.5推理能力强、上下文窗口大
Kimi 系列Kimi超长上下文、中文优化
DeepSeek 系列DeepSeek性价比高、编程能力强
通义千问Qwen多模态、中文理解好
豆包系列Doubao响应快、成本低
智谱 AIGLM 4.7多模态、工具调用
MinimaxMinimax M2创意生成、对话能力强
开源模型GPT-OSS-120b/20b开源可控、自由度高
检查
模型库持续更新,更多模型即将上线!

💰 计费与定价#

如何计费?收费标准是什么?#

七牛云提供 两种计费方式:

方式一:按量计费#

📊 计费原理
根据实际使用的 Token 数量收费
💡 计费公式
费用 = 输入Token数 × 输入单价 + 输出Token数 × 输出单价
✓ 适合人群
使用量不稳定的用户
初次试用的用户
追求灵活性的用户

方式二:资源包#

📦 购买方式
预先购买一定量的指定模型的 Token 额度,享受折扣
✓ 适合人群
使用频率高的用户
追求性价比的用户
有稳定使用需求的企业
提示
选择建议:
新用户或不确定使用量 → 先用按量计费
确定长期使用 → 购买资源包更划算

Token 怎么计算?1万 Token 大概是多少字?#

Token 计算规则#

语言类型计算方式示例
中文通常 1-2 个汉字 = 1 个 Token"今天天气很好" ≈ 6 个 Token
英文通常 1 个单词 = 1-2 个 Token"Hello World" ≈ 2 个 Token

1万 Token 大约相当于#

内容类型大约字数/内容量
中文文本7,000 - 10,000 字
英文文本5,000 - 7,500 单词
小说约 15-20 页(A4纸)
代码约 400-600 行代码
💡
举例:一次包含 100 字问题和 500 字回答的对话,大约消耗 600-800 个 Token。

资源包用完了怎么办?#

有 3 种处理方式:
方式说明特点
方式1:购买新资源包继续享受折扣优惠价格✓ 推荐
方式2:自动转按量计费资源包用完后自动切换无需操作
方式3:暂停使用等待下次购买后继续服务会暂停
警告
建议在资源包快用完时提前续费,避免服务中断!

不同模型的价格一样吗?#

不一样! 不同模型的定价不同:
价格差异原因:
💰 模型成本:参数量越大的模型,计算成本越高
🎯 能力差异:能力更强的模型通常价格更高
🌍 来源不同:国际模型和国产模型定价策略不同
📊 市场定位:高端模型 vs 经济型模型
一般规律:
最贵:Claude、GPT 等顶级模型
中等:Kimi、通义千问等主流模型
经济:DeepSeek、豆包等性价比模型
最便宜:开源小模型
提示
建议:根据任务复杂度选择合适的模型
简单任务(如分类、摘要)→ 使用经济型模型
复杂任务(如深度推理、代码生成)→ 使用高端模型
具体模型价格请在 AI 大模型广场 查看

🔒 安全与隐私#

我的数据安全吗?会被用来训练模型吗?#

✅ 数据安全保障#

🔒 端到端加密
所有数据传输采用 HTTPS 加密,防止中间人攻击
🚫 不存储敏感数据
七牛云不会存储您的对话内容和敏感信息
📝 完整审计日志
所有 API 调用都有详细日志,可追溯查询
⚖️ 合规认证
符合数据安全和隐私保护相关法律法规
危险
明确承诺:您通过七牛云 AI 服务提交的数据 不会被用于训练模型!

API 密钥泄露了怎么办?#

⚠️ 立即采取以下措施:
步骤1:立即禁用泄露的密钥
登录控制台 → 密钥管理 → 禁用或删除该密钥
步骤2:生成新的密钥
创建新的 API Key,更新到您的应用程序中
步骤3:检查用量记录
查看是否有异常调用,评估损失
步骤4:联系客服
如发现异常扣费,及时联系技术支持
预防措施:
✓ 不要将 API Key 硬编码在代码中
✓ 不要将 API Key 上传到公开的 Git 仓库
✓ 使用环境变量或配置文件存储密钥
✓ 定期轮换密钥
✓ 为不同项目使用不同的密钥

⚙️ 技术问题#


API 调用速度慢怎么办?#

可能的原因和解决方案#

原因1:网络延迟
服务器距离较远导致延迟高
解决方案:
选择就近的服务区域
检查本地网络质量
原因2:输入内容过长
上下文或输入文本太长导致处理慢
解决方案:
精简输入内容,去除无关信息
使用摘要功能压缩长文本
分批处理大量数据
原因3:模型计算复杂
使用的模型参数量大,计算时间长
解决方案:
针对简单任务使用轻量级模型
使用流式输出获得更快的首字响应
调整 max_tokens 参数限制输出长度
原因4:高峰时段拥堵
使用高峰期请求排队
解决方案:
错峰使用
联系客服升级为企业专属资源
使用异步调用方式
提示
如果以上方法都无法解决,请联系技术支持进行诊断!

兼容 OpenAI API 是什么意思?#

通俗解释:
"兼容 OpenAI API" 意味着如果您之前使用过 OpenAI 的服务(如 ChatGPT API),可以 无缝切换 到七牛云,几乎不需要修改代码!

实际优势#

✅ 迁移成本低:只需修改 API 地址和密钥
✅ 学习成本低:使用相同的文档和示例
✅ 生态丰富:可以使用 OpenAI 的第三方工具

切换示例#

:::

🎯 应用场景#

可以用于商业项目吗?#

✅ 完全可以!#

七牛云 AI 服务 支持商业使用,您可以将其集成到各类商业产品和服务中。

常见商业应用场景#

💼 企业内部系统
智能客服系统
知识库问答
文档自动生成
数据分析助手
🌐 面向用户的产品
AI 写作助手
智能教育平台
内容创作工具
聊天机器人
🛍️ 电商与营销
商品描述生成
个性化推荐
营销文案撰写
用户评论分析
🏥 专业服务
法律文书助手
医疗咨询辅助
金融分析工具
翻译服务
警告
注意事项:
遵守服务协议和使用条款
不得用于违法违规用途
某些行业(如医疗、金融)需注意合规要求
AI 生成内容建议人工审核后再发布

AI 生成的内容版权归谁?#

版权归属#

✓ 您拥有生成内容的使用权
可以自由使用、修改、商业化 AI 生成的内容
ℹ️ AI 生成内容的版权较复杂
根据不同国家/地区法律,AI 生成内容的版权归属尚无统一定论
⚠️ 建议进行人工审核和修改
对 AI 生成的内容进行适当修改,增强独创性
提示
最佳实践:
1.
AI 生成内容作为创作辅助,而非直接使用
2.
对重要内容进行人工审核和润色
3.
在关键商业场景咨询专业法律意见
4.
标注内容由 AI 辅助生成(在必要时)

能处理实时数据吗?#

✅ 支持的实时场景#

实时对话:支持流式输出,边生成边返回
联网搜索:通过 MCP 工具获取实时网络信息
API 数据:调用外部 API 获取实时数据(通过网络搜索)
实时分析:对实时传入的数据进行分析处理

⚠️ 有限制的场景#

模型知识截止日期:模型的训练数据有时间限制(如2024年)
未配置工具:如果没有配置相应的 MCP 工具,无法主动获取外部实时数据
专有数据库:无法直接访问您的私有数据库(需要通过工具配置)
解决方案:
使用 联网搜索 功能获取最新信息
通过 MCP 协议 连接实时数据源
在 Prompt 中提供 实时数据作为上下文
💡
示例:要让 AI 分析今天的股票价格,可以先通过 API 获取实时股价数据,然后在 Prompt 中提供给 AI 进行分析。

🆘 故障排查#

API 调用返回错误怎么办?#

常见错误及解决方法#

错误 401: Unauthorized(未授权)
原因:API 密钥错误或已失效
解决方法:
✓ 检查 API Key 是否正确
✓ 确认密钥未被禁用或删除
✓ 重新生成密钥并更新
错误 429: Too Many Requests(请求过多)
原因:超过请求频率限制
解决方法:
✓ 降低请求频率
✓ 实现请求重试机制(指数退避)
✓ 联系客服提升配额
错误 400: Bad Request(错误请求)
原因:请求参数格式错误
解决方法:
✓ 检查 JSON 格式是否正确
✓ 确认必填参数是否完整
✓ 参考 API 文档核对参数类型
错误 500: Internal Server Error(服务器错误)
原因:服务器内部错误
解决方法:
✓ 稍后重试
✓ 检查服务状态页面
✓ 如持续出现,联系技术支持
错误 402: Payment Required(余额不足)
原因:账户余额或资源包不足
解决方法:
✓ 充值账户或购买资源包
✓ 检查费用明细
提示
遇到无法解决的错误,请保存完整的错误信息和请求日志,联系技术支持获得帮助!

为什么 AI 的回答不准确?#

可能的原因和改进方法#

原因1:Prompt 不够清晰
类型示例
❌ 模糊的 Prompt"写点东西"
✅ 清晰的 Prompt"请写一篇 500 字的产品介绍,产品是智能手表,面向年轻人群"
原因2:缺少上下文信息
AI 缺乏必要的背景知识
改进方法:
✓ 在 Prompt 中提供充足的背景信息
✓ 上传相关文档作为参考
✓ 使用多轮对话逐步补充信息
原因3:模型能力限制
使用的模型不适合当前任务
改进方法:
✓ 复杂任务使用更强大的模型(如 Claude 4.5)
✓ 尝试不同模型并对比效果
原因4:训练数据截止日期
模型不了解最新信息
改进方法:
✓ 使用联网搜索功能
✓ 在 Prompt 中提供最新数据
✓ 明确告知 AI 需要最新信息
💡
技巧:如果回答不满意,可以要求 AI "再想想" 或 "重新回答",有时会得到更好的结果!

如何联系技术支持?#

多种联系方式,随时为您服务#

📝 工单系统
推荐方式,响应时间快
登录控制台 → 提交工单
https://support.qiniu.com/tickets/new
💬 在线客服
工作时间实时响应
官网右下角聊天窗口
📖 文档中心
自助查找解决方案
https://developer.qiniu.com/aitokenapi
🏢 企业专属
企业客户专属通道
联系您的客户经理
信息
提交问题时,请提供:
详细的问题描述
错误信息截图或日志
复现步骤
使用的模型和参数
账户信息(不要包含密钥)
这将帮助我们更快地解决您的问题!

📌 其他问题#

有使用限制吗?#

存在以下限制:
限制类型说明如何提升
请求频率(QPS)每秒请求数限制联系客服提升
上下文长度单次输入的最大 Token 数使用支持更长上下文的模型
并发连接数同时进行的请求数量联系客服提升配额
输出长度单次生成的最大 Token 数通过参数配置(max_tokens)
内容限制禁止违法违规内容无法提升
提示
个人用户 vs 企业用户:
个人用户有基础配额
企业用户可申请更高配额
大规模使用建议联系商务洽谈专属方案

支持批量处理吗?#

✅ 支持!#

七牛云 AI 提供批量处理能力,适合大规模数据处理场景。
批量处理方式:
方式1:循环调用 API
在代码中循环处理多个请求
✓ 简单易实现 ⚠️ 注意频率限制
方式2:批量 API
一次请求处理多个数据
✓ 效率更高 ✓ 成本更低
使用方式参考:https://developer.qiniu.com/aitokenapi/12964/ai-batch-inference-api
方式3:企业定制方案
联系商务定制批量处理方案
✓ 专属配额 ✓ 优先处理
适用场景:
批量文档翻译
大量数据分类标注
批量内容审核
海量文本摘要生成

可以离线使用吗?#

❌ 云端服务不支持离线使用#

七牛云 AI 是基于云端的推理服务,需要通过互联网访问。

总结#

💡

还有疑问?#

本 FAQ 涵盖了七牛云 AI 大模型推理服务的常见问题。如果您有其他疑问:
📖 查阅文档 - https://developer.qiniu.com/aitokenapi
💬 联系客服 - https://support.qiniu.com/tickets/new
🎯
七牛云 AI 团队致力于为您提供优质的 AI 服务和技术支持!
开始使用七牛云 AI →
修改于 2025-12-29 01:51:43
上一页
七牛云 AI 大模型推理服务
下一页
关键概念与术语表
Built with