七牛云大模型推理服务
模型广场
模型广场
  1. AI模型接口
  • AI模型接口
    • 七牛云 AI 大模型推理服务
    • 常见问题 FAQ
    • 关键概念与术语表
    • 本文档站使用方式
    • 如何获取API-KEY
    • Claude 模型缓存功能使用指南 (Cache Control)
    • 服务接入点
    • 模型
      • 模型列表
    • 聊天
      • 原厂接口
        • 什么是原厂接口
        • bypass Anthropic协议
        • bypass Vertex/Gemini协议
        • bypass Responses协议
      • gemini-3.1-pro-preview
        • gemini-3.1-pro-preview 思考
        • gemini-3.1-pro-preview qfile
      • gemini-2.5-pro
        • gemini-2.5-pro思考
      • openai/gpt-5
        • openai/gpt-5 思考
      • openai/gpt-5.2
        • openai/gpt-5.2 思考
      • openai/gpt-5.2-codex
        • openai/gpt-5.2-codex
      • gemini-2.5-flash
        • gemini-2.5-flash 思考
      • claude-4.5-sonnet
        • claude-4.5-sonnet 思考
      • claude-4.6-opus
        • claude-4.6-opus 思考
      • deepseek/deepseek-v3.2-251201
        • deepseek/deepseek-v3.2-251201 思考
      • deepseek-v3
        • 聊天
      • doubao-seed-1.6
        • doubao-seed-1.6
      • qwen3-max-2026-01-23
        • 聊天完成
      • moonshotai/kimi-k2.5
        • 聊天完成
      • 聊天完成
      • Anthropic协议
    • 视频
      • Webhook
      • sora-2
        • 创建视频生成任务
        • 查询视频生成状态
        • 视频 Remix
      • sora-2-pro
        • 创建视频生成任务
        • 查询视频生成状态
        • 视频 Remix
      • 火山格式
        • bytedance/doubao-seedance-2-0-260128
          • 创建视频生成任务
          • 查询视频生成任务
      • Fal格式
        • bytedance/doubao-seedance-2-0-260128
          • 创建文生视频任务
          • 创建图生视频任务
          • 创建参考生视频任务
          • 查询任务状态
          • 查询任务结果
        • veo-3.1-generate-001
          • 创建文生视频任务
          • 创建首尾帧生视频任务
          • 创建图生视频任务
          • 查询状态
          • 获取结果
        • veo-3.1-fast-generate-001
          • 创建文生视频任务
          • 创建首尾帧生视频任务
          • 创建图生视频任务
          • 查询状态
          • 获取结果
        • vidu
          • viduq1
            • 创建文生视频任务
            • 创建参考生视频任务-非主体调用(视频生成)
            • 创建参考生视频任务-主体调用(支持音视频功能)
            • 查询任务状态
            • 查询任务结果
          • viduq2
            • 创建文生视频任务
            • 创建参考生视频任务-非主体调用(视频生成
            • 创建参考生视频任务-主体调用(支持音视频功能)
            • 查询任务状态
            • 查询任务结果
          • viduq2-pro
            • 创建图生视频任务
            • 创建首尾帧生视频任务
            • 创建参考生视频任务-非主体调用(视频生成)
            • 查询任务状态
            • 查询任务结果
          • viduq2-turbo
            • 创建图生视频任务
            • 创建首尾帧生视频任务
            • 查询任务状态
            • 查询任务结果
          • viduq3-pro
            • 创建图生视频任务
            • 创建文生视频任务
            • 创建首尾帧生视频任务
            • 查询任务状态
            • 查询任务结果
          • viduq3-turbo
            • 创建参考生视频任务
            • 创建图生视频任务
            • 创建文生视频任务
            • 创建首尾帧生视频任务
            • 查询任务状态
            • 查询任务结果
          • viduq3
            • 创建参考生视频任务
            • 查询任务状态
            • 查询任务结果
        • kling
          • kling-v2-5-turbo
            • 文生视频
            • 图生视频
          • kling-v2-6
            • 文生视频
            • 图生视频
            • 动作控制
          • kling-v3
            • 文生视频
            • 图生视频
            • 动作控制
          • kling-video-o1
            • 图生视频
            • 参考生视频
          • kling-v3-omni
            • 文生视频
            • 图生视频
            • 参考生视频
          • 查询任务状态
          • 查询任务结果
      • kling
        • kling-v2-1
          • 创建视频任务
          • 查询视频生成状态
        • kling-v2-5-turbo
          • 创建视频任务
          • 查询视频生成状态
        • kling-v2-6
          • 创建视频任务
          • 查询视频生成状态
        • kling-v3
          • 创建视频任务
          • 查询视频生成状态
        • kling-video-o1
          • 创建视频任务
          • 查询视频生成状态
        • kling-v3-omni
          • 创建视频任务
          • 查询视频生成状态
    • 图像生成
      • kling-v1
        • 创建文生图或单图生图任务
        • 查询任务状态
      • kling-v1-5
        • 创建文生图或单图生图任务
        • 查询任务状态
      • kling-v2
        • 创建文生图或单图生图任务
        • 创建多图生图任务
        • 查询任务状态
      • kling-v2-new
        • 创建单图生图任务
        • 查询任务状态
      • kling-v2-1
        • 创建文生图或单图生图任务
        • 创建多图生图任务
        • 查询任务状态
      • gemini-2.5-flash-image
        • 对话接口 - 支持文生图、图生图和纯对话
        • 文生图接口 - 根据文本描述生成图像
        • 图生图接口 - 基于输入图像生成新图像
      • gemini-3.0-pro-image-preview
        • 对话接口 - 支持文生图、图生图和纯对话
        • 文生图接口 - 根据文本描述生成图像
        • 图生图接口 - 基于输入图像生成新图像
      • gemini-3.1-flash-image-preview
        • 对话接口 - 支持文生图、图生图和纯对话
        • 文生图接口 - 根据文本描述生成图像
        • 图生图接口 - 基于输入图像生成新图像
      • kling-image-o1
        • 创建图像生成任务
        • 查询图像生成任务
        • 获取结果
      • openai/gpt-image-2
        • 文生图
        • 图生图
    • 文件
      • 创建文件上传任务
      • 查询文件状态
      • 列出用户文件
    • 素材
      • 七牛云虚拟人像素材使用指南
      • 素材分组
        • 创建素材分组
        • 查询单个素材分组
        • 查询素材分组列表
        • 更新素材分组
      • 素材
        • 创建素材
        • 查询单个素材
        • 查询素材列表
    • 数据模型
      • 聊天
        • ChatCompletionRequest
        • ChatCompletionRequestMessage
        • MessageContent
        • ImageUrl
        • VideoUrl
        • FileUrl
        • InputAudio
        • CacheControl
        • ThinkingBlock
        • Image
        • ToolObject
        • ToolFunction
        • ToolParameters
        • ToolCall
        • ToolCallFunction
        • FunctionCall
        • ChatTemplateKwargs
        • ThinkType
        • ReasoningType
        • ImageConfig
        • SafetySetting
      • 视频
        • Sora
          • SoraVideoTask
          • SoraVideoTaskRemix
        • kling-v2-1
          • KlingV21CreateRequest
          • KlingV21CreateResponse
          • KlingV21StatusResponse
        • kling-video-o1
          • KlingVideoO1CreateRequest
          • KlingVideoO1CreateResponse
          • KlingVideoO1StatusResponse
        • kling-v2-5-turbo
          • KlingV25TurboCreateRequest
          • KlingV25TurboCreateResponse
          • KlingV25TurboStatusResponse
        • kling-v3-omni
          • KlingV3OmniCreateRequest
        • kling-v3
          • KlingV3CreateRequest
        • kling-v2-6
          • KlingV26CreateRequest
          • KlingV26CreateResponse
          • KlingV26VideoStatusResponse
        • Veo
          • CreateVideoGenerationRequest
          • Instance
          • ImageInput
          • LastFrameInput
          • VideoInput
          • ReferenceImage
          • Parameters
          • CreateVideoGenerationResponse
          • VideoGenerationJobInfo
          • VideoGenerationData
          • VideoResult
          • ErrorResponse
        • VideoCreateResponse
        • VideoStatusResponse
        • File
      • 图像生成
        • kling-v1
          • KlingV1CreateImageRequest
          • KlingV1EditImageRequest
        • kling-v1-5
          • KlingV15CreateImageRequest
        • kling-v2
          • KlingV2CreateImageRequest
          • KlingV2EditImageRequest
        • kling-v2-new
          • KlingV2NewCreateImageRequest
        • kling-v2-1
          • KlingV21CreateImageRequest
          • KlingV21EditImageRequest
        • gemini-2.5-flash-image
          • Gemini25FlashImageChatCompletionRequest
          • Gemini25FlashImageGenerationRequest
          • Gemini25FlashImageEditRequest
          • Gemini25FlashImageConfig
        • gemini-3.0-pro-image-preview
          • Gemini30ProImageChatCompletionRequest
          • Gemini30ProImageGenerationRequest
          • Gemini30ProImageEditRequest
          • Gemini30ProImageConfig
        • KlingImageTaskResponse
        • KlingImageTaskStatusResponse
        • ChatMessage
        • ChatCompletionResponse
        • FalOmniImageRequest
        • Gemini31FlashImageChatCompletionRequest
        • CreateOmniImageResponse
        • Gemini31FlashImageGenerationRequest
        • ImageTaskInfoResponse
        • Gemini31FlashImageEditRequest
        • Gemini31FlashImageConfig
      • CreateFileRequest
      • HappyHorseTextToVideoRequest
      • ViduQ3ReferenceToVideoRequest
      • ContentItem
      • FalSeedanceTextToVideoRequest
      • QueueStatus
      • FalOmniImageRequest
      • MultiPromptItem
      • AssetGroupCreateRequest
      • FileResponse
      • HappyHorseImageToVideoRequest
      • FalSubmitResponse
      • FalSeedanceImageToVideoRequest
      • FalOmniImageElement
      • ElementListItem
      • Veo31FirstLastFrameToVideoInput
      • ToolItem
      • AssetGroupUpdateRequest
      • ReferenceElement
      • HappyHorseReferenceToVideoRequest
      • FalSeedanceReferenceToVideoRequest
      • CreateVideoTaskResponse
      • AssetGroupResponse
      • FileListResponse
      • HappyHorseVideoEditRequest
      • FalStatus
      • KlingV25TurboTextToVideoRequest
      • ApiErrorBody
      • AssetGroupListResponse
      • File
      • ImageUrlObject
      • FileDeleteResponse
      • FalRequestURLs
      • CommonPromptFields
      • KlingV26TextToVideoRequest
      • GetVideoTaskResponse
      • ChatMessage
      • AssetCreateRequest
      • KlingV3TextToVideoRequest
      • AssetResponse
      • KodoSource
      • KlingV3OmniTextToVideoRequest
      • AssetListResponse
      • ErrorResponse
      • KlingV25TurboImageToVideoRequest
      • ChatCompletionResponse
      • Veo31ImageToVideoInput
      • Veo31TextToVideoInput
      • KlingOmniO3TextToVideoRequest
      • KlingV26ImageToVideoRequest
      • KlingV3ImageToVideoRequest
      • ErrorDetail
      • KlingVideoO1ImageToVideoRequest
      • KlingV3OmniImageToVideoRequest
      • FileError
      • KlingOmniO1ImageToVideoRequest
      • KlingVideoO1ReferenceToVideoRequest
      • ImageGenerationResponse
      • KlingOmniO3ImageToVideoRequest
      • KlingV3OmniReferenceToVideoRequest
      • FalLogEntry
      • FalMetrics
      • FalVideoItem
      • FalResultResponse
      • FalStatusResponse
      • FalErrorDetail
      • FalErrorResponse
      • VideoUrlObject
      • KlingOmniO1ReferenceToVideoRequest
      • KlingV26MotionControlRequest
      • KlingOmniO3ReferenceToVideoRequest
      • KlingV3MotionControlRequest
      • AudioUrlObject
      • DraftTaskObject
      • VideoTaskOutputContent
      • FalImageItem
      • VideoTaskToolUsageItem
      • VideoTaskUsage
  • 管理接口
    • 管理接口的认证方式
    • API Key 管理
      • 批量创建 API Key
    • 日志导出
      • 导出请求日志
      • 导出请求日志为文件
    • 数据模型
      • StatLogOKResp
      • BatchCreateApiKeysRequest
      • StatLogResp
      • ErrorResponse
      • BatchCreateApiKeysSuccessResponse
      • BatchCreateApiKeysData
      • ApiKeyInfo
      • ErrorDetail
  1. AI模型接口

服务接入点

七牛云 AI 大模型推理服务的接入点介绍、区域分布及 API 兼容性说明。

服务接入点#

七牛云 AI 大模型推理服务提供多个服务接入点,支持国内外用户就近接入,同时兼容 OpenAI、Anthropic、Vertex/Gemini 等主流 AI 平台的 API 协议,最大程度降低迁移和集成成本。

接入点概览#

服务接入点(Endpoint / Base URL)是所有 API 请求的起始地址。根据您的网络环境和业务所在区域,选择合适的接入点可以获得更低的延迟和更高的稳定性。
区域Base URL说明
国内https://api.qnaigc.com面向中国大陆用户,延迟更低
海外https://api.modelink.ai面向海外用户或需要访问境外模型

国内接入点#

Base URL:https://api.qnaigc.com
适用于中国大陆地区的用户和业务,连接七牛云国内节点,具有更低的网络延迟。大多数场景推荐优先使用此接入点。

海外接入点#

Base URL:https://api.modelink.ai
适用于海外部署的业务或需要通过海外节点访问特定模型的场景。与国内接入点提供完全相同的 API 接口和模型支持。

API 兼容性#

七牛云 AI 大模型推理服务对主流 AI 平台的 API 协议提供广泛兼容,您无需重写代码即可从其他平台迁移。

基础协议:OpenAI Chat Completions#

接口路径: POST /v1/chat/completions
这是服务的核心接口,完全兼容 OpenAI 的 Chat Completions 规范,支持文本对话、流式输出、函数调用等能力,覆盖平台上绝大多数模型(包括 Claude、Gemini、DeepSeek、Qwen 等各厂商模型)。
只需将 base_url 替换为七牛云接入点、api_key 替换为七牛云 API Key,其余代码无需修改:
从 OpenAI 迁移:

原厂直通接口(Bypass)#

Bypass 接口是在基础协议之外提供的补充能力。与 /v1/chat/completions 的统一协议转换不同,bypass 接口将请求直接透传至对应厂商的原生协议,不做格式转换,因此可以使用该厂商 API 的全部原生特性,例如 Anthropic 的 Extended Thinking、Gemini 的 googleSearch 工具等。
两种接入方式的对比:
基础协议(/v1/chat/completions)原厂直通(/bypass/...)
协议格式OpenAI Chat Completions各厂商原生协议
模型覆盖平台全量模型对应厂商的官方模型
原生特性支持通用能力厂商完整原生特性
迁移成本极低,换 URL 即可需使用厂商原生 SDK

Bypass Anthropic#

接口路径: POST /bypass/anthropic/v1/messages
以 Anthropic Messages API 原生协议调用 Claude 系列模型,支持 Extended Thinking、Prompt Caching、联网搜索等 Claude 特有能力。支持 Anthropic 官方提供的 Claude 系列模型(如 claude-sonnet-4-6、claude-opus-4-6 等)。

Bypass Vertex / Gemini#

接口路径: POST /bypass/vertex/v1/models/{model}:{invokeFuncName}
以 Vertex AI / Gemini 原生协议调用 Gemini 系列模型,支持 googleSearch、代码执行等 Gemini 原生工具。支持 Google 官方提供的 Gemini 系列模型(如 gemini-2.5-pro、gemini-3.1-pro-preview 等)。

Bypass OpenAI Responses#

接口路径: POST /bypass/openai/v1/responses
以 OpenAI Responses API 原生协议调用 GPT 系列模型,支持联网搜索(web_search_preview)、多轮状态管理等功能。支持 OpenAI 官方提供的 GPT 系列模型(如 openai/gpt-5、openai/gpt-5.5 等)。

各接口路径汇总#

接口类型路径协议格式
聊天补全(标准)POST /v1/chat/completionsOpenAI Chat Completions
Anthropic 原厂直通POST /bypass/anthropic/v1/messagesAnthropic Messages API
Vertex/Gemini 原厂直通POST /bypass/vertex/v1/models/{model}:{func}Vertex AI / Gemini API
OpenAI Responses 原厂直通POST /bypass/openai/v1/responsesOpenAI Responses API
视频、图像等生成接口以各模型接入文档为准七牛云自定义
模型列表GET /v1/modelsOpenAI 兼容
关于视频、图像等多模态生成接口: 接入点(Base URL)与上方一致,具体接口路径、请求参数及返回格式因模型而异,请参考各模型的接入文档。

认证方式#

所有 AI 模型调用接口(聊天、视频、图像等)使用 API Key 进行认证:
获取 API Key: 登录 七牛云控制台 → AI 大模型推理 → API Key,即可创建或复制密钥。

接入点选择建议#

场景推荐接入点
中国大陆业务https://api.qnaigc.com
海外部署 / 跨境访问https://api.modelink.ai
高延迟敏感场景就近选择,优先国内接入点
提示: 两个 AI 模型接入点(国内/海外)提供完全一致的接口规范,仅网络路由不同,可按需灵活切换。
修改于 2026-06-02 06:39:56
上一页
Claude 模型缓存功能使用指南 (Cache Control)
下一页
模型列表
Built with