外观
一文说清腾讯云 TokenHub
腾讯云 TokenHub 是一个大模型统一接入平台:一个账号、一个 API Key、一个 endpoint,调遍国内主流大模型。
不用分别去注册混元、DeepSeek、Kimi、MiniMax、智谱的账号,不用管各家余额和 API Key,只要在 TokenHub 开通服务,改一行代码里的 base_url,就能切换任意模型。
它解决了什么问题
如果你同时在用多家大模型 API,通常要面对这些麻烦:
- 每家单独注册账号、充值、管理 API Key
- 各家协议略有差异,切换模型时需要改代码
- 想对比不同模型效果,流程繁琐
TokenHub 的做法是:统一 endpoint + OpenAI 兼容协议。所有模型共用同一个接口地址 https://tokenhub.tencentmaas.com/v1,只需修改请求中的 model 字段就能切换,现有 OpenAI SDK 代码无需改动。
按需求选模型
与其列出所有模型的参数,不如直接告诉你:你的场景该用哪个。
| 我需要做什么 | 推荐模型 | 调用参数 |
|---|---|---|
| AI 编程 / Coding Agent | Hy3 preview | hy3-preview |
| 复杂推理 / 深度分析 | GLM-5.1、DeepSeek-V4-Pro | glm-5.1 / deepseek-v4-pro |
| 日常对话 / 通用任务 | DeepSeek-V4-Flash、MiniMax-M3 | deepseek-v4-flash / minimax-m3 |
| 图片 / 视频理解(多模态) | MiniMax-M3、GLM-5V-Turbo | minimax-m3 / glm-5v-turbo |
| 角色扮演 / 情感陪伴 | Hunyuan-role | hunyuan-role-latest |
| 专业翻译 | Hy-MT2-Pro | hy-mt2-pro |
| 生成图片 | HY-Image-V3.0 | hy-image-v3.0 |
| 生成视频 | HY-Video-1.5 | hy-video-1.5 |
| 生成 3D 模型 | HY-3D-3.1 | hy-3d-3.1 |
不确定选哪个?优先试 DeepSeek-V4-Flash——速度快、成本低,新用户有免费额度,用来摸底最合适。
三步接入
第一步:开通服务,领免费额度
登录 TokenHub 控制台,开通服务后点击右上角「新用户福利免费体验」,可一次领取多款模型的免费试用额度。
第二步:创建 API Key
进入 API Key 管理页,选择地域后点击「创建 API Key」,妥善保存生成的 Key。
第三步:改一行代码
TokenHub 兼容 OpenAI 协议,把现有代码的 base_url 替换掉即可:
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://tokenhub.tencentmaas.com/v1"
)
response = client.chat.completions.create(
model="deepseek-v4-flash", # 改这里切换模型
messages=[{"role": "user", "content": "你好"}]
)
print(response.choices[0].message.content)CURL 版本:
curl -X POST 'https://tokenhub.tencentmaas.com/v1/chat/completions' \
-H 'Authorization: Bearer YOUR_API_KEY' \
-H 'Content-Type: application/json' \
-d '{"model": "deepseek-v4-flash", "messages": [{"role": "user", "content": "你好"}]}'附录:完整模型列表
语言模型
| 模型 | 调用参数(model) | 厂商 | 能力 | 介绍 |
|---|---|---|---|---|
| Hy3 preview | hy3-preview | 混元 | 深度思考文本生成 | 面向 Agent 工作负载设计,MoE 架构三档思考模式,256K 上下文,SWE-bench 代码基准接近最强水平。 |
| Hy-MT2-Pro | hy-mt2-pro | 混元 | 翻译 | 混元翻译旗舰模型(30B-A3B),重点支持 33 个语种互译及 5 种民汉/方言,专业领域与真实业务场景表现优秀,支持结构化翻译、术语表、风格翻译等指令遵循任务。8K 上下文。 |
| Hunyuan-role | hunyuan-role-latest | 混元 | 角色扮演文本生成 | 针对角色扮演场景,人设高度贴合、极致拟人口语化,具有吸引力的剧情演绎与情感陪伴。32K 上下文。 |
| DeepSeek-V4-Pro 原厂直供 | deepseek-v4-pro-202606 | DeepSeek | 文本生成深度思考 | 由 DeepSeek 直接提供,TokenHub 不对该服务提供 SLA 保障。1M 上下文。 |
| DeepSeek-V4-Flash 原厂直供 | deepseek-v4-flash-202605 | DeepSeek | 文本生成深度思考 | 由 DeepSeek 直接提供,TokenHub 不对该服务提供 SLA 保障。1M 上下文。 |
| DeepSeek-V4-Pro | deepseek-v4-pro | DeepSeek | 文本生成深度思考 | 1.6T 参数原生多模态旗舰,CSA+HCA 混合注意力架构,复杂数学推理、长程代码工程及 Agent 协作代表行业顶尖水平。1M 上下文。 |
| DeepSeek-V4-Flash | deepseek-v4-flash | DeepSeek | 文本生成深度思考 | 高并发低延迟生产级利器,1M 上下文标配,极低成本实现旗舰级推理与卓越 Agent 响应效率。 |
| Deepseek-v3.2 | deepseek-v3.2 | DeepSeek | 深度思考文本生成 | 685B 参数 MoE 模型,稀疏注意力架构长文本处理更高效,推理评测达 GPT-5 水平。128K 上下文。 |
| GLM-5.1 | glm-5.1 | 智谱 AI | 文本生成深度思考 | 智谱最新旗舰,代码能力大幅增强,支持长达 8 小时自主连续工作,整体对齐 Claude Opus 4.6,构建 Autonomous Agent 的理想基座。200K 上下文。 |
| GLM-5V-Turbo | glm-5v-turbo | 智谱 AI | 多模态理解文本生成深度思考 | 智谱首个多模态 Coding 基座,原生处理图片/视频/文本,深度适配 Agent 工作流,可与 Claude Code 等 Agent 深度协同。200K 上下文。 |
| GLM-5-Turbo | glm-5-turbo | 智谱 AI | 文本生成深度思考 | 针对真实 Agent 长链路任务深度优化,重点提升复杂指令拆解、工具调用与长任务稳定性。200K 上下文。 |
| GLM-5 | glm-5 | 智谱 AI | 深度思考文本生成 | 新一代旗舰基座,面向 Agentic Engineering,擅长复杂系统工程、长程 Agent 任务,Coding 与 Agent 能力开源 SOTA。200K 上下文。 |
| Kimi K2.6 | kimi-k2.6 | 月之暗面 | 多模态理解文本生成深度思考 | Kimi 最新开源模型,行业领先的代码、长程任务执行与 Agent 集群能力,多语言泛化能力卓越。256K 上下文。 |
| Kimi K2.5 | kimi-k2.5 | 月之暗面 | 文本生成深度思考 | Kimi 迄今最全能模型,原生多模态架构,支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务。256K 上下文。 |
| MiniMax-M3 | minimax-m3 | MiniMax | 多模态理解文本生成深度思考 | MiniMax 最新旗舰,全新 MSA 注意力架构,编程和智能体任务达前沿水平,原生多模态支持图片/视频输入。1M 超长上下文。 |
| MiniMax-M2.7 | minimax-m2.7 | MiniMax | 文本生成深度思考 | 自我进化大语言模型,卓越软件工程与专业办公能力,支持复杂 Agent 交互与端到端项目交付。200K 上下文。 |
| MiniMax-M2.5 | minimax-m2.5 | MiniMax | 深度思考文本生成 | 编程、工具调用、搜索与办公生产力场景均达到或刷新行业 SOTA。200K 上下文。 |
| Qwen3.5-Plus | qwen3.5-plus | 通义千问 | 深度思考文本生成 | Qwen3.5 原生视觉语言系列 Plus 模型,线性注意力 + 稀疏 MoE 混合架构,多项评测媲美当前顶尖前沿模型,纯文本与多模态效果相较 3 系列飞跃式进步。991K 上下文。 |
| Qwen3.5-Flash | qwen3.5-flash | 通义千问 | 文本生成深度思考视觉理解 | Qwen3.5 原生视觉语言系列 Flash 模型,混合架构兼具推理速度与性能,纯文本与多模态效果相较 3 系列飞跃式进步。991K 上下文。 |
视觉模型
图像生成
| 模型 | 调用参数(model) | 厂商 | 能力 | 介绍 |
|---|---|---|---|---|
| HY-Image-V3.0 | hy-image-v3.0 | 混元 | 文生图图生图 | 能思考图像布局与构图,解析千字级复杂语义,支持长文本文字、复杂漫画、表情包及科普插画生成。 |
| HY-Image-Lite | hy-image-lite | 混元 | 文生图 | 超高压缩编解码器,快速响应与高品质输出,适用于电商商品图美化、素材生成、游戏场景迭代。 |
视频生成
| 模型 | 调用参数(model) | 厂商 | 能力 | 介绍 |
|---|---|---|---|---|
| HY-Video-1.5 | hy-video-1.5 | 混元 | 文生视频图生视频 | 支持文本/图像多模态输入生成高清视频,可实现场景切换与多角色交互,适用于企业广告营销与个人创意场景。 |
| YT-Video-2.0 | yt-video-2.0 | 优图 | 图生视频 | 生成动态连贯性高的视频,适用于高要求广告、影视片段与产品展示视频场景。 |
| YT-Video-HumanActor | yt-video-humanactor | 优图 | 图生视频 | 单张参考照片驱动生成动态人像视频,精准还原表情与姿态,支持写实、二次元等多风格切换。 |
| YT-Video-FX | yt-video-fx | 优图 | 图生视频 | 上传图片并选择特效模板,将静态图像转化为充满动感与活力的特效视频。 |
3D 生成
| 模型 | 调用参数(model) | 厂商 | 能力 | 介绍 |
|---|---|---|---|---|
| HY-3D-3.1 | hy-3d-3.1 | 混元 | 文生3D图生3D | 支持文生3D、图生3D、八视图生3D、单几何生成(白模)功能,精度与质量更高。 |
| HY-3D-3.0 | hy-3d-3.0 | 混元 | 文生3D图生3D | 支持文生3D、图生3D、多视图生3D、单几何生成(白模)、草图生3D、智能拓扑生3D。 |
| HY-3D-Express | hy-3d-express | 混元 | 文生3D图生3D | 混元生3D 极速版,生成时间缩短至 1 分 30 秒内,快速输出 3D 模型文件。 |
多模态理解模型
| 模型 | 调用参数(model) | 厂商 | 能力 | 介绍 |
|---|---|---|---|---|
| YT-VITA | youtu-vita | 优图 | 视觉理解多模态理解文本生成 | 多模态理解模型,支持对视频和图片内容进行分析,可用于视频结构解析、图像目标检测等场景。128K 上下文。 |
能力说明
深度思考:模型在生成最终回答前,先进行内部思维链(Chain-of-Thought)推理,通过逐步分析和拆解问题,提升复杂任务(如数学、逻辑推理、代码生成等)的回答准确性。
结构化输出:模型支持按照指定的格式(如 JSON Schema)输出结构化数据,便于下游程序直接解析和使用,适用于信息抽取、数据填充、API 响应构建等场景。
Function Calling:模型支持函数调用能力,可在推理过程中根据用户意图自动识别并触发预定义的外部工具或 API,实现查询数据库、调用第三方服务等扩展操作。
Cache 缓存:模型 Cache 缓存能力可复用历史请求中的上下文计算结果,减少重复计算开销,从而提升响应速度并降低调用成本。
参考资料
TokenHub 产品迭代较快,本文内容可能存在疏漏或滞后,最新模型列表与功能说明请以腾讯云官方网站为准。
- 腾讯云 TokenHub 模型广场:https://console.cloud.tencent.com/tokenhub/models
- 腾讯云 TokenHub 模型列表:https://cloud.tencent.com/document/product/1823/130051
文中模型列表、能力标签、功能描述等内容以官方网站显示为准。