平台概览
TokenHub 以模型广场、能力标签和统一接入方式为核心,让模型调用从分散试错走向标准化服务。
整合自研与第三方模型
同时覆盖混元与外部优质模型,不需要为每个厂商维护完全不同的接入方式。
从对话到图像视频生成
通用对话、深度推理、代码生成、视觉理解、图像生成、视频生成都在同一平台组织。
调用、保障与专属部署并存
支持按量调用、保障型资源和专属部署,适合从试用到生产的不同阶段。
重点推荐
以下两款模型分别代表了高质量 Agent 推理和高并发低延迟生产能力。
Hy3 preview
面向 Agent 工作负载设计,MoE 架构三档思考模式,256K 上下文,SWE-bench 代码基准接近最强水平,适合跨文件代码重构与长文档分析。
MiniMax-M3
MiniMax 最新旗舰,全新 MSA 注意力架构,编程和 Agent 任务达前沿水平,原生多模态支持图片/视频输入,1M 超长上下文。
全部模型
按语言模型、视觉模型和多模态理解模型三类组织,方便快速筛选所需能力。
| 模型 | 厂商 | 能力 | 介绍 |
|---|---|---|---|
| Hy3 preview | 混元 | 深度思考、文本生成 | 面向 Agent 工作负载设计,三档思考模式,256K 上下文,适合复杂工程任务。 |
| Hy-MT2-Pro | 混元 | 翻译 | 混元翻译旗舰(30B-A3B),支持 33 个语种及民汉/方言互译,8K 上下文。 |
| Hunyuan-role | 混元 | 角色扮演、文本生成 | 适合角色扮演、人设拟合和情感陪伴类场景,32K 上下文。 |
| DeepSeek-V4-Pro 原厂直供 | DeepSeek | 文本生成、深度思考 | 由 DeepSeek 直接提供,TokenHub 不提供 SLA 保障,1M 上下文。 |
| DeepSeek-V4-Flash 原厂直供 | DeepSeek | 文本生成、深度思考 | 由 DeepSeek 直接提供,TokenHub 不提供 SLA 保障,1M 上下文。 |
| DeepSeek-V4-Pro | DeepSeek | 文本生成、深度思考 | 1.6T 参数原生多模态旗舰,复杂推理、长程代码工程与 Agent 协作代表行业顶尖水平,1M 上下文。 |
| DeepSeek-V4-Flash | DeepSeek | 文本生成、深度思考 | 高并发低延迟生产模型,极低成本实现旗舰级推理与 Agent 响应效率,1M 上下文。 |
| Deepseek-v3.2 | DeepSeek | 深度思考、文本生成 | 685B 参数 MoE 模型,稀疏注意力架构,推理评测达 GPT-5 水平,128K 上下文。 |
| GLM-5.1 | 智谱 AI | 文本生成、深度思考 | 代码能力大幅增强,支持长达 8 小时自主连续工作,200K 上下文。 |
| GLM-5V-Turbo | 智谱 AI | 多模态理解、文本生成、深度思考 | 首个多模态 Coding 基座,原生处理图片/视频/文本,200K 上下文。 |
| GLM-5-Turbo | 智谱 AI | 文本生成、深度思考 | 重点优化复杂指令拆解、工具调用与长任务稳定性,200K 上下文。 |
| GLM-5 | 智谱 AI | 深度思考、文本生成 | 面向 Agentic Engineering 的旗舰模型,擅长复杂系统工程,200K 上下文。 |
| Kimi K2.6 | 月之暗面 | 多模态理解、文本生成、深度思考 | 最新开源模型,代码、长程任务与 Agent 集群能力领先,256K 上下文。 |
| Kimi K2.5 | 月之暗面 | 文本生成、深度思考 | 原生多模态架构,支持视觉与文本输入,对话和 Agent 任务兼顾,256K 上下文。 |
| MiniMax-M3 | MiniMax | 多模态理解、文本生成、深度思考 | 最新旗舰,MSA 注意力架构,原生多模态支持图片/视频输入,1M 超长上下文。 |
| MiniMax-M2.7 | MiniMax | 文本生成、深度思考 | 适合复杂软件工程与专业办公任务,200K 上下文。 |
| MiniMax-M2.5 | MiniMax | 深度思考、文本生成 | 在编程、工具调用、搜索与办公场景保持强势表现,200K 上下文。 |
| Qwen3.5-Plus | 通义千问 | 深度思考、文本生成 | 线性注意力 + 稀疏 MoE 混合架构,纯文本与多模态效果飞跃式进步,991K 上下文。 |
| Qwen3.5-Flash | 通义千问 | 文本生成、深度思考、视觉理解 | 混合架构兼具推理速度与性能,纯文本与多模态效果飞跃式进步,991K 上下文。 |
| 模型 | 厂商 | 能力 | 介绍 |
|---|---|---|---|
| HY-3D-3.1 | 混元 | 文生 3D、图生 3D | 支持文本生 3D、图生 3D、多视图生成、草图生 3D 与智能拓扑生成。 |
| HY-3D-3.0 | 混元 | 文生 3D、图生 3D | 覆盖文本、图片、多视图和白模生成等典型 3D 场景。 |
| HY-Image-V3.0 | 混元 | 文生图、图生图 | 强调复杂语义理解、构图控制、长文本和复杂漫画生成能力。 |
| HY-Video-1.5 | 混元 | 文生视频、图生视频 | 适合广告营销、创意演示和内容制作场景。 |
| HY-Image-Lite | 混元 | 文生图 | 主打快速响应和高质量输出,适合电商、美化与素材生产。 |
| YT-Video-2.0 | 优图 | 图生视频 | 适合高要求广告、影视片段与产品展示视频。 |
| YT-Video-HumanActor | 优图 | 图生视频 | 基于单张参考照片生成动态人物视频,支持多种风格切换。 |
| YT-Video-FX | 优图 | 图生视频 | 基于图片和特效模板生成动感视频。 |
| HY-3D-Express | 混元 | 文生 3D、图生 3D | 强调生成速度,适合快速输出 3D 模型文件。 |
| 模型 | 厂商 | 能力 | 介绍 |
|---|---|---|---|
| YT-VITA | 优图 | 视觉理解、多模态理解、文本生成 | 可对视频和图片内容做结构分析、目标检测和多模态推理,适合视觉内容理解场景。 |
能力说明
这些能力标签决定了模型在复杂推理、结构化输出和工具协作中的真实可用性。
深度思考
模型在生成最终答案前先进行内部推理链分析,提升数学、逻辑、代码等复杂任务的准确性。
结构化输出
支持按 JSON Schema 等结构返回结果,便于程序直接消费。
Function Calling
可自动识别并调用外部工具或 API,实现数据库查询、第三方服务集成等扩展能力。
Cache 缓存
复用历史上下文计算结果,降低重复计算开销,加快速度并降低成本。
OpenAI 兼容
可沿用熟悉的 SDK、请求格式和开发习惯,降低现有应用迁移成本。
快速上手
从开通、领取免费体验到创建 API Key 与实际接入,完整流程可以很快走通。
登录 TokenHub 控制台
开通服务后,在模型广场浏览可用模型及说明。
领取免费体验包
新用户可从“新用户福利免费体验”入口领取多个模型的试用额度。
创建 API Key
进入 API Key 管理页,选择地域、创建密钥并设置访问范围,生成后请妥善保管。
通过兼容接口调用
TokenHub 兼容 OpenAI API 协议,常见 SDK 只需要切换 base_url 即可接入。
curl -X POST 'https://tokenhub.tencentmaas.com/v1/chat/completions' \
-H 'Authorization: Bearer YOUR_API_KEY' \
-H 'Content-Type: application/json' \
-d '{
"model": "deepseek-v4-flash",
"messages": [{"role": "user", "content": "你好"}],
"stream": true
}'
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://tokenhub.tencentmaas.com/v1"
)
response = client.chat.completions.create(
model="deepseek-v4-flash",
messages=[{"role": "user", "content": "你好"}]
)
print(response.choices[0].message.content)
参考资料
模型列表和能力标签更新很快,建议结合官方入口获取最新信息。