设备 License 定价
AI硬件语音全流程方案,按设备按年授权。包含 ASR + LLM + TTS + 视觉理解全链路能力。
全流程 License
选择适合你的档位
每台设备绑定一个 License,有效期自激活起 1 年。语音 + LLM 推理 + 视觉理解全包含,一个 SDK 即可集成。
基础版
¥6.99
/ 设备 / 年
- 9 小时 语音时长
- 1,350,000 LLM 推理 tokens
- 50 轮 视觉对话 *
- ASR + LLM + TTS + Vision
- 一个 SDK 集成
推荐
高级版
¥14.90
/ 设备 / 年
- 19 小时 语音时长
- 2,850,000 LLM 推理 tokens
- 200 轮 视觉对话 *
- ASR + LLM + TTS + Vision
- 一个 SDK 集成
尊享版
¥46.50
/ 设备 / 年
- 60 小时 语音时长
- 9,000,000 LLM 推理 tokens
- 1,000 轮 视觉对话 *
- ASR + LLM + TTS + Vision
- 一个 SDK 集成
开通即赠 10 个免费基础版 License(有效期 1 年)。同一产品下的所有设备只能分配同一规格。
* 视觉对话轮次仅计量视觉理解能力的调用,对话过程中的语音时长与 LLM tokens 按各自配额正常消耗。以 720P(1280×720)为标准分辨率,更高分辨率按像素面积等比折算。
扩展资源
按量计费,用多少付多少
当 License 包含的资源用尽后,可购买扩展资源包继续使用。产品下所有设备共享,永久有效至耗尽。
| 扩展资源 | 计费单元 | 单价 |
|---|---|---|
| LLM 推理 | 10 亿 tokens | ¥280 |
| 语音时长(ASR + TTS) | 100 小时 | ¥133 |
| 视觉对话 * | 1,000 轮 | ¥20 |
| 声音复刻 | 个 / 年 | ¥150 |
* 视觉对话轮次仅计量视觉理解的调用次数,不含对话中的语音与 LLM 消耗。以 720P 为基准,1080P ≈ 2.25 轮,4K ≈ 9 轮,实际以接口返回为准。
行业价格一览
同等用量下的全流程费用
基于基础档用量(9 小时语音 + 135 万 tokens),统一使用各厂商自家付费 LLM 的等效全流程成本。
AI降临派
阿里千问
豆包
讯飞
OpenAI
* 数据基于各厂商 2026 年 2 月公开报价。OpenAI 使用 gpt-realtime 音频 token 计费(输入 $32 + 输出 $64 / 百万 tokens),因金额远超国内厂商,柱状条已截断。各厂商详细计算方式见下表。
| 厂商 | 计费模式 | ASR | LLM | TTS | 合计 |
|---|---|---|---|---|---|
| AI降临派 | 全流程 License | — | — | — | ¥6.99 |
| 阿里千问 | ASR+LLM+TTS 分项 | ¥2.59 | ¥1.89 | ¥7.02 | ¥11.50 |
| 豆包 | 全流程 License | — | — | — | ¥13.95 |
| 讯飞 | 装机量 + LLM 分项 | ¥3.00(一次性装机) | 含上 | ¥31.35 | |
| OpenAI | Realtime API 按 token | 音频输入 $32 + 输出 $64 / 百万 tokens | ~¥2,866 | ||
* 阿里千问使用 Paraformer + Qwen-Plus + CosyVoice-flash 组合。讯飞使用离线装机量包 + 星火 Pro/Max。OpenAI 按 gpt-realtime 标准模型音频 token 估算,汇率按 $1 ≈ ¥7.2。