设备 License 定价
AI硬件语音全流程方案,按设备按年授权。包含 ASR + LLM + TTS + 视觉理解全链路能力。
选择适合你的档位
每台设备绑定一个 License,有效期自激活起 1 年。语音 + LLM 推理 + 视觉理解全包含,一个 SDK 即可集成。
- 9 小时 语音时长
- 2,700,000 LLM 推理 tokens
- 50 轮 视觉对话 *
- ASR + LLM + TTS + Vision
- 一个 SDK 集成
- 19 小时 语音时长
- 5,700,000 LLM 推理 tokens
- 200 轮 视觉对话 *
- ASR + LLM + TTS + Vision
- 一个 SDK 集成
- 60 小时 语音时长
- 18,000,000 LLM 推理 tokens
- 1,000 轮 视觉对话 *
- ASR + LLM + TTS + Vision
- 一个 SDK 集成
基础版对标:相同时长,2× tokens,半价
| 语音时长 | LLM tokens | 视觉对话 | 价格 | |
|---|---|---|---|---|
| AI降临派 | 9 小时 | 270 万 | 50 轮 | ¥6.99 |
| 豆包 | 9 小时 | 135 万 | — | ¥13.95 |
同样的语音时长,LLM tokens 多一倍,价格仅为一半,且额外包含视觉对话。套餐相比按量购买可节省约 49%~56%。
开通即赠 10 个免费基础版 License(有效期 1 年)。同一产品下的所有设备只能分配同一规格。
* 视觉对话轮次仅计量视觉理解能力的调用,对话过程中的语音时长与 LLM tokens 按各自配额正常消耗。以 720P(1280×720)为标准分辨率,更高分辨率按像素面积等比折算。
按量计费,用多少付多少
当 License 包含的资源用尽后,可购买扩展资源包继续使用。产品下所有设备共享,永久有效至耗尽。
| 扩展资源 | 计费单元 | 单价 |
|---|---|---|
| LLM 推理 | 10 亿 tokens | ¥280 |
| 语音时长(ASR + TTS) | 100 小时 | ¥133 |
| 视觉对话 * | 1,000 轮 | ¥20 |
| 声音复刻 | 个 / 年 | ¥150 |
* 视觉对话轮次仅计量视觉理解的调用次数,不含对话中的语音与 LLM 消耗。以 720P 为基准,1080P ≈ 2.25 轮,4K ≈ 9 轮,实际以接口返回为准。
LLM 推理单价对比(元 / 百万 tokens)
* 基于各厂商 2026 年 2 月公开报价。输入/输出价格不同的厂商按 1:1 混合估算。
同等用量下的全流程费用
基于基础档用量(9 小时语音 + 270 万 tokens),统一使用各厂商自家付费 LLM 的等效全流程成本。
* 数据基于各厂商 2026 年 2 月公开报价。豆包基础版套餐仅含 135 万 tokens,需另购 135 万 tokens 达到等量。OpenAI 因金额远超国内厂商,柱状条已截断。各厂商详细计算方式见下表。
| 厂商 | 计费模式 | ASR | LLM | TTS | 合计 |
|---|---|---|---|---|---|
| AI降临派 | 全流程 License | — | — | — | ¥6.99 |
| 阿里千问 | ASR+LLM+TTS 分项 | ¥2.59 | ¥3.78 | ¥7.02 | ¥13.39 |
| 豆包 | License + 扩展补量 | — | +¥1.89 | — | ¥15.84 |
| 讯飞 | 装机量 + LLM 分项 | ¥3.00(一次性装机) | 含上 | ¥59.70 | |
| OpenAI | Realtime API 按 token | 音频输入 $32 + 输出 $64 / 百万 tokens | ~¥5,331 | ||
* 阿里千问使用 Paraformer + Qwen-Plus + CosyVoice-flash 组合。豆包基础版含 135 万 tokens,达到 270 万需额外购买扩展资源(¥1.40/百万 tokens)。讯飞使用离线装机量包 + 星火 Pro/Max。OpenAI 按 gpt-realtime 标准模型音频 token 估算,汇率按 $1 ≈ ¥7.2。