设备 License 定价
AI硬件语音全流程方案,按设备按年授权。包含 ASR + LLM + TTS + 视觉理解全链路能力。
选择适合你的档位
每台设备绑定一个 License,有效期自激活起 1 年。语音 + LLM 推理 + 视觉理解全包含,一个 SDK 即可集成。
- 9 小时 语音时长
- 2,700,000 LLM 推理 tokens
- 50 轮 视觉对话 *
- ASR + LLM + TTS + Vision
- 一个 SDK 集成
- 每台设备 / 年限购 1 次
- 19 小时 语音时长
- 5,700,000 LLM 推理 tokens
- 200 轮 视觉对话 *
- ASR + LLM + TTS + Vision
- 一个 SDK 集成
- 每台设备 / 年限购 1 次
- 60 小时 语音时长
- 18,000,000 LLM 推理 tokens
- 1,000 轮 视觉对话 *
- ASR + LLM + TTS + Vision
- 一个 SDK 集成
- 每台设备 / 年限购 1 次
基础版对标豆包自组:相同用量,~7× 更便宜
| 语音时长 | LLM tokens | 视觉对话 | 价格 | |
|---|---|---|---|---|
| AI降临派 | 9 小时 | 270 万 | 50 轮 | $0.99 ≈¥7 |
| 豆包自组(Seed 2.0 Pro + 流式 ASR 2.0 + 语音合成 2.0) | 9 小时 | 270 万 | — | $6.54 ≈¥47 |
同样的 9 小时对话 + 270 万 tokens,豆包自组按官方计费需 $6.54,AI降临派 License 仅 $0.99 即可,且额外包含视觉对话能力。三档套餐相比按等量资源包购买均节省 ~93%(详见各档卡片"按量等价"标签)。
* 豆包自组算法:9 小时对话按 AI 陪伴典型上下行比例 1:4 拆分(用户 1.8h ASR + AI 回复 7.2h TTS)。LLM:270 万 tokens × Doubao Seed 2.0 Pro 入出均价 $1.33/M ≈ $3.59;ASR:1.8h × 豆包流式语音识别 2.0 ¥1/小时 ≈ $0.25;TTS:按中文自然对话语速 150 字/分钟,7.2h × 60 × 150 ≈ 6.48 万字符 × 豆包语音合成 2.0 ¥3/万字符 ≈ $2.70。汇率 $1 ≈ ¥7.2。
开通即赠 10 个免费基础版 License(有效期 1 年)。同一产品下的所有设备只能分配同一规格。
* 视觉对话轮次仅计量视觉理解能力的调用,对话过程中的语音时长与 LLM tokens 按各自配额正常消耗。以 720P(1280×720)为标准分辨率,更高分辨率按像素面积等比折算。
按量计费,用多少付多少
当 License 包含的资源用尽后,可购买扩展资源包继续使用。产品下所有设备共享,永久有效至耗尽。
| 扩展资源 | 计费单元 | 单价 |
|---|---|---|
| LLM 推理 | 10 亿 tokens(即 $0.28 / 百万 tokens) | $280 ≈¥2,016 |
| 语音时长(ASR + TTS) | 100 小时 | $133 ≈¥958 |
| 视觉对话 * | 1,000 轮 | $20 ≈¥144 |
| 声音复刻 | 个 / 年 | $150 ≈¥1,080 |
* 视觉对话轮次仅计量视觉理解的调用次数,不含对话中的语音与 LLM 消耗。以 720P 为基准,1080P ≈ 2.25 轮,4K ≈ 9 轮,实际以接口返回为准。
LLM 主力旗舰模型单价对比(美元 / 百万 tokens)
* 基于各厂商 2026 年 5 月公开 API 报价。我方 $0.28 为入/出同价;他方一律按 (输入 + 输出) / 2 的平均值口径计算。汇率参考 $1 ≈ ¥7.2,即 $0.28/百万 tokens ≈ ¥2.02/百万 tokens;$17.50 ≈ ¥126/百万 tokens。
同等用量下的全流程费用
基于基础档用量(9 小时语音 + 270 万 tokens),统一使用各厂商 2026 年主力旗舰 LLM 计算等效全流程成本。所有他方 LLM 单价按 (输入 + 输出) / 2 的平均值口径。
* 数据基于各厂商 2026 年 5 月公开 API 报价。LLM 全部使用各家主力旗舰版本,且按 (输入 + 输出) / 2 的平均价计算。我方 $0.99 为基础版 License 价(入/出同价 $0.28/M)。OpenAI 因金额远超其他厂商,柱状条已截断。各厂商详细计算见下表。
| 厂商 / 主力 LLM | 计费模式 | ASR (9h) | LLM (2.7M, 入出均价) | TTS (9h) | 合计 |
|---|---|---|---|---|---|
| AI降临派(自研) | 全流程 License | — | — | — | $0.99 |
| DeepSeek V4 Pro 自组 | 第三方 ASR/TTS + LLM | $0.37 | $1.78 ($0.66/M) | $1.00 | $3.15 |
| 豆包 Seed 2.0 Pro | 火山引擎全栈分项 | $0.25 (¥1/h × 1.8h) | $3.59 ($1.33/M) | $2.70 (¥3/万字 × 6.48万字) | $6.54 |
| 智谱 GLM-5.1 自组 | 第三方 ASR/TTS + LLM | $0.37 | $5.78 ($2.14/M) | $1.00 | $7.15 |
| 阿里 Qwen3-Max | 百炼全栈分项 | $0.37 (Paraformer) | $6.32 ($2.34/M) | $1.00 (CosyVoice-flash) | $7.69 |
| Kimi K2.6 自组 | 第三方 ASR/TTS + LLM | $0.37 | $6.70 ($2.48/M) | $1.00 | $8.07 |
| Claude Sonnet 4.6 自组 | 第三方 ASR/TTS + LLM | $0.37 | $24.30 ($9.00/M) | $1.00 | $25.67 |
| OpenAI gpt-realtime | Realtime API 按 token | 音频输入 $32 + 输出 $64 / 百万 tokens(入出平均 $48/M) | ~$762 | ||
* 豆包 Seed 2.0 Pro:火山引擎 0-32K 输入档官方价 ¥3.2 输入 + ¥16 输出(入出均价 ¥9.6 ≈ $1.33/M);ASR/TTS 全部按火山引擎自家计费——9 小时对话按 AI 陪伴典型上下行比例 1:4 拆分,ASR 1.8h × ¥1/h(豆包流式语音识别 2.0);TTS 按中文自然对话语速 150 字/分钟,7.2h ≈ 6.48 万字符 × ¥3/万字(豆包语音合成 2.0)。阿里 Qwen3-Max 官方价 $0.78/$3.90(均价 $2.34/M),ASR/TTS 用 Paraformer + CosyVoice-flash。DeepSeek / Kimi / 智谱 / Claude 不提供原生 ASR/TTS,按行业惯例搭配阿里 Paraformer (¥2.59/9h) + CosyVoice-flash (¥7.02/9h) 估算。OpenAI 按 gpt-realtime 标准模型音频 token 估算,汇率 $1 ≈ ¥7.2。