🧐 AI 模型计费

chatnio官方站有两种计费方式。一种是随用随付的弹性计费，一种是订阅计划。其他站点请参阅其站点的信息，与官方站计费无关。

下面是弹性计费方式的详细价格表。请到chatnio官方站查看订阅计划的详细信息。

{% hint style="info" %} 1 CNY = 10 Nio 点数。 (如模型请求 1 次计费 0.05 点数，即计费 0.005 元)

订阅的按次配额在 API 中转中无法适用，中转仅支持弹性计费。 {% endhint %}

OpenAI / Azure OpenAI

模型	费率	问题 Token (点数 / 1k token)	回答 Token (点数 / 1k token)
gpt-3.5-turbo (0301, 0613)	1 元 1 刀 (官网 7 分之一)	0.015	0.02
gpt-3.5-turbo-1106	1 元 1 刀 (官网 7 分之一)	0.01	0.02
gpt-3.5-turbo-0125	1 元 1 刀 (官网 7 分之一)	0.005	0.015
gpt-3.5-turbo-16k	1 元 1 刀 (官网 7 分之一)	0.03	0.04
gpt-4 (0314, 0613)	1 元 1 刀 (官网 7 分之一)	0.3	0.6
gpt-4-turbo (2024-04-09) gpt-4-1106-preview gpt-4-0125-preview gpt-4-turbo-preview gpt-4-vision-preview	1 元 1 刀 (官网 7 分之一)	0.1	0.3
gpt-4-v gpt-4-dalle gpt-4-all	0.1 元一次（轻度 GPT-4 用户性价比远超官网）	-	1 / 次
gpt-4-32k (0314, 0613)	1 元 1 刀 (官网 7 分之一)	0.6	1.2
azure-gpt-3.5-turbo	0.4 元 1 刀 (官网 17 分之一)	0.006	0.008
azure-gpt-3.5-turbo-16k	0.4 元 1 刀 (官网 17 分之一)	0.012	0.016
azure-gpt-4	0.8 元 1 刀 (官网 9 分之一)	0.240	0.480
azure-gpt-4-32k	0.8 元 1 刀 (官网 9 分之一)	0.480	0.960
dalle, dall-e-2, dall-e-3	请参见下方 AI 绘图	-	-
gpt-3.5-free, gpt-3.5-16k-free	1 元 5000 次 (1 点数 500 次)	-	0.002 / 次

{% hint style="warning" %} DALLE-2, DALLE-3, GPT-4 Turbo & Vision Preview 已做好 Vision 格式兼容，按照通用格式调用即可（在任何地方输入 url 即可），无需再适配进行格式（同样支持格式）。

GPT 3.5 Free 系列不保证稳定性，不支持 Function Calling。 {% endhint %}

AI 绘图

模型	费率	价格（点数）	信息
dalle, dall-e-2	1 元 1 刀 (官网 7 分之一)	0.18	512x512
dall-e-3	官网 6折	3	HD 1024x1024
midjourney	官网平均计费	1	Relax 模式
midjourney-fast	官网平均计费	2	Fast 模式
midjourney-turbo	官网平均计费	5	Turbo 模式
stable-diffusion	算力平均值	0.25	Stable Diffusion XL, POE 逆向 + Hugging Face

Claude

模型	费率	问题 Token (点数 / 1k token)	回答 Token (点数 / 1k token)
claude-1-100k, claude-1, claude-1.3, cluade-slack (废弃)	对齐官网计费	0.08	0.27
claude-2, claude-2.1	对齐官网计费	0.8	2.7
claude-3-opus-20240229	价格同 gpt-4-32k
claude-3-sonnet-20240229	价格同 gpt-4
claude-3-haiku-20240307	价格同 gpt-3.5-turbo-16k

{% hint style="info" %} Claude 3 与 Claude 2.1 为 200k 上下文，Claude 2 为 100k 上下文，Claude 全系并发较低，出现 403, 503 等报错为正常上游速率限制情况。

Claude Slack 因为 Slack 政策调整现已关闭使用。 {% endhint %}

SparkDesk 讯飞星火

模型

费率

问题 Token (点数 / 1k token)

回答 Token (点数 / 1k token)

spark-desk-v3.5

spark-desk-v3

spark-desk-v2

对齐官网计费

0.3

spark-desk-v1.5

对齐官网计费

0.15

ChatGLM 智谱清言

模型	费率	问题 Token (点数 / 1k token)	回答 Token (点数 / 1k token)
glm-4	对齐官网计费	1	1
glm-4v	对齐官网计费	1	1
glm-3-turbo	对齐官网计费	0.05	0.05
zhipu-chatglm-turbo (智谱v3 格式, 同 glm-3-turbo)	对齐官网计费	0.05	0.05
zhipu-chatglm-pro（废弃）	对齐官网计费	0.1	0.1
zhipu-chatglm-std（废弃）	对齐官网计费	0.05	0.05
zhipu-chatglm-lite（废弃）	对齐官网计费	0.05	0.05

DashScope 通义千问

模型	费率	问题 Token (点数 / 1k token)	回答 Token (点数 / 1k token)
qwen-plus	对齐官网计费	0.2	0.2
qwen-plus-net	对齐官网计费	0.2	0.2
qwen-turbo	对齐官网计费	0.08	0.08
qwen-turbo-net	对齐官网计费	0.08	0.08

Google Gemini / PaLM2

模型

回答 Token (点数 / 次数)

gemini-pro

gemini-pro-vision

gemini-1.5-pro-latest

0.05 / 次

chat-bison-001

0.05 / 次

{% hint style="info" %} Google PaLM2 (chat-bision-001) 不支持包括中文在内的语言并且会频繁出现编码问题，Google 几乎已废弃该模型，推荐使用 Gemini (gemini 返回同为“伪”流式传输)。 {% endhint %}

New Bing

模型	回答 Token (点数 / 次数)
bing-creative	0.1 / 次
bing-balanced	0.1 / 次
bing-precise	0.1 / 次

{% hint style="info" %} New Bing 为逆向模型，不保证并发，出现错误为正常现象。 {% endhint %}

Meta LLaMa

模型

费率

问题 Token (点数 / 1k token)

回答 Token (点数 / 1k token)

llama-3-70b

llama-2-70b

code-llama-34b

算力平均值

0.25

llama-3-8b

llama-2-13b

llama-2-7b

code-llama-13b

code-llama-7b

算力平均值

0.1

{% hint style="info" %} LLaMa 模型不保证高速和稳定性，吐字速度随当前可用性能影响 {% endhint %}

腾讯混元

模型	费率	问题 Token (点数 / 1k token)	回答 Token (点数 / 1k token)
hunyuan	对齐官网计费	1	1

360 智脑

模型	费率	问题 Token (点数 / 1k token)	回答 Token (点数 / 1k token)
360-gpt-v9	对齐官网计费	0.12	0.12

百川 AI

模型	费率	问题 Token (点数 / 1k token)	回答 Token (点数 / 1k token)
baichuan-53b	对齐官网计费	0.2	0.2

火山方舟（抖音豆包）

模型	费率	问题 Token (点数 / 1k token)	回答 Token (点数 / 1k token)
skylark-lite-public	对齐官网计费	0.04	0.04
skylark-plus-public	对齐官网计费	0.08	0.08
skylark-pro-public	对齐官网计费	0.11	0.11
skylark-chat	对齐官网计费	0.11	0.11

Pika Text To Video (文生视频)

模型	费率	价格 (点数)
pika-text-to-video	官网平均计费	5 / 次 (一元 2 次)

Suno (文生音乐)

模型	费率	价格 (点数)
suno-v3	官网平均计费	2 / 次 (一元 5 次)

最低余额限制

为了防止超出余额的部分过多，同时为了防止滥用，Chat Nio 设定了特定模型的最低余额预检，当小于该余额时，不可发起请求。

对于按照次数计费模型，最低余额为单次调用费用。（如：模型 0.1 点数 / 次, 最低可调用点数余额为 0.1）

对于按照 Token 计费模型，最低余额为 1K 输入 Token 费用 + 1K 输出 Token 费用。（如：模型输入输出均为 0.1 点数 / 1k tokens, 最低可调用点数余额为 0.1 + 0.1 = 0.2）

对于不计费模型，无最低余额限制。

Token 计算方式

Chat Nio 计费完全按照 OpenAI Tiktoken 计费。了解更多实现步骤请前往：

{% content-ref url="chang-jian-wen-ti-jie-da.md" %} chang-jian-wen-ti-jie-da.md {% endcontent-ref %}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ai-mo-xing-ji-ji-fei.md

ai-mo-xing-ji-ji-fei.md

🧐 AI 模型计费

OpenAI / Azure OpenAI

AI 绘图

Claude

SparkDesk 讯飞星火

ChatGLM 智谱清言

DashScope 通义千问

Google Gemini / PaLM2

New Bing

Meta LLaMa

腾讯混元

360 智脑

百川 AI

火山方舟（抖音豆包）

Pika Text To Video (文生视频)

Suno (文生音乐)

最低余额限制

Token 计算方式

Files

ai-mo-xing-ji-ji-fei.md

Latest commit

History

ai-mo-xing-ji-ji-fei.md

File metadata and controls

🧐 AI 模型计费

OpenAI / Azure OpenAI

AI 绘图

Claude

SparkDesk 讯飞星火

ChatGLM 智谱清言

DashScope 通义千问

Google Gemini / PaLM2

New Bing

Meta LLaMa

腾讯混元

360 智脑

百川 AI

火山方舟（抖音豆包）

Pika Text To Video (文生视频)

Suno (文生音乐)

最低余额限制

Token 计算方式