Skip to content
This repository has been archived by the owner on May 2, 2024. It is now read-only.

Latest commit

 

History

History
128 lines (77 loc) · 12.3 KB

ai-mo-xing-ji-ji-fei.md

File metadata and controls

128 lines (77 loc) · 12.3 KB

🧐 AI 模型计费

chatnio官方站 有两种计费方式。一种是随用随付的弹性计费,一种是订阅计划。其他站点请参阅其站点的信息,与官方站计费无关。

下面是弹性计费方式的详细价格表。请到chatnio官方站查看订阅计划的详细信息。

{% hint style="info" %} 1 CNY = 10 Nio 点数。 (如模型请求 1 次计费 0.05 点数,即计费 0.005 元)

订阅的按次配额在 API 中转中无法适用,中转仅支持弹性计费。 {% endhint %}

OpenAI / Azure OpenAI

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
gpt-3.5-turbo (0301, 0613)1 元 1 刀 (官网 7 分之一)0.0150.02
gpt-3.5-turbo-11061 元 1 刀 (官网 7 分之一)0.010.02
gpt-3.5-turbo-01251 元 1 刀 (官网 7 分之一)0.0050.015
gpt-3.5-turbo-16k1 元 1 刀 (官网 7 分之一)0.030.04
gpt-4 (0314, 0613)1 元 1 刀 (官网 7 分之一)0.30.6

gpt-4-turbo (2024-04-09)

gpt-4-1106-preview

gpt-4-0125-preview

gpt-4-turbo-preview

gpt-4-vision-preview

1 元 1 刀 (官网 7 分之一)0.10.3

gpt-4-v

gpt-4-dalle

gpt-4-all

0.1 元一次(轻度 GPT-4 用户性价比远超官网)-1 / 次
gpt-4-32k (0314, 0613)1 元 1 刀 (官网 7 分之一)0.61.2
azure-gpt-3.5-turbo0.4 元 1 刀 (官网 17 分之一)0.0060.008
azure-gpt-3.5-turbo-16k0.4 元 1 刀 (官网 17 分之一)0.0120.016
azure-gpt-40.8 元 1 刀 (官网 9 分之一)0.2400.480
azure-gpt-4-32k0.8 元 1 刀 (官网 9 分之一)0.4800.960
dalle, dall-e-2, dall-e-3 请参见下方 AI 绘图--
gpt-3.5-free, gpt-3.5-16k-free1 元 5000 次 (1 点数 500 次)-0.002 / 次

{% hint style="warning" %} DALLE-2, DALLE-3, GPT-4 Turbo & Vision Preview 已做好 Vision 格式兼容,按照通用格式调用即可(在任何地方输入 url 即可),无需再适配进行格式(同样支持格式)。

GPT 3.5 Free 系列不保证稳定性,不支持 Function Calling。 {% endhint %}

AI 绘图

模型费率价格(点数)信息
dalle, dall-e-21 元 1 刀 (官网 7 分之一)0.18512x512
dall-e-3官网 6折3HD 1024x1024
midjourney官网平均计费1Relax 模式
midjourney-fast官网平均计费2Fast 模式
midjourney-turbo官网平均计费5Turbo 模式
stable-diffusion算力平均值0.25Stable Diffusion XL, POE 逆向 + Hugging Face

Claude

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)

claude-1-100k, claude-1,

claude-1.3,

cluade-slack (废弃)

对齐官网计费0.080.27
claude-2, claude-2.1对齐官网计费0.82.7
claude-3-opus-20240229价格同 gpt-4-32k
claude-3-sonnet-20240229价格同 gpt-4
claude-3-haiku-20240307价格同 gpt-3.5-turbo-16k

{% hint style="info" %} Claude 3 与 Claude 2.1 为 200k 上下文,Claude 2 为 100k 上下文,Claude 全系并发较低,出现 403, 503 等报错为正常上游速率限制情况。

Claude Slack 因为 Slack 政策调整现已关闭使用。 {% endhint %}

SparkDesk 讯飞星火

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)

spark-desk-v3.5

spark-desk-v3

spark-desk-v2

对齐官网计费0.30.3
spark-desk-v1.5对齐官网计费0.150.15

ChatGLM 智谱清言

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
glm-4对齐官网计费11
glm-4v对齐官网计费11
glm-3-turbo对齐官网计费0.050.05
zhipu-chatglm-turbo (智谱v3 格式, 同 glm-3-turbo)对齐官网计费0.050.05
zhipu-chatglm-pro(废弃)对齐官网计费0.10.1
zhipu-chatglm-std(废弃)对齐官网计费0.050.05
zhipu-chatglm-lite(废弃)对齐官网计费0.050.05

DashScope 通义千问

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
qwen-plus对齐官网计费0.20.2
qwen-plus-net对齐官网计费0.20.2
qwen-turbo对齐官网计费0.080.08
qwen-turbo-net对齐官网计费0.080.08

Google Gemini / PaLM2

模型 回答 Token (点数 / 次数)

gemini-pro

gemini-pro-vision

gemini-1.5-pro-latest

0.05 / 次
chat-bison-001 0.05 / 次

{% hint style="info" %} Google PaLM2 (chat-bision-001) 不支持包括中文在内的语言并且会频繁出现编码问题,Google 几乎已废弃该模型,推荐使用 Gemini (gemini 返回同为“伪”流式传输)。 {% endhint %}

New Bing

模型 回答 Token (点数 / 次数)
bing-creative 0.1 / 次
bing-balanced 0.1 / 次
bing-precise 0.1 / 次

{% hint style="info" %} New Bing 为逆向模型,不保证并发,出现错误为正常现象。 {% endhint %}

Meta LLaMa

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)

llama-3-70b

llama-2-70b

code-llama-34b

算力平均值0.250.25

llama-3-8b

llama-2-13b

llama-2-7b

code-llama-13b

code-llama-7b

算力平均值0.10.1

{% hint style="info" %} LLaMa 模型不保证高速和稳定性,吐字速度随当前可用性能影响 {% endhint %}

腾讯混元

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
hunyuan对齐官网计费11

360 智脑

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
360-gpt-v9对齐官网计费0.120.12

百川 AI

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
baichuan-53b对齐官网计费0.20.2

火山方舟(抖音豆包)

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
skylark-lite-public对齐官网计费0.040.04
skylark-plus-public对齐官网计费0.080.08
skylark-pro-public对齐官网计费0.110.11
skylark-chat对齐官网计费0.110.11

Pika Text To Video (文生视频)

模型 费率 价格 (点数)
pika-text-to-video 官网平均计费 5 / 次 (一元 2 次)

Suno (文生音乐)

模型 费率 价格 (点数)
suno-v3 官网平均计费 2 / 次 (一元 5 次)

最低余额限制

为了防止超出余额的部分过多,同时为了防止滥用,Chat Nio 设定了特定模型的最低余额预检,当小于该余额时,不可发起请求。

对于按照次数计费模型,最低余额为单次调用费用。(如:模型 0.1 点数 / 次, 最低可调用点数余额为 0.1)

对于按照 Token 计费模型,最低余额为 1K 输入 Token 费用 + 1K 输出 Token 费用。(如:模型输入输出均为 0.1 点数 / 1k tokens, 最低可调用点数余额为 0.1 + 0.1 = 0.2)

对于不计费模型,无最低余额限制。

Token 计算方式

Chat Nio 计费完全按照 OpenAI Tiktoken 计费。了解更多实现步骤请前往:

{% content-ref url="chang-jian-wen-ti-jie-da.md" %} chang-jian-wen-ti-jie-da.md {% endcontent-ref %}