常用大模型接口

大模型工具

电脑版/苹果设备推荐用 cherry studio;安卓设备可以用Poe或chat Bot;不建议用chat box,我在使用过程中遇到诸多的恶性BUG。

cherry studio 里面已经配置好了API地址和名称,填入API即可,其内置的服务基本涵盖常用的聚合代理商和各家模型商

https://cherry-ai.com/

截图_20250115224804.png

截图_20250115224640.png

截图_20250115224822.png

模型聚合商

国内聚合

ocoolAI

在线使用:https://one.ocoolai.com/chat/1-cw

邀请链接:https://one.ocoolai.com/register/?aff_code=nEi5

平台:https://one.ocoolai.com/

价格介绍:https://one.ocoolai.com/account/pricing

账单管理:https://one.ocoolai.com

文档:https://one.ocoolai.com/chat/3-table

请求URL:https://one.ocoolai.com

API申请管理:

API:


代理的模型非常全面,基本常见的模型都有,价格正常

CloseAI

该站代理openAI的chatgpt、Anthropic的Claude、Google的Gemini。

在线使用:https://www.closechat.org/

邀请链接:https://referer.shadowai.xyz/r/1021300

平台:https://www.closeai-asia.com/

价格介绍:https://www.closeai-asia.com/pricing

账单管理:https://platform.closeai-asia.com/account/billing

文档:https://doc.closeai-asia.com/tutorial/library.html

请求URL:https://api.openai-proxy.org

API申请管理:https://platform.closeai-asia.com/developer/api

API:

不同供应商,对应的请求URL不同:

模型供应商 原域名 替换为 备注
OpenAI https://api.openai.com/v1 https://api.openai-proxy.org/v1 一般需要加/v1
Anthropic https://api.anthropic.com https://api.openai-proxy.org/anthropic 添加/anthropic后缀
Gemini https://generativelanguage.googleapis.com https://api.openai-proxy.org/google 添加/google后缀

DeerAPI

平台:https://api.deerapi.com/

价格介绍:https://api.deerapi.com/pricing

文档:https://api.deerapi.com/doc


适合用来了解当前比较热门的模型有哪些,代理的模型最全面,600+。

缺点是价格体系比较模糊,可能并不适合使用。

硅基流动

在线使用:https://cloud.siliconflow.cn/playground/chat/

邀请链接:https://cloud.siliconflow.cn/i/2O22SLhR

平台:https://cloud.siliconflow.cn/

价格介绍:https://siliconflow.cn/zh-cn/pricing

账单管理:https://cloud.siliconflow.cn/bills

文档:https://doc.closeai-asia.com/tutorial/library.html

请求URL:https://api.siliconflow.cn/v1/chat/completions

API申请管理:https://cloud.siliconflow.cn/account/ak

API:


注意,不同的模型,使用的请求URL并不相同;另外该站代理的模型较少,没有OpenAI的chatgpt,代理的谷歌等也不全。但是注册赠送14块钱,没有过期时间,有较多完全免费的小模型调用。

image-20250112220838478

国外聚合

国外的聚合站价格比国内的要贵不少,而且看起来,国外代理站的价格相对统一,国内代理站的价格也相对统一;

openrouter.ai

在线使用:https://openrouter.ai/chat

邀请链接:暂无

平台:https://openrouter.ai/

价格介绍:https://openrouter.ai/models

账单管理:https://openrouter.ai/credits

文档:https://openrouter.ai/docs/quick-start

请求URL:https://openrouter.ai/api/v1

API申请管理:https://openrouter.ai/settings/keys

API:

免费模型:https://openrouter.ai/models?max_price=0

AiHubMix

在线使用:https://doc.aihubmix.com/

邀请链接:https://aihubmix.com?aff=kF3q

平台:https://aihubmix.com

价格介绍:https://aihubmix.com/models

账单管理:https://aihubmix.com/statistics

文档:https://doc.aihubmix.com/

请求URL:https://aihubmix.com

API申请管理:https://aihubmix.com/token

API:

模型提供商

国内模型

智谱AI

在线使用:https://bigmodel.cn/trialcenter/modeltrial?modelCode=glm-4-plus

邀请链接:https://www.bigmodel.cn/invite?icode=nVCjjIBWT38YRtaMPDXeSOZLO2QH3C0EBTSr%2BArzMw4%3D

平台:https://bigmodel.cn/

价格介绍:https://bigmodel.cn/pricing

账单管理:https://open.bigmodel.cn/finance/resourcepack

文档:https://bigmodel.cn/dev/api/normal-model/glm-4

请求URL:https://open.bigmodel.cn/api/paas/v4/chat/completions

API申请管理:https://www.bigmodel.cn/invite?icode=nVCjjIBWT38YRtaMPDXeSOZLO2QH3C0EBTSr%2BArzMw4%3D

API:

GLM-4系列—文本型

GLM-4 系列提供了复杂推理、超长上下文、极快推理速度等多款模型,适用于多种应用场景。

免费:glm-4-flash

收费:glm-zero-preview,glm-4-plus,glm-4-0520,glm-4-air,glm-4-airx,glm-4-long,glm-4-flashx

GLM-4V系列—多模态

GLM-4 系列提供了多图理解、视频理解、单图理解度等多款模型,适用于多种应用场景。

免费:glm-4v-flash

收费:glm-4v-plus,glm-4v

专用场景模型—代码、角色扮演、心理咨询

CodeGeeX是一款强大的AI编程助手,提供智能问答和代码补全功能,支持多种编程语言,帮助开发者提高编程效率。

charglm-4支持基于人设的角色扮演、超长多轮的记忆、千人千面的角色对话,广泛应用于情感陪伴、游戏智能NPC、网红/明星/影视剧IP分身、数字人/虚拟主播、文字冒险游戏等拟人对话或游戏场景。

Emohaa学习了经典的Hill助人理论,拥有人类心理咨询师的专业话术能力,具有较强的倾听、情感映射、共情等情绪支持能力,帮助用户了解自身想法和感受,学习应对情绪问题,帮助用户实现乐观、积极的心理和情感状态。

收费:codegeex-4,charglm-4,emohaa


Flash 免费系列全面覆盖语言模型、视觉理解、图像生成及视频生成等多种模型。可以准确理解各任务场景语言描述及指令,更精确的完成多模态理解类任务,或生成高质量的图片、视频等多模态内容。

模型 简介 单价 Batch API 定价
GLM-4-Flash 语言模型 免费 免费
GLM-4V-Flash 图像理解 免费 不支持
CogView-3-Flash 图像生成 免费 不支持
CogVideoX-Flash 视频生成 免费 不支持

全自研第四代基座大模型 GLM-4,性能相比GLM-3提升60%,IFEval指令跟随能力评测高达90%,128k上下文大海捞针测试100%精准召回,同时具备视觉及高级Agent能力。

模型 简介 上下文 单价 Batch API 定价
GLM-Zero-Preview 复杂推理 16K 0.01 元 / 千tokens 不支持
GLM-4-Plus 高智能旗舰 128K 0.05 元 / 千tokens 0.025元 / 千tokens
GLM-4-0520 高智能模型 128K 0.1 元 / 千tokens 0.05元 / 千tokens
GLM-4-AirX 极速推理 8K 0.01 元 / 千tokens 不支持
GLM-4-Air 高性价比 128K 0.0005 元 / 千tokens 0.00025元 / 千tokens
GLM-4-Long 超长输入 1M 0.001 元 / 千tokens 不支持
GLM-4-FlashX 高速低价 128K 0.0001 元 / 千tokens 不支持

我们非常重视开发者对其他垂类应用场景的模型 API 需求,我们提供基于 GLM 架构的角色扮演、心理陪伴、代码生成等垂类模型。

模型 简介 上下文 单价 Batch API 定价
CharGLM-4 角色扮演 8K 0.001 元 / 千tokens 不支持
Emohaa 心理陪伴 8K 0.015 元 / 千tokens 不支持
CodeGeeX-4 代码生成 128K 0.0001 元 / 千tokens 不支持
Rerank 重排序模型 4K 0.0008 元 / 千tokens 不支持
新用户赠送 Tokens包 【新用户专享】1600万GLM-4-Air 推理资源包 赠送 ¥0
1 Tokens包 【新用户专享】200万GLM-4-Plus 推理资源包 赠送 ¥0
2 Tokens包 【新用户专享】400次图像与视频生成推理资源包 赠送 ¥0
3 Tokens包 【新用户专享】200万通用模型推理资源包 赠送 ¥0

image-20250111191130269

DeepSeek

在线使用:https://chat.deepseek.com/

邀请链接:暂无

平台:https://api-docs.deepseek.com/zh-cn/

价格介绍:https://api-docs.deepseek.com/zh-cn/quick_start/pricing/

账单管理:https://platform.deepseek.com/usage

文档:https://api-docs.deepseek.com/zh-cn/

请求URL:https://api.deepseek.com

API申请管理:https://platform.deepseek.com/api_keys

API:

deepseek-chat

收费:deepseek-chat

*** 出于与 OpenAI 兼容考虑,您也可以将 **base_url 设置为 https://api.deepseek.com/v1 来使用,但注意,此处 v1 与模型版本无关。

*** **deepseek-chat 模型已全面升级为 DeepSeek-V3,接口不变。 通过指定 model='deepseek-chat' 即可调用 DeepSeek-V3。


DeepSeek 模型已升级至 V3!截止到北京时间 2025 年 2 月 8 日 24:00,调用模型均享优惠价,与历史价格一致。优惠期结束后 DeepSeek-V3 API 价格将升级调整,后续自动按照全新价格计费

模型(1) 上下文长度 最大输出长度(2) 输入价格 (缓存命中)(3) 输入价格 (缓存未命中) 输出价格
deepseek-chat 64K 8K 0.5元/百万tokens(4) 0.1元/百万tokens 2元/百万tokens(4) 1元/百万tokens 8元/百万tokens(4) 2元/百万tokens

通义千问

在线使用:https://tongyi.aliyun.com/

邀请链接:暂无

平台:https://www.aliyun.com/product/bailian

价格介绍:https://help.aliyun.com/zh/model-studio/getting-started/models

账单管理:

文档:https://help.aliyun.com/zh/model-studio/getting-started/first-api-call-to-qwen

请求URL:https://dashscope.aliyuncs.com/compatible-mode/v1

API申请管理:https://bailian.console.aliyun.com/?apiKey=1#/api-key

API:

百炼开通后180天内,免费赠送100万Token,大部分模型都可以使用

通义千问-Plus

能力均衡,推理效果、成本和速度介于通义千问-Max和通义千问-Turbo之间,适合中等复杂任务

收费:qwen-plus,qwen-plus-latest,qwen-plus-2024-08-06

通义千问-Turbo

通义千问系列速度最快、成本很低的模型,适合简单任务

收费:qwen-turbo,qwen-turbo-latest,qwen-turbo-2024-06-24

Qwen-Long

支持总结和分析长达千万字的文档,且成本极低。

收费:qwen-long

通义千问VL

通义千问VL是具有视觉(图像)理解能力的文本生成模型,不仅能进行OCR(图片文字识别),还能进一步总结和推理,例如从商品照片中提取属性,根据习题图进行解题等。

收费:qwen-vl-max,qwen-vl-max-latest,qwen-vl-plus,qwen-vl-plus-latest

通义千问OCR

通义千问OCR模型是专用于文字提取的模型。相较于通义千问VL模型,它更专注于文档、表格、试题、手写体文字等类型图像的文字提取能力。它能够识别多种语言,包括英语、法语、日语、韩语、德语、俄语和意大利语等。

收费:qwen-vl-ocr,qwen-vl-ocr-latest,qwen-vl-ocr-2024-10-28

通义千问Audio

通义千问Audio是音频理解模型,支持输入多种音频(人类语音、自然音、音乐、歌声)和文本,并输出文本。该模型不仅能对输入的音频进行转录,还具备更深层次的语义理解、情感分析、音频事件检测、语音聊天等能力。

qwen-audio-turbo,qwen-audio-turbo-latest

通义千问Coder

收费:qwen-coder-plus,qwen-coder-plus-latest,qwen-coder-turbo,qwen-coder-turbo-latest

免费:qwen2.5-coder-3b-instruct

通义千问-开源版

模型名称中,xxb表示参数规模,例如qwen2-72b-instruct表示参数规模为72B,即720亿。

百炼支持调用通义千问的开源版,您无需本地部署模型。对于开源版,建议使用Qwen2.5或Qwen2模型。

收费:qwen2.5-72b-instruct,qwen2.5-32b-instruct,qwen2.5-14b-instruct,qwen2.5-7b-instruct

免费:qwen2.5-3b-instruct,qwen2.5-1.5b-instruct,qwen2.5-0.5b-instruct

字节豆包

在线使用:https://www.doubao.com/chat/

邀请链接:暂无

平台:https://console.volcengine.com/ark/region:ark+cn-beijing/experience

价格介绍:

账单管理:https://console.volcengine.com/ark/region:ark+cn-beijing/openManagement?LLM=%7B%7D&OpenTokenDrawer=false

文档:https://www.volcengine.com/docs/82379/1302013

请求URL:https://ark.cn-beijing.volces.com/api/v3/chat/completions

API申请管理:https://console.volcengine.com/ark/region:ark+cn-beijing/apiKey?apikey=%7B%7D

API:


模型名称:需要填入的是创建的推理接入点 ID,而不是模型名称

https://www.volcengine.com/docs/82379/1298454

Doubao-pro-256k:ep-20250112213054-fcnpj

科大讯飞

在线使用:https://xinghuo.xfyun.cn/spark

邀请链接:暂无

平台:https://console.xfyun.cn/services/sparkapiCenter

价格介绍:https://xinghuo.xfyun.cn/sparkapi#price

账单管理:

文档:https://www.xfyun.cn/doc/spark/HTTP%E8%B0%83%E7%94%A8%E6%96%87%E6%A1%A3.html

请求URL:https://spark-api-open.xf-yun.com/v1/chat/completions

API申请管理:https://console.xfyun.cn/services/cbm

API:

参数名称 类型 是否必传 取值范围 描述
model string lite generalv3 pro-128k generalv3.5 max-32k 4.0Ultra 指定访问的模型版本: lite指向Lite版本; generalv3指向Pro版本; pro-128k指向Pro-128K版本; generalv3.5指向Max版本; max-32k指向Max-32K版本; 4.0Ultra指向4.0 Ultra版本;

腾讯混元

在线使用:https://yuanbao.tencent.com/chat/naQivTmsDa

邀请链接:暂无

平台:https://cloud.tencent.com/product/hunyuan

价格介绍:https://cloud.tencent.com/document/product/1729/97731

账单管理:https://console.cloud.tencent.com/hunyuan/packages

文档:https://cloud.tencent.com/document/product/1729

请求URL:https://hunyuan.tencentcloudapi.com

API申请管理:https://console.cloud.tencent.com/hunyuan/api-keyhttps://platform.deepseek.com/api_keys

API:

免费:hunyuan-lite

收费:hunyuan-turbo,hunyuan-turbo-latest,hunyuan-large,hunyuan-large-longcontext,hunyuan-turbo-vision,hunyuan-standard-vision,hunyuan-standard,hunyuan-standard-256K,hunyuan-pro,hunyuan-code,hunyuan-role,hunyuan-functioncall,hunyuan-vision,


image-20250107003422281

image-20250111201317460

文心一言

在线使用:https://bigmodel.cn/trialcenter/modeltrial?modelCode=glm-4-plus

邀请链接:

平台:https://console.bce.baidu.com/qianfan/ais/console/onlineTest/LLM/ERNIE-4.0-Turbo-128K

价格介绍:https://cloud.baidu.com/doc/WENXINWORKSHOP/s/hlrk4akp7

账单管理:

文档:https://console.bce.baidu.com/support/?timestamp=1736225949689#/api

请求URL:https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions_pro

API申请管理:https://console.bce.baidu.com/qianfan/ais/console/applicationConsole/application/v1

API:

image-20250107130541189

在线测试:https://console.bce.baidu.com/support/?timestamp=1736225949689#/api?product=QIANFAN&project=%E5%8D%83%E5%B8%86ModelBuilder&parent=ERNIE%204.0&api=rpc%2F2.0%2Fai_custom%2Fv1%2Fwenxinworkshop%2Fchat%2Fcompletions_pro&method=post

零一万物

在线使用:https://platform.lingyiwanwu.com/playground?model=yi-lightning

邀请链接:暂无

平台:https://platform.lingyiwanwu.com/

价格介绍:https://platform.lingyiwanwu.com/docs#%E6%A8%A1%E5%9E%8B%E4%B8%8E%E8%AE%A1%E8%B4%B9

账单管理:https://platform.lingyiwanwu.com/billing

文档:https://platform.lingyiwanwu.com/docs

请求URL:https://api.lingyiwanwu.com/v1/chat/completions

API申请管理:https://platform.lingyiwanwu.com/apikeys

API:

新账号赠送36元

image-20250112210453925

image-20250112210735444

月之暗面 KIMI

在线使用:https://kimi.moonshot.cn/

邀请链接:暂无

平台:https://platform.moonshot.cn/

价格介绍:https://platform.moonshot.cn/docs/pricing/chat#%E8%AE%A1%E8%B4%B9%E9%80%BB%E8%BE%91

账单管理:https://platform.moonshot.cn/console/account

文档:https://platform.moonshot.cn/docs/

请求URL:https://api.moonshot.cn

API申请管理:https://platform.moonshot.cn/console/api-keys

API:

百川

在线使用:https://platform.baichuan-ai.com/playground

邀请链接:暂无

平台:https://platform.moonshot.cn/

价格介绍:https://platform.baichuan-ai.com/price

账单管理:https://platform.baichuan-ai.com/console/bill

文档:https://platform.baichuan-ai.com/docs/api

请求URL:https://api.baichuan-ai.com/v1/chat/completions

API申请管理:https://platform.baichuan-ai.com/console/apikey

API:


百川实名认证后才可以充值,而且实名认证要求身份证号和手机号都是同一个身份证

使用的模型 ID,模型列表: Baichuan4-Turbo Baichuan4-Air Baichuan4 Baichuan3-Turbo Baichuan3-Turbo-128k Baichuan2-Turbo

阶跃星辰

在线使用:https://platform.stepfun.com/console-tools

邀请链接:暂无

平台:https://platform.stepfun.com/

价格介绍:https://platform.stepfun.com/docs/pricing/details

账单管理:https://platform.stepfun.com/account-overview

文档:https://platform.stepfun.com/docs

请求URL:https://api.stepfun.com/v1/chat/completions

API申请管理:https://api.stepfun.com/v1/chat/completions

API:


文本大模型 Step-1 的定价表

模型 计费单位 输入价格 输出价格
step-1-8k 1M tokens 5元 20元
step-1-32k 1M tokens 15元 70元
step-1-128k 1M tokens 40元 200元
step-1-256k 1M tokens 95元 300元
step-1-flash 1M tokens 1元 4元

MINMAX

在线使用:https://platform.minimaxi.com/examination-center/text-experience-center/cc_v2

邀请链接:暂无

平台:https://www.minimaxi.com/

价格介绍:https://platform.minimaxi.com/document/Price

账单管理:https://platform.minimaxi.com/user-center/payment/billing-history

文档:https://platform.stepfun.com/docs

请求URL:https://api.minimax.chat/v1/text/chatcompletion_v2

API申请管理:https://platform.minimaxi.com/user-center/basic-information/interface-key

API:

360智脑

在线使用:

邀请链接:暂无

平台:https://ai.360.com/open


需要先申请,人工审核

国外模型

谷歌gemini

在线使用:https://gemini.google.com/app?hl=zh

邀请链接:暂无

平台:https://aistudio.google.com/prompts/new_chat

价格介绍:https://ai.google.dev/pricing?hl=zh-cn#1_5flash

账单管理:

文档:https://ai.google.dev/gemini-api/docs?utm_source=gfd&utm_medium=referral&utm_campaign=blog-dec&utm_content=gemini2-L0-docs&hl=zh-cn

请求URL:https://generativelanguage.googleapis.com

API申请管理:

API:

收费:gemini-2.0-flash

有google账号,个人就可以在AI studio在免费使用gemini的各种模型:

https://ai.google.dev/gemini-api/docs/ai-studio-quickstart?hl=zh-cn

Anthropic的Claude

在线使用:https://console.anthropic.com/workbench/

邀请链接:暂无

平台:https://console.anthropic.com

价格介绍:

账单管理:https://console.anthropic.com/settings/billing

文档:https://docs.anthropic.com/zh-CN/api/getting-started

请求URL:https://api.anthropic.com/v1/messages

API申请管理:

API:

收费:claude-3-5-sonnet-20241022