常用大模型接口
大模型工具
电脑版/苹果设备推荐用 cherry studio;安卓设备可以用Poe或chat Bot;不建议用chat box,我在使用过程中遇到诸多的恶性BUG。
cherry studio 里面已经配置好了API地址和名称,填入API即可,其内置的服务基本涵盖常用的聚合代理商和各家模型商
模型聚合商
国内聚合
ocoolAI
在线使用:https://one.ocoolai.com/chat/1-cw
邀请链接:https://one.ocoolai.com/register/?aff_code=nEi5
价格介绍:https://one.ocoolai.com/account/pricing
文档:https://one.ocoolai.com/chat/3-table
请求URL:https://one.ocoolai.com
API申请管理:
API:
代理的模型非常全面,基本常见的模型都有,价格正常
CloseAI
该站代理openAI的chatgpt、Anthropic的Claude、Google的Gemini。
在线使用:https://www.closechat.org/
邀请链接:https://referer.shadowai.xyz/r/1021300
平台:https://www.closeai-asia.com/
价格介绍:https://www.closeai-asia.com/pricing
账单管理:https://platform.closeai-asia.com/account/billing
文档:https://doc.closeai-asia.com/tutorial/library.html
请求URL:https://api.openai-proxy.org
API申请管理:https://platform.closeai-asia.com/developer/api
API:
不同供应商,对应的请求URL不同:
模型供应商 | 原域名 | 替换为 | 备注 |
---|---|---|---|
OpenAI | https://api.openai.com/v1 | https://api.openai-proxy.org/v1 | 一般需要加/v1 |
Anthropic | https://api.anthropic.com | https://api.openai-proxy.org/anthropic | 添加/anthropic后缀 |
Gemini | https://generativelanguage.googleapis.com | https://api.openai-proxy.org/google | 添加/google后缀 |
DeerAPI
价格介绍:https://api.deerapi.com/pricing
文档:https://api.deerapi.com/doc
适合用来了解当前比较热门的模型有哪些,代理的模型最全面,600+。
缺点是价格体系比较模糊,可能并不适合使用。
硅基流动
在线使用:https://cloud.siliconflow.cn/playground/chat/
邀请链接:https://cloud.siliconflow.cn/i/2O22SLhR
平台:https://cloud.siliconflow.cn/
价格介绍:https://siliconflow.cn/zh-cn/pricing
账单管理:https://cloud.siliconflow.cn/bills
文档:https://doc.closeai-asia.com/tutorial/library.html
请求URL:https://api.siliconflow.cn/v1/chat/completions
API申请管理:https://cloud.siliconflow.cn/account/ak
API:
注意,不同的模型,使用的请求URL并不相同;另外该站代理的模型较少,没有OpenAI的chatgpt,代理的谷歌等也不全。但是注册赠送14块钱,没有过期时间,有较多完全免费的小模型调用。
国外聚合
国外的聚合站价格比国内的要贵不少,而且看起来,国外代理站的价格相对统一,国内代理站的价格也相对统一;
openrouter.ai
在线使用:https://openrouter.ai/chat
邀请链接:暂无
价格介绍:https://openrouter.ai/models
账单管理:https://openrouter.ai/credits
文档:https://openrouter.ai/docs/quick-start
请求URL:https://openrouter.ai/api/v1
API申请管理:https://openrouter.ai/settings/keys
API:
免费模型:https://openrouter.ai/models?max_price=0
AiHubMix
在线使用:https://doc.aihubmix.com/
邀请链接:https://aihubmix.com?aff=kF3q
价格介绍:https://aihubmix.com/models
账单管理:https://aihubmix.com/statistics
请求URL:https://aihubmix.com
API申请管理:https://aihubmix.com/token
API:
模型提供商
国内模型
智谱AI
在线使用:https://bigmodel.cn/trialcenter/modeltrial?modelCode=glm-4-plus
邀请链接:https://www.bigmodel.cn/invite?icode=nVCjjIBWT38YRtaMPDXeSOZLO2QH3C0EBTSr%2BArzMw4%3D
价格介绍:https://bigmodel.cn/pricing
账单管理:https://open.bigmodel.cn/finance/resourcepack
文档:https://bigmodel.cn/dev/api/normal-model/glm-4
请求URL:https://open.bigmodel.cn/api/paas/v4/chat/completions
API申请管理:https://www.bigmodel.cn/invite?icode=nVCjjIBWT38YRtaMPDXeSOZLO2QH3C0EBTSr%2BArzMw4%3D
API:
GLM-4系列—文本型
GLM-4 系列提供了复杂推理、超长上下文、极快推理速度等多款模型,适用于多种应用场景。
免费:glm-4-flash
收费:glm-zero-preview,glm-4-plus,glm-4-0520,glm-4-air,glm-4-airx,glm-4-long,glm-4-flashx
GLM-4V系列—多模态
GLM-4 系列提供了多图理解、视频理解、单图理解度等多款模型,适用于多种应用场景。
免费:glm-4v-flash
收费:glm-4v-plus,glm-4v
专用场景模型—代码、角色扮演、心理咨询
CodeGeeX是一款强大的AI编程助手,提供智能问答和代码补全功能,支持多种编程语言,帮助开发者提高编程效率。
charglm-4支持基于人设的角色扮演、超长多轮的记忆、千人千面的角色对话,广泛应用于情感陪伴、游戏智能NPC、网红/明星/影视剧IP分身、数字人/虚拟主播、文字冒险游戏等拟人对话或游戏场景。
Emohaa学习了经典的Hill助人理论,拥有人类心理咨询师的专业话术能力,具有较强的倾听、情感映射、共情等情绪支持能力,帮助用户了解自身想法和感受,学习应对情绪问题,帮助用户实现乐观、积极的心理和情感状态。
收费:codegeex-4,charglm-4,emohaa
Flash 免费系列全面覆盖语言模型、视觉理解、图像生成及视频生成等多种模型。可以准确理解各任务场景语言描述及指令,更精确的完成多模态理解类任务,或生成高质量的图片、视频等多模态内容。
模型 | 简介 | 单价 | Batch API 定价 |
---|---|---|---|
GLM-4-Flash | 语言模型 | 免费 | 免费 |
GLM-4V-Flash | 图像理解 | 免费 | 不支持 |
CogView-3-Flash | 图像生成 | 免费 | 不支持 |
CogVideoX-Flash | 视频生成 | 免费 | 不支持 |
全自研第四代基座大模型 GLM-4,性能相比GLM-3提升60%,IFEval指令跟随能力评测高达90%,128k上下文大海捞针测试100%精准召回,同时具备视觉及高级Agent能力。
模型 | 简介 | 上下文 | 单价 | Batch API 定价 |
---|---|---|---|---|
GLM-Zero-Preview | 复杂推理 | 16K | 0.01 元 / 千tokens | 不支持 |
GLM-4-Plus | 高智能旗舰 | 128K | 0.05 元 / 千tokens | 0.025元 / 千tokens |
GLM-4-0520 | 高智能模型 | 128K | 0.1 元 / 千tokens | 0.05元 / 千tokens |
GLM-4-AirX | 极速推理 | 8K | 0.01 元 / 千tokens | 不支持 |
GLM-4-Air | 高性价比 | 128K | 0.0005 元 / 千tokens | 0.00025元 / 千tokens |
GLM-4-Long | 超长输入 | 1M | 0.001 元 / 千tokens | 不支持 |
GLM-4-FlashX | 高速低价 | 128K | 0.0001 元 / 千tokens | 不支持 |
我们非常重视开发者对其他垂类应用场景的模型 API 需求,我们提供基于 GLM 架构的角色扮演、心理陪伴、代码生成等垂类模型。
模型 | 简介 | 上下文 | 单价 | Batch API 定价 |
---|---|---|---|---|
CharGLM-4 | 角色扮演 | 8K | 0.001 元 / 千tokens | 不支持 |
Emohaa | 心理陪伴 | 8K | 0.015 元 / 千tokens | 不支持 |
CodeGeeX-4 | 代码生成 | 128K | 0.0001 元 / 千tokens | 不支持 |
Rerank | 重排序模型 | 4K | 0.0008 元 / 千tokens | 不支持 |
新用户赠送 | Tokens包 | 【新用户专享】1600万GLM-4-Air 推理资源包 | 赠送 | ¥0 |
---|---|---|---|---|
1 | Tokens包 | 【新用户专享】200万GLM-4-Plus 推理资源包 | 赠送 | ¥0 |
2 | Tokens包 | 【新用户专享】400次图像与视频生成推理资源包 | 赠送 | ¥0 |
3 | Tokens包 | 【新用户专享】200万通用模型推理资源包 | 赠送 | ¥0 |
DeepSeek
在线使用:https://chat.deepseek.com/
邀请链接:暂无
平台:https://api-docs.deepseek.com/zh-cn/
价格介绍:https://api-docs.deepseek.com/zh-cn/quick_start/pricing/
账单管理:https://platform.deepseek.com/usage
文档:https://api-docs.deepseek.com/zh-cn/
请求URL:https://api.deepseek.com
API申请管理:https://platform.deepseek.com/api_keys
API:
deepseek-chat
收费:deepseek-chat
*** 出于与 OpenAI 兼容考虑,您也可以将 **base_url
设置为 https://api.deepseek.com/v1
来使用,但注意,此处 v1
与模型版本无关。
*** **deepseek-chat
模型已全面升级为 DeepSeek-V3,接口不变。 通过指定 model='deepseek-chat'
即可调用 DeepSeek-V3。
DeepSeek 模型已升级至 V3!截止到北京时间 2025 年 2 月 8 日 24:00,调用模型均享优惠价,与历史价格一致。优惠期结束后 DeepSeek-V3 API 价格将升级调整,后续自动按照全新价格计费
模型(1) | 上下文长度 | 最大输出长度(2) | 输入价格 (缓存命中)(3) | 输入价格 (缓存未命中) | 输出价格 |
---|---|---|---|---|---|
deepseek-chat | 64K | 8K |
通义千问
在线使用:https://tongyi.aliyun.com/
邀请链接:暂无
平台:https://www.aliyun.com/product/bailian
价格介绍:https://help.aliyun.com/zh/model-studio/getting-started/models
账单管理:
文档:https://help.aliyun.com/zh/model-studio/getting-started/first-api-call-to-qwen
请求URL:https://dashscope.aliyuncs.com/compatible-mode/v1
API申请管理:https://bailian.console.aliyun.com/?apiKey=1#/api-key
API:
百炼开通后180天内,免费赠送100万Token,大部分模型都可以使用
通义千问-Plus
能力均衡,推理效果、成本和速度介于通义千问-Max和通义千问-Turbo之间,适合中等复杂任务
收费:qwen-plus,qwen-plus-latest,qwen-plus-2024-08-06
通义千问-Turbo
通义千问系列速度最快、成本很低的模型,适合简单任务
收费:qwen-turbo,qwen-turbo-latest,qwen-turbo-2024-06-24
Qwen-Long
支持总结和分析长达千万字的文档,且成本极低。
收费:qwen-long
通义千问VL
通义千问VL是具有视觉(图像)理解能力的文本生成模型,不仅能进行OCR(图片文字识别),还能进一步总结和推理,例如从商品照片中提取属性,根据习题图进行解题等。
收费:qwen-vl-max,qwen-vl-max-latest,qwen-vl-plus,qwen-vl-plus-latest
通义千问OCR
通义千问OCR模型是专用于文字提取的模型。相较于通义千问VL模型,它更专注于文档、表格、试题、手写体文字等类型图像的文字提取能力。它能够识别多种语言,包括英语、法语、日语、韩语、德语、俄语和意大利语等。
收费:qwen-vl-ocr,qwen-vl-ocr-latest,qwen-vl-ocr-2024-10-28
通义千问Audio
通义千问Audio是音频理解模型,支持输入多种音频(人类语音、自然音、音乐、歌声)和文本,并输出文本。该模型不仅能对输入的音频进行转录,还具备更深层次的语义理解、情感分析、音频事件检测、语音聊天等能力。
qwen-audio-turbo,qwen-audio-turbo-latest
通义千问Coder
收费:qwen-coder-plus,qwen-coder-plus-latest,qwen-coder-turbo,qwen-coder-turbo-latest
免费:qwen2.5-coder-3b-instruct
通义千问-开源版
模型名称中,xxb表示参数规模,例如qwen2-72b-instruct表示参数规模为72B,即720亿。
百炼支持调用通义千问的开源版,您无需本地部署模型。对于开源版,建议使用Qwen2.5或Qwen2模型。
收费:qwen2.5-72b-instruct,qwen2.5-32b-instruct,qwen2.5-14b-instruct,qwen2.5-7b-instruct
免费:qwen2.5-3b-instruct,qwen2.5-1.5b-instruct,qwen2.5-0.5b-instruct
字节豆包
在线使用:https://www.doubao.com/chat/
邀请链接:暂无
平台:https://console.volcengine.com/ark/region:ark+cn-beijing/experience
价格介绍:
文档:https://www.volcengine.com/docs/82379/1302013
请求URL:https://ark.cn-beijing.volces.com/api/v3/chat/completions
API申请管理:https://console.volcengine.com/ark/region:ark+cn-beijing/apiKey?apikey=%7B%7D
API:
模型名称:需要填入的是创建的推理接入点 ID,而不是模型名称
https://www.volcengine.com/docs/82379/1298454
Doubao-pro-256k:ep-20250112213054-fcnpj
科大讯飞
在线使用:https://xinghuo.xfyun.cn/spark
邀请链接:暂无
平台:https://console.xfyun.cn/services/sparkapiCenter
价格介绍:https://xinghuo.xfyun.cn/sparkapi#price
账单管理:
文档:https://www.xfyun.cn/doc/spark/HTTP%E8%B0%83%E7%94%A8%E6%96%87%E6%A1%A3.html
请求URL:https://spark-api-open.xf-yun.com/v1/chat/completions
API申请管理:https://console.xfyun.cn/services/cbm
API:
参数名称 | 类型 | 是否必传 | 取值范围 | 描述 |
---|---|---|---|---|
model | string | 是 | lite generalv3 pro-128k generalv3.5 max-32k 4.0Ultra | 指定访问的模型版本: lite指向Lite版本; generalv3指向Pro版本; pro-128k指向Pro-128K版本; generalv3.5指向Max版本; max-32k指向Max-32K版本; 4.0Ultra指向4.0 Ultra版本; |
腾讯混元
在线使用:https://yuanbao.tencent.com/chat/naQivTmsDa
邀请链接:暂无
平台:https://cloud.tencent.com/product/hunyuan
价格介绍:https://cloud.tencent.com/document/product/1729/97731
账单管理:https://console.cloud.tencent.com/hunyuan/packages
文档:https://cloud.tencent.com/document/product/1729
请求URL:https://hunyuan.tencentcloudapi.com
API申请管理:https://console.cloud.tencent.com/hunyuan/api-keyhttps://platform.deepseek.com/api_keys
API:
免费:hunyuan-lite
收费:hunyuan-turbo,hunyuan-turbo-latest,hunyuan-large,hunyuan-large-longcontext,hunyuan-turbo-vision,hunyuan-standard-vision,hunyuan-standard,hunyuan-standard-256K,hunyuan-pro,hunyuan-code,hunyuan-role,hunyuan-functioncall,hunyuan-vision,
文心一言
在线使用:https://bigmodel.cn/trialcenter/modeltrial?modelCode=glm-4-plus
邀请链接:
平台:https://console.bce.baidu.com/qianfan/ais/console/onlineTest/LLM/ERNIE-4.0-Turbo-128K
价格介绍:https://cloud.baidu.com/doc/WENXINWORKSHOP/s/hlrk4akp7
账单管理:
文档:https://console.bce.baidu.com/support/?timestamp=1736225949689#/api
请求URL:https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions_pro
API申请管理:https://console.bce.baidu.com/qianfan/ais/console/applicationConsole/application/v1
API:
零一万物
在线使用:https://platform.lingyiwanwu.com/playground?model=yi-lightning
邀请链接:暂无
平台:https://platform.lingyiwanwu.com/
价格介绍:https://platform.lingyiwanwu.com/docs#%E6%A8%A1%E5%9E%8B%E4%B8%8E%E8%AE%A1%E8%B4%B9
账单管理:https://platform.lingyiwanwu.com/billing
文档:https://platform.lingyiwanwu.com/docs
请求URL:https://api.lingyiwanwu.com/v1/chat/completions
API申请管理:https://platform.lingyiwanwu.com/apikeys
API:
新账号赠送36元
月之暗面 KIMI
在线使用:https://kimi.moonshot.cn/
邀请链接:暂无
平台:https://platform.moonshot.cn/
价格介绍:https://platform.moonshot.cn/docs/pricing/chat#%E8%AE%A1%E8%B4%B9%E9%80%BB%E8%BE%91
账单管理:https://platform.moonshot.cn/console/account
文档:https://platform.moonshot.cn/docs/
请求URL:https://api.moonshot.cn
API申请管理:https://platform.moonshot.cn/console/api-keys
API:
百川
在线使用:https://platform.baichuan-ai.com/playground
邀请链接:暂无
平台:https://platform.moonshot.cn/
价格介绍:https://platform.baichuan-ai.com/price
账单管理:https://platform.baichuan-ai.com/console/bill
文档:https://platform.baichuan-ai.com/docs/api
请求URL:https://api.baichuan-ai.com/v1/chat/completions
API申请管理:https://platform.baichuan-ai.com/console/apikey
API:
百川实名认证后才可以充值,而且实名认证要求身份证号和手机号都是同一个身份证
使用的模型 ID,模型列表: Baichuan4-Turbo Baichuan4-Air Baichuan4 Baichuan3-Turbo Baichuan3-Turbo-128k Baichuan2-Turbo
阶跃星辰
在线使用:https://platform.stepfun.com/console-tools
邀请链接:暂无
平台:https://platform.stepfun.com/
价格介绍:https://platform.stepfun.com/docs/pricing/details
账单管理:https://platform.stepfun.com/account-overview
文档:https://platform.stepfun.com/docs
请求URL:https://api.stepfun.com/v1/chat/completions
API申请管理:https://api.stepfun.com/v1/chat/completions
API:
文本大模型 Step-1 的定价表
模型 | 计费单位 | 输入价格 | 输出价格 |
---|---|---|---|
step-1-8k | 1M tokens | 5元 | 20元 |
step-1-32k | 1M tokens | 15元 | 70元 |
step-1-128k | 1M tokens | 40元 | 200元 |
step-1-256k | 1M tokens | 95元 | 300元 |
step-1-flash | 1M tokens | 1元 | 4元 |
MINMAX
在线使用:https://platform.minimaxi.com/examination-center/text-experience-center/cc_v2
邀请链接:暂无
价格介绍:https://platform.minimaxi.com/document/Price
账单管理:https://platform.minimaxi.com/user-center/payment/billing-history
文档:https://platform.stepfun.com/docs
请求URL:https://api.minimax.chat/v1/text/chatcompletion_v2
API申请管理:https://platform.minimaxi.com/user-center/basic-information/interface-key
API:
360智脑
在线使用:
邀请链接:暂无
需要先申请,人工审核
国外模型
谷歌gemini
在线使用:https://gemini.google.com/app?hl=zh
邀请链接:暂无
平台:https://aistudio.google.com/prompts/new_chat
价格介绍:https://ai.google.dev/pricing?hl=zh-cn#1_5flash
账单管理:
请求URL:https://generativelanguage.googleapis.com
API申请管理:
API:
收费:gemini-2.0-flash
有google账号,个人就可以在AI studio在免费使用gemini的各种模型:
https://ai.google.dev/gemini-api/docs/ai-studio-quickstart?hl=zh-cn
Anthropic的Claude
在线使用:https://console.anthropic.com/workbench/
邀请链接:暂无
平台:https://console.anthropic.com
价格介绍:
账单管理:https://console.anthropic.com/settings/billing
文档:https://docs.anthropic.com/zh-CN/api/getting-started
请求URL:https://api.anthropic.com/v1/messages
API申请管理:
API:
收费:claude-3-5-sonnet-20241022