那个最适合你?主流大模型评测!

1、入选模型
所属公司 - 详细 |
|||
---|---|---|---|
所属公司 | 所属公司 | ||
01、ChatGPT | 美国 OpenAI | 12、Kimi | 北京 月之暗面 |
02、Claude | 美国 Anthropic | 13、豆包 | 北京 字节跳动 |
03、Gemini | 美国 Google | 14、万知 | 北京 零一万物 |
04、Llama | 美国 Meta | 15、跃问 | 上海 阶跃星辰 |
05、Mistral | 法国 Mistral | 16、DeepSeek | 北京 深度求索 |
06、Reka | 美国 Reka | 17、商汤商量 | 上海 日日新 |
07、文心一言 | 北京 百度 | 18、海螺 AI | 上海 稀宇科技 |
08、通义千问 | 杭州 阿里 | 19、百川 | 北京 昆仑万维 |
09、腾讯元宝 | 深圳 腾讯 | 20、天工 AI | 北京 百川智能 |
10、智谱清言 | 北京 智谱华章 | 21、秘塔 AI | 上海 秘塔网络 |
11、讯飞星火 | 合肥 科大讯飞 | 22、360 AI | 北京 奇虎科技 |
自 DeepSeek 开源以后,“百模大战”进入了第二阶段,有的选择了“投降”,接入 DeepSeek。
有的,则加快了研发,就在昨天 Claude 3.7 发布。
1、简介
Claude 是 OpenAI 员工离职后的自立门户,号称是 ChatGPT 最强对手,一度并称为“双雄”。
Claude 一共有 3 个模型,性能从低到高,分别是 Haiku、Sonnet、Opus。
Haiku(绯句),也就是 Mini 版,速度最快。
Sonnet(十四行诗),也就是标准版本。
Opus(巨作),Pro 版,性能最强。
Claude 3.7 的发布,是业界首个“混合推理模型”。
简单来说,就好比 DeepSeek 将 V3 “普通大语言模型” 和 R1 “推理模型”融合在了一起。
这是一种全新的设计理念。
同时,它也是最强的“代码模型”,在很多程序员用户的口碑里,Claude 的代码能力独一档。
在测试了 6 个“大语言模型智障测试”里,
Claude 还真就用“代码”的方式来数 r 的数量,结果也是对的。
还有,它的中文能力还是差点意思,毕竟是国外的大模型,中文语料库少,也可以理解。
2、注册
不过,Claude 对中国大陆用户极不友好,曾经大规模封禁过中国 IP。
好在现在 Claude 已经似乎没有那么强硬了,又或者是获得投资后,服务器资源充裕了。
奶酪重新注册了帐号,并使用了一段时间,期间一切正常。
但是!
现在注册 Claude 帐号,首先要有“魔法”,其次要用“谷歌帐号”,最后还要“手机验证”。
最难的是“手机验证”。
一个简单的方法,是到淘宝、拼多多这样的网站是购买手机验证服务,价格一般在 1-3 元。
搜索 “claude 手机号” 即可,亲测可用。
3、备用
如果你卡在了第一步,没有“魔法”。
那么,奶酪推荐一个国内就可以使用的公益项目,完全免费了很长一段时间,名字叫“在问”。
免魔法,直接使用,同时它也支持“国内外”多家大模型,你可以自由选择。
地址:https://zaiwen.xueban.org.cn/chat
4、使用
还有,如果你有在用“奶酪浏览器”,那么你还可以一键调用使用它们,一共有 3 种调用方法。
1、右键菜单
在网页里,选中关键字即可一键搜索,支持 Claude,支持在问,支持 20 多家主流大模型。
2、关键字搜索
在地址栏里直接搜索,先输入 cs,空格后输入 e,再次空格后,输入要搜索的关键词。
这里的 e,你可以在扩展 ContextSearch web-ext 里自定义设置。
3、多重搜索
按快捷键 Al+2 弹出界面,点击大模型名称,浏览器就会依次搜索,右键点击,则后台打开。
5、API
Claude 的优势在于其代码能力,而且,你到官网上使用 Chat 聊天功能,仍然有被封的风险。
注册官网帐号,是为了可以第一时间体验新功能。
真正干活的,还得是 API。
目前,Claude 官网不接受中国大陆用户购买 API,从第三方平台充值,又需要 Visa 信用卡。
一个便宜实惠,又不需要魔法的方法,是“合租”。
去年的时候, 奶酪组建了一个“合租群”。
集齐了当下所有的大模型,特别是 ChatGPT 和 Claude,不需要合租,就可以直接购买。
而且,价格也是全网最低的,只需要买 50 块的 API,就可以用很久了。
如果你有需要,你可以考虑加入“奶酪合租群”。详细:https://www.runningcheese.com/hezu
DeepSeek
2024 年底,DeepSeek 发布最强开源 MoE 模型 DeepSeek V3。
它给世界带来的震撼在于,用了不到 1/10 的价格就比肩 gpt-4o,速度还比之前还快了 3 倍。
国内媒体给它打上了“AI 拼多多”的标签,但我不认同,我认为它是 “AI 小米”,
AI 的 “小米时刻” 已经到来。
优劣势:
DeepSeek 不但可以免费使用。
而且还提供了 API,我们可以用来完成具体的任务,比如把 API 用在 AI 编程工具 Cursor 上。
而且价格也是目前性价比最高的,1 元/百万 Tokens。
缺点的话,上下文最大只支持 128K,API 最大支持 64K,说实话实在太少了。
API Key:
DeepSeek 提供了能够兼容 OpenAI 的 API 格式,只要将 API 信息填在 OpenAI 一栏即可。
我们以 AI 编程工具 Cursor 以例。
API Key:https://platform.deepseek.com/api_keys
URL:https://api.deepseek.com/v1
Model:deepseek-chat
在 Cursor 里使用自定义 API Key 方法下如:
免费 API Key:
DeepSeek API 的价格是每 10 块钱 500 百万 Tokens,价格在 2025 年 2 月 8 日前有效。
如果你不想花钱,那么可以考虑第三方网站提供的 API。
https://openrouter.ai 提供了 1 美元的免费额度。
使用方法与 DeepSeek 一样,就是在"模型名称"一栏要修改为:deepseek/deepseek-chat
API Key:https://openrouter.ai/settings/keys
URL:https://openrouter.ai/api/v1
Model:deepseek/deepseek-chat
参数量 - 详细 |
|||
---|---|---|---|
参数量 | 参数量 | ||
01、ChatGPT | MoE 万亿参数 | 12、Kimi | 2000 亿 |
02、Claude | 1370 亿 | 13、豆包 | 2000 亿 |
03、Gemini | MoE,具体未公布 | 14、万知 | 340 亿 |
04、Llama | 700 亿 | 15、跃问 | MoE 万亿参数 |
05、Mistral | MoE 1760 亿 | 16、DeepSeek | MoE 2360 亿 |
06、Reka | 具体未公布 | 17、商汤商量 | MoE 6000 亿 |
07、文心一言 | 2600 亿 | 18、海螺 AI | MoE 万亿参数 |
08、通义千问 | 1100 亿 | 19、百川 | 千亿参数 |
09、腾讯元宝 | MoE 万亿参数 | 20、天工 AI | MoE 4000 亿 |
10、智谱清言 | 1300 亿 | 21、秘塔 AI | 700 亿 |
11、讯飞星火 | 千亿参数 | 22、360 AI | 70 亿 |
上下文 - 详细 |
|||
---|---|---|---|
上下文 | 上下文 | ||
01、ChatGPT | 128K | 12、Kimi | 200K、2M |
02、Claude | 200K | 13、豆包 | 128K |
03、Gemini | 1M、2M | 14、万知 | 200K |
04、Llama | 8K、1M | 15、跃问 | 32K |
05、Mistral | 32K、64K | 16、DeepSeek | 32K、128K |
06、Reka | 128K | 17、商汤商量 | 128K |
07、文心一言 | 128K | 18、海螺 AI | 8K、245K |
08、通义千问 | 128K、10M | 19、百川 | 192K |
09、腾讯元宝 | 256K | 20、天工 AI | 未公布 |
10、智谱清言 | 128K | 21、秘塔 AI | 未公布 |
11、讯飞星火 | 8K | 22、360 AI | 360K |
多模态 - 详细 |
|||
---|---|---|---|
多模态 | 多模态 | ||
01、ChatGPT | 文、图、音 | 12、Kimi | 文 |
02、Claude | 文、图 | 13、豆包 | 文、图、音 |
03、Gemini | 文、图、音、视 | 14、万知 | 文 |
04、Llama | 文、图 | 15、跃问 | 文、图 |
05、Mistral | 文、 | 16、DeepSeek | 文 |
06、Reka | 文、图、音、视 | 17、商汤商量 | 文、图、音 |
07、文心一言 | 文、图、音、视 | 18、海螺 AI | 文、图、音 |
08、通义千问 | 文、图、音、视 | 19、百川 | 文、图 |
09、腾讯元宝 | 文、图 | 20、天工 AI | 文、图、音 |
10、智谱清言 | 文、图 | 21、秘塔 AI | 文 |
11、讯飞星火 | 文、图、音、视 | 22、360 AI | 文 |
API 价格 - 详细 |
||
---|---|---|
ChatGPT | 输入价格 / 1M tokens | 输出价格 / 1M tokens |
gpt-4o | 36 元 | 108 元 |
gpt-4-turbo | 72 元 | 216 元 |
gpt-3.5-turbo | 3.6 元 | 10.8 元 |
Claude | ||
Claude Opus | 108 元 | 540 元 |
Claude Sonnet | 21.6 元 | 108 元 |
Claude Haiku | 1.8 元 | 9 元 |
Gemini | ||
Gemini 1.5 Pro | 25.2 元 | 75.6 元 |
Gemini 1.5 Flash | 2.52 元 | 7.56 元 |
Mistral | ||
Mistral Large | 28.8 元 | 86.4 元 |
Mistral Medium | 19.44 元 | 58.32 元 |
Mistral Codestral | 7.2 元 | 21.6 元 |
Mistral Small | 7.2 元 | 21.6 元 |
Mixtral 8x22B | 14.4 元 | 43.2 元 |
Mixtral 8x7B | 5.04 元 | 5.04 元 |
Mistral 7B | 1.8 元 | 1.8 元 |
Reka | ||
Reka Core | 72 元 | 180 元 |
Reka Flash | 5.8 元 | 14.4 元 |
Reka Edge | 2.9 元 | 7.2 元 |
文心一言 | ||
ERNIE-4.0 | 120 元 | 120 元 |
ERNIE-3.5 | 12 元 | 12 元 |
ERNIE-Lite | 免费 | 免费 |
ERNIE-Speed | 免费 | 免费 |
通义千问 | ||
qwen-max | 40 元 | 120 元 |
qwen-plus | 4 元 | 12 元 |
qwen-turbo | 2 元 | 6 元 |
qwen-long | 0.5 元 | 2 元 |
qwen1.5-110b-chat | 7 元 | 14 元 |
qwen1.5-72b-chat | 5 元 | 10 元 |
qwen1.5-32b-chat | 3.5 元 | 7 元 |
qwen1.5-14b-chat | 2 元 | 4 元 |
qwen1.5-7b-chat | 1 元 | 2 元 |
qwen1.5-1.8b-chat | 免费 | 免费 |
qwen1.5-0.5b-chat | 免费 | 免费 |
腾讯混元 | ||
hunyuan-pro | 30 元 | 100 元 |
hunyuan-standard-256k | 15 元 | 60 元 |
hunyuan-standard | 4.5 元 | 5 元 |
hunyuan-lite | 免费 | 免费 |
智谱清言 | ||
GLM-4 | 100 元 | 100 元 |
GLM-4-Airx | 10 元 | 10 元 |
GLM-4-Air | 1 元 | 1 元 |
GLM-4-Flash | 0.1 元 | 0.1 元 |
GLM-3-Turbo | 1 元 | 1 元 |
讯飞星火 | ||
Spark3.5 Max | 21~30 元 | 21~30 元 |
Spark3.5 Pro | 21~30 元 | 21~30 元 |
Spark3.5 Lite | 免费 | 免费 |
月之暗面 | ||
moonshot-v1-128k | 60 元 | 60 元 |
moonshot-v1-32k | 24 元 | 24 元 |
moonshot-v1-8k | 12 元 | 12 元 |
豆包 | ||
Doubao-pro-128k | 5 元 | 9 元 |
Doubao-pro-32k | 0.8 元 | 2 元 |
Doubao-lite-128k | 0.8 元 | 1 元 |
Doubao-lite-32k | 0.3 元 | 0.6 元 |
零一万物 | ||
yi-large | 20 元 | 20 元 |
yi-large-turbo | 12 元 | 12 元 |
yi-large-rag | 25 元 | 25 元 |
yi-medium | 2.5 元 | 2.5 元 |
yi-medium-200k | 12 元 | 12 元 |
yi-spark | 1 元 | 1 元 |
yi-vision | 6 元 | 6 元 |
Deepseek | ||
deepseek-chat | 1 元 | 2 元 |
deepseek-coder | 1 元 | 2 元 |
商汤商量 | ||
SenseChat-5 | 40 元 | 100 元 |
SenseChat | 12 元 | 12 元 |
SenseChat-32K | 36 元 | 36 元 |
SenseChat-128K | 60 元 | 60 元 |
SenseChat-Turbo | 2 元 | 5 元 |
海螺 AI | ||
abab6.5 | 30 元 | 30 元 |
abab6.5s-245k | 10 元 | 10 元 |
abab6.5t | 5 元 | 5 元 |
abab6.5g | 5 元 | 5 元 |
abab5.5s | 5 元 | 5 元 |
天工 | ||
Sky-Chat-3.0 | 10 元 | 10 元 |
Sky-Chat-2.0 | 5 元 | 5 元 |
百川 | ||
Baichuan4-32k | 100 元 | 100 元 |
Baichuan3-Turbo-32k | 12 元 | 12 元 |
Baichuan3-Turbo-128k | 24 元 | 24 元 |
Baichuan2-Turbo-192k | 16 元 | 16 元 |
Baichuan2-Turbo-32k | 8 元 | 8 元 |
最后
- 欢迎关注奶酪 公众号 获取奶酪所有的原创资源,回复文章编号,比如 i01 就可获取对应的资源。
- 欢迎订阅我的 “奶酪书签专业版”,15年沉淀,超过 5000 个分类井条有序的好用实用 html 网站书签。
- 本文由「奔跑中的奶酪」原创创作,欢迎订阅、留言和 打赏,也欢迎引用和转载,但要注明出处。