欧美主流 AI 模型

Claude(Anthropic)

中文常译:克劳德。由美国公司 Anthropic 开发,以信息论之父 Claude Elwood Shannon(克劳德·香农)命名,致敬其对通信与计算理论的奠基性贡献。

Claude 系列目前分为 Haiku、Sonnet、Opus 三档,分别对应轻量、均衡、旗舰能力。Opus 并非独立模型,而是 Claude 系列的最高规格档位,拉丁语原意为"作品/杰作",暗指其为 Anthropic 当前最具代表性的成果。

GPT / ChatGPT(OpenAI)

中文常译:无固定译名,口语常称"ChatGPT"或"챗지피티"GPTGenerative Pre-trained Transformer(生成式预训练变换器)的缩写,直接描述了模型的核心架构与训练范式。ChatGPT 是 OpenAI 在 2022 年底推出的对话产品,将 GPT 技术包装为聊天界面,“Chat"点明交互形式。GPT-4o 中的 o 代表 omni(全模态),意指同时处理文本、图像、语音。

Gemini(Google DeepMind)

中文常译:双子座。由 Google DeepMind 开发,取名自双子座(Gemini)星座,一方面契合其多模态设计——如同双子并存般同时理解文本与图像;另一方面也与 Google 早期探索多模态 AI 的项目代号相呼应。分为 Nano、Flash、Pro、Ultra 四档。

Grok(xAI)

中文常译:格罗克。由埃隆·马斯克创立的 xAI 开发。“Grok"一词来源于罗伯特·海因莱因 1961 年科幻小说《异乡异客》(Stranger in a Strange Land),火星语中意为"彻底地、直觉性地理解某事”,暗示该模型追求对世界的深层理解,而非表面检索。

Llama(Meta)

中文常译:骆马 / 羊驼。由 Meta(原 Facebook)开发,全称 Large Language Model Meta AI,首字母缩写恰好拼出南美动物"羊驼(Llama)",兼顾了品牌辨识度与幽默感。Llama 系列以开源著称,是目前开源社区使用最广泛的基础模型之一。

Mistral(Mistral AI)

中文常译:密斯特拉尔风 / 米斯特拉。由法国初创公司 Mistral AI 开发,取名自密斯特拉尔风——一种席卷法国南部地中海沿岸的强劲西北风,象征速度、力量与法国本土属性。Mistral 系列以高效小参数著称,旗舰模型 Mixtral 采用混合专家(MoE)架构。

Copilot(Microsoft)

中文常译:副驾驶。由微软整合 OpenAI GPT-4 能力推出,定位为工作效率"副驾驶”——不替代人类决策,而是坐在副驾驶席位协助操控,贯穿于 Office、Windows、Bing 等微软生态。

Perplexity(Perplexity AI)

中文常译:困惑度。由同名公司开发,名称直接借用了自然语言处理领域衡量语言模型不确定性的经典指标 Perplexity(困惑度),既是技术术语的自我致敬,也暗示其产品核心——通过实时检索消解用户的"困惑"。

MythoMax(社区模型)

中文常译:神话极限。并非商业公司产品,而是 Hugging Face 社区开发者基于 Llama 深度微调的开源模型,“Mytho"取自 mythology(神话),“Max"指参数规模上限,整体传达出超越常规的雄心。是目前开源角色扮演和创意写作领域热门的社区模型之一。

Command R(Cohere)

中文常译:指令R。由加拿大公司 Cohere 开发,面向企业 RAG(检索增强生成)场景。Command 强调其遵循指令的能力,R 代表 Retrieval(检索),直接点明其核心设计目标。

Phi(Microsoft Research)

中文常译:φ / 斐。微软研究院开发的小参数高效模型系列,以希腊字母 φ(phi) 命名,在数学与物理学中象征黄金比例与基本常数,暗示用"小而精"的参数实现"大而优"的效果。


中国主流 AI 模型

DeepSeek(深度求索)

中文官方名:深度求索。由量化私募公司幻方科技孵化,名称出自屈原《离骚》”路漫漫其修远兮,吾将上下而求索",“深度"既指深度学习技术,也呼应诗句中对真理的不懈追寻。DeepSeek-R1 系列以极低训练成本达到与 GPT-4 级别相近的推理能力,引发全球关注。

Kimi(月之暗面 Moonshot AI)

中文常用名:Kimi。由月之暗面(Moonshot AI)开发,“Kimi"在日语中意为”",亲切随和;英文发音轻盈,易于记忆。公司名"Moonshot”(登月计划)与模型名形成反差——宏大愿景配以温柔称谓,强调人机对话的亲密感。

文心一言 / ERNIE Bot(百度)

中文官方名:文心一言。百度大模型产品,”文心“取自文心雕龙,象征中国文学与思想传统;”一言“强调一言即可触达知识。底层模型英文名 ERNIE(增强知识融合表示)是 Enhanced Representation through kNowledge IntEgration 的缩写,技术层面强调知识图谱与语言模型的融合。

通义千问 / Qwen(阿里巴巴)

中文官方名:通义千问。阿里巴巴云开发,”通义“意为通情达义、融会贯通;”千问“呼应《天问》典故,寓意可回答千万种问题。英文缩写 Qwen(Qian Wen)直接音译自"千问”。目前已开源,是全球最活跃的开源模型系列之一。

讯飞星火(科大讯飞)

中文官方名:讯飞星火。科大讯飞开发,"讯飞“为公司名;”星火“取自”星星之火,可以燎原",强调 AI 从小火种到燎原之势的发展愿景,同时暗指知识如星火般点亮智慧。

混元(腾讯)

中文官方名:混元。腾讯开发,取自道家哲学"混沌初开,乾坤始奠“中的"混元”——宇宙未分阴阳之前的原始整体状态,象征模型融合万物、包罗万象的能力。

豆包(字节跳动)

中文官方名:豆包。字节跳动开发,面向 C 端用户的对话产品。"豆包“是中国传统小吃,亲切、接地气、无门槛感,刻意与高冷的技术形象拉开距离,强调日常陪伴属性。底层模型代号为 Doubao

智谱清言 / GLM(智谱 AI)

中文官方名:智谱清言。清华系初创公司智谱 AI 开发,”智谱“意为智慧图谱;”清言“取自魏晋清谈之风,寓意清晰、雅正的表达。底层模型 GLM(General Language Model)是清华大学自研的通用语言模型架构。

Yi(零一万物)

中文官方名:零一万物 Yi。由前 Google 中国区总裁李开复创立,模型命名为 Yi——中文”“的拼音,取自《道德经》”道生一,一生二,二生三,三生万物",寓意从模型基座出发衍生无限可能。


其他国家 AI 模型

Falcon(阿联酋 TII)

中文常译:猎鹰。由阿联酋技术创新研究院(TII)开发,以阿联酋国鸟猎鹰命名——猎鹰在阿拉伯文化中是智慧、速度与荣耀的象征,也是阿联酋国徽的核心图腾。Falcon 180B 曾短暂登顶开源模型榜首。

Aya(Cohere / 加拿大)

中文常译:阿雅。由 Cohere 联合全球研究者共建,"Aya“在斯瓦希里语、阿拉伯语等多种语言中均有”奇迹、礼物“之意,象征该模型对全球多语言社区的普惠承诺,覆盖 100 余种语言。