| AI21 Labs |
2017年 |
以色列特拉维夫 |
✅ Jurassic系列、Jamba系列 |
企业级生成式AI平台,专注长文本理解与写作辅助 |
Series D $300M (2025),累计融资超$500M |
| AionLabs |
2021年 |
以色列特拉维夫 |
⚠️ 基于DeepSeek V3.2优化的Aion-2.0 |
AI制药孵化器+沉浸式角色扮演/故事生成垂直场景 |
由阿斯利康、默克、辉瑞、梯瓦、AWS等联合支持 |
| Alibaba Cloud Int. |
2009年 |
中国杭州 |
✅ 通义千问(Qwen)系列 |
全球云服务+大模型基础设施,企业级AI解决方案 |
阿里云为阿里集团子公司,未单独融资 |
| Amazon Bedrock |
2023年(服务发布) |
美国西雅图 |
❌ 聚合多厂商模型(Anthropic/Cohere等) |
AWS生态内的企业级生成式AI应用构建平台 |
AWS为亚马逊子公司 |
| Anthropic |
2021年 |
美国旧金山 |
✅ Claude系列 |
AI安全优先的研究型公司,专注可靠、可解释的AI系统 |
累计融资超$27B,最新$13B (2026) |
| Arcee AI |
2023年 |
美国旧金山 |
✅ Trinity系列(400B参数开源MoE) |
高效开源大模型,面向开发者与代理工作流 |
总融资约$50M,正推进$200M+融资(估值$1B+) |
| AtlasCloud |
2023年 |
美国纽约 |
❌ 全模态推理API聚合平台 |
云推理基础设施服务,一站式接入300+模型 |
信息有限,初创阶段 |
| Azure (Microsoft) |
2010年(云平台) |
美国雷德蒙德 |
❌ 托管OpenAI模型+自研Phi系列 |
企业级云AI平台,集成Office/Teams生态 |
微软子公司 |
| Baseten |
2019年 |
美国旧金山 |
❌ 模型部署/推理平台 |
MLOps基础设施,简化模型生产化部署 |
Series B $35M (2022) |
| Cerebras |
2016年 |
美国洛杉矶 |
❌ 专注AI芯片(Wafer-Scale Engine) |
超大规模AI训练/推理硬件加速 |
Series H $1B (2026),估值$23B |
| Chutes |
2024年 |
去中心化网络 |
❌ 去中心化无服务器AI计算平台 |
基于Bittensor生态的分布式推理网络 |
信息有限,Web3融资 |
| Cirrascale |
2015年前 |
美国 |
❌ 专用GPU/IPU云推理服务 |
高性能AI推理云基础设施,固定费率定价 |
信息有限,企业服务模式 |
| Clarifai |
2013年 |
美国纽约 |
✅ 自研视觉/多模态模型 |
计算机视觉API平台,企业级图像/视频理解 |
Series C $45M+ |
| Cloudflare |
2009年 |
美国旧金山 |
❌ Workers AI聚合开源模型 |
边缘AI推理,低延迟全球分发 |
上市公司(NYSE: NET) |
| Cohere |
2019年 |
加拿大多伦多/美国旧金山 |
✅ Command系列、Embedding模型 |
企业级NLP平台,专注搜索/RAG/分类 |
Series D $500M (2025),估值$6.8B |
| Crusoe |
2018年 |
美国丹佛 |
❌ 专注可持续算力 |
利用stranded energy的AI云基础设施 |
Series C $600M (2024) |
| DeepInfra |
2022-2023年 |
美国加州Palo Alto |
❌ 开源模型托管推理 |
低成本开源大模型API服务,专注Agent推理优化 |
Seed $8M (2023) |
| DeepSeek |
2023年7月 |
中国杭州 |
✅ DeepSeek-V3/R1系列 |
开源优先的高性能大模型,专注推理/代码 |
由高鹄资本(High-Flyer)全资支持,未外部融资 |
| Featherless |
2023年 |
信息有限 |
❌ 无服务器开源模型推理平台 |
托管17,000+ HuggingFace模型,专注开发者体验 |
CEO Eugene Cheah,信息有限 |
| Fireworks |
2022年 |
美国旧金山 |
❌ 开源模型优化推理 |
高吞吐、低延迟的开源模型推理平台 |
Series B $55M (2024) |
| Friendli |
2021年 |
韩国首尔 |
✅ Friendli-LLM系列 |
多语言大模型,专注韩语/亚洲市场 |
Series B $100M+ |
| GMICloud |
2022年 |
美国硅谷 |
❌ AI原生GPU云计算服务 |
全球AI基础设施,NVIDIA首批Reference Cloud Partner |
信息有限,创投支持 |
| Google AI Studio |
2023年(服务) |
美国山景城 |
✅ Gemini系列、Gemma系列 |
开发者友好的Gemini快速原型平台 |
Google子公司 |
| Google Vertex |
2021年 |
美国山景城 |
✅ 集成Gemini/PaLM等 |
企业级MLOps+生成式AI统一平台 |
Google子公司 |
| Groq |
2016年 |
美国山景城 |
❌ 专注LPU推理芯片 |
超高速AI推理硬件+云服务 |
Series D $300M+ (2024) |
| Hyperbolic |
2024年 |
信息有限 |
❌ 去中心化AI计算与推理 |
Web3+AI融合,可验证推理+隐私保护 |
Seed $7M + Series A $12M (2024),累计$20M |
| Inception Labs |
2025年 |
美国帕洛阿尔托 |
✅ 扩散基础模型(代码/文本) |
斯坦福教授创立,专注扩散模型技术的AI初创 |
Seed $50M (Menlo Ventures领投) |
| Inceptron |
信息有限 |
信息有限 |
❌ AI推理优化与部署平台 |
帮助企业部署、优化、扩展生产环境AI模型 |
信息有限 |
| Infermatic |
信息有限 |
信息有限 |
⚠️ 模型微调/合并服务+RAG嵌入模型 |
开发者模型微调平台,支持领域适配与角色扮演 |
信息有限 |
| Inflection |
2022年 |
美国帕洛阿尔托 |
✅ Pi系列(个人AI助手) |
个人化AI助手,专注情感交互 |
Series B $1.3B (2023),核心团队已并入微软 |
| io.net |
2022年 |
美国旧金山 |
❌ 去中心化GPU网络 |
聚合闲置GPU的分布式推理/训练平台 |
Series A $30M (2024) |
| Liquid AI |
2021年 |
美国(源自MIT) |
✅ LFM系列(液态神经网络) |
高效小参数动态权重模型,专注边缘/移动端部署 |
Seed $37.5M + Series A $250M (AMD领投),估值$2B+ |
| Mancer |
信息有限 |
信息有限 |
⚠️ 无审查角色扮演模型推理服务 |
创意写作/角色扮演垂直场景,支持SillyTavern等客户端 |
信息有限,社区驱动 |
| MiniMax |
2021年12月 |
中国上海 |
✅ MiniMax-M系列、ABAB系列 |
多模态基础模型,专注C端应用与内容生成 |
Series B $600M (2024),估值$2.5B+ |
| Mistral |
2023年4月 |
法国巴黎 |
✅ Mistral/Mixtral/Codestral系列 |
开源优先的高性能大模型,开发者友好 |
Series C $600M+ (2024),估值$6B+ |
| Moonshot AI |
2023年3月 |
中国北京 |
✅ Kimi系列(长文本专长) |
长上下文理解+多模态,专注知识型应用 |
Series A $1B (2024),估值$2.5B+ |
| Morph.ai |
2016年 |
印度古尔冈/美国帕洛阿尔托 |
❌ 营销自动化聊天机器人平台 |
企业级WhatsApp Business API营销自动化 |
信息有限,早期融资 |
| Nebius Token Factory |
2024年(品牌) |
荷兰阿姆斯特丹 |
❌ Nebius AI云+Token Factory推理平台 |
全栈AI算力服务,企业级开源模型推理平台 |
上市公司(NASDAQ: NBIS),2025年收入$1.46亿(+360% YoY) |
| NextBit |
2013年(手机) / 信息有限(AI) |
美国(原) / 信息有限 |
❌ 信息有限 |
原为云存储手机品牌(2017年被Razer收购);AI领域信息待确认 |
原获Kickstarter众筹+雷蛇收购 |
| NovitaAI |
2023年前 |
新加坡 |
❌ 开源模型API聚合推理 |
开发者友好的开源模型推理服务,强调成本效益 |
信息有限 |
| OpenAI |
2015年 |
美国旧金山 |
✅ GPT系列、Codex、DALL·E等 |
通用人工智能研究+商业化,行业标杆 |
非营利+营利混合结构,微软战略投资超$13B |
| OpenInference |
信息有限 |
信息有限 |
❌ LLMOps可观测性工具(Arize AI旗下) |
AI应用调试/监控/评估基础设施,开源LLM追踪 |
Arize AI子公司,Arize累计融资$100M+ |
| Parasail |
2024年前 |
信息有限 |
❌ DePIN质押解决方案 |
AI+DePIN领域的信任层协议,保障去中心化基础设施服务质量 |
Seed $4M (2024),估值$50M |
| Perplexity |
2022年 |
美国旧金山 |
✅ Sonar系列(搜索增强) |
AI搜索助手,专注实时信息检索+答案生成 |
Series C $100M+ (2024),估值$1B+ |
| Phala Network |
2018年 |
新加坡/去中心化 |
❌ 隐私计算+可信AI推理 |
基于TEE的隐私保护区块链,支持去中心化AI应用 |
多轮加密融资,Polkadot平行链 |
| Relace |
2024年 |
美国旧金山 |
✅ Relace Search(代码检索专用小模型) |
AI编程代理基础设施,a16z领投的代码库智能搜索工具 |
Series A $23M (2025, a16z领投) |
| SambaNova |
2017年 |
美国帕洛阿尔托 |
✅ 自研Dataflow架构+模型 |
企业级AI软硬件一体化平台 |
Series E $200M+,估值$5B+ |
| Switchpoint AI |
2024年前 |
美国(西北大学孵化) |
❌ 企业级LLM智能路由 |
按成本/性能/隐私自动路由请求到最优模型,零供应商锁定 |
Pitch竞赛获奖$150K (2025),早期阶段 |
| Together |
2022年 |
美国旧金山 |
❌ 开源模型聚合推理 |
开发者友好的开源大模型云平台 |
Series A $20M+ (2023) |
| Venice.ai |
2024年前 |
信息有限/去中心化 |
⚠️ 隐私优先+无审查模型服务 |
区块链支持的私密AI聊天,不存储对话记录,支持DeepSeek等开源模型 |
信息有限,Web3社区驱动 |
| Weights & Biases |
2018年 |
美国旧金山 |
❌ MLOps实验追踪平台 |
AI研发协作与模型实验管理工具 |
Series C $200M (2021),估值$1B+ |
| xAI |
2023年3月 |
美国帕洛阿尔托 |
✅ Grok系列 |
科学发现导向的AI,集成X平台生态 |
累计融资$42B+ (2026),估值$50B+ |
| Xiaomi |
2010年 |
中国北京 |
✅ MiMo系列(开源MoE) |
消费电子+AI融合,端云协同大模型 |
上市公司(HK: 1810),AI为战略投入方向 |
| Z.ai (智谱) |
2020年 |
中国北京 |
✅ GLM系列(ChatGLM/GLM-Edge等) |
开源+商业双轮驱动,专注中文场景与科研 |
Series B $300M+ (2024),估值$3B+ |