AI 模型导航

About 2203 wordsAbout 7 min

2025-02-10

国产大模型

深度求索 DeepSeek

模型名称：DeepSeek-V3、DeepSeek-R1
开发机构：深度求索（DeepSeek）
特点：

开源模式：与国外闭源模式不同，采用开源策略，引发国内外复现热潮，成本仅为600万美元，远低于国际巨头。
高性能：在数学、代码、自然语言推理任务中与 OpenAI o1 相当，文科任务表现突出（总分68.3，文科78.2）。
算法创新：通过优化训练策略提升推理能力，减少对昂贵标注数据的依赖。

通义千问 Qwen

模型名称：Qwen2-72B、Qwen-max-latest 等
开发机构：阿里巴巴
特点：

国际竞争力：Qwen2-72B 在 OpenCompass 评测中超越 Meta 的 Llama3-70B ，成为全球下载量最大的中文开源模型。
多模态能力：Qwen-VL 在多模态评测中表现优异，支持图像与文本交互。
高性价比：通过优化架构降低成本，价格降至0.5元/百万 Tokens 以下

商汤 SenseChat

模型名称：SenseChat 5.5-latest
开发机构：商汤科技
特点：

文科优势：文科得分81.8，超越多数国际模型，擅长自然语言生成与理解。
行业应用：广泛应用于智慧城市、医疗等领域，支持复杂场景的语义分析。

文心一言 ERNIE

模型名称：ERNIE-4.0-Turbo、文心一言
开发机构：百度
特点：

中文理解：在中文语义处理上表现突出，集成于百度搜索、地图等产品中。
垂直领域优化：针对医疗、教育等场景推出专用版本，支持本地化部署。

星火认知大模型

开发机构：科大讯飞
特点：

语音交互：结合讯飞语音技术，在实时翻译、语音助手场景中表现优异。
教育领域：应用于智能教学、个性化学习方案生成。

混元大模型

开发机构：腾讯
特点：

多场景覆盖：嵌入微信、QQ等社交平台，支持内容生成、智能客服等功能。
合成数据应用：通过生成合成数据降低标注成本，加速模型迭代。

盘古大模型

开发机构：华为
特点：

工业级应用：聚焦智能制造、能源等领域，支持复杂工业场景的预测与优化。
全栈技术：结合华为昇腾芯片与AI框架，提供端到端解决方案。

智谱 GLM

模型名称：GLM-4-Plus、GLM-4-9B
开发机构：智谱AI
特点：

高效训练：通过分布式训练技术降低算力需求，适合中小型企业部署。
学术合作：与高校合作推动开源生态，支持科研场景的模型定制。

360智脑

模型名称：360zhinao2-o1
开发机构：360公司
特点：

安全导向：专注于网络安全领域的威胁检测与防御，支持实时数据分析。
低成本API：提供高性价比的API服务，适合中小企业集成。

豆包 Doubao

模型名称：Doubao-pro-32k-241215
开发机构：字节跳动
特点：

短视频与推荐：优化视频内容理解与推荐算法，提升抖音等平台的个性化体验。
多语言支持：支持东南亚、欧洲等多语言场景，助力国际化业务。

Kimi AI

模型名称：moonshot-v1-vision-preview、k1.5
开发机构：月之暗面科技有限公司
特点：

超长文本处理：支持20万汉字输入，长文本处理能力达到国际顶尖水平的10倍，在学术论文解析、法律文件分析、API文档理解等场景中表现突出。
工具集成与成本优化：支持 API Tool Calling 功能，上下文缓存技术降低 90% 的长文本处理成本。

海外大模型

OpenAI

模型名称：GPT-3.5 Turbo、GPT-4、GPT-4o 等
开发机构：OpenAI（美国）
特点：

多模态能力：从 GPT-3.5 到 GPT-4，逐步支持文本、图像、语音等多模态输入与生成。
行业标杆：GPT-4 在复杂推理、数学和编程任务中表现卓越，总分为80.4（SuperCLUE榜单），尤其在理科任务（87.3分）中领先全球。
广泛应用：集成于 ChatGPT、Microsoft Copilot 等产品，覆盖内容生成、代码编写、教育辅助等领域。

Claude

模型名称：Claude 3.5 Haiku、Claude 3.5 Sonnet
开发机构：Anthropic（美国）
特点：

安全与可控性：采用“宪法AI”理念，通过预设规则减少有害内容生成，提升用户控制力。
复杂推理优势：Claude 3.5 Sonnet 在数学、代码等 Hard 任务中得分 54.6，与 OpenAI 模型接近。
长上下文支持：支持超长文本输入，适用于法律文档分析、学术研究等场景。

Gemini

模型名称：Gemini 2.0 Flash
开发机构：Google DeepMind（美国）
特点：

多模态融合：支持文本、图像、音频、视频的全模态处理，在跨模态推理中表现突出。
多语言适配：覆盖全球主要语言，优化国际化场景应用，如实时翻译和多语言内容生成。
模型分层：提供Ultra（超大模型）、Pro（通用模型）、Nano（轻量化）三种版本，适配不同设备需求。

LLaMA（Meta AI）

模型名称：LLaMA-3.3
开发机构：Meta（美国）
特点：

开源生态：LLaMA-3.3-70B 等模型开源，吸引全球开发者参与改进，广泛应用于智能客服和文本生成。
技术创新：采用旋转位置编码（RoPE）和 SwiGLU 激活函数，提升模型性能和训练稳定性。
垂直领域优化：在金融、医疗等场景中表现优异，支持本地化部署。

Copilot

模型名称：GPT-4
开发机构：GitHub、微软、OpenAI（合作）
特点：

编程辅助：基于 GPT-4 Turbo，提供代码自动补全、错误修复和项目适配建议，提升开发效率。
跨平台集成：嵌入 Microsoft 365（Word、Excel等），支持文档生成、数据分析等办公场景。
用户个性化：通过学习用户习惯，生成定制化代码和文档模板。

Mistral

模型名称：Codestral、Mistral、Pixtral
开发机构：Hugging Face（法国）
特点：

生成式任务优化：专注于文本和图像生成，擅长创意内容生产（如广告文案、艺术设计）。
轻量化部署：模型参数规模适中，适合中小企业和开发者快速集成。

Grok

模型名称：grok-2-1212、grok-2-vision-1212
开发机构：Grok公司（美国）
特点：

行业深度适配：在金融风控和医疗诊断中表现突出，支持高频数据分析和模式识别。
实时交互：优化低延迟响应，适用于实时决策场景（如股票交易、急诊诊断）。

Stable Diffusion

模型名称：Stable Diffusion 3.5
开发机构：Stability AI（英国）
特点：

图像生成标杆：基于扩散模型，生成高质量图像和视频，广泛应用于艺术创作和影视制作。
开源社区驱动：通过社区协作不断迭代模型，支持用户自定义训练和微调。

Synthesia

开发机构：Synthesia（英国）
特点：

虚拟数字人：生成逼真虚拟形象视频，支持多语言配音，应用于教育、广告和虚拟客服。
无代码操作：用户可通过文本输入快速生成视频内容，降低制作门槛。

ElevenLabs语音引擎

模型名称：Multilingual v2、Flash v2.5
开发机构：ElevenLabs（美国）
特点：

语音克隆与合成：通过15秒音频样本克隆用户音色，支持多语言情感化语音生成。
跨场景应用：集成于有声书制作、虚拟助手和游戏配音等领域。

Changelog

8/20/25, 11:06 AM

View All Changelog

4c155-Merge branch 'dev1'on 8/20/25

AI 模型导航

国产大模型

海外大模型

Changelog

求求了，快滚去学习！！！