摘要: AI大模型领域分类
一、通用大语言模型
| 工具名称 | 能做什么 | 官网 |
|---|---|---|
| GPT-5系列 (OpenAI) | 全能助手:日常聊天、写文章、改代码、解数学题,还能语音对话、看图说话。一次能处理整本小说那么长的内容,随时调用联网搜索和工具(比如订餐、查天气)。 | openai.com |
| Claude 4.x系列 (Anthropic) | 文档分析专家:扔给它10份百页财报、一整套合同或学术论文,它能精准总结、对比条款、找出矛盾。写作风格自然,擅长润色报告、起草邮件,几乎不会“胡编乱造”。 | claude.ai |
| Gemini 3.x系列 (Google) | 海量资料吞噬者:一次喂进10本书或3小时会议视频,它能瞬间找出关键细节。还能边看视频边回答问题,实时搜索最新信息,结合地图、文档帮你做调研报告。 | gemini.google.com |
| DeepSeek V3/R1系列 (深度求索) | 免费数学+代码神器:解奥数题、写LeetCode算法、解释复杂代码,速度快还不要钱。支持上传PDF、Word,一键总结长文,开发者最爱。 | deepseek.com |
| Grok 4系列 (xAI) | 实时冲浪嘴替:随时抓取X平台最新热点,用幽默毒舌的风格回答,还能一边帮你查资料一边发帖。适合追热点、写段子、搞怪互动。 | grok.x.ai |
| Kimi K系列 (月之暗面) | 中文长文收割机:一次处理200万字(相当于三体三部曲),上传几十份研报、法律卷宗,它立马给你整理出核心观点,还自带联网搜索验证事实。 | kimi.ai |
| Llama 4系列 (Meta) | 企业自建AI引擎:开源可商用,你可以在内部服务器部署一个“私有版ChatGPT”,处理公司机密文档,支持千万级token上下文(如分析整个代码库)。 | llama.com |
| Qwen 3.5系列 (阿里) | 中文场景多面手:写朋友圈文案、生成周报、翻译外文、做会议纪要,尤其懂中文梗和文化。轻量版还能装进手机App离线跑。 | chat.qwen.ai |
二、编程/代码生成
| 工具名称 | 能做什么 | 官网 |
|---|---|---|
| Claude Code (Anthropic) | 自主编程代理人:给它一个需求“写个爬虫每天抓新闻发邮件”,它自己拆任务、写代码、跑测试、调bug,一条龙搞定,你只需要看结果。 自主开发代理: 扔给它一个复杂的改动需求,它能自己看代码、自己跑测试、自己修 Bug,直到任务彻底完成 |
claude.com |
| GitHub Copilot / Copilot Next (GitHub) | 代码自动补全大师:在VS Code里打字它就猜下一行,一键生成函数、注释、单元测试。新版本还能用语音说“给这个API加个缓存”它直接改好。 | github.com |
| Cursor | AI原生IDE:边写代码边跟AI聊天,框住一段代码说“改成异步”它立刻重写。内置GPT-5和Claude,能帮你整个项目重构、写文档、部署一条龙。 让 AI 帮你写完整个软件: 即使你不会写代码,只要描述功能,它能直接改写你本地的文件并运行出结果。 从需求到代码自动完成:写代码→改Bug→重构→部署,一站式开发 IDE里自动写/改代码、生成测试、重构项目(像AI同事实时协作) |
cursor.sh |
| OpenAI Codex (OpenAI) | 自然语言转代码神器:说“做一个计算器网页”它直接生成HTML/CSS/JS。适合快速原型、自动化脚本,支持Python、JavaScript等主流语言。 | openai.com |
| DeepSeek Coder (深度求索) | 开源算法刷题神器:给你LeetCode难题的多种解法,还能解释每一步原理。本地部署后可以当私密代码助手,专攻算法、数据结构。 | deepseek.com |
| Code Llama (Meta) | 本地代码保镖:完全离线的代码生成模型,适合处理敏感项目。可以帮你写SQL查询、重构老旧代码、生成API文档。 | llama.com |
三、科学/数学/复杂推理
| 工具名称 | 能做什么 | 官网 |
|---|---|---|
| Gemini 3.x系列 (Google) | 科研文献粉碎机:上传100篇PDF论文,它能提取所有公式、对比实验数据、总结研究趋势。还能看懂复杂图表,帮你验证数学推导。 解决复杂数学题、分析科研数据、处理长篇论文级资料 |
gemini.google.com deepmind.google |
| Claude Opus 4.x (Anthropic) | 专家级分析员:给一份技术白皮书,它能指出逻辑漏洞;给一组实验数据,它能提出假设并设计验证方案。适合需要深度思考的科研/咨询场景。 做严谨推理、复杂问题拆解、科研级分析 |
claude.ai |
| GPT-5系列 (OpenAI) | 跨学科解题王:从量子力学到经济学模型,它能一步步推导演算,并给出可理解的解释。还能帮你写LaTeX公式、生成模拟数据。 多步骤逻辑推理,解决复杂问题(类似一步步思考) |
openai.com |
| DeepSeek R1系列 (深度求索) | 开源推理尖兵:专攻数学证明、逻辑谜题、算法优化。可本地部署,用于教育、竞赛培训,或嵌入需要推理能力的应用。 数学推理、算法分析、逻辑题求解 |
deepseek.com |
| OpenAI o1 / GPT Thinking (OpenAI) | 慢思考专家:对付奥数题、物理难题、复杂规划,它会像人类一样反复推敲,给出最严谨的解答。适合需要“想清楚再答”的高难度任务。 | openai.com |
| Alibaba Qwen 3.5 | 数学计算、逻辑分析、技术问题解答 | qwen.aliyun.com |
四、文案/写作/专业文档
| 工具名称 | 能做什么 | 官网 |
|---|---|---|
| Claude Sonnet/Opus 4.x (Anthropic) | 专业写手+编辑:帮你起草商业计划书、润色学术论文、调整邮件语气。给个大纲它能扩写出结构清晰的长文,还能模仿特定作家的风格。 写论文、报告、合同、长文档,逻辑清晰、质量高 |
claude.ai |
| GPT-5系列 (OpenAI) | 创意文案工厂:10秒钟生成10条广告slogan,写小红书文案、短视频脚本、产品说明书都不在话下。还能批量改写、翻译、总结。 写文案、脚本、营销内容,快速批量生成 |
openai.com |
| Gemini 3.x系列 (Google) | 研究报告助理:输入关键词,它自动搜索最新资讯、整理数据、生成带引用来源的调研报告。还能把枯燥的数据变成生动的图表描述。 写研究型内容、整理资料、生成结构化文档 |
gemini.google.com |
| Kimi K系列 (月之暗面) | 中文文档榨汁机:扔进一本500页的行业报告,它立刻给你画出思维导图、提炼核心观点、生成执行摘要。还能对比多份合同的差异。 | kimi.ai |
五、文生图
| 工具名称 | 能做什么 | 官网 |
|---|---|---|
| Midjourney v7 | 设计师灵感伙伴:输入“赛博朋克城市,霓虹灯,雨夜,电影质感”立刻生成艺术级概念图。适合做插画、海报、游戏原画,风格感极强。 | midjourney.com |
| Flux系列 (Black Forest Labs) | 商用海报生成器:准确生成带中文文字的广告图,比如“618大促,全场五折”排版规整。开源可商用,电商设计首选。 | blackforestlabs.ai |
| DALL-E 3 (OpenAI) | 小白出图神器:直接说“一只穿西装的猫在开会”,几秒出图,理解力超强。集成在ChatGPT里,边聊边改图,快速做配图、插画。 | openai.com |
| Stable Diffusion | 极客定制画板:本地安装后可以自由加插件,用ControlNet控制人物姿势、用LoRA训练专属画风。适合技术流玩家深度定制。 | stability.ai |
| Qwen-Image / Kling Image (阿里/快手) | 亚洲审美专家:生成的人物更符合东方审美,支持“水墨画”“国潮”风格,还能准确写出毛笔字。PPT配图、社交媒体封面随叫随到。 | chat.qwen.ai / kling.kuaishou.com |
| Imagen 4 (Google) | 超逼真摄影机:输入“逆光人像,发丝细节,胶片颗粒”生成的照片几乎以假乱真,光影和纹理处理顶级,适合广告级视觉素材。 | deepmind.google |
| Adobe Firefly | 设计师的瑞士军刀:在PS里直接框选区域说“加朵云”,AI自动生成。还能替换背景、扩展画面、生成矢量图,版权安全商用无忧。 | adobe.com |
| Ideogram | 排版强迫症救星:生成的图片文字位置、字体、大小完全可控,做logo、封面、标题图特别稳,再也不用后期P字。 | ideogram.ai |
| ComfyUI | 节点式炼丹炉:把图像生成拆成乐高积木,自由连接各种模型、控制模块。适合想探索AI绘画极限的极客和研究者。 | comfyui.com |
六、文生视频
| 工具名称 | 能做什么 | 官网 |
|---|---|---|
| Sora 2 (OpenAI) | 电影导演级视频:输入“宇航员在火星上打篮球,慢动作”它生成2分钟连贯视频,人物、场景、物理规律完全一致。能做短片、广告、概念预告。 生成有故事感的长镜头: 视频里的人物长相从头到尾保持一致,镜头语言丰富,适合做有剧情的短片预告。 |
openai.com |
| Veo 3 (Google DeepMind) | 好莱坞运镜神器:指定“推拉摇移”镜头语言,AI生成的视频自动匹配,还自带环境音效。适合专业影视制作人快速预览分镜。 电影级真实视频、物理运动+音画同步、复杂运镜、专业短片 自带音效的短视频: 画面极其精致,且生成的视频自带逼真的环境音(如海浪声、脚步声),音画一体。 |
deepmind.google |
| Kling系列 (快手) | 短视频爆款制造机:生成跳舞、烹饪、运动类视频特别流畅,人物动作自然,支持“让主角从左边跑到右边”这种精确控制,国内用户免费。 拍出逼真生活动作: 无论是吃面、跑步还是说话,动作极其自然无撕裂,支持 4K 画质和多镜头脚本控制 |
kling.kuaishou.com |
| Runway系列 | 在线视频剪辑室:AI生成视频、一键抠除绿幕、智能补帧、文字转语音。从零到成片一条龙,适合短视频创作者快速产出。 修改视频里的内容: 比如把视频里的路人抹掉、把背景从白昼变黑夜,或者让一张静止老照片动起来。 |
runwayml.com |
| Seedance 2.0 (字节跳动) | 分镜大师:上传剧本,它自动生成分镜头脚本,人物和场景跨镜头保持一致,还能根据你的照片让主角“出演”视频。 | seedance.com |
| Pika | 轻量级视频玩具:输入“小猫弹吉他”立刻生成3秒动图,操作简单,适合做表情包、社交媒体小视频。 | pika.art |
七、音频生成
| 工具名称 | 能做什么 | 官网 |
|---|---|---|
| AudioX (港科大) | 全能音效师:从文字生成下雨声、从视频自动配音、给一段旋律续写成完整歌曲。做视频配音、游戏音效、音乐创作都行。 生成音效、音乐、视频配音 全能声音工厂: 输入文字生成任何口音的配音、电影配乐、甚至是非常罕见的环境音效。 |
audiox.github.io |
| ElevenLabs | 人声克隆机:上传1分钟录音,就能用你的声音朗读任何文字,支持愤怒、悲伤等多种情绪,做有声书、虚拟主播超逼真。 真人语音生成、配音、语音克隆 |
elevenlabs.io |
| Whisper (OpenAI) | 语音转文字劳模:把2小时会议录音变成逐字稿,支持99种语言,还能自动翻译。记者、学生、会议记录员必备。 语音转文字、会议记录、字幕生成 |
openai.com |
| Azure Speech Service (微软) | 企业级语音工具箱:实时语音翻译、定制品牌音色、呼叫中心质检,支持每秒处理上万并发,大公司首选。 语音识别+语音合成,用于客服/系统 |
azure.microsoft.com |
| iFlytek (科大讯飞) | 中文方言专家:能听懂粤语、四川话、上海话,转写准确率95%以上。开会时实时出字幕,还能生成会议纪要。 中文语音输入、语音控制、识别 |
iflytek.com |
八、AI设计工具
| 工具名称 | 能做什么 | 官网 |
|---|---|---|
| Stitch (Google) | 无限画布设计伙伴:一边语音说“加个按钮”“背景改蓝色”一边修改原型,静态图瞬间变成可点击的交互demo。UI/UX设计师的加速器。 | stitch.withgoogle.com |
九、AI智能体/代理
| 工具名称 | 能做什么 | 官网 |
|---|---|---|
| OpenClaw | 数字员工操作系统:告诉它“整理桌面文件,把照片分类,然后发周报”,它自己打开文件夹、操作软件、写邮件,全程无需人插手。 自动操作电脑、执行任务流程 |
openclaw.ai |
| Manus | 全能执行助理:说“帮我订下周三去上海的机票,选靠窗,顺便查当地天气”,它自己打开浏览器、填信息、下单,完事儿告诉你结果。 全自动跑腿: 你下令“调研 5 家竞品并做个 PPT”,它会自动打开网页搜数据、整理内容并直接生成文件给你。 自动完成任务:查资料→写报告→执行操作,一步到位 |
manus.ai |
| 实在Agent (实在智能) | 老旧软件救星:那些没API的老系统,它像人一样看屏幕操作,自动录入数据、生成报表。财务、HR的自动化神器。 | aisinit.com |
| Loomy (科大讯飞) | 桌面智能管家:每天自动整理下载文件夹,把工作文档按项目归类,还能定时帮你备份重要文件,支持语音指令。 自动办公、整理文件、处理数据 |
loomy.iflytek.com |
| AutoGPT | 自主任务机器人:给它一个目标“研究AI最新趋势并写成报告”,它会自己搜索、阅读、总结、写稿,直到完成任务。 自动执行多步骤任务(无人干预) |
autogpt.net |
| LangChain | 智能体开发框架:用它能拼装出复杂的AI应用,比如一个能查天气、订餐厅、记备忘录的多功能助手。 搭建AI应用、开发智能体系统 |
langchain.com |
| CrewAI | 团队协作模拟器:让多个AI扮演市场、产品、程序员,一起开会讨论方案,最后输出一份完整的项目计划。 | crewai.com |
| OpenAI Assistants API | 定制助手工厂:开发者用几行代码就能创建专属AI,让它能查知识库、写代码、调用公司内部API,集成到APP里当客服或顾问。 构建可调用工具的AI助手 |
platform.openai.com |
十、语音AI
| 工具名称 | 能做什么 | 官网 |
|---|---|---|
| Whisper (OpenAI) | 语音转写员:采访录音、会议录音扔进去,瞬间变文字,还能区分不同说话人。支持各种口音和背景噪音环境。 | openai.com |
| ElevenLabs | 配音演员:给文本配上情绪饱满的人声,可以选“温柔女声”“浑厚男声”,甚至模仿名人声音。做视频配音、有声小说太方便。 | elevenlabs.io |
| Azure Speech Service (微软) | 全球化语音平台:同时处理多语种实时翻译,比如跨国会议中英文互译,还能自定义唤醒词,用于智能音箱、车载系统。 | azure.microsoft.com |
| iFlytek (科大讯飞) | 方言转写王:无论用户说粤语、闽南语还是河南话,都能准确转成文字。课堂录音、采访记录神器。 | iflytek.com |
十一、垂直行业模型
| 工具名称 | 能做什么 | 官网 |
|---|---|---|
| AlphaFold 3 (Google DeepMind) | 生命科学预言家:输入蛋白质序列,它预测3D结构,加速新药研发、疾病研究。生物学家、医药公司的超级计算机。 加速科研新药开发: 科学家用来预测蛋白质和 DNA 结构,将原本数年的实验周期缩短到几天。 |
deepmind.google |
| NotebookLM (Google) | 个人知识库大脑:上传几十篇文献、笔记,它自动建立知识网络,能回答“某某理论最早出现在哪篇论文”,还能生成复习播客。 把枯燥文档变播客: 扔进去几份晦涩的学术论文,它能自动生成一段两个真人对话的播客,让你用耳朵听懂。 |
notebooklm.google.com |
| 医疗AI模型 (Google Health) | 影像诊断助手:分析CT、X光片,标记可疑病灶,辅助医生快速判断。还能根据病历推荐诊疗方案。 | health.google |
| 医疗AI模型 (IBM Watson Health) | 临床决策支持:整合患者数据、医学文献,给出个性化治疗建议,帮助医生制定癌症治疗方案。 | ibm.com |
| 金融AI模型 (Bloomberg AI) | 市场情报分析员:实时监控新闻、财报、交易数据,预警风险,自动生成投资摘要。量化基金的左膀右臂。 | bloomberg.com |
| 法律AI模型 (Harvey) | 律师助理机器人:审阅合同找出风险条款,检索类似案例,起草法律文书。律所效率倍增器。 | harvey.ai |
| NVIDIA Nemotron | 工业仿真专家:优化流体力学模拟、材料科学计算,帮助工程师设计更高效的飞机引擎或芯片散热。 | build.nvidia.com |
十二、轻量/端侧模型
| 工具名称 | 能做什么 | 官网 |
|---|---|---|
| Google Gemini Flash | 手机里的AI助手:离线运行,实时语音翻译、拍照识物、会议纪要,不耗流量不卡顿。 | deepmind.google |
| OpenAI GPT Mini/Nano | 嵌入式大脑:装进智能手表、IoT设备里,提供基础对话、指令控制,功耗极低。 | openai.com |
| Meta Llama 小模型 | 个人电脑私密助手:完全离线运行,处理本地文档、写日记、做日程,数据不出门。 | llama.com |
| Gemma (Google) | 边缘计算小钢炮:在树莓派上就能跑,适合智能家居、机器人等场景,快速响应本地指令。 | ai.google.dev |
十三、开源/高性价比模型
| 工具名称 | 能做什么 | 官网 |
|---|---|---|
| DeepSeek V3/R1系列 (深度求索) | 免费的全能选手:数学、代码、写作、翻译样样行,API调用几乎不要钱,适合创业公司、学生党低成本使用。 | deepseek.com |
| Qwen 3.5系列 (阿里) | 中文开源之王:从7B到72B多个版本可选,可商用,一键部署企业私有AI,支持文档处理、多轮对话。 | chat.qwen.ai |
| Llama 4系列 (Meta) | 开源模型全家桶:从可手机运行的小模型到企业级超大模型全都有,社区生态丰富,各种插件、教程随便用。 | llama.com |


