本文作者:wxk

AI大模型领域分类

wxk 2026-03-19 17:26:18
后台-系统设置-扩展变量-手机广告位-内容正文顶部
摘要: AI大模型领域分类

一、通用大语言模型

工具名称 能做什么 官网
GPT-5系列 (OpenAI) 全能助手:日常聊天、写文章、改代码、解数学题,还能语音对话、看图说话。一次能处理整本小说那么长的内容,随时调用联网搜索和工具(比如订餐、查天气)。 openai.com
Claude 4.x系列 (Anthropic) 文档分析专家:扔给它10份百页财报、一整套合同或学术论文,它能精准总结、对比条款、找出矛盾。写作风格自然,擅长润色报告、起草邮件,几乎不会“胡编乱造”。 claude.ai
Gemini 3.x系列 (Google) 海量资料吞噬者:一次喂进10本书或3小时会议视频,它能瞬间找出关键细节。还能边看视频边回答问题,实时搜索最新信息,结合地图、文档帮你做调研报告。 gemini.google.com
DeepSeek V3/R1系列 (深度求索) 免费数学+代码神器:解奥数题、写LeetCode算法、解释复杂代码,速度快还不要钱。支持上传PDF、Word,一键总结长文,开发者最爱。 deepseek.com
Grok 4系列 (xAI) 实时冲浪嘴替:随时抓取X平台最新热点,用幽默毒舌的风格回答,还能一边帮你查资料一边发帖。适合追热点、写段子、搞怪互动。 grok.x.ai
Kimi K系列 (月之暗面) 中文长文收割机:一次处理200万字(相当于三体三部曲),上传几十份研报、法律卷宗,它立马给你整理出核心观点,还自带联网搜索验证事实。 kimi.ai
Llama 4系列 (Meta) 企业自建AI引擎:开源可商用,你可以在内部服务器部署一个“私有版ChatGPT”,处理公司机密文档,支持千万级token上下文(如分析整个代码库)。 llama.com
Qwen 3.5系列 (阿里) 中文场景多面手:写朋友圈文案、生成周报、翻译外文、做会议纪要,尤其懂中文梗和文化。轻量版还能装进手机App离线跑。 chat.qwen.ai

二、编程/代码生成

工具名称 能做什么 官网
Claude Code (Anthropic) 自主编程代理人:给它一个需求“写个爬虫每天抓新闻发邮件”,它自己拆任务、写代码、跑测试、调bug,一条龙搞定,你只需要看结果。
自主开发代理: 扔给它一个复杂的改动需求,它能自己看代码、自己跑测试、自己修 Bug,直到任务彻底完成
claude.com
GitHub Copilot / Copilot Next (GitHub) 代码自动补全大师:在VS Code里打字它就猜下一行,一键生成函数、注释、单元测试。新版本还能用语音说“给这个API加个缓存”它直接改好。 github.com
Cursor AI原生IDE:边写代码边跟AI聊天,框住一段代码说“改成异步”它立刻重写。内置GPT-5和Claude,能帮你整个项目重构、写文档、部署一条龙。
让 AI 帮你写完整个软件: 即使你不会写代码,只要描述功能,它能直接改写你本地的文件并运行出结果。
从需求到代码自动完成:写代码→改Bug→重构→部署,一站式开发
IDE里自动写/改代码、生成测试、重构项目(像AI同事实时协作)
cursor.sh
OpenAI Codex (OpenAI) 自然语言转代码神器:说“做一个计算器网页”它直接生成HTML/CSS/JS。适合快速原型、自动化脚本,支持Python、JavaScript等主流语言。 openai.com
DeepSeek Coder (深度求索) 开源算法刷题神器:给你LeetCode难题的多种解法,还能解释每一步原理。本地部署后可以当私密代码助手,专攻算法、数据结构。 deepseek.com
Code Llama (Meta) 本地代码保镖:完全离线的代码生成模型,适合处理敏感项目。可以帮你写SQL查询、重构老旧代码、生成API文档。 llama.com

三、科学/数学/复杂推理

工具名称 能做什么 官网
Gemini 3.x系列 (Google) 科研文献粉碎机:上传100篇PDF论文,它能提取所有公式、对比实验数据、总结研究趋势。还能看懂复杂图表,帮你验证数学推导。
解决复杂数学题、分析科研数据、处理长篇论文级资料
gemini.google.com
deepmind.google
Claude Opus 4.x (Anthropic) 专家级分析员:给一份技术白皮书,它能指出逻辑漏洞;给一组实验数据,它能提出假设并设计验证方案。适合需要深度思考的科研/咨询场景。
做严谨推理、复杂问题拆解、科研级分析
claude.ai
GPT-5系列 (OpenAI) 跨学科解题王:从量子力学到经济学模型,它能一步步推导演算,并给出可理解的解释。还能帮你写LaTeX公式、生成模拟数据。
多步骤逻辑推理,解决复杂问题(类似一步步思考)
openai.com
DeepSeek R1系列 (深度求索) 开源推理尖兵:专攻数学证明、逻辑谜题、算法优化。可本地部署,用于教育、竞赛培训,或嵌入需要推理能力的应用。
数学推理、算法分析、逻辑题求解
deepseek.com
OpenAI o1 / GPT Thinking (OpenAI) 慢思考专家:对付奥数题、物理难题、复杂规划,它会像人类一样反复推敲,给出最严谨的解答。适合需要“想清楚再答”的高难度任务。 openai.com
Alibaba Qwen 3.5 数学计算、逻辑分析、技术问题解答 qwen.aliyun.com

四、文案/写作/专业文档

工具名称 能做什么 官网
Claude Sonnet/Opus 4.x (Anthropic) 专业写手+编辑:帮你起草商业计划书、润色学术论文、调整邮件语气。给个大纲它能扩写出结构清晰的长文,还能模仿特定作家的风格。
写论文、报告、合同、长文档,逻辑清晰、质量高
claude.ai
GPT-5系列 (OpenAI) 创意文案工厂:10秒钟生成10条广告slogan,写小红书文案、短视频脚本、产品说明书都不在话下。还能批量改写、翻译、总结。
写文案、脚本、营销内容,快速批量生成
openai.com
Gemini 3.x系列 (Google) 研究报告助理:输入关键词,它自动搜索最新资讯、整理数据、生成带引用来源的调研报告。还能把枯燥的数据变成生动的图表描述。
写研究型内容、整理资料、生成结构化文档
gemini.google.com
Kimi K系列 (月之暗面) 中文文档榨汁机:扔进一本500页的行业报告,它立刻给你画出思维导图、提炼核心观点、生成执行摘要。还能对比多份合同的差异。 kimi.ai

五、文生图

工具名称 能做什么 官网
Midjourney v7 设计师灵感伙伴:输入“赛博朋克城市,霓虹灯,雨夜,电影质感”立刻生成艺术级概念图。适合做插画、海报、游戏原画,风格感极强。 midjourney.com
Flux系列 (Black Forest Labs) 商用海报生成器:准确生成带中文文字的广告图,比如“618大促,全场五折”排版规整。开源可商用,电商设计首选。 blackforestlabs.ai
DALL-E 3 (OpenAI) 小白出图神器:直接说“一只穿西装的猫在开会”,几秒出图,理解力超强。集成在ChatGPT里,边聊边改图,快速做配图、插画。 openai.com
Stable Diffusion 极客定制画板:本地安装后可以自由加插件,用ControlNet控制人物姿势、用LoRA训练专属画风。适合技术流玩家深度定制。 stability.ai
Qwen-Image / Kling Image (阿里/快手) 亚洲审美专家:生成的人物更符合东方审美,支持“水墨画”“国潮”风格,还能准确写出毛笔字。PPT配图、社交媒体封面随叫随到。 chat.qwen.ai / kling.kuaishou.com
Imagen 4 (Google) 超逼真摄影机:输入“逆光人像,发丝细节,胶片颗粒”生成的照片几乎以假乱真,光影和纹理处理顶级,适合广告级视觉素材。 deepmind.google
Adobe Firefly 设计师的瑞士军刀:在PS里直接框选区域说“加朵云”,AI自动生成。还能替换背景、扩展画面、生成矢量图,版权安全商用无忧。 adobe.com
Ideogram 排版强迫症救星:生成的图片文字位置、字体、大小完全可控,做logo、封面、标题图特别稳,再也不用后期P字。 ideogram.ai
ComfyUI 节点式炼丹炉:把图像生成拆成乐高积木,自由连接各种模型、控制模块。适合想探索AI绘画极限的极客和研究者。 comfyui.com

六、文生视频

工具名称 能做什么 官网
Sora 2 (OpenAI) 电影导演级视频:输入“宇航员在火星上打篮球,慢动作”它生成2分钟连贯视频,人物、场景、物理规律完全一致。能做短片、广告、概念预告。
生成有故事感的长镜头: 视频里的人物长相从头到尾保持一致,镜头语言丰富,适合做有剧情的短片预告。
openai.com
Veo 3 (Google DeepMind) 好莱坞运镜神器:指定“推拉摇移”镜头语言,AI生成的视频自动匹配,还自带环境音效。适合专业影视制作人快速预览分镜。
电影级真实视频、物理运动+音画同步、复杂运镜、专业短片
自带音效的短视频: 画面极其精致,且生成的视频自带逼真的环境音(如海浪声、脚步声),音画一体。
deepmind.google
Kling系列 (快手) 短视频爆款制造机:生成跳舞、烹饪、运动类视频特别流畅,人物动作自然,支持“让主角从左边跑到右边”这种精确控制,国内用户免费。
拍出逼真生活动作: 无论是吃面、跑步还是说话,动作极其自然无撕裂,支持 4K 画质和多镜头脚本控制
kling.kuaishou.com
Runway系列 在线视频剪辑室:AI生成视频、一键抠除绿幕、智能补帧、文字转语音。从零到成片一条龙,适合短视频创作者快速产出。
修改视频里的内容: 比如把视频里的路人抹掉、把背景从白昼变黑夜,或者让一张静止老照片动起来。
runwayml.com
Seedance 2.0 (字节跳动) 分镜大师:上传剧本,它自动生成分镜头脚本,人物和场景跨镜头保持一致,还能根据你的照片让主角“出演”视频。 seedance.com
Pika 轻量级视频玩具:输入“小猫弹吉他”立刻生成3秒动图,操作简单,适合做表情包、社交媒体小视频。 pika.art

七、音频生成

工具名称 能做什么 官网
AudioX (港科大) 全能音效师:从文字生成下雨声、从视频自动配音、给一段旋律续写成完整歌曲。做视频配音、游戏音效、音乐创作都行。
生成音效、音乐、视频配音
全能声音工厂: 输入文字生成任何口音的配音、电影配乐、甚至是非常罕见的环境音效。
audiox.github.io
ElevenLabs 人声克隆机:上传1分钟录音,就能用你的声音朗读任何文字,支持愤怒、悲伤等多种情绪,做有声书、虚拟主播超逼真。
真人语音生成、配音、语音克隆
elevenlabs.io
Whisper (OpenAI) 语音转文字劳模:把2小时会议录音变成逐字稿,支持99种语言,还能自动翻译。记者、学生、会议记录员必备。
语音转文字、会议记录、字幕生成
openai.com
Azure Speech Service (微软) 企业级语音工具箱:实时语音翻译、定制品牌音色、呼叫中心质检,支持每秒处理上万并发,大公司首选。
语音识别+语音合成,用于客服/系统
azure.microsoft.com
iFlytek (科大讯飞) 中文方言专家:能听懂粤语、四川话、上海话,转写准确率95%以上。开会时实时出字幕,还能生成会议纪要。
中文语音输入、语音控制、识别
iflytek.com

八、AI设计工具

工具名称 能做什么 官网
Stitch (Google) 无限画布设计伙伴:一边语音说“加个按钮”“背景改蓝色”一边修改原型,静态图瞬间变成可点击的交互demo。UI/UX设计师的加速器。 stitch.withgoogle.com

九、AI智能体/代理

工具名称 能做什么 官网
OpenClaw 数字员工操作系统:告诉它“整理桌面文件,把照片分类,然后发周报”,它自己打开文件夹、操作软件、写邮件,全程无需人插手。
自动操作电脑、执行任务流程
openclaw.ai
Manus 全能执行助理:说“帮我订下周三去上海的机票,选靠窗,顺便查当地天气”,它自己打开浏览器、填信息、下单,完事儿告诉你结果。
全自动跑腿: 你下令“调研 5 家竞品并做个 PPT”,它会自动打开网页搜数据、整理内容并直接生成文件给你。
自动完成任务:查资料→写报告→执行操作,一步到位
manus.ai
实在Agent (实在智能) 老旧软件救星:那些没API的老系统,它像人一样看屏幕操作,自动录入数据、生成报表。财务、HR的自动化神器。 aisinit.com
Loomy (科大讯飞) 桌面智能管家:每天自动整理下载文件夹,把工作文档按项目归类,还能定时帮你备份重要文件,支持语音指令。
自动办公、整理文件、处理数据
loomy.iflytek.com
AutoGPT 自主任务机器人:给它一个目标“研究AI最新趋势并写成报告”,它会自己搜索、阅读、总结、写稿,直到完成任务。
自动执行多步骤任务(无人干预)
autogpt.net
LangChain 智能体开发框架:用它能拼装出复杂的AI应用,比如一个能查天气、订餐厅、记备忘录的多功能助手。
搭建AI应用、开发智能体系统
langchain.com
CrewAI 团队协作模拟器:让多个AI扮演市场、产品、程序员,一起开会讨论方案,最后输出一份完整的项目计划。 crewai.com
OpenAI Assistants API 定制助手工厂:开发者用几行代码就能创建专属AI,让它能查知识库、写代码、调用公司内部API,集成到APP里当客服或顾问。
构建可调用工具的AI助手
platform.openai.com

十、语音AI

工具名称 能做什么 官网
Whisper (OpenAI) 语音转写员:采访录音、会议录音扔进去,瞬间变文字,还能区分不同说话人。支持各种口音和背景噪音环境。 openai.com
ElevenLabs 配音演员:给文本配上情绪饱满的人声,可以选“温柔女声”“浑厚男声”,甚至模仿名人声音。做视频配音、有声小说太方便。 elevenlabs.io
Azure Speech Service (微软) 全球化语音平台:同时处理多语种实时翻译,比如跨国会议中英文互译,还能自定义唤醒词,用于智能音箱、车载系统。 azure.microsoft.com
iFlytek (科大讯飞) 方言转写王:无论用户说粤语、闽南语还是河南话,都能准确转成文字。课堂录音、采访记录神器。 iflytek.com

十一、垂直行业模型

工具名称 能做什么 官网
AlphaFold 3 (Google DeepMind) 生命科学预言家:输入蛋白质序列,它预测3D结构,加速新药研发、疾病研究。生物学家、医药公司的超级计算机。
加速科研新药开发: 科学家用来预测蛋白质和 DNA 结构,将原本数年的实验周期缩短到几天。
deepmind.google
NotebookLM (Google) 个人知识库大脑:上传几十篇文献、笔记,它自动建立知识网络,能回答“某某理论最早出现在哪篇论文”,还能生成复习播客。
把枯燥文档变播客: 扔进去几份晦涩的学术论文,它能自动生成一段两个真人对话的播客,让你用耳朵听懂。
notebooklm.google.com
医疗AI模型 (Google Health) 影像诊断助手:分析CT、X光片,标记可疑病灶,辅助医生快速判断。还能根据病历推荐诊疗方案。 health.google
医疗AI模型 (IBM Watson Health) 临床决策支持:整合患者数据、医学文献,给出个性化治疗建议,帮助医生制定癌症治疗方案。 ibm.com
金融AI模型 (Bloomberg AI) 市场情报分析员:实时监控新闻、财报、交易数据,预警风险,自动生成投资摘要。量化基金的左膀右臂。 bloomberg.com
法律AI模型 (Harvey) 律师助理机器人:审阅合同找出风险条款,检索类似案例,起草法律文书。律所效率倍增器。 harvey.ai
NVIDIA Nemotron 工业仿真专家:优化流体力学模拟、材料科学计算,帮助工程师设计更高效的飞机引擎或芯片散热。 build.nvidia.com

十二、轻量/端侧模型

工具名称 能做什么 官网
Google Gemini Flash 手机里的AI助手:离线运行,实时语音翻译、拍照识物、会议纪要,不耗流量不卡顿。 deepmind.google
OpenAI GPT Mini/Nano 嵌入式大脑:装进智能手表、IoT设备里,提供基础对话、指令控制,功耗极低。 openai.com
Meta Llama 小模型 个人电脑私密助手:完全离线运行,处理本地文档、写日记、做日程,数据不出门。 llama.com
Gemma (Google) 边缘计算小钢炮:在树莓派上就能跑,适合智能家居、机器人等场景,快速响应本地指令。 ai.google.dev

十三、开源/高性价比模型

工具名称 能做什么 官网
DeepSeek V3/R1系列 (深度求索) 免费的全能选手:数学、代码、写作、翻译样样行,API调用几乎不要钱,适合创业公司、学生党低成本使用。 deepseek.com
Qwen 3.5系列 (阿里) 中文开源之王:从7B到72B多个版本可选,可商用,一键部署企业私有AI,支持文档处理、多轮对话。 chat.qwen.ai
Llama 4系列 (Meta) 开源模型全家桶:从可手机运行的小模型到企业级超大模型全都有,社区生态丰富,各种插件、教程随便用。 llama.com
后台-系统设置-扩展变量-手机广告位-内容正文底部
分享到:

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏