侧边栏壁纸
  • 累计撰写 56 篇文章
  • 累计创建 5 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

2026 年 - AI 开发者必备:Agent 开源生态图谱

温馨提示:
部分素材来自网络,若不小心影响到您的利益,请联系我们删除。

🤖 数据来源:GitHub API | 采集日期:2026-06-05 | 数据真实可查

ChatGPT Image 2026年6月5日 121446.png

开源项目

一、🤖 Agent 框架(35+ 项目,最热赛道)

👑 超级巨星(⭐ 100k+)

框架 Stars 语言 出品方 定位 简介 GitHub
AutoGPT 185,000 Python Significant Gravitas 自主 AI Agent 始祖 全球首个自主AI Agent项目,支持自动任务分解、多步推理和工具调用,开创了Agent赛道。内置插件生态和可视化工作流编辑器,是理解Agent范式的入门必读。 Significant-Gravitas/AutoGPT
Hermes Agent 181,000 Python Nous Research 自进化 AI Agent 2026年增长最猛的Agent项目,采用三层记忆架构(短期/长期/元记忆),能与用户共同进化。支持自我反思、自主学习和个性化适配,代表了Agent从"工具"到"伙伴"的范式跃迁。 NousResearch/hermes-agent
LangChain 139,000 Python LangChain Inc Agent 工程平台 LLM应用开发的事实标准框架,提供链式调用、工具绑定、记忆管理、Agent编排等核心能力。生态最完整,社区最活跃,几乎所有Agent项目都直接或间接基于LangChain构建。 langchain-ai/langchain

🌟 准巨星(⭐ 50k - 100k)

框架 Stars 语言 出品方 定位 简介 GitHub
DeerFlow 70,500 Python 字节跳动 长周期 SuperAgent 字节跳动开源的深度研究Agent框架,支持长周期任务的规划、执行与反思闭环。擅长处理需要多步推理和信息整合的复杂场景,如深度调研和报告生成。 bytedance/deer-flow
MetaGPT 68,500 Python DeepWisdom 多 Agent 模拟软件公司 用多个AI Agent模拟完整软件开发团队(产品经理、架构师、工程师、QA),自动生成需求文档、系统设计、代码和测试,是Multi-Agent协作范式的开创者。 geekan/MetaGPT
AutoGen 58,700 Python Microsoft 多 Agent 编程框架 微软出品的多Agent对话框架,支持Agent之间通过对话协作完成复杂任务。灵活的角色定义和消息传递机制,是企业级多Agent系统的首选框架。 microsoft/autogen
OpenManus 56,500 Python FoundationAgents 通用 Agent 平台 Manus AI的开源复刻版,2026年增长最快的Agent项目之一。支持多步任务规划、工具调用和环境交互,提供完整的Agent运行时和可视化界面,降低了构建通用Agent的门槛。 FoundationAgents/OpenManus
CrewAI 52,900 Python CrewAI Inc 角色扮演式编排 以"船员"比喻Agent协作的编排框架,每个Agent有明确的角色、目标和工具。强调任务分配和团队协作,API设计优雅简洁,上手极快,适合快速原型开发。 crewAIInc/crewAI

⭐ 快速增长(⭐ 10k - 50k)

框架 Stars 语言 出品方 定位 简介 GitHub
CowAgent 45,100 Python zhayujie 超级 AI 助手 国产超级AI助手,集成多模型对话、知识库、插件系统和多模态能力。支持微信/企微/飞书等多平台接入,是国内最活跃的AI助手开源项目。 zhayujie/CowAgent
nanobot 43,700 Python HKUDS 轻量 AI Agent 港大数据科学实验室出品,仅4000行代码实现完整Agent能力。极简设计哲学,零依赖、高性能,适合嵌入到现有系统中,是"小而美"Agent框架的典范。 HKUDS/nanobot
Agno 40,500 Python Agno AGI 极速轻量 Agent 框架 前身为Phidata,主打极速和轻量。Type-safe的API设计,内置RAG、记忆和工具调用,支持多模态Agent构建,性能优异,适合生产环境部署。 agno-agi/agno
AgentGPT 36,200 TypeScript reworkd 浏览器端 Agent 将AutoGPT的能力搬到浏览器中,提供直观的Web界面来配置和运行自主Agent。无需本地环境搭建,降低了Agent使用门槛,是Agent可视化的先驱。 reworkd/AgentGPT
DSPy 34,900 Python Stanford NLP LLM 编程框架 斯坦福NLP出品,将LLM提示工程从"手工调参"提升为"自动编译"。通过声明式编程自动优化Prompt和Few-shot示例,是Prompt Engineering科学化的里程碑。 stanfordnlp/dspy
LangGraph 33,900 Python LangChain Inc 有向图 Agent 工作流 LangChain团队出品的Agent编排引擎,用有向图定义Agent的状态流转和决策逻辑。支持循环、条件分支和人机协作,是构建复杂Agent工作流的首选工具。 langchain-ai/langgraph
ChatDev 33,300 Python OpenBMB 多 Agent 模拟软件公司 清华团队出品,用多Agent模拟虚拟软件公司。Agent之间通过自然语言对话协作完成软件开发全流程,是Multi-Agent软件工程的重要研究成果。 OpenBMB/ChatDev
Semantic Kernel 28,100 C# Microsoft .NET/Python Agent 微软为.NET和Python生态打造的AI Agent SDK,深度集成Azure OpenAI服务。支持插件、记忆和规划能力,是C#/.NET开发者构建AI应用的首选。 microsoft/semantic-kernel
SmolAgents 27,700 Python HuggingFace 极简 Agent HuggingFace出品的极简Agent框架,核心代码不到1000行。支持Code Agent范式(Agent直接写代码执行任务),与HuggingFace生态深度集成。 huggingface/smolagents
OpenAI Agents SDK 26,900 Python OpenAI 轻量多 Agent OpenAI官方Agent开发SDK,提供Agent定义、工具绑定、交接(handoff)和防护栏等核心能力。设计简洁,与OpenAI API深度集成,是使用OpenAI模型构建Agent的最短路径。 openai/openai-agents-python
AgentScope 26,200 Python 阿里达摩院 可观测 Agent 阿里达摩院出品的多Agent平台,强调可观测性和可控性。提供丰富的Agent模板、分布式运行时和可视化调试工具,适合研究和生产环境的多Agent系统。 modelscope/agentscope
Haystack 25,500 Python deepset NLP/RAG 编排 deepset出品的NLP和RAG编排框架,提供模块化的Pipeline架构。擅长文档搜索、问答和RAG场景,与Elasticsearch等搜索引擎深度集成。 deepset-ai/haystack
Mastra 24,800 TypeScript Mastra AI TypeScript Agent 框架 TypeScript生态最热门的Agent框架,提供类型安全的Agent构建API。内置工作流引擎、RAG和评估工具,与Vercel AI SDK深度集成,是TS开发者构建AI应用的利器。 mastra-ai/mastra
Vercel AI SDK 24,700 TypeScript Vercel 前端 AI 开发 SDK Vercel出品的AI开发SDK,让前端开发者轻松集成LLM能力。支持流式输出、工具调用和多模型切换,是Next.js/React生态AI开发的标准配置。 vercel/ai
Letta 23,100 Python Letta AI 有状态 Agent 前身为MemGPT,专注解决LLM的上下文窗口限制。通过虚拟上下文管理和长期记忆机制,让Agent拥有"无限记忆"能力,是Agent记忆方向的标杆项目。 letta-ai/letta
BabyAGI 22,300 Python yoheinakajima 自主任务 Agent 先驱 最早的自主Agent项目之一,用极简代码(~140行)实现了任务创建、优先级排序和自主执行的完整循环。代码虽少但影响深远,启发了整个自主Agent赛道。 yoheinakajima/babyagi
OpenAI Swarm 21,600 Python OpenAI 轻量多 Agent 协作 OpenAI出品的实验性多Agent框架,主打轻量级Agent协作和交接。设计极简,强调教学价值而非生产用途,是理解多Agent协作模式的优秀教材。 openai/swarm
Guidance 21,500 Python Microsoft LLM 结构化控制 微软出品,通过约束LLM输出来实现结构化和可控的文本生成。将传统编程的控制流(if/else/for)引入LLM调用,大幅降低Prompt Engineering的不确定性。 guidance-ai/guidance
Google ADK 20,000 Python/Go Google 企业级 Agent 开发套件 Google推出的Agent Development Kit,提供Agent构建、工具集成、多Agent编排和企业级安全等全套能力。与Google Cloud深度集成,是企业级Agent开发的Google方案。 google/adk-python
OWL 19,800 Python CAMEL-AI 多 Agent 协作 CAMEL-AI团队出品的多Agent协作框架,主打Agent团队的自组织和自协调能力。在GAIA等Agent基准测试中表现优异,是多Agent协作研究的重要项目。 camel-ai/owl
DB-GPT 18,900 Python eosphoros 数据驱动 Agent 专注数据库场景的Agent框架,支持自然语言查数据、智能数据分析和可视化。内置知识库管理和多模型调度,是数据智能方向的差异化Agent项目。 eosphoros-ai/DB-GPT
SuperAGI 17,600 Python TransformerOptimus 模块化自主 Agent 平台 模块化的自主Agent平台,提供Agent创建、工具市场、资源管理和并发控制等企业级功能。支持多Agent并行运行和可视化监控,适合构建生产级Agent系统。 TransformerOptimus/SuperAGI
Pydantic AI 17,500 Python Pydantic 类型安全 Agent Pydantic团队出品,将Pydantic的类型验证哲学带入Agent开发。Agent的输入输出都有严格的类型约束,减少运行时错误,是Python类型安全Agent开发的标杆。 pydantic/pydantic-ai
Camel 17,100 Python CAMEL-AI 多 Agent 通信先驱 学术界最早的多Agent框架之一,首创了Agent间的角色扮演对话模式。在Multi-Agent通信和协作研究方面有重要贡献,论文引用量极高。 camel-ai/camel
Outlines 13,900 Python dottxt-ai LLM 结构化输出 通过有限状态机和正则约束实现LLM输出的100%结构化。支持JSON Schema、正则表达式和CFG等约束方式,是解决LLM输出不可控问题的利器。 dottxt-ai/outlines
Instructor 13,100 Python jxnl LLM 结构化输出 基于Pydantic的LLM结构化输出库,通过类型注解让LLM直接返回Python对象。支持自动重试和验证,API极其简洁,是结构化输出的最简方案。 instructor-ai/instructor

🔧 潜力新星(⭐ 3k - 10k)

框架 Stars 语言 出品方 定位 简介 GitHub
XAgent 8,500 Python OpenBMB 自主复杂任务求解 清华团队出品的自主Agent,专注于复杂任务的自动分解和执行。支持ToolAgent子系统和双循环决策机制,适合需要多步推理的场景。 OpenBMB/XAgent
Voyager 7,000 Python NVIDIA 具身终身学习 Agent NVIDIA出品,在Minecraft中实现具身Agent的终身学习。Agent通过自主探索、技能库积累和代码生成不断提升能力,是具身AI和终身学习研究的重要成果。 MineDojo/Voyager
TaskWeaver 6,200 Python Microsoft 代码优先数据分析 Agent 微软出品的代码优先Agent,擅长数据分析和可视化。Agent直接生成Python代码执行任务,支持插件扩展和多轮对话,适合数据处理场景。 microsoft/TaskWeaver
AG2 4,600 Python AG2 AI AutoGen 社区版 AutoGen项目的社区活跃分支,在原版基础上增加了更多实用功能和改进。保持了AutoGen的核心架构,同时提供更活跃的社区支持和更快的迭代更新。 ag2ai/ag2
BeeAI 3,300 TypeScript IBM Research IBM 多 Agent 框架 IBM研究院出品的多Agent框架,强调Agent间的标准化通信和协作。基于开放协议设计,支持跨框架的Agent互操作,是企业级多Agent系统的IBM方案。 i-am-bee/beeai-framework

二、🦞 个人 AI 助手(新兴超级赛道)

项目 Stars 语言 出品方 简介 GitHub
OpenClaw 377,000 TypeScript OpenClaw GitHub有史以来Star数最高的AI项目之一,全平台个人AI助手。支持桌面、移动和Web端,内置插件生态、多模型切换和本地知识库,是开源AI助手的天花板。 openclaw/openclaw
Hermes Agent 181,000 Python Nous Research 与你共同成长的AI伙伴,三层记忆架构实现个性化进化。不仅能完成任务,还能学习和适应用户习惯,代表AI助手从工具到伙伴的进化方向。 NousResearch/hermes-agent
OpenCode 170,000 TypeScript anomalyco 开源终端编程Agent,在命令行中提供智能编程辅助。支持多模型、代码理解和自动修复,是终端重度用户的高效编程伙伴,增长速度惊人。 anomalyco/opencode
Open Interpreter 63,800 Python 社区 让LLM直接操控你的电脑——用自然语言执行代码、管理文件、控制系统设置。开创了"自然语言=操作系统"的交互范式,是AI助手领域的先驱项目。 OpenInterpreter/open-interpreter
CowAgent 45,100 Python zhayujie 国产超级AI助手,深度集成微信/企微/飞书等国内主流平台。支持多模型对话、知识库、插件系统和联网搜索,最接地气的国产AI助手方案。 zhayujie/CowAgent
OpenHuman 21,000 TypeScript TinyHumans AI 2026年5月爆火的新锐项目,主打"本地优先"的桌面AI助手。所有数据在本地处理,强调隐私和个性化,核心理念是"你的AI应该住在你家里"。 tinyhumans-ai/openhuman

三、🚀 AI 编程 / 开发工具

工具 Stars 语言 出品方 简介 GitHub
Gemini CLI 103,000 TypeScript Google Google出品的终端AI编程Agent,拥有100万token超大上下文窗口且免费使用。支持代码理解、生成、重构和调试,是终端AI编程的新王者。 google-gemini/gemini-cli
browser-use 97,200 Python 社区 让AI Agent像人一样操控浏览器,实现网页自动化、数据采集和表单填写。2025-2026年增长最猛的AI工具之一,解决了Agent与Web交互的核心痛点。 browser-use/browser-use
Codex CLI 88,800 Rust OpenAI OpenAI官方终端编程Agent,Rust编写性能极佳。支持沙盒和自主双模式,内置安全审核机制,是OpenAI编程能力的命令行入口。 openai/codex
OpenHands 75,900 Python All-Hands-AI 原名OpenDevin,AI软件开发Agent。能自主编写代码、运行测试、修复Bug,模拟完整的软件开发流程,是Devin类产品的最佳开源替代。 All-Hands-AI/OpenHands
gpt_academic 70,800 Python Binary-Husky 面向学术的AI工具,支持论文阅读、翻译、润色、LaTeX排版和代码分析。深受科研工作者喜爱,是国内Star数最高的AI应用项目之一。 binary-husky/gpt_academic
Cline 62,800 TypeScript cline VS Code中最受欢迎的自主编程Agent插件,能理解代码库上下文、自动编辑文件、执行终端命令。插件架构设计优秀,是VS Code AI编程的首选方案。 cline/cline
GPT-Engineer 55,200 Python gpt-engineer-org 用自然语言描述需求,自动生成完整应用程序。从项目初始化到代码实现一气呵成,是"Prompt to Product"理念的早期实践者。 gpt-engineer-org/gpt-engineer
Aider 45,800 Python paul-gauthier 终端AI结对编程工具,与Git深度集成。支持多种LLM、增量代码编辑和自动提交,是终端党的AI编程利器,社区活跃度极高。 paul-gauthier/aider
Bolt.diy 45,600 TypeScript StackBlitz Labs Bolt.new的开源版本,AI全栈Web开发平台。通过对话生成完整Web应用,支持前后端代码生成和一键部署,是AI驱动Web开发的重要开源方案。 stackblitz-labs/bolt.diy
GPT-Pilot 33,800 Python Pythagora AI开发搭档,模拟完整的软件开发流程。从需求分析到代码实现逐步推进,支持代码审查和迭代优化,是AI软件工程方向的早期探索者。 Pythagora-io/gpt-pilot
Continue 33,500 TypeScript continuedev 开源AI编程IDE插件,支持VS Code和JetBrains全系列。可自选模型、自定义Prompt和上下文,是商业Copilot的开源替代品,企业友好。 continuedev/continue
Tabby 33,600 Rust TabbyML Rust编写的自托管AI编码助手,数据完全私有化部署。支持代码补全、聊天和代码搜索,是企业级AI编程助手的最佳私有化方案。 TabbyML/tabby
CopilotKit 32,300 TypeScript CopilotKit 为React/Next.js应用添加AI Copilot能力的前端框架。发起AG-UI协议标准,支持AI Agent与前端UI的智能交互,是构建AI增强Web应用的利器。 CopilotKit/CopilotKit
Roo Code 24,200 TypeScript RooCode Inc. Cline的最活跃社区分支,在原版基础上增加了自定义模式、MCP增强和UI优化。独立的开发路线图,功能迭代迅速,已形成自己的用户生态。 RooVetGit/Roo-Code
SWE-agent 19,400 Python Princeton NLP 普林斯顿出品,自动定位和修复代码Bug并提交PR。在SWE-bench评测中表现优异,代表了AI自动修Bug的前沿水平,是AI DevOps的重要探索。 princeton-nlp/SWE-agent
Devika 19,500 Python stitionai Cognition AI旗下Devin的开源替代品,自主AI软件工程师。支持多步规划、代码编写和项目部署,是最早的自主编程Agent开源项目之一。 stitionai/devika

四、📚 RAG & 知识库

框架 Stars 语言 简介 GitHub
RAGFlow 81,300 Python 深度文档解析RAG引擎,支持PDF/Word/PPT等复杂格式的精准解析。内置OCR、版面分析和表格识别,是文档理解能力最强的开源RAG方案,企业级知识库首选。 infiniflow/ragflow
AnythingLLM 60,700 JavaScript 最易用的本地RAG桌面应用,一键部署无需技术背景。支持多模型、多文档格式和Agent能力,让非技术用户也能搭建私有知识库,是RAG民主化的标杆项目。 Mintplex-Labs/anything-llm
Mem0 57,700 Python AI Agent通用记忆层,为Agent提供持久化的长期记忆能力。自动提取、存储和检索用户偏好与对话历史,是构建个性化Agent的核心基础设施,增长速度极快。 mem0ai/mem0
PrivateGPT 57,200 Python 100%离线运行的RAG方案,所有数据和推理完全在本地处理。零外部API依赖,是数据隐私敏感场景的不可替代方案,深受企业和政府用户青睐。 zylon-ai/private-gpt
LlamaIndex 49,900 Python 文档Agent+数据框架,连接LLM与外部数据的桥梁。支持160+数据源接入、高级RAG策略和Agent工作流,是RAG领域最成熟、生态最完整的框架。 run-llama/llama_index
Quivr 39,200 Python “开源第二大脑”,个人知识管理利器。支持多格式文档导入、智能分类和语义搜索,提供优雅的用户界面,是个人知识管理领域最受欢迎的开源方案。 Quivr-App/quivr
LightRAG 35,800 Python 港大出品,轻量高速的RAG框架。EMNLP 2025论文支撑,在保持检索质量的同时大幅提升速度,适合对延迟敏感的应用场景,是学术RAG研究的代表作。 HKUDS/LightRAG
GraphRAG 33,500 Python 微软出品,知识图谱增强RAG。通过构建文档实体关系图谱来提升检索质量,在全局性问答和复杂推理场景下表现远超传统RAG,是RAG技术的重要创新。 microsoft/graphrag
PageIndex 32,200 Python 无向量推理RAG,摒弃传统向量检索范式。通过创新的索引结构实现高效检索,在准确率和速度上都有显著提升,是RAG技术路线的重要探索方向。 VectifyAI/PageIndex
Danswer 30,000 Python 企业级AI搜索平台,连接Slack/Google Drive/Confluence等企业数据源。支持自然语言搜索和智能问答,是企业内部知识搜索的最佳开源方案。 danswer-ai/danswer
FastGPT 28,200 TypeScript 知识库+Agent工作流平台,提供可视化工作流编辑器。支持多模型对话、知识库管理和API发布,低代码搭建AI应用,在国内企业场景中应用广泛。 labring/FastGPT
kotaemon 25,400 Python Cinnamon出品的RAG文档QA工具,专注技术文档问答场景。支持多轮对话、引用溯源和文档对比,界面简洁专业,是文档QA细分领域的精品。 Cinnamon/kotaemon
MaxKB 21,100 Python 1Panel团队出品的企业知识库问答系统。深度集成国产大模型,支持多租户和权限管理,提供开箱即用的部署方案,适合国内企业快速落地。 1Panel-dev/MaxKB
DocsGPT 17,900 Python 技术文档问答专精工具,自动解析项目文档并提供智能问答。支持多种文档源接入和对话式搜索,是开发者文档问答场景的热门开源方案。 arc53/DocsGPT
QAnything 14,000 Python 网易有道出品的本地知识库系统。支持多格式文档解析、本地化部署和多模型接入,在中文文档理解方面有独特优势,适合国内企业使用。 netease-youdao/QAnything
KAG 8,800 Python 阿里OpenSPG出品的知识图谱增强RAG框架。将知识图谱与RAG深度结合,在需要精确推理的知识问答场景中表现优异,是KAG技术路线的代表作。 OpenSPG/KAG

五、⚡ 推理 & 部署

框架 Stars 语言 简介 GitHub
Ollama 172,400 Go “AI界的Docker”,一行命令本地运行大模型。支持Llama/Qwen/DeepSeek等主流模型一键下载运行,是本地AI开发的必备工具,极大降低了AI模型使用门槛。 ollama/ollama
llama.cpp 113,200 C++ 让CPU也能高效推理LLM的传奇项目。纯C/C++实现,零依赖,支持4-bit量化,在MacBook和树莓派上都能流畅运行,是边缘设备AI推理的基石。 ggerganov/llama.cpp
vLLM 81,100 Python 高吞吐LLM推理引擎,PagedAttention技术大幅提升GPU利用率和并发能力。是生产环境部署LLM推理服务的事实标准,被各大云厂商广泛采用。 vllm-project/vllm
LiteLLM 48,400 Python 统一100+LLM的API网关,用OpenAI兼容格式调用所有模型。内置负载均衡、费用追踪和Fallback机制,是多模型管理场景的必备中间件。 BerriAI/litellm
LocalAI 46,500 Go 本地OpenAI兼容服务器,支持LLM/图像/语音/嵌入等多种AI能力。提供完整的OpenAI兼容API,是搭建本地AI服务平台的一站式方案。 mudler/LocalAI
Jan 42,900 TypeScript Jan.ai出品的本地离线AI助手桌面应用。支持模型下载管理、本地知识库和API服务,界面美观体验流畅,是ChatGPT桌面版的最佳开源替代。 janhq/jan
FastChat 39,500 Python LMSYS出品的模型训练/推理/评估一体化平台。支持Vicuna等知名模型的训练和服务,提供标准化的模型评测基准,是LLM研究和部署的重要工具。 lm-sys/FastChat
SGLang 28,300 Python 高性能LLM推理引擎,RadixAttention技术实现结构化生成加速。在JSON/正则约束生成场景下性能领先,适合需要结构化输出的高并发服务。 sgl-project/sglang
MLX 26,600 Python Apple出品的机器学习框架,专为Apple Silicon优化。在M系列芯片上推理性能远超PyTorch,是Mac用户本地跑AI模型的首选框架。 ml-explore/mlx
MLC-LLM 22,800 Python 让LLM在手机/浏览器/IoT设备上运行的跨平台推理引擎。基于TVM编译优化,支持iOS/Android/Web等多端部署,是边缘AI推理的先驱项目。 mlc-ai/mlc-llm
TensorRT-LLM 13,800 Python NVIDIA官方GPU推理优化库,深度优化Transformer模型推理性能。支持各种量化策略和并行推理,是NVIDIA GPU上LLM推理的性能天花板。 NVIDIA/TensorRT-LLM
TGI 10,900 Python HuggingFace官方推理服务器,支持多种模型架构和量化方式。与HuggingFace Hub深度集成,提供生产级的推理API,是HF生态的标准推理组件。 huggingface/text-generation-inference
LMDeploy 7,900 Python 上海AI Lab出品的高效推理引擎,InternLM生态核心组件。支持多种量化和并行策略,在国产模型推理场景下性能优异,是国产AI推理方案的代表。 InternLM/lmdeploy

六、🏋️ 训练 / 微调

框架 Stars 语言 简介 GitHub
Unsloth 65,200 Python LLM微调加速引擎,2x加速训练且减少70%显存占用。支持LoRA/QLoRA等主流微调方法,提供Web UI和Jupyter Notebook接口,让微调变得简单高效。 unslothai/unsloth
LLaMA Factory 64,500 Python 一站式LLM微调平台,支持100+模型的预训练/微调/评估。提供Web UI零代码微调,集成RLHF/DPO等对齐方法,是国内最受欢迎的LLM微调工具。 hiyouga/LLaMA-Factory
DeepSpeed 42,400 Python 微软出品的大规模深度学习优化库。ZeRO技术突破显存限制,支持千亿参数模型训练,是GPT/LLaMA等大模型训练的底层基础设施。 microsoft/DeepSpeed
Stanford Alpaca 30,300 Python 斯坦福出品的指令微调先驱,用GPT-3.5生成指令数据微调LLaMA。开创了低成本复刻ChatGPT的范式,论文引用量极高,是指令微调研究的里程碑。 tatsu-lab/stanford_alpaca
PEFT 21,200 Python HuggingFace出品的参数高效微调库。集成LoRA/Prefix Tuning/P-Tuning等主流PEFT方法,API简洁统一,是LLM微调的标准工具。 huggingface/peft
TRL 18,500 Python HuggingFace出品的Transformer强化学习库。支持RLHF/DPO/GRPO等对齐方法,是LLM对齐训练的标准实现,与PEFT和Transformers无缝集成。 huggingface/trl
Megatron-LM 16,500 Python NVIDIA出品的大规模语言模型训练框架。支持万亿参数模型的分布式训练,提供张量/流水线/数据三维并行策略,是超大规模模型训练的工业标准。 NVIDIA/Megatron-LM
ms-swift 14,400 Python 阿里魔搭ModelScope官方微调框架,国产模型微调首选。支持通义千问/ChatGLM等全系列国产模型,提供中文场景优化的训练流程和数据集。 modelscope/ms-swift
Axolotl 11,300 Python 易用的LLM微调框架,YAML配置文件驱动,无需写代码即可完成微调。支持多种模型和微调方法,社区活跃,是"零代码微调"理念的早期实践者。 OpenAccess-AI-Collective/axolotl
OpenRLHF 9,600 Python DeepSeek-R1时代最重要的开源GRPO/PPO框架。专注RLHF对齐训练,支持大规模分布式训练和Ray调度,是LLM对齐训练的高性能开源方案。 OpenRLHF/OpenRLHF

七、🎨 图像 / 视频生成

框架 Stars 语言 简介 GitHub
SD WebUI 163,000 Python Stable Diffusion的图形界面,AI图像生成的标准工具。丰富的插件生态、ControlNet集成和模型管理能力,让非技术用户也能创作高质量AI图像。 AUTOMATIC1111/stable-diffusion-webui
ComfyUI 116,000 Python 节点式AI图像工作流引擎,可视化的方式构建复杂的图像生成Pipeline。支持SD/SDXL/FLUX等所有主流模型,灵活度极高,是专业AI创作者的首选工具。 comfyanonymous/ComfyUI
Stable Diffusion 73,100 Python 扩散模型开源化的里程碑项目,开启了AI图像生成的全民时代。Stability AI出品,开源权重和代码,催生了一整个AI图像生成生态。 Stability-AI/stablediffusion
deepfakes/faceswap 55,300 Python Deepfake换脸开源项目,AI图像生成的早期热门。支持高质量人脸替换和训练,技术成熟但需注意伦理和法律合规使用。 deepfakes/faceswap
Fooocus 49,600 Python 专注"输入Prompt即出图"的极简体验,无需复杂参数调节。内置智能优化和风格预设,让新手也能生成高质量图像,是SD生态中最易用的工具。 lllyasviel/Fooocus
Real-ESRGAN 35,700 Python 图像超分辨率修复经典工具,AI一键提升图片清晰度和分辨率。支持老旧照片修复和动漫图片增强,效果自然真实,是图像后处理领域的必备工具。 xinntao/Real-ESRGAN
ControlNet 33,900 Python SD可控生成革命性插件,通过边缘/深度/姿态等条件精确控制图像生成。彻底改变了AI图像生成的可控性问题,已成为SD生态不可或缺的核心组件。 lllyasviel/ControlNet
Diffusers 33,800 Python HuggingFace出品的扩散模型库,提供统一API调用所有主流扩散模型。支持SD/SDXL/FLUX等模型,是扩散模型开发和研究的标准代码库。 huggingface/diffusers
Open-Sora 29,100 Python 开源版Sora视频生成,复现OpenAI Sora的核心能力。支持高质量文本到视频生成,是国内团队在视频生成领域的重要开源贡献。 hpcaitech/Open-Sora
InvokeAI 27,300 Python 专业级SD创作工具,提供画布编辑、批量生成和工作流管理。界面设计精良,交互体验优秀,是SD生态中面向专业创作者的高端方案。 invoke-ai/InvokeAI
Stability Gen Models 27,200 Python Stability AI的生成模型仓库,包含SD/SDXL等核心模型权重。开源模型生态的基础设施,被无数下游应用和项目所依赖。 Stability-AI/generative-models
FLUX 25,600 Python Black Forest Labs出品的新一代文生图模型,由原SD核心团队打造。在图像质量和文本渲染方面大幅超越SD,被视为SD的精神续作。 black-forest-labs/flux
LivePortrait 18,500 Python 快手出品,让照片"活起来"。通过驱动视频控制人像表情和动作,生成逼真的面部动画,在虚拟人和短视频创作场景中有广泛应用。 KwaiVGI/LivePortrait
Wan2.1 16,200 Python 新兴开源视频生成模型,在视频质量和运动一致性方面表现优异。支持多种分辨率和时长生成,是2026年视频生成领域的重要新力量。 Wan-Video/Wan2.1
CogVideo 12,800 Python 清华THUDM出品的视频生成模型,支持长视频生成和多种条件控制。学术研究实力强劲,是国产视频生成模型的代表作品。 THUDM/CogVideo
HunyuanVideo 12,200 Python 腾讯混元开源的视频生成模型,支持高质量文本到视频生成。在运动合理性和画面一致性方面有独特优化,是大厂开源视频生成的重要贡献。 Tencent/HunyuanVideo
AnimateDiff 12,100 Python 将静态图像模型转化为视频生成器的创新方案。无需从头训练视频模型,通过运动模块实现图像到视频的转换,思路巧妙影响广泛。 guoyww/AnimateDiff
InstantID 12,000 Python 零样本身份保持图像生成,一张照片即可生成保持身份特征的各种图像。无需微调即可实现个性化生成,是ID保持生成领域的突破性工作。 InstantID/InstantID
PhotoMaker 10,100 Python 腾讯ARC出品,个性化图像生成。上传少量照片即可生成各种风格和场景的个人图像,支持身份保持和风格迁移,是个性化生成领域的精品。 TencentARC/PhotoMaker

八、🎤 语音 / 音频

框架 Stars 语言 简介 GitHub
Whisper 102,000 Python OpenAI出品的语音识别标杆模型,支持99种语言的高精度语音转文字。鲁棒性强、部署简单,是几乎所有语音AI应用的基础组件。 openai/whisper
GPT-SoVITS 58,400 Python 少样本语音克隆与合成,仅需几秒音频即可克隆任意人声。支持中日英多语种,效果逼真且训练快速,是语音克隆领域最受欢迎的开源项目。 RVC-Boss/GPT-SoVITS
TTS (Coqui) 45,500 Python 深度学习语音合成全能库,支持1100+语言的TTS和语音克隆。模型丰富、文档完善,是语音合成研究和应用的瑞士军刀。 coqui-ai/TTS
ChatTTS 39,400 Python 专为对话场景优化的TTS模型,支持笑声、停顿等细粒度控制。生成的语音自然流畅,特别适合AI助手和客服等对话式应用场景。 2noise/ChatTTS
Bark 39,100 Python Suno AI出品的多语种TTS,支持13+语言且能生成笑声、音乐等非语音音效。表达能力丰富,在情感表达方面优于传统TTS方案。 suno-ai/bark
MockingBird 36,900 Python 5秒克隆声音的语音合成工具,国产项目中的语音克隆先驱。支持中文场景优化,提供Web界面和API,是最早让普通人体验语音克隆的项目。 babysor/MockingBird
OpenVoice 36,600 Python MyShell出品的即时声音克隆技术,将音色和内容分离实现零样本克隆。支持跨语种克隆且延迟极低,是实时语音交互场景的理想选择。 myshell-ai/OpenVoice
Fish Speech 30,700 Python 多语种零样本TTS,支持中日英韩等多语言的高质量语音合成。推理速度快、音质好,在开源TTS中综合表现优异,社区活跃度持续攀升。 fishaudio/fish-speech
CosyVoice 21,500 Python 阿里通义实验室出品的语音合成模型。支持多语种、情感控制和流式合成,与通义生态深度集成,是国产TTS模型的技术标杆。 FunAudioLLM/CosyVoice
F5-TTS 14,700 Python 基于Flow Matching的零样本TTS,无需微调即可克隆任意声音。架构创新、效果出色,是TTS技术路线的重要探索,在Flow Matching TTS方向影响广泛。 SWivid/F5-TTS
Spark-TTS 11,000 Python 新兴高质量TTS模型,在语音自然度和表现力方面有显著提升。支持多语种和情感控制,是2026年TTS领域值得关注的开源新力量。 SparkAudio/Spark-TTS

九、👁️ 计算机视觉

框架 Stars 语言 简介 GitHub
OpenCV 87,800 C++ 计算机视觉标准库,2500+算法覆盖图像处理、目标检测、特征提取等全场景。几乎所有CV应用的底层依赖,是CV领域不可或缺的基础设施。 opencv/opencv
Ultralytics 58,000 Python YOLO系列统一框架,支持YOLOv5/v8/v11等全系列目标检测/分割/追踪模型。API简洁统一,训练和部署一体化,是目标检测领域的一站式方案。 ultralytics/ultralytics
Segment Anything 54,300 Python Meta出品的"分割一切"模型,一个模型分割任意图像中的任意对象。零样本泛化能力惊人,开创了通用图像分割的新范式,被广泛应用于各行各业。 facebookresearch/segment-anything
SAM 2 19,300 Python Meta SAM二代,从图像分割扩展到视频分割。支持实时视频流中的对象分割和追踪,性能和泛化能力再次提升,是视频理解的重要基础设施。 facebookresearch/sam2
GroundingDINO 10,200 Python 开放词汇目标检测,用自然语言描述检测任意对象。将语言理解与目标检测结合,无需预定义类别即可检测新对象,是开放世界检测的代表作。 IDEA-Research/GroundingDINO

十、🗄️ 向量数据库

框架 Stars 语言 简介 GitHub
Milvus 44,600 Go 云原生向量数据库,支持万亿级向量的分布式存储和检索。提供丰富的索引类型和混合查询能力,是企业级向量搜索的首选方案,生态最完整。 milvus-io/milvus
Qdrant 31,800 Rust Rust编写的高性能向量搜索引擎,极致性能和内存安全。支持过滤查询和分布式部署,API简洁易用,是追求高性能场景的向量数据库首选。 qdrant/qdrant
Chroma 28,200 Rust AI搜索基础设施,为LLM应用提供轻量级向量存储。Python/JS双语言SDK,与LangChain/LlamaIndex深度集成,是RAG应用中最常用的向量存储方案。 chroma-core/chroma
Weaviate 16,300 Go 混合向量/对象数据库,同时支持向量搜索和结构化查询。内置模块化向量化能力,GraphQL API接口,适合需要混合搜索能力的企业级应用。 weaviate/weaviate
pgvector 16,000 C PostgreSQL的向量搜索扩展,无需新数据库即可实现向量检索。对已有PostgreSQL用户极其友好,零学习成本,是"向量搜索融入现有系统"的最佳方案。 pgvector/pgvector
LanceDB 10,500 Rust 嵌入式向量数据库,无需服务器直接嵌入应用。基于Lance列格式优化,支持多模态数据检索,适合边缘设备和轻量级应用场景。 lancedb/lancedb

十一、🔢 嵌入 / 检索

框架 Stars 语言 简介 GitHub
Jina 21,900 Python 多模态AI云原生服务框架,提供嵌入、重排序和推理等API服务。支持文本/图像/代码等多模态嵌入,是构建AI搜索和RAG应用的基础设施。 jina-ai/jina
FlagEmbedding 11,800 Python 智源研究院出品的嵌入模型和检索框架。BGE系列模型在MTEB排行榜名列前茅,是中文嵌入检索领域的标杆项目,与国产模型生态深度集成。 FlagOpen/FlagEmbedding

十二、🔌 协议 / 标准化

项目 Stars 语言 简介 GitHub
MCP Servers 86,800 TypeScript MCP协议参考实现集合,包含文件系统、数据库、API等数十种标准MCP Server。开箱即用地为AI应用接入各种外部工具,是MCP生态的核心组件。 modelcontextprotocol/servers
A2A 24,100 Python Google提出的Agent-to-Agent通信协议,定义Agent间标准化交互规范。支持跨框架、跨厂商的Agent互操作,已有150+组织参与,与MCP形成AI协议双雄格局。 google/A2A
MCP Python SDK 23,200 Python Anthropic提出的Model Context Protocol Python实现,定义AI模型与外部工具的标准化连接方式。已被主流AI产品广泛采纳,成为Agent工具调用的事实标准。 modelcontextprotocol/python-sdk
MCP TypeScript SDK 12,600 TypeScript MCP协议的TypeScript/JavaScript实现,让Node.js/前端应用也能接入MCP生态。与Python SDK互补,扩展了MCP的应用范围到Web和移动端。 modelcontextprotocol/typescript-sdk

十三、🖥️ UI 平台

框架 Stars 语言 简介 GitHub
Open WebUI 140,000 Python Ollama最佳搭档,功能最全的开源AI聊天界面。支持多模型对话、知识库、插件和工作流,提供类似ChatGPT的完整Web体验,本地部署首选。 open-webui/open-webui
NextChat 88,200 TypeScript 一键部署的ChatGPT Web界面,支持多种LLM后端。极简设计、响应式布局、PWA支持,可快速部署到Vercel/Cloudflare等平台,是个人AI聊天站的热门选择。 ChatGPTNextWeb/NextChat
LobeChat 78,200 TypeScript 现代化多模型聊天平台,精美的UI设计和丰富的功能。支持插件市场、Agent助手、TTS和知识库,提供桌面端和Web端,是开源AI聊天界面的颜值担当。 lobehub/lobe-chat
ChatBox 40,300 TypeScript 轻量级AI桌面客户端,支持多模型对话和Prompt管理。界面简洁清爽,启动速度快,适合追求极简体验的用户,支持Windows/Mac/Linux全平台。 Bin-Huang/chatbox
LibreChat 38,200 TypeScript 多模型ChatGPT克隆,同时支持OpenAI/Anthropic/Google等主流API。提供文件上传、图像生成、搜索和代码解释器等功能,是功能最全的开源ChatGPT替代品。 danny-avila/LibreChat

十四、🔄 工作流自动化 / 低代码平台

框架 Stars 语言 简介 GitHub
n8n 191,000 TypeScript AI工作流自动化平台,Zapier的最佳开源替代。400+节点连接器,可视化拖拽编排,内置AI Agent节点,是企业自动化工作流的首选方案。 n8n-io/n8n
Langflow 149,000 Python/JS 低代码RAG/Agent工作流构建平台,可视化拖拽方式搭建AI应用。内置LangChain集成,支持自定义组件和API发布,降低了AI应用开发的技术门槛。 langflow-ai/langflow
Dify 144,000 TypeScript 生产级AI应用开发平台,提供Agent编排、RAG管道、工作流设计和应用管理。支持多模型切换和企业级部署,是构建生产级AI应用的一站式平台。 langgenius/dify
Flowise 53,400 TypeScript 拖拽式LLM流程构建工具,无代码搭建AI工作流。支持LangChain/LlamaIndex组件拖拽组合,一键生成API端点,适合快速原型开发和内部工具搭建。 FlowiseAI/Flowise
Apache Airflow 45,700 Python 工作流编排的行业标准,Apache基金会顶级项目。用Python定义DAG工作流,支持复杂依赖管理和分布式执行,是数据工程和AI Pipeline的基础设施。 apache/airflow
Activepieces 22,600 TypeScript AI原生工作流自动化平台,Zapier/Make的开源替代。内置200+连接器,支持AI Agent节点,界面现代易用,是中小企业工作流自动化的热门选择。 activepieces/activepieces
Prefect 22,100 Python 现代Python工作流引擎,Airflow的现代化替代。原生支持异步、重试和可观测性,Python-first设计理念,是数据科学家和ML工程师的工作流首选。 PrefectHQ/prefect
Windmill 16,700 TypeScript 脚本转工作流平台,将Python/TS/Go脚本一键变为可调度工作流。内置UI生成器和权限管理,适合开发者团队快速将脚本工具产品化。 windmill-labs/windmill

十五、📈 监控 / 评估

框架 Stars 语言 简介 GitHub
LangFuse 28,500 TypeScript 开源LLM可观测性平台,追踪LLM应用的每一次调用、Token消耗和延迟。支持Trace/Span/Score分析,是LLM应用运维和成本优化的标准工具。 langfuse/langfuse
MLflow 26,300 Python AI工程全生命周期管理平台,覆盖实验追踪、模型注册、部署和监控。Databricks出品,是MLOps领域最成熟的开源方案,支持LLM和传统ML统一管理。 mlflow/mlflow
DeepEval 15,900 Python LLM测试评估框架,为LLM应用提供系统化的质量评估。支持14+评测指标(忠实度/相关性/幻觉检测等),集成pytest,是LLM应用CI/CD的必备工具。 confident-ai/deepeval
RAGAS 14,200 Python RAG系统专项评估框架,提供忠实度、答案相关性和上下文精度等核心指标。是RAG系统质量评估的事实标准,与LangChain/LlamaIndex深度集成。 explodinggradients/ragas
Phoenix 10,000 Python Arize AI出品的AI可观测性平台,提供LLM Trace可视化和异常检测。支持OpenTelemetry标准,界面直观美观,是LLM应用监控和调试的利器。 Arize-ai/phoenix

十六、🧠 大模型(开源模型)

模型 Stars 出品方 简介 GitHub
DeepSeek-V3 103,700 DeepSeek 国产最强开源LLM,671B MoE架构,性能对标GPT-4。混合专家模型设计,训练成本仅600万美元,以极低成本实现了顶级性能,震惊全球AI社区。 deepseek-ai/DeepSeek-V3
DeepSeek-R1 92,000 DeepSeek DeepSeek推理模型,通过强化学习实现深度推理链。在数学、编程和科学推理方面表现卓越,开源了完整模型和蒸馏版本,推动了推理模型的开源浪潮。 deepseek-ai/DeepSeek-R1
Qwen3 15,000 阿里通义 阿里通义千问最新一代开源LLM,支持多尺寸(0.6B到235B)和多模态。中英文双语优化,思维模式切换,在多项基准测试中达到开源模型领先水平。 QwenLM/Qwen3
Kimi K2 10,800 月之暗面 月之暗面出品的MIT许可开源模型,MoE架构1T参数。在工具调用和Agent场景中表现优异,是完全开源(含商用许可)的最大规模模型之一。 moonshotai/kimi-k2
Mistral 10,800 Mistral AI 法国AI独角兽出品的高效开源LLM系列。以极小的参数量实现了接近大模型的性能,推动了"小模型大能力"的技术路线,在欧洲AI生态中有重要影响力。 mistralai/mistral-inference
Yi 7,800 01.AI 李开复创办的零一万物出品,中英文双语大模型。在多个基准测试中表现优异,提供多尺寸模型选择,是中国AI创业公司开源的代表作。 01-ai/Yi
Llama 7,600 Meta Meta开源大模型系列,从Llama 1到4持续迭代。开源大模型的标杆,推动了整个开源LLM生态的发展,其架构和训练方法被广泛借鉴。 meta-llama/llama-models
InternLM 7,200 上海AI Lab 书生系列大模型,学术界影响力最高的开源LLM之一。支持超长上下文、工具调用和多模态,配套完整的训练/微调/部署工具链。 InternLM/InternLM
GLM-4 7,100 智谱AI 智谱AI出品的双语大模型,ChatGLM系列的最新一代。支持128K上下文和多模态能力,在中文理解和生成方面有独特优势,是国内最具学术背景的开源LLM。 THUDM/GLM-4
Gemma N/A Google Google出品的轻量开源LLM,基于Gemini同源技术。2B/9B/27B多尺寸可选,专为边缘设备优化,主要通过HuggingFace分发。 Google HuggingFace
MiniMax-M2 N/A MiniMax MiniMax出品的新一代MoE开源模型,456B总参数/45.9B激活参数。在长文本处理和多模态方面有独特优势,主要通过HuggingFace分发。 MiniMax HuggingFace

十七、🏗️ 基础框架

框架 Stars 语言 简介 GitHub
TensorFlow 195,400 C++ Google出品的机器学习框架,深度学习领域的奠基者。完整的生态系统(TFX/TFLite/TensorBoard),从训练到部署覆盖全链路,至今仍是工业界最广泛使用的ML框架。 tensorflow/tensorflow
Transformers 161,300 Python HuggingFace核心库,提供10万+预训练模型的统一API。几乎所有LLM应用都基于Transformers构建,是AI开源生态中最重要的基础设施级项目。 huggingface/transformers
PyTorch 100,400 Python Meta出品的深度学习框架,学术界和AI研究的事实标准。动态计算图设计直观灵活,几乎所有AI论文都基于PyTorch实现,是AI研究和原型开发的首选。 pytorch/pytorch
FastAPI 98,900 Python Python高性能Web框架,AI应用后端的事实标准。基于类型注解自动生成API文档,支持异步和WebSocket,几乎所有AI项目都用FastAPI构建后端服务。 tiangolo/fastapi
Streamlit 44,800 Python 数据应用快速构建框架,几行Python代码创建交互式Web应用。无需前端知识,特别适合数据可视化和AI Demo展示,是数据科学家的Web开发利器。 streamlit/streamlit
Ray 42,800 Python 分布式AI计算引擎,支持模型训练/推理/服务的分布式部署。Anyscale出品,是大规模AI应用的计算基础设施,被各大云厂商和AI公司广泛采用。 ray-project/ray
Gradio 42,800 Python HuggingFace出品,快速搭建ML模型Demo。支持多种输入输出组件,一键分享到HuggingFace Spaces,是AI模型展示和交互的标准Demo工具。 gradio-app/gradio
NumPy 32,200 Python Python科学计算基础库,几乎所有Python数据/AI项目的底层依赖。提供高效的多维数组和数学运算,是Python科学计算生态的基石。 numpy/numpy
JAX 31,500 Python Google出品的高性能数值计算框架,函数式编程范式+自动微分+XLA编译。在大规模训练和研究中性能优于PyTorch,是Google系AI项目的底层框架。 jax-ml/jax

全景生态关系图

ChatGPT Image 2026年5月27日 112414.png

📌 说明

  1. 所有数据通过实时搜索 GitHub 获取(2026-06-05)
  2. 覆盖 17 大类别、200+ 项目,涵盖 Agent 生态全链路
  3. 所有项目均已补充 GitHub 地址200字以内中文简介,可直接访问
  4. Star 数据为实时抓取,可能存在小幅波动,数据仅供参考
  5. 整理不易,如有遗漏或错误欢迎指出 🙏
0

评论区