华体会世界杯直播

热点资讯

华体会世界杯直播

华体会体育世界杯中国官网首页 Agent六款开源操心器用大横评——完万能土产货跑, 完全无须钱

发布日期：2026-06-18 17:35 点击次数：171

华体会体育世界杯中国官网首页 Agent六款开源操心器用大横评——完万能土产货跑，完全无须钱

你知说念吗，让 Agent记取你的技俩高下文、本事决策和责任民俗，这件事完全不错不花一分钱、不连任何云管事、数据全留在我方电脑上就作念到。

每次掀开 Hermes 或 OpenClaw 新建会话，你都得再行证明一遍技俩用了什么框架、前次修 MCP 断线用的什么号令、为什么选 jose 而不是 jsonwebtoken。不是模子不够聪惠，是高下文窗口实质上是"一次性"的——会话遣散，操心也随着清零。

开源社区早就盯上了这个问题。昔时一年里，至少有六款故意针对 Agent操心扩张的开源器用冒了出来——完全开源免费、完全不错土产货部署、况兼功能少量不可使。

这篇著述就带你把这六款器用一一看一遍：它们怎样责任的、怎样装配成立、各自有什么所长和短板、你的场景最符合哪个。

先搞清你需要哪种"操心"

在聊具体器用之前，有一个要津分裂要先证实显——AI 助手需要记的东西，其实分两种：

类型问的问题例如行径/情节操心"我（Agent）前次怎样操作的？""前次设备 MCP 断线用了什么号令？"学问/文档操心"我知说念什么府上？""GEO 写稿圭表第三条怎样说的？"

前者纪录 Agent 的操作历史，后者检索已有的文档学问库。两类需求符合不同的器用，最佳的决策是搭配使用。

一、行径操心类：让 Agent 记取"我作念过什么"

1. agentmemory

GitHub：rohitg00/agentmemory（23，000+ Stars，MIT 左券）

agentmemory 是当今艳羡度最高的 AI 编程 Agent 捏久操心决策。它的中枢卖点就一个词：零搅扰。Agent 实行器用调用时，它通过 Hook 机制自动静默拿获通盘操作，你什么都无须管。

责任旨趣

每次 Agent（Hermes、Claude Code 等）调用器用时，agentmemory 拿获一条 Observation 纪录。

这些纪录过程 iii-engine 压缩后存入土产货 SQLite。下次新建会话时，agentmemory 自动检索探讨历史高下文并注入进去。

检索机制：三流交融

这是 agentmemory 最值得细说的场地。它不是通俗地作念要津词搜索——它同期跑三路：BM25 全文检索、向量语义检索、学问图谱遍历，临了通过 RRF（Reciprocal Rank Fusion）交融排序。在 LongMemEval-S 基准测试上，调回率作念到了 95.2%，而 mem0 唯有 68.5%、Letta/MemGPT 是 83.2%。

典型使用场景

记取技俩里用了哪个库以及为什么选它（"为什么用 jose 而不是 jsonwebtoken"）

跨会话连接前次没作念完的任务

自动藏匿还是踩过的坑（"这个 CORS 问题前次怎样贬责的"）

多个 Agent 实例（Hermes + OpenClaw）分享合并份本事决策历史

优点

零搅扰，完全自动拿获，不需要手动调遣任何文献

零外部依赖，纯 SQLite，不需要 Docker 或荒谬管事

多 Agent 分享，一个管事同期管事多个 Agent 实例

MIT 左券，完全土产货运行，不连任何外部 LLM

调回精度在同类器用中最高（95.2% R@5）

❌ 短处

仅对接 Coding Agent，不符合通用 LLM 应用的用户画像场景

默许 Embedding 模子（all-MiniLM-L6-v2，80MB）对华文复古一般，华文技俩提议替换为 Qwen3-Embedding

依赖 iii-engine 版块锁定（v0.11.2），升级需严慎

值得贯注的是，agentmemory 的操心写入和检索均不调用任何 LLM，完全土产货经营。这是它和 mem0 最大的区别之一。

2. mem0

GitHub：mem0ai/mem0（41，000+ Stars，Apache 2.0）

mem0 和 agentmemory 定位不同。它面向的是 LLM 应用（聊天机器东说念主、个性化助手），从对话内容中自动索求结构化用户事实——偏好、民俗、身份信息——构建用户画像。

责任旨趣

每次对话遣散后，mem0 调用 LLM 分析对话内容，索求出雷同"这个用户心爱 TypeScript、不心爱冗余能干"的事实，写入向量数据库。下次对话时检索注入，杀青个性化。

典型使用场景

记取用户的编码格调偏好（"心爱函数式格调，无须 class"）

跨会话保捏用户画像（"这个用户在作念 Electron 技俩"）

构建面向末端用户的个性化 AI 居品

优点

自动从对话索求事实，无需手动回来

复古 MCP 接入，可集成到 Hermes/OpenClaw

生态最教诲（YC 投资，14M+ 下载）

❌ 短处

部署较重：需要 Qdrant 或 Chroma 等向量数据库（荒谬 Docker 管事）

每次写入操心时必须调用 LLM 索求事实（复古土产货 Ollama/oMLX）

与 agentmemory 定位不同，不符合替代后者

二、学问检索类：让 Agent 找到"我存了什么"

3. QMD

GitHub：Shopify CEO Tobi Lütke 发起，OpenClaw 生态中枢器用（MIT 左券）

QMD（Quick Markdown Database）是专为 OpenClaw / Hermes 蓄意的土产货 Markdown 学问库搜索引擎。它贬责的问题不是"前次怎样作念的"，而是"我的条记里写了什么"。

责任旨趣

QMD 对你 workspace 目次下的通盘 Markdown 文献建立双索引——BM25 倒排索引加向量索引——查询时两路打分，再经 Reranker 交融排序，复返最探讨的文本段落。三个土产货模子自动下载，悉数约 2.3GB：

模子脚色默许模子大小Embeddingjina-embeddings-v3 (GGUF)330 MBRerankerjina-reranker-v2-base-multilingual (GGUF)640 MBQuery Expansion内置小 LLM1.3 GB

华文技俩可替换为 Qwen3-Embedding GGUF 以优化检索成果。

典型使用场景

搜索本事条记、架构蓄意文档（"这个接口的蓄意原则"）

检索 GEO 写稿圭表（"SEO 要津词密度条目"）

查找已有代码片断的证实（"Aliyun OSS 签名上传的备注"）

看成 NotebookLM 的土产货替代决策

优点

专为 Markdown 优化，OpenClaw 生态原生复古

三模子管线检索质料高（BM25 + 向量 + Reranker）

完全离线，模子下载一次后长久缓存

复古多 Collection，不同技俩学问库相互阻挠

❌ 短处

需要手动调遣 Markdown 文献，华体会·体育世界杯(中国)官方网站不自动拿获 Agent 行径

初度 qmd embed 下载约 2.3GB 模子

对代码库和非 Markdown 文献复古有限

Query Expansion 阶段会调用内置小 LLM，增多查询延伸约 300ms，无需荒谬成立。

4. Cognee

GitHub：topoteretes/cognee（Apache 2.0）

Cognee 从根柢上区别于 QMD：它不作念文档通常度检索，而是从文档中索肆业识图谱，回复"A 和 B 有什么关联"这类推感性问题。

责任旨趣：ECL 三阶段

Extract：识别文档中的实体（模块、东说念主员、认识、本事名词）

Cognify：用 LLM 猜想实体间关联（依赖/影响/属于），构建三元组

Load：写入土产货图数据库（默许 NetworkX 内存图，可换 Neo4j）

查询时通过图遍历而非向量通常度，能杀青多跳推理。比如" MCP 断线 → 影响哪些 Agent → 这些 Agent 依赖哪些管事"——这种问题 QMD 是答不了的。

典型使用场景

集结代码库中模块之间的依赖关联

猜想"A 功能崩溃会影响哪些卑鄙"

从多篇文档中轮廓出共同论断

分析系统架构的影响链路

优点

❌ 短处

索引速率慢，每篇文档都要跑 LLM 索务实体，约比 QMD 慢 5–10 倍

查询延伸较高（图遍历 200ms–2s）

对通俗的文档检索需求属于"杀鸡用牛刀"

实体索求是 Cognee 的中枢按次，必须调用 LLM，但复古土产货 Ollama/oMLX，完全免费。

三、时序与用户画像类

5. Zep（Community Edition）

GitHub：getzep/zep（Apache 2.0）

Zep 专注于时序感知操心——它不仅记取"说了什么"，还记取"什么时候说的、这条信息是否已被更新隐蔽"。2026 年与 LangGraph 深度整合后艳羡度大增。

典型使用场景

"上周我说用 Redis，这周改成了 SQLite，以最新的为准"

跟踪技俩决策的演化历史（某个本事决策阅历了几次变更）

需要时分线推理的复杂对话系统

优点

时序跟踪是疏淡才气，其他器用都莫得

2026 年 LangGraph 官方集成，生态好

企业级蓄意，复古大范围部署

❌ 短处

需要 Postgres + pgvector，部署比拟重

对纯 Coding Agent 场景价值有限（agentmemory 更合适）

6. TencentDB Agent Memory

GitHub：Tencent/TencentDB-Agent-Memory（Apache 2.0，2026 年 4 月开源）

腾讯开源的四层渐进式操心架构，完全 SQLite 土产货运行，对华文内容和国里面署环境针对性优化。

四层架构

层级内容L0 原始对话全量保存L1 原子操心自动索求事实、偏好、要津接续L2 场景分块按技俩聚类，高下文精确调回L3 用户画像沉稳个性化解析

典型使用场景

华文环境的用户偏好操心

国内信创/疏淡化部署场景

替代 mem0 的纯土产货华文决策

优点

零外部依赖，纯 SQLite

AG国际APP2026世界杯中国官方下载

华文分词和语义集结针对性优化

Apache 2.0，国内社区调遣活跃

❌ 短处

生态相对较新，MCP 器用数目少于 agentmemory

文档和社区资源主要为华文

L1 层索求事实需要团结 LLM（可成立土产货 Qwen3）

对比总览

功能与本事对比

器用定位写入形式检索形式土产货依赖需要 LLM开源左券agentmemoryCoding Agent 行径操心自动 HookBM25+向量+图谱SQLite（零依赖）不需要MITmem0用户画像/个性化自动索求向量检索需要 Qdrant需要Apache 2.0QMDMarkdown 文档检索手动写文献BM25+向量+Reranker土产货 GGUFQuery ExpansionMITCognee学问图谱/关联推理自动索求三元组图遍历土产货（需 LLM）必须Apache 2.0Zep CE时序感知操心自动索求向量+时序索引Postgres+pgvector需要Apache 2.0TencentDB AM华文用户画像自动索求向量检索SQLite（零依赖）L1 层需要Apache 2.0

土产货部署友好度

器用磁盘占用荒谬管事部署难度agentmemory~80–600 MB（Embedding）隐约简QMD~2.3 GB（3个GGUF模子）隐约简TencentDB AM极小（SQLite）隐约简Cognee~500 MB SDK + LLM已有 Ollama/oMLX通俗mem0~1 GBQdrant（Docker）中等Zep CE~2 GBPostgres + pgvector（Docker）较复杂

检索精度对比

器用评测得分备注agentmemory95.2%（LongMemEval-S R@5）三流交融检索Letta/MemGPT83.2%供参考mem068.5%不同场景蓄意，不完全可比Zep75.14%（LOCOMO）不同基准，侧重时序推理

各器用使用不同评测基准，数字不可径直横向比拟，仅供参考。

怎样选？场景决策树