🦞 OpenClaw 能力改进方案调研
记忆系统 & Web Fetch 能力的 GitHub 开源改进方案
调研日期:2026年3月4日
🧠 一、OpenClaw 记忆系统改进方案
调研目标:找到 GitHub 上专门针对 OpenClaw 记忆系统优化的项目,包括配置建议和 Skill 集成方案。
📍 当前 OpenClaw 记忆系统架构
- MEMORY.md - 长期记忆,存储持久化的事实和偏好
- memory/YYYY-MM-DD.md - 每日日志,append-only 记录
- memory_search - 向量语义搜索工具
- memory_get - 按行范围读取特定文件
官方 Cognitive Memory Skill
github.com/openclaw/skills/tree/main/skills/icemilo414/cognitive-memory
⭐ 1,089 stars (skills repo)
OpenClaw 官方 Skills 仓库中的认知记忆系统,用多存储认知架构替代基础扁平文件记忆。
核心改进点:
- 四层记忆存储:Episodic (事件) + Semantic (语义图谱) + Procedural (流程) + Core (核心)
- 自然语言触发:"remember"、"forget"、"reflect" 自动路由到对应存储
- 衰减遗忘机制:relevance(t) = base × e^(-0.03×days) × log2(access+1),模拟人类遗忘
- 反思循环:定期运行内部独白,深化理解并更新 IDENTITY.md
- 审计追踪:Git + audit.log 记录所有记忆变更
# 初始化
bash scripts/init_memory.sh /path/to/workspace
# 配置 ~/.clawdbot/clawdbot.json
{
"memorySearch": {
"enabled": true,
"provider": "voyage",
"sources": ["memory", "sessions"],
"indexMode": "hot",
"minScore": 0.3,
"maxResults": 20
}
}
新增目录结构:
memory/graph/- 知识图谱 (实体 + 关系)memory/procedures/- 学习的工作流程memory/vault/- 固定记忆 (不衰减)memory/meta/decay-scores.json- 相关性追踪
推荐 Memory Complete Skill
clawhub.com/skills/openclaw-skills-memory-complete
⭐ 5/5 评分 (65 安装)
完整的生产级记忆系统,结合行为协议、自动捕获、可搜索回调和维护功能。
核心组件:
- MEMORY PROTOCOL - 强制规定何时保存信息 (用户提到事实时写前日志)
- SESSION-STATE.md - 热上下文模式,快速恢复会话状态
- RECENT_CONTEXT.md - 心跳强制自动捕获亮点
- capture.py / recall.py - 命令行存储和查询工具
- 整合与剪枝 - 定期压缩记忆,保持紧凑
npx -y @lobehub/market-cli skills install openclaw-skills-memory-complete --agent open-claw
适用场景:
- 持久化用户偏好
- 会话重置后恢复上下文
- 回答"我们之前讨论过什么关于X"
- 在上下文压缩后存活
社区 Persistent Memory Skill
clawhub.com/skills/webdevtodayjason/memo-persistent-memory
SQLite + FTS5 方案
使用 SQLite + FTS5 全文搜索的持久记忆系统,自动跨会话捕获上下文。
核心特性:
- SQLite 存储 - 结构化存储,支持复杂查询
- FTS5 全文搜索 - 高效的关键词检索
- 自动捕获 - 无需手动记录,后台自动存储
- Worker 服务 - 独立进程管理记忆生命周期
openclaw add @webdevtodayjason/memo-persistent-memory
📊 记忆系统方案对比
| 方案 | 存储架构 | 搜索能力 | 适用场景 | 复杂度 |
|---|---|---|---|---|
| 当前 (MEMORY.md) | 扁平 Markdown | 向量语义搜索 | 简单偏好记录 | 低 |
| Cognitive Memory | 四层认知架构 | 向量 + 知识图谱 | 复杂 Agent、长期演进 | 高 |
| Memory Complete | 协议 + 自动捕获 | 关键词 + 时间衰减 | 生产级、会话恢复 | 中 |
| Persistent Memory | SQLite + FTS5 | 全文搜索 | 大量数据、快速检索 | 中 |
💡 记忆系统改进建议
- 优先推荐:安装
Memory Complete Skill,获得 SESSION-STATE.md 模式和自动捕获功能 - 进阶升级:如需知识图谱和反思循环,部署
Cognitive Memory Skill - 配置优化:在 openclaw.json 中启用 memorySearch,设置 minScore=0.3 提高召回率
🌐 二、OpenClaw Web Fetch 能力改进方案
调研目标:找到改进 OpenClaw 内置 web_fetch 工具的配置方案和 Skill 集成建议。
📍 当前 web_fetch 工具限制
- 不支持 JavaScript 渲染 - 只做 HTTP GET + HTML 解析
- 无法绑过反爬 - 容易被 Cloudflare 等拦截
- 提取顺序:Readability → Firecrawl (如配置) → 基础 HTML 清理
官方 Firecrawl 内置集成
docs.openclaw.ai/tools/firecrawl
官方内置 fallback
OpenClaw 官方支持将 Firecrawl 作为 web_fetch 的后备提取器,处理 JS 重型网站和反爬。
配置方法 (openclaw.json):
{
"tools": {
"web": {
"fetch": {
"firecrawl": {
"apiKey": "FIRECRAWL_API_KEY_HERE",
"baseUrl": "https://api.firecrawl.dev",
"onlyMainContent": true,
"maxAgeMs": 172800000, // 2天缓存
"timeoutSeconds": 60
}
}
}
}
}
工作原理:
- 提取顺序:Readability (本地) → Firecrawl → 基础 HTML 清理
- proxy: "auto" - 自动尝试 stealth 代理绕过反爬
- storeInCache: true - 自动缓存结果
推荐 Firecrawl CLI Skill
github.com/firecrawl/cli
🔥 官方 Agent Skill
Firecrawl 官方提供的 CLI 和 Agent Skill,为 OpenClaw 提供完整的网页抓取、搜索和浏览器自动化能力。
核心能力:
- Scrape - 单页抓取,输出 Markdown/HTML/JSON/截图
- Search - 网页搜索 + 可选抓取结果
- Crawl - 全站爬取
- Browser - 远程浏览器沙箱,支持交互式自动化
- Map - 快速发现网站所有 URL
npx -y firecrawl-cli init --browser --all
# 抓取单页
firecrawl https://example.com --only-main-content
# 搜索并抓取
firecrawl search "OpenClaw documentation" --scrape --scrape-formats markdown
# 浏览器自动化 (远程沙箱,无需本地 Chromium)
firecrawl browser "open https://news.ycombinator.com"
firecrawl browser "snapshot"
firecrawl browser "click @e5"
firecrawl browser "scrape"
firecrawl browser close
相比 web_fetch 的优势:
- 无需本地浏览器 - 所有会话在远程沙箱运行
- 真正并行 - 多个浏览器会话同时运行
- 安全隔离 - 导航和 DOM 操作在沙箱中执行
- 更好的 Token 经济 - 返回干净的结构化数据
社区 Crawl4AI Skill
github.com/brettdavies/crawl4ai-skill
50k+ stars (主项目)
最受欢迎的开源 LLM 友好爬虫,提供专门的 Skill 包供 AI Agent 使用。
核心特性:
- LLM 就绪输出 - 智能生成带标题、表格、代码块的 Markdown
- BM25 过滤 - 启发式过滤无关内容
- LLM 驱动提取 - 支持所有 LLM 进行结构化数据提取
- 崩溃恢复 - 长时间爬取支持断点续爬
- 完全开源免费 - 无需 API Key
pip install -U crawl4ai && crawl4ai-setup
# CLI 使用
crwl https://www.nbcnews.com/business -o markdown
crwl https://docs.crawl4ai.com --deep-crawl bfs --max-pages 10
crwl https://example.com/products -q "Extract all product prices"
📊 Web Fetch 方案对比
| 方案 | JS 渲染 | 反爬能力 | 成本 | 部署复杂度 |
|---|---|---|---|---|
| web_fetch (当前) | ❌ 不支持 | ❌ 无 | 免费 | 内置 |
| Firecrawl 内置配置 | ✅ 支持 | ✅ Stealth Proxy | 按量付费 | 配置 API Key |
| Firecrawl CLI Skill | ✅ 远程沙箱 | ✅ 企业级 | 按量付费 | 安装 Skill |
| Crawl4AI Skill | ✅ 本地 Playwright | ⚠️ 中等 | 免费 | 安装 + Playwright |
💡 Web Fetch 改进建议
- 快速改进:在 openclaw.json 中配置 Firecrawl API Key,立即获得 JS 渲染和反爬能力
- 推荐升级:安装 Firecrawl CLI Skill (
npx firecrawl-cli init --all),获得完整浏览器自动化能力 - 零成本方案:安装 Crawl4AI Skill,完全开源免费,适合本地机器资源充足的场景
- 组合使用:日常用 web_fetch + Firecrawl fallback,复杂场景用 Firecrawl CLI Browser 模式
📋 三、实施优先级建议
| 优先级 | 改进项 | 操作步骤 | 预期效果 |
|---|---|---|---|
| P0 | 配置 Firecrawl fallback | openclaw.json 添加 API Key | 立即解决 JS 渲染问题 |
| P1 | 安装 Memory Complete | npx @lobehub/market-cli skills install openclaw-skills-memory-complete | 会话恢复 + 自动捕获 |
| P2 | 安装 Firecrawl CLI Skill | npx firecrawl-cli init --all | 完整浏览器自动化 |
| P3 | 部署 Cognitive Memory | bash scripts/init_memory.sh + 配置修改 | 知识图谱 + 反思循环 |
评论