OpenClaw 能力改进方案调研报告

🦞 OpenClaw 能力改进方案调研

记忆系统 & Web Fetch 能力的 GitHub 开源改进方案
调研日期:2026年3月4日

🧠 一、OpenClaw 记忆系统改进方案

调研目标:找到 GitHub 上专门针对 OpenClaw 记忆系统优化的项目,包括配置建议和 Skill 集成方案。

📍 当前 OpenClaw 记忆系统架构

  • MEMORY.md - 长期记忆,存储持久化的事实和偏好
  • memory/YYYY-MM-DD.md - 每日日志,append-only 记录
  • memory_search - 向量语义搜索工具
  • memory_get - 按行范围读取特定文件

官方 Cognitive Memory Skill

github.com/openclaw/skills/tree/main/skills/icemilo414/cognitive-memory
⭐ 1,089 stars (skills repo)

OpenClaw 官方 Skills 仓库中的认知记忆系统,用多存储认知架构替代基础扁平文件记忆。

核心改进点:

  • 四层记忆存储:Episodic (事件) + Semantic (语义图谱) + Procedural (流程) + Core (核心)
  • 自然语言触发:"remember"、"forget"、"reflect" 自动路由到对应存储
  • 衰减遗忘机制:relevance(t) = base × e^(-0.03×days) × log2(access+1),模拟人类遗忘
  • 反思循环:定期运行内部独白,深化理解并更新 IDENTITY.md
  • 审计追踪:Git + audit.log 记录所有记忆变更
# 初始化 bash scripts/init_memory.sh /path/to/workspace # 配置 ~/.clawdbot/clawdbot.json { "memorySearch": { "enabled": true, "provider": "voyage", "sources": ["memory", "sessions"], "indexMode": "hot", "minScore": 0.3, "maxResults": 20 } }

新增目录结构:

  • memory/graph/ - 知识图谱 (实体 + 关系)
  • memory/procedures/ - 学习的工作流程
  • memory/vault/ - 固定记忆 (不衰减)
  • memory/meta/decay-scores.json - 相关性追踪

推荐 Memory Complete Skill

clawhub.com/skills/openclaw-skills-memory-complete
⭐ 5/5 评分 (65 安装)

完整的生产级记忆系统,结合行为协议、自动捕获、可搜索回调和维护功能。

核心组件:

  • MEMORY PROTOCOL - 强制规定何时保存信息 (用户提到事实时写前日志)
  • SESSION-STATE.md - 热上下文模式,快速恢复会话状态
  • RECENT_CONTEXT.md - 心跳强制自动捕获亮点
  • capture.py / recall.py - 命令行存储和查询工具
  • 整合与剪枝 - 定期压缩记忆,保持紧凑
npx -y @lobehub/market-cli skills install openclaw-skills-memory-complete --agent open-claw

适用场景:

  • 持久化用户偏好
  • 会话重置后恢复上下文
  • 回答"我们之前讨论过什么关于X"
  • 在上下文压缩后存活

社区 Persistent Memory Skill

clawhub.com/skills/webdevtodayjason/memo-persistent-memory
SQLite + FTS5 方案

使用 SQLite + FTS5 全文搜索的持久记忆系统,自动跨会话捕获上下文。

核心特性:

  • SQLite 存储 - 结构化存储,支持复杂查询
  • FTS5 全文搜索 - 高效的关键词检索
  • 自动捕获 - 无需手动记录,后台自动存储
  • Worker 服务 - 独立进程管理记忆生命周期
openclaw add @webdevtodayjason/memo-persistent-memory

📊 记忆系统方案对比

方案 存储架构 搜索能力 适用场景 复杂度
当前 (MEMORY.md) 扁平 Markdown 向量语义搜索 简单偏好记录
Cognitive Memory 四层认知架构 向量 + 知识图谱 复杂 Agent、长期演进
Memory Complete 协议 + 自动捕获 关键词 + 时间衰减 生产级、会话恢复
Persistent Memory SQLite + FTS5 全文搜索 大量数据、快速检索

💡 记忆系统改进建议

  • 优先推荐:安装 Memory Complete Skill,获得 SESSION-STATE.md 模式和自动捕获功能
  • 进阶升级:如需知识图谱和反思循环,部署 Cognitive Memory Skill
  • 配置优化:在 openclaw.json 中启用 memorySearch,设置 minScore=0.3 提高召回率

🌐 二、OpenClaw Web Fetch 能力改进方案

调研目标:找到改进 OpenClaw 内置 web_fetch 工具的配置方案和 Skill 集成建议。

📍 当前 web_fetch 工具限制

  • 不支持 JavaScript 渲染 - 只做 HTTP GET + HTML 解析
  • 无法绑过反爬 - 容易被 Cloudflare 等拦截
  • 提取顺序:Readability → Firecrawl (如配置) → 基础 HTML 清理

官方 Firecrawl 内置集成

docs.openclaw.ai/tools/firecrawl
官方内置 fallback

OpenClaw 官方支持将 Firecrawl 作为 web_fetch 的后备提取器,处理 JS 重型网站和反爬。

配置方法 (openclaw.json):

{ "tools": { "web": { "fetch": { "firecrawl": { "apiKey": "FIRECRAWL_API_KEY_HERE", "baseUrl": "https://api.firecrawl.dev", "onlyMainContent": true, "maxAgeMs": 172800000, // 2天缓存 "timeoutSeconds": 60 } } } } }

工作原理:

  • 提取顺序:Readability (本地) → Firecrawl → 基础 HTML 清理
  • proxy: "auto" - 自动尝试 stealth 代理绕过反爬
  • storeInCache: true - 自动缓存结果

推荐 Firecrawl CLI Skill

github.com/firecrawl/cli
🔥 官方 Agent Skill

Firecrawl 官方提供的 CLI 和 Agent Skill,为 OpenClaw 提供完整的网页抓取、搜索和浏览器自动化能力。

核心能力:

  • Scrape - 单页抓取,输出 Markdown/HTML/JSON/截图
  • Search - 网页搜索 + 可选抓取结果
  • Crawl - 全站爬取
  • Browser - 远程浏览器沙箱,支持交互式自动化
  • Map - 快速发现网站所有 URL
npx -y firecrawl-cli init --browser --all
# 抓取单页 firecrawl https://example.com --only-main-content # 搜索并抓取 firecrawl search "OpenClaw documentation" --scrape --scrape-formats markdown # 浏览器自动化 (远程沙箱,无需本地 Chromium) firecrawl browser "open https://news.ycombinator.com" firecrawl browser "snapshot" firecrawl browser "click @e5" firecrawl browser "scrape" firecrawl browser close

相比 web_fetch 的优势:

  • 无需本地浏览器 - 所有会话在远程沙箱运行
  • 真正并行 - 多个浏览器会话同时运行
  • 安全隔离 - 导航和 DOM 操作在沙箱中执行
  • 更好的 Token 经济 - 返回干净的结构化数据

社区 Crawl4AI Skill

github.com/brettdavies/crawl4ai-skill
50k+ stars (主项目)

最受欢迎的开源 LLM 友好爬虫,提供专门的 Skill 包供 AI Agent 使用。

核心特性:

  • LLM 就绪输出 - 智能生成带标题、表格、代码块的 Markdown
  • BM25 过滤 - 启发式过滤无关内容
  • LLM 驱动提取 - 支持所有 LLM 进行结构化数据提取
  • 崩溃恢复 - 长时间爬取支持断点续爬
  • 完全开源免费 - 无需 API Key
pip install -U crawl4ai && crawl4ai-setup
# CLI 使用 crwl https://www.nbcnews.com/business -o markdown crwl https://docs.crawl4ai.com --deep-crawl bfs --max-pages 10 crwl https://example.com/products -q "Extract all product prices"

📊 Web Fetch 方案对比

方案 JS 渲染 反爬能力 成本 部署复杂度
web_fetch (当前) ❌ 不支持 ❌ 无 免费 内置
Firecrawl 内置配置 ✅ 支持 ✅ Stealth Proxy 按量付费 配置 API Key
Firecrawl CLI Skill ✅ 远程沙箱 ✅ 企业级 按量付费 安装 Skill
Crawl4AI Skill ✅ 本地 Playwright ⚠️ 中等 免费 安装 + Playwright

💡 Web Fetch 改进建议

  • 快速改进:在 openclaw.json 中配置 Firecrawl API Key,立即获得 JS 渲染和反爬能力
  • 推荐升级:安装 Firecrawl CLI Skill (npx firecrawl-cli init --all),获得完整浏览器自动化能力
  • 零成本方案:安装 Crawl4AI Skill,完全开源免费,适合本地机器资源充足的场景
  • 组合使用:日常用 web_fetch + Firecrawl fallback,复杂场景用 Firecrawl CLI Browser 模式

📋 三、实施优先级建议

优先级 改进项 操作步骤 预期效果
P0 配置 Firecrawl fallback openclaw.json 添加 API Key 立即解决 JS 渲染问题
P1 安装 Memory Complete npx @lobehub/market-cli skills install openclaw-skills-memory-complete 会话恢复 + 自动捕获
P2 安装 Firecrawl CLI Skill npx firecrawl-cli init --all 完整浏览器自动化
P3 部署 Cognitive Memory bash scripts/init_memory.sh + 配置修改 知识图谱 + 反思循环