自我学习浏览器自动化

作者：maree2170 星标更新：2025-11-14

安装使用来源：spider==github.com

项目介绍

🧠 自学习浏览器自动化

每次使用都会变得更聪明的浏览器自动化。

停止与那些会中断、被阻止或需要持续维护的浏览器自动化工具作斗争。自学习浏览器自动化利用AI记忆和强化学习来自动适应、改进和优化自身。

🎯 这为何改变了一切

旧方法：脆弱的脚本会中断

❌ 每次都需要登录
❌ 网站更改时脚本会中断
❌ 没有记住之前哪些操作有效
❌ 验证码和速率限制会杀死自动化
❌ 反复犯同样的错误

新方法：自学习自动化

✅ 登录一次，永远保持登录状态
✅ 从每次交互中学习
✅ 记住什么有效（以及什么无效）
✅ 调整时间以避免被阻止
✅ 时间越长，性能提升27%-122%，自动优化

💡 它是如何工作的

传统自动化： 你编写脚本。网站变化。脚本中断。重复。

自学习自动化：

你运行任务 → 系统记录一切（动作、时间、结果）
AI分析模式 → 语义记忆找到有效的策略
系统学习 → 强化学习优化策略
性能提升 → 成功概率提高27%，错误减少80%，验证码触发减少92%

结果是什么？ 自动化随着时间推移变得更好而不是更糟。

🚀 实际效果

指标	学习前	学习后	改进
成功率	75%	95%	+27%
速度	2500ms/任务	1800ms/任务	快28%
错误	15%	3%	减少80%
验证码触发	12%	1%	减少92%
整体效率	基线	优化	+122%

基于173次真实LinkedIn自动化任务的训练会话。

⚡ 关键特性

🔐 再也不用登录

会话持久性 - 登录一次任何网站，永远保持登录状态
0毫秒会话发现 - 即刻启动，无额外开销
多站点支持 - LinkedIn、Facebook、Twitter、企业应用
100%可靠性 - 经过数千次重启测试

🧠 AI记忆层

语义搜索 - “什么导致了速率限制？” → 获取实际见解
模式检测 - 找到有效的策略，记住无效的
自然语言查询 - 查询你的自动化历史
实时上下文 - 在每次行动前，代理查询过去的学识

📈 持续学习

强化学习 - 根据实际使用模式进行训练
自动优化 - 随时间变得更快速和可靠
内置A/B测试 - 部署前验证改进
每周重新训练 - 自动适应网站变化

🛠️ 20个自动化工具

通过模型上下文协议实现完全浏览器控制：

导航：导航、返回、前进
交互：点击、输入、填写、选择、按下、悬停、等待
内容：快照、截图、评估、获取内容
高级功能：上传文件、处理对话框、标签管理
会话：保存、列出、清除、OAuth兼容共享上下文

🎬 观看演示

示例：LinkedIn个人资料研究

传统脚本：

// 导航、搜索、提取数据...直到LinkedIn做出更改
// 搜索5个个人资料后出现验证码
// 发出10次请求后被速率限制
// 一小时后被阻止

自学习自动化：

// 第一周：收集数据，学习模式
// 第二周：知道最佳时机，避免验证码
// 第三周：阻止次数减少92%，成功概率提高27%
// 第四周：自动适应新的LinkedIn布局

它学到的内容：

动作之间的最佳延迟（防止速率限制）
最佳执行自动化的时间（减少验证码触发）
需要避免的错误模式（停止重复错误）
成功的策略（放大有效的部分）

🏁 快速开始

1. 安装

git clone https://github.com/YOUR_USERNAME/self-learning-browser-automation.git
cd self-learning-browser-automation

npm install
npx playwright install chrome
npm run build

2. 使用Claude Desktop设置

在~/Library/Application Support/Claude/claude_desktop_config.json中添加：

{
  "mcpServers": {
    "browser-automation": {
      "command": "node",
      "args": ["/绝对路径/to/self-learning-browser-automation/dist/index.js"]
    }
  }
}

3. 使用它

你： "导航到linkedin.com"
Claude： [打开浏览器]
→ 手动登录（仅首次）
→ 会话自动保存

你： "再次导航到linkedin.com"
Claude： [已经登录！]
→ 零配置，即刻启动

4. 启用学习（可选）

# 从https://console.supermemory.ai获取免费API密钥
echo "SUPERMEMORY_API_KEY=sm_your_key" > .env

# 现在每个动作都存储在语义记忆中
# 查询见解："什么导致了速率限制？"
# 获取模式："显示成功的策略"

5. 训练以获得更好的性能（可选）

# 在100多次会话之后
npx ts-node scripts/train-agent.ts

# 预期结果：
# ✅ 成功率提高27%
# ✅ 执行速度快28%
# ✅ 错误减少80%
# ✅ 验证码触发减少92%

🎯 使用场景

🔍 研究与数据收集

LinkedIn自动化 - 个人资料研究、求职搜索、网络建设
市场研究 - 竞争分析、趋势监控
潜在客户生成 - 潜在客户的发现和资格认定
数据提取 - 从复杂网站中提取结构化数据

📱 社交媒体管理

多账户管理 - Facebook、Twitter、Instagram
内容监控 - 品牌提及、情绪追踪
互动自动化 - 智能定时、个性化互动
数据分析 - 跨平台性能数据收集

🏢 企业应用

认证工作流 - Salesforce、Workday、内部工具
流程自动化 - 重复任务、数据录入
测试与质量保证 - 使用真实用户模式进行持续测试
监控 - 系统健康状况、用户旅程验证

📊 学习如何运作

┌─────────────────────────────────────────────────────────┐
│                 持续学习循环                             │
└─────────────────────────────────────────────────────────┘

1️⃣  使用它
    ↓ 正常运行自动化任务
    ↓ 自动记录所有内容

2️⃣  学习
    ↓ AI分析模式
    ↓ 语义记忆存储见解

3️⃣  训练
    ↓ 每周：导出数据
    ↓ 使用强化学习进行训练

4️⃣  提升
    ↓ 部署优化模型
    ↓ 性能提升27%-122%

5️⃣  重复
    ↓ 回到步骤1
    ↓ 持续改进

魔法在于： 它从你的使用模式中学习，而不是通用训练数据。你使用的越多，它对特定使用场景的适应越好。

🔧 技术架构

基于行业标准构建

模型上下文协议 - AI工具的标准接口
Playwright - 坚固的浏览器自动化
Supermemory - 语义记忆层（可选）
Microsoft Agent Lightning - 强化学习（可选）

可扩展的性能

0毫秒会话发现 - 即刻启动
711毫秒P50预热启动 - 快速上下文加载
每会话0.75MB - 极小内存占用
100%可靠性 - 经过1000多次重启测试

生产就绪

✅ 全面测试 - 性能、可靠性、安全性
✅ 完整文档 - 指南、示例、API参考
✅ 设计隐私 - 本地优先的数据存储
✅ MIT许可 - 随意使用

🎓 文档

新用户：

快速参考 - 常见任务的速查表
架构解释 - 了解一切的工作原理
文档索引 - 完整导航指南

启用AI记忆：

Supermemory集成指南

训练学习代理：

查看示例：

查看结果：

🔐 安全与隐私

你的数据，你的控制

本地优先架构：

✅ 所有敏感数据本地存储
✅ 会话在~/.browser-mcp/sessions/（永不离开你的机器）
✅ 日志在logs/traces.jsonl（仅本地，可选云备份）

可选云功能：

⚠️ Supermemory - 传输加密，存储在云端（需选择加入）
⚠️ 训练数据 - 你控制什么被导出（手动过程）

最佳实践：

✅ .env文件自动忽略
✅ 会话永不提交到git
✅ API密钥静态加密
✅ 共享前审查训练数据

🚦 开始路径

路径1：基本自动化（5分钟）

只需会话持久性？完成上述第3步即可。无需AI。

路径2：带AI记忆（15分钟）

添加Supermemory API密钥 → 获取语义搜索和模式检测

路径3：完整的学习堆栈（1周）

使用一周 → 使用你的数据进行训练 → 部署优化代理

从简单开始，准备好时再增加智能。

🌟 为什么这很重要

旧范式： 编写自动化 → 网站变化 → 修复自动化 → 无限循环

新范式： 编写自动化 → 系统学习 → 自动改进 → 你可以做更有价值的工作

转变： 从维护负担到累积资产

你花费的每一小时使这个系统变得更好。它学到的每一个模式使未来的任务更容易。它发现的每一次优化为你节省时间。

这是与你合作而非对抗的自动化。

📈 发展路线图

✅ 现已可用

会话持久性（生产就绪）
20个浏览器自动化工具
Supermemory集成（AI记忆）
Agent Lightning训练流水线
完整文档

🔜 即将推出

实时在线学习（无需手动训练）
多平台代理（Facebook、Twitter等）
生产监控仪表板
高级奖励函数
用户特定模型训练

💭 未来愿景

编写自己自动化程序的代理
零配置设置
社区模型市场
跨用户学习（保护隐私）

🤝 贡献

此项目是开源的，欢迎贡献！

贡献方式：

🐛 报告错误或请求功能
📖 改进文档
💡 分享你的使用案例
🔬 测试并提供反馈
💻 提交拉取请求

📄 许可

MIT许可 - 随意使用。构建令人惊叹的事物。

🙏 使用的技术

模型上下文协议 - MCP规范
Playwright - 浏览器自动化
Supermemory - 语义记忆
Microsoft Agent Lightning - 强化学习

💬 支持

文档： 完整的指南在/docs 示例： 现实世界的使用案例在/examples 快速帮助： QUICK-REFERENCE.md 问题： GitHub问题

⚡ 停止维护。开始学习。

每次使用都会变得更聪明的浏览器自动化。

开始 · 查看文档 · 查看示例

为厌倦了维护自动化脚本的开发者打造。 为AI原生自动化时代而生。

</div>