返回市场
自我学习浏览器自动化

自我学习浏览器自动化

作者:maree2170 星标更新:2025-11-14

项目介绍

🧠 自学习浏览器自动化

每次使用都会变得更聪明的浏览器自动化。

停止与那些会中断、被阻止或需要持续维护的浏览器自动化工具作斗争。自学习浏览器自动化利用AI记忆和强化学习来自动适应、改进和优化自身。

License: MIT TypeScript Model Context Protocol


🎯 这为何改变了一切

旧方法:脆弱的脚本会中断

❌ 每次都需要登录
❌ 网站更改时脚本会中断
❌ 没有记住之前哪些操作有效
❌ 验证码和速率限制会杀死自动化
❌ 反复犯同样的错误

新方法:自学习自动化

✅ 登录一次,永远保持登录状态
✅ 从每次交互中学习
✅ 记住什么有效(以及什么无效)
✅ 调整时间以避免被阻止
✅ 时间越长,性能提升27%-122%,自动优化

💡 它是如何工作的

传统自动化: 你编写脚本。网站变化。脚本中断。重复。

自学习自动化:

  1. 你运行任务 → 系统记录一切(动作、时间、结果)
  2. AI分析模式 → 语义记忆找到有效的策略
  3. 系统学习 → 强化学习优化策略
  4. 性能提升 → 成功概率提高27%,错误减少80%,验证码触发减少92%

结果是什么? 自动化随着时间推移变得更好而不是更糟。


🚀 实际效果

指标学习前学习后改进
成功率75%95%+27%
速度2500ms/任务1800ms/任务快28%
错误15%3%减少80%
验证码触发12%1%减少92%
整体效率基线优化+122%

基于173次真实LinkedIn自动化任务的训练会话。


⚡ 关键特性

🔐 再也不用登录

  • 会话持久性 - 登录一次任何网站,永远保持登录状态
  • 0毫秒会话发现 - 即刻启动,无额外开销
  • 多站点支持 - LinkedIn、Facebook、Twitter、企业应用
  • 100%可靠性 - 经过数千次重启测试

🧠 AI记忆层

  • 语义搜索 - “什么导致了速率限制?” → 获取实际见解
  • 模式检测 - 找到有效的策略,记住无效的
  • 自然语言查询 - 查询你的自动化历史
  • 实时上下文 - 在每次行动前,代理查询过去的学识

📈 持续学习

  • 强化学习 - 根据实际使用模式进行训练
  • 自动优化 - 随时间变得更快速和可靠
  • 内置A/B测试 - 部署前验证改进
  • 每周重新训练 - 自动适应网站变化

🛠️ 20个自动化工具

通过模型上下文协议实现完全浏览器控制:

  • 导航:导航、返回、前进
  • 交互:点击、输入、填写、选择、按下、悬停、等待
  • 内容:快照、截图、评估、获取内容
  • 高级功能:上传文件、处理对话框、标签管理
  • 会话:保存、列出、清除、OAuth兼容共享上下文

🎬 观看演示

示例:LinkedIn个人资料研究

传统脚本:

// 导航、搜索、提取数据...直到LinkedIn做出更改
// 搜索5个个人资料后出现验证码
// 发出10次请求后被速率限制
// 一小时后被阻止

自学习自动化:

// 第一周:收集数据,学习模式
// 第二周:知道最佳时机,避免验证码
// 第三周:阻止次数减少92%,成功概率提高27%
// 第四周:自动适应新的LinkedIn布局

它学到的内容:

  • 动作之间的最佳延迟(防止速率限制)
  • 最佳执行自动化的时间(减少验证码触发)
  • 需要避免的错误模式(停止重复错误)
  • 成功的策略(放大有效的部分)

🏁 快速开始

1. 安装

git clone https://github.com/YOUR_USERNAME/self-learning-browser-automation.git
cd self-learning-browser-automation

npm install
npx playwright install chrome
npm run build

2. 使用Claude Desktop设置

~/Library/Application Support/Claude/claude_desktop_config.json中添加:

{
  "mcpServers": {
    "browser-automation": {
      "command": "node",
      "args": ["/绝对路径/to/self-learning-browser-automation/dist/index.js"]
    }
  }
}

3. 使用它

你: "导航到linkedin.com"
Claude: [打开浏览器]
→ 手动登录(仅首次)
→ 会话自动保存

你: "再次导航到linkedin.com"
Claude: [已经登录!]
→ 零配置,即刻启动

4. 启用学习(可选)

# 从https://console.supermemory.ai获取免费API密钥
echo "SUPERMEMORY_API_KEY=sm_your_key" > .env

# 现在每个动作都存储在语义记忆中
# 查询见解:"什么导致了速率限制?"
# 获取模式:"显示成功的策略"

5. 训练以获得更好的性能(可选)

# 在100多次会话之后
npx ts-node scripts/train-agent.ts

# 预期结果:
# ✅ 成功率提高27%
# ✅ 执行速度快28%
# ✅ 错误减少80%
# ✅ 验证码触发减少92%

🎯 使用场景

🔍 研究与数据收集

  • LinkedIn自动化 - 个人资料研究、求职搜索、网络建设
  • 市场研究 - 竞争分析、趋势监控
  • 潜在客户生成 - 潜在客户的发现和资格认定
  • 数据提取 - 从复杂网站中提取结构化数据

📱 社交媒体管理

  • 多账户管理 - Facebook、Twitter、Instagram
  • 内容监控 - 品牌提及、情绪追踪
  • 互动自动化 - 智能定时、个性化互动
  • 数据分析 - 跨平台性能数据收集

🏢 企业应用

  • 认证工作流 - Salesforce、Workday、内部工具
  • 流程自动化 - 重复任务、数据录入
  • 测试与质量保证 - 使用真实用户模式进行持续测试
  • 监控 - 系统健康状况、用户旅程验证

📊 学习如何运作

┌─────────────────────────────────────────────────────────┐
│                 持续学习循环                             │
└─────────────────────────────────────────────────────────┘

1️⃣  使用它
    ↓ 正常运行自动化任务
    ↓ 自动记录所有内容

2️⃣  学习
    ↓ AI分析模式
    ↓ 语义记忆存储见解

3️⃣  训练
    ↓ 每周:导出数据
    ↓ 使用强化学习进行训练

4️⃣  提升
    ↓ 部署优化模型
    ↓ 性能提升27%-122%

5️⃣  重复
    ↓ 回到步骤1
    ↓ 持续改进

魔法在于: 它从你的使用模式中学习,而不是通用训练数据。你使用的越多,它对特定使用场景的适应越好。


🔧 技术架构

基于行业标准构建

可扩展的性能

  • 0毫秒会话发现 - 即刻启动
  • 711毫秒P50预热启动 - 快速上下文加载
  • 每会话0.75MB - 极小内存占用
  • 100%可靠性 - 经过1000多次重启测试

生产就绪

  • 全面测试 - 性能、可靠性、安全性
  • 完整文档 - 指南、示例、API参考
  • 设计隐私 - 本地优先的数据存储
  • MIT许可 - 随意使用

🎓 文档

新用户:

启用AI记忆:

训练学习代理:

查看示例:

查看结果:


🔐 安全与隐私

你的数据,你的控制

本地优先架构:

  • ✅ 所有敏感数据本地存储
  • ✅ 会话在~/.browser-mcp/sessions/(永不离开你的机器)
  • ✅ 日志在logs/traces.jsonl(仅本地,可选云备份)

可选云功能:

  • ⚠️ Supermemory - 传输加密,存储在云端(需选择加入)
  • ⚠️ 训练数据 - 你控制什么被导出(手动过程)

最佳实践:

  • .env文件自动忽略
  • ✅ 会话永不提交到git
  • ✅ API密钥静态加密
  • ✅ 共享前审查训练数据

🚦 开始路径

路径1:基本自动化(5分钟)

只需会话持久性?完成上述第3步即可。无需AI。

路径2:带AI记忆(15分钟)

添加Supermemory API密钥 → 获取语义搜索和模式检测

路径3:完整的学习堆栈(1周)

使用一周 → 使用你的数据进行训练 → 部署优化代理

从简单开始,准备好时再增加智能。


🌟 为什么这很重要

旧范式: 编写自动化 → 网站变化 → 修复自动化 → 无限循环

新范式: 编写自动化 → 系统学习 → 自动改进 → 你可以做更有价值的工作

转变:维护负担累积资产

你花费的每一小时使这个系统变得更好。它学到的每一个模式使未来的任务更容易。它发现的每一次优化为你节省时间。

这是与你合作而非对抗的自动化。


📈 发展路线图

✅ 现已可用

  • 会话持久性(生产就绪)
  • 20个浏览器自动化工具
  • Supermemory集成(AI记忆)
  • Agent Lightning训练流水线
  • 完整文档

🔜 即将推出

  • 实时在线学习(无需手动训练)
  • 多平台代理(Facebook、Twitter等)
  • 生产监控仪表板
  • 高级奖励函数
  • 用户特定模型训练

💭 未来愿景

  • 编写自己自动化程序的代理
  • 零配置设置
  • 社区模型市场
  • 跨用户学习(保护隐私)

🤝 贡献

此项目是开源的,欢迎贡献!

贡献方式:

  • 🐛 报告错误或请求功能
  • 📖 改进文档
  • 💡 分享你的使用案例
  • 🔬 测试并提供反馈
  • 💻 提交拉取请求

📄 许可

MIT许可 - 随意使用。构建令人惊叹的事物。


🙏 使用的技术


💬 支持

文档: 完整的指南在/docs 示例: 现实世界的使用案例在/examples 快速帮助: QUICK-REFERENCE.md 问题: GitHub问题


<div align="center">

⚡ 停止维护。开始学习。

每次使用都会变得更聪明的浏览器自动化。

开始 · 查看文档 · 查看示例


为厌倦了维护自动化脚本的开发者打造。 为AI原生自动化时代而生。

</div>