2025年6月5日 · 1 分钟阅读

Claude Code 全网爬取技能栈

Claude Code 配上这几个 Skill，基本能爬全网了。 1. 扒社媒（小红书 / X / 抖音 / YouTube / 公众号 / Reddit） Agent reach — 开源 AI 脚手架，支持多个平台通过 API 访问。安装 CLI 工具、配置搜索引擎，帮助 AI Agent 实现...

Claude Code 配上这几个 Skill，基本能爬全网了。

1. 扒社媒（小红书 / X / 抖音 / YouTube / 公众号 / Reddit）

Agent-reach — 开源 AI 脚手架，支持多个平台通过 API 访问。安装 CLI 工具、配置搜索引擎，帮助 AI Agent 实现对各种平台的访问。

2. 批量抓数据 / 破反爬

Scrapling — 自适应网页抓取框架，支持从单次请求到全量爬取。内置静态、JS 渲染、反爬隐身三种抓取器，高速提取结构化数据、绕过 Cloudflare 等反爬，网页改版后能自动重新定位元素、不易失效。

3. 扒登录后的页面 / 让 AI 自己操作

Browser-use — 浏览器自动化框架，让 AI 像人一样操作网页。LLM 驱动，自主完成填表、点击、操作后台等多步任务，能复用 Chrome 里已登录的状态。

4. 要盯着它操作 / 复杂认证的页面

Claude in Chrome — Anthropic 官方浏览器扩展。把 Claude 装进真实的 Chrome，亲眼看着它在页面里点击、填写、操作，适合需要盯着、或认证特别复杂的页面。

5. 要全自动联网 / 接管日常 Chrome

Web-access — Agent 联网 Skill，覆盖从公开搜索到登录后操作的全场景。在 WebSearch / WebFetch / curl / CDP 之间自动择优，用 CDP 接管日常 Chrome（天然带登录态），还能检索本地浏览器的书签与历史。

核心原则

从轻到重，够用就停，能不开浏览器就别开。

实战案例：用这套扒一个课程网站，后台全流程把文档和视频扒下来、自动翻译加字幕、存进 Obsidian，非常丝滑。

来源: 0xEcho @ X