XPath · 正则 · CSS选择器 · JSON · 可视化

专业高效的
网页数据采集工具

火车采集器 (LocoySpider) 是国内领先的网页数据采集软件。可视化规则编辑、智能翻页、多线程采集、定时任务，轻松抓取任意网站数据。

XPath 正则表达式 CSS选择器 JSON 智能提取 API采集

下载 Windows 版了解更多

v9.x · 免费使用 · Windows 7 / 10 / 11 (X64)

无病毒

数据安全

官方正版

高效采集

采集任务

规则编辑

数据预览

电商商品采集运行中

新闻资讯抓取已完成

论坛数据采集暂停

网页采集

API 接口

数据库

采集中 https://example.com/products?page={{page}}&cat=electronics 运行

URL 列表采集规则数据预览导出设置

采集中 · 第 18/25 页已采集 432 条 · 3 条失败

1 Apple MacBook Pro 16 英寸 M3 Max 芯片成功

2 Sony WH-1000XM5 降噪蓝牙耳机黑色成功

3 Dell UltraSharp 27 4K USB-C 显示器成功

4 Logitech MX Master 3S 无线鼠标成功

5 Samsung 990 Pro 2TB NVMe SSD 超时

进度 72% 预计剩余 3 分钟

核心功能

强大的数据采集能力

从网页抓取到数据导出，覆盖数据采集的全流程

可视化规则

点击式规则编辑器，鼠标选中即可生成采集规则，无需编写代码，小白也能轻松上手。

智能翻页

自动识别分页规则，支持 URL 翻页、Ajax 加载、滚动加载、下一页按钮等多种翻页方式。

多线程采集

支持多线程并发采集，代理 IP 轮换，自动限速，大幅提升采集效率的同时避免被封。

多种提取方式

支持 XPath、CSS 选择器、正则表达式、JSON Path 等多种数据提取方式，适配各类网站。

定时采集

支持 Cron 表达式定时任务，可设置每日/每周/自定义周期自动运行，数据实时更新。

多格式导出

采集数据可导出为 Excel、CSV、JSON、SQL、TXT 等格式，支持直接写入 MySQL/SQL Server。

反爬突破

内置浏览器引擎，支持 Cookie 登录、验证码识别、JS 渲染，轻松应对各种反爬机制。

文件下载

支持采集图片、文档、视频等文件并自动下载到本地，批量下载效率高。

规则配置

可视化编辑规则
零代码数据采集

火车采集器的规则编辑器让数据采集变得极其简单。打开目标网页，鼠标选中要采集的内容，自动生成 XPath 或 CSS 选择器规则。

鼠标点选式规则生成，所见即所得
支持规则导入导出和模板共享
内置数据清洗与格式转换
实时预览采集结果，规则调试方便

Rule Editor · 电商商品采集规则

目标 URL https://example.com/products?page=[1-100]

列表规则 //div[@class='product-item']

商品名称 .//h3/text()

商品价格 .//span[@class='price']/text()

商品图片 .//img/@src

商品链接 .//a[@class='detail']/@href

数据过滤价格 > 0 && 名称 != ""

导出格式 Excel + MySQL

专业高效的网页数据采集工具