XPath · 正则 · CSS选择器 · JSON · 可视化

专业高效的
网页数据采集工具

火车采集器 (LocoySpider) 是国内领先的网页数据采集软件。可视化规则编辑、智能翻页、多线程采集、定时任务,轻松抓取任意网站数据。

XPath 正则表达式 CSS选择器 JSON 智能提取 API采集
v9.x · 免费使用 · Windows 7 / 10 / 11 (X64)
无病毒
数据安全
官方正版
高效采集
采集任务
规则编辑
数据预览
电商商品采集 运行中
新闻资讯抓取 已完成
论坛数据采集 暂停
网页采集
API 接口
数据库
采集中 https://example.com/products?page={{page}}&cat=electronics 运行
URL 列表 采集规则 数据预览 导出设置
采集中 · 第 18/25 页 已采集 432 条 · 3 条失败
1 Apple MacBook Pro 16 英寸 M3 Max 芯片 成功
2 Sony WH-1000XM5 降噪蓝牙耳机 黑色 成功
3 Dell UltraSharp 27 4K USB-C 显示器 成功
4 Logitech MX Master 3S 无线鼠标 成功
5 Samsung 990 Pro 2TB NVMe SSD 超时
进度 72% 预计剩余 3 分钟
核心功能

强大的数据采集能力

从网页抓取到数据导出,覆盖数据采集的全流程

可视化规则

点击式规则编辑器,鼠标选中即可生成采集规则,无需编写代码,小白也能轻松上手。

智能翻页

自动识别分页规则,支持 URL 翻页、Ajax 加载、滚动加载、下一页按钮等多种翻页方式。

多线程采集

支持多线程并发采集,代理 IP 轮换,自动限速,大幅提升采集效率的同时避免被封。

多种提取方式

支持 XPath、CSS 选择器、正则表达式、JSON Path 等多种数据提取方式,适配各类网站。

定时采集

支持 Cron 表达式定时任务,可设置每日/每周/自定义周期自动运行,数据实时更新。

多格式导出

采集数据可导出为 Excel、CSV、JSON、SQL、TXT 等格式,支持直接写入 MySQL/SQL Server。

反爬突破

内置浏览器引擎,支持 Cookie 登录、验证码识别、JS 渲染,轻松应对各种反爬机制。

文件下载

支持采集图片、文档、视频等文件并自动下载到本地,批量下载效率高。

规则配置

可视化编辑规则
零代码数据采集

火车采集器的规则编辑器让数据采集变得极其简单。打开目标网页,鼠标选中要采集的内容,自动生成 XPath 或 CSS 选择器规则。

  • 鼠标点选式规则生成,所见即所得
  • 支持规则导入导出和模板共享
  • 内置数据清洗与格式转换
  • 实时预览采集结果,规则调试方便
Rule Editor · 电商商品采集规则
目标 URL https://example.com/products?page=[1-100]
列表规则 //div[@class='product-item']
商品名称 .//h3/text()
商品价格 .//span[@class='price']/text()
商品图片 .//img/@src
商品链接 .//a[@class='detail']/@href
数据过滤 价格 > 0 && 名称 != ""
导出格式 Excel + MySQL
50万+
用户数量
15
持续更新
30+
行业覆盖
100%
中文支持