火车采集器 (LocoySpider) 是国内领先的网页数据采集软件。可视化规则编辑、智能翻页、多线程采集、定时任务,轻松抓取任意网站数据。
从网页抓取到数据导出,覆盖数据采集的全流程
点击式规则编辑器,鼠标选中即可生成采集规则,无需编写代码,小白也能轻松上手。
自动识别分页规则,支持 URL 翻页、Ajax 加载、滚动加载、下一页按钮等多种翻页方式。
支持多线程并发采集,代理 IP 轮换,自动限速,大幅提升采集效率的同时避免被封。
支持 XPath、CSS 选择器、正则表达式、JSON Path 等多种数据提取方式,适配各类网站。
支持 Cron 表达式定时任务,可设置每日/每周/自定义周期自动运行,数据实时更新。
采集数据可导出为 Excel、CSV、JSON、SQL、TXT 等格式,支持直接写入 MySQL/SQL Server。
内置浏览器引擎,支持 Cookie 登录、验证码识别、JS 渲染,轻松应对各种反爬机制。
支持采集图片、文档、视频等文件并自动下载到本地,批量下载效率高。
火车采集器的规则编辑器让数据采集变得极其简单。打开目标网页,鼠标选中要采集的内容,自动生成 XPath 或 CSS 选择器规则。