易采集EasySpider:无代码可视化爬虫
一个可视化,几分钟设计一个爬虫/浏览器自动化测试任务的开源、免费、无广告软件
欢迎点击下方Github仓库地址查看示例和Star此开源项目~

赞助者

Proxy302是一个全球代理IP自助超市。按需付费,无需套餐捆绑购买;无阶梯式定价,充值即可使用所有类型的代理IP;免费测试,注册获取$1测试额度。覆盖全球240+国家和地区,6500万个住宅IP可供选择。
亮数据BrightData是代理市场领导者,覆盖全球的7200万IP,提供真人住宅IP,即时批量采集网络公开数据,成功率亲测有保证。需要性价比高代理IP的可点击上方图片注册后联系中文客服,现在有首充多少就送多少的活动,现在有首充多少就送多少的活动。
Capsolver.com是一家基于人工智能,提供自动验证码解决功能的服务商。支持的验证码类型包括reCAPTCHA、hCaptcha和FunCaptcha、AWS captcha、Geetest、Akamai Web、BMP、Imperva/Incapsula、captcha图像识别等。
123Proxy是企业级海外代理IP提供商, 拥有独家的8000万+代理IP池,190+国家覆盖,真实家庭住宅IP,适合各种用途的数据采集类任务。它支持免费测试2-4小时,注册联系客服即可获取;它还支持15%返现活动,给公司购买代理可以返现到个人,直接微信/支付宝返现,打工人的小福利。
Koala-IP提供海量低价高质量代理IP服务,致力于为客户提供最优价格和最稳定的代理IP解决方案。无论你是需要网络爬虫、数据抓取、隐私保护还是跨地域访问,Koala-IP(中文)都能满足你的所有需求。立即注册Koala-IP,享受超高性价比的代理IP服务,提升你的业务效益!
适合任意人群办公
像使用Excel一样可视化的设计和执行爬虫/浏览器自动化测试任务,不论有没有代码经验。
支持配置云服务器
可以配置好云服务器地址用来统一保存任务信息,统一管理。
定义任意复杂的任务
支持无限循环嵌套和判断条件,还可以执行自定义JavaScript指令和系统指令,可将退出循环的Break语句插入流程图任意位置。

软件特性

开源免费无广告
代码开源,软件所有功能均免费(商用除外),且没有任何弹窗和外部广告。
跨平台
软件可以在Windows,MacOS和Linux上运行。
简单快速
图形化的设置和执行爬虫任务,通常一个爬虫任务只需要2-5分钟即可设计完成。
安全
不需要注册,所有任务和数据均保存在本地,不经过任何第三方服务器。
灵活
可任意添加浏览器插件,执行JavaScript指令,使用Selenium语句直接操纵浏览器。
并行多开
可开启任意数量的执行程序,实现大规模数据的并行采集。
动态调试
点击/双击设计完成的操作可自动标记/试运行,方便定位和调试问题,节省修改任务时间。
自定义插件
支持外挂自定义插件,实现任意的自定义功能。
验证码识别
支持多种验证码识别方案,如图形验证码,reCAPTCHA验证码等。
元素截图和OCR识别
支持元素截图和OCR识别,以及图片下载。
代理IP
支持切换隧道IP,私有IP等。
局域网使用
支持在没有互联网的局域网内使用。
外部程序调用
可以任意调用系统外部程序,从而问完成任意复杂的需求。
API调用
可以通过API调用执行任务,实现高级的自动化采集。
定时执行
支持定时执行任务,成为贴心生活小助手。
暂停运行
随时暂停任务执行以便手工调试页面和输入验证码。
Python环境自定义
可任意修改执行时的Python环境,如可自定义变量,并将变量值写入任意代码语句。
移动端模拟
支持模拟手机端设备,实现手机网页采集。
灵活导入
支持读取Excel文件以导入大批量输入参数。
自由导出
可导出为Excel/CSV/TXT文件,支持写入MySQL数据库。
任务迁移
任务可任意复制和迁移到其他机器,无视操作系统环境。
页面滚动
可以设置页面滚动来获取需要滚动加载的内容。
IFRAME支持
支持采集在iframe标签内的数据,包括多层嵌套的iframe。
Cookies修改
可获取和修改页面Cookies值。
命令行执行
直接以命令行的方式执行任务,无缝嵌入到其他程序中。
无头模式
支持无头模式,可在后台运行,不会弹出浏览器窗口。
正则表达式
支持正则表达式,可在任意位置使用正则表达式。
修改网页内容
可修改网页内容,实现更加精密的采集需求定制。
代码调试
软件包自带执行源码,可用Python直接运行和调试代码。
JSON支持
支持JSON格式的数据采集。
下载文件
支持下载文件,可下载图片、PDF、压缩包等文件。
弹窗处理
支持处理浏览器的Alert和Confirm弹窗。

版权声明与支持作者

本软件仅供学习交流使用,严禁使用软件进行任何违法违规的操作,如爬取不允许爬取的政府/军事机关网站等。使用本软件所造成的一切后果由使用者自负,与作者本人无关,作者不会承担任何责任。同时,软件受到专利权保护,如要用于商业用途,如使用软件进行盈利接单,用于公司业务,或出售采集到的数据等,请邮件联系作者:naibowang@foxmail.com进行专利授权等付费操作:https://www.patentguru.com/cn/search?q=一种自定义提取流程的服务封装系统

对于个人使用者来说,易采集EasySpider是一款完全免费无广告的开源软件,软件开发和维护全靠作者用爱发电,因此您可以选择支持作者让作者有更多的热情和精力维护此软件,或者您使用了此软件进行了盈利,欢迎您通过下面的方式支持作者:

1. 支付宝账号:naibowang@foxmail.com,也可以扫描下方二维码。

2. 微信收款:扫描下方二维码。

3. PayPal账号:naibowang,也可以扫描下方二维码。