源码名称:【spiderflow爬虫平台 v0.5.0】高度灵活可配置+图形化方式定义爬虫流程+不写代码即可完成爬虫
源码大小:1.8MB
开发语言:PHP+Mysql
操作系统:Windows,Linux
源码简介与安装说明:
spiderflow是一个高度灵活可配置的爬虫平台。作为新一代爬虫平台,它以图形化方式定义爬虫流程,不写代码即可完成爬虫。
特性:
支持Xpath/JsonPath/css选择器/正则提取/混搭提取
支持JSON/XML/二进制格式
支持多数据源、SQL select/selectInt/selectOne/insert/update/delete
支持爬取JS动态渲染(或ajax)的页面
支持代理
支持自动保存至数据库/文件
常用字符串、日期、文件、加解密等函数
支持插件扩展(自定义执行器,自定义方法)
任务监控,任务日志
支持HTTP接口
支持Cookie自动管理
支持自定义函数
沃客云资源,库测试截图:
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。