当前位置:网站首页>零代码工具推荐 八爪鱼采集器
零代码工具推荐 八爪鱼采集器
2022-07-31 09:03:00 【不允许摆烂】
简介
八爪鱼采集器是一款全网通用的互联网数据采集器,模拟人浏览网页的行为,通过简单的页面点选,生成自动化的采集流程,从而将网页数据转化为结构化数据,存储于EXCEL或数据库等多种形式。并提供基于云计算的大数据云采集解决方案,实现数据采集。是数据一键采集平台。很适合新手使用。采集原理类似火车头采集器,用户设定抓取规则,软件执行。八爪鱼的优点是提供了常见抓取网站的模板,如果不会写规则, 就直接用套用模板就好了。
它是基于浏览器内核实现可视化抓取数据,所以存在卡顿、采集数据慢的现象。不过整体来说还是不错的,毕竟能基本满足新手在短时间抓取数据的场景,比如翻页查询,Ajax 动态加载数据等。
优点分析
开源,免费,操作极为简单,我们可以把他理解成一个简单的爬虫,即使你不会爬虫,也可以通过它轻松爬取到想要的数据
缺点分析
因为我们是白嫖的,所以爬取速度比较慢
下载安装
网站:https://www.bazhuayu.com/
进入网站 点击免费下载
点击立刻下载 注意选择操作系统 我下的是windows的,mac通过下面的按钮也能下载到
下载到本地 然后开始安装 安装步骤傻瓜式安装,就不叙述了,注意安装目录即可
安装完成后打开应用就是这个样子
然后可以登录或者注册账号,根据自己的需求操作即可
这个就是登录页面
我们可以自己选择采集数据都模板,也可以使用它推荐的热门模板,这里我就直接使用推荐的模板了,注意,有的模板是收费的!
操作步骤
1 登陆后找到主页面,选择主页的简易采集,如图:
2 选择简易采集中选择模板,有的模板收费!
那我们就选择一个不收费的模板去采集数据,这里我们选择百度
3 进入到百度版块后可以进行具体规则模板的选择,选择百度资讯-百家号搜索采集
可以看到这个是免费的,我们就用它了
4 点击立即使用进入到信息设置页面,根据个人需要设置相关关键词,例如此处我们输入的关键字为“河南暴雨”,并设置分页(搜索页)为10页的数据,如图:
5 点击保存并启动后就可以进行数据采集了,以下是本地采集效果示例,如图:
选择本地采集,普通模式,也就是说把数据保存到本地而不是云服务,当然,普通模式肯定比加速模式慢的,白嫖就知足吧
然后就会开始收集数据,普通模式有点慢,我们需要耐心等待,如果觉得收集一些就够了,可以点击右侧的暂停和停止按钮来终止
过了一会就收集到数据了,可以看到已经收集到了一些数据了
我们将收集的数据导出
可以看到 支持多种导出方式,不进支持excel,json等格式,也是可以直接导出到数据库!
导出数据
导出到数据库我还没试过,后面我会试下补充上,这样就省去了我从excel导入到mysql的操作
边栏推荐
猜你喜欢
ARC在编译和运行做了什么?
Doraemon teach you forwarded and redirect page
A brief introduction to the SSM framework
[What is the role of auto_increment in MySQL?】
[MySQL exercises] Chapter 4 · Explore operators in MySQL with kiko
【云原生与5G】微服务加持5G核心网
【MySQL功法】第4话 · 和kiko一起探索MySQL中的运算符
ecshop安装的时候提示不支持JPEG格式
【TCP/IP】Network Model
js右侧圆点单页滚动介绍页面
随机推荐
【黄啊码】MySQL入门—3、我用select ,老板直接赶我坐火车回家去,买的还是站票
Flink1.15源码阅读flink-clients——flink命令行帮助命令
[What is the role of auto_increment in MySQL?】
SSM framework explanation (the most detailed article in history)
ARC在编译和运行做了什么?
Linux 创建mysql数据库并创建账号密码
【MySQL功法】第2话 · 数据库与数据表的基本操作
JSP application对象简介说明
2022 Hangzhou Electric Cup Super League 3
js雷达图统计图表插件
MySQL 的几种碎片整理方案总结(解决delete大量数据后空间不释放的问题)
Golang-based swagger super intimate and super detailed usage guide [there are many pits]
云服务器部署 Web 项目
剑指offer-解决面试题的思路
Flink1.15源码阅读——PER_JOB vs APPLICATION执行流程
[MySQL exercises] Chapter 3 Common data types in MySQL
MySQL 高级(进阶) SQL 语句 (一)
SQL连接表(内连接、左连接、右连接、交叉连接、全外连接)
【云原生】微服务之Feign的介绍与使用
ScheduledExecutorService - 定时周期执行任务