当前位置:网站首页>采集数据工具推荐,以及采集数据列表详细图解流程
采集数据工具推荐,以及采集数据列表详细图解流程
2022-07-01 15:09:00 【蹦跶哒的王小哲】
工具推荐
最近工作需要,需要抓取一些网站信息作为参考。之前没搞过,脑壳儿疼。

于是就找了几款抓取数据的软件,找了以下三种:
1,火车采集器;
火车头。这款不知道是我下的不对,还是不会用,怎么也抓取不了,任务状态一直是红色,个人感觉操作难度系数高,执行任务提示让我进行升级,研究了小半天,最终放弃了。

如果有知道怎么使用的道友们,麻烦私信我,教教我怎么使用。
2,八爪鱼采集器;
个人感觉,操作比较简单,适合小白,操作手册也算比较详细。
主要还要看公司的业务,需求抓取数据量大不大。目前是免费抓取网站不限制,任务数限制30个,对于小业务来讲,多少也够用;
3,147SEO。

这个虽主打说是免费,但是有些功能还是会不能使用,有些功能的使用需要依赖于绑定网站,不知道这样做是否安全。
采集详细图解流程
以下案例,以采集百度 “什么是快乐星球” 资讯列表为例。采集标题,描述,链接以及详情页 内容字段。
1,复制要采集的网站地址,输入到 八爪鱼首页 采集栏,点击 开始采集;


2,(1)点击标题,在右侧选择选中全部;(2)自行点击选择需要的字段;(3)然后点击采集数据。




3,滑到页面底部,点击“下一页”按钮,在右侧选择 循环点击下一页;


4,选择(1)点击右上角 保存 按钮;(2)点击 采集 按钮;(3)选择本地采集,立即启动


5,最后选择导出数据就可以了。
边栏推荐
- [Cloudera][ImpalaJDBCDriver](500164)Error initialized or created transport for authentication
- How to realize clock signal frequency division?
- [zero basic IOT pwn] reproduce Netgear wnap320 rce
- Digital transformation: data visualization enables sales management
- 【天线】【3】CST一些快捷键
- Tiantou village, Guankou Town, Xiamen special agricultural products Tiantou Village special agricultural products ant new village 7.1 answer
- Written on the first day after Doris graduated
- JVM second conversation -- JVM memory model and garbage collection
- TypeScript:const
- Flink 系例 之 TableAPI & SQL 与 MYSQL 分组统计
猜你喜欢

Official announcement: Apache Doris graduated successfully and became the top project of ASF!

skywalking 6.4 分布式链路跟踪 使用笔记
![[leetcode 324] 摆动排序 II 思维+排序](/img/cb/26d89e1a1f548b75a5ef9f29eebeee.png)
[leetcode 324] 摆动排序 II 思维+排序

idea中新建的XML文件变成普通文件的解决方法.

The first technology podcast month will be broadcast soon
k8s部署redis哨兵的实现

定了!2022海南二级造价工程师考试时间确定!报名通道已开启!

Task.Run(), Task.Factory.StartNew() 和 New Task() 的行为不一致分析

opencv学习笔记四--银行卡号识别

智能运维实战:银行业务流程及单笔交易追踪
随机推荐
solidty-基础篇-基础语法和定义函数
solidty-基础篇-结构体和数组,私有 / 公共函数,函数的返回值和修饰符,事件
leetcode:329. Longest increasing path in matrix
22-06-26周总结
Can I choose to open an account on Great Wall Securities? Is it safe?
《QT+PCL第六章》点云配准icp系列3
What if you are always bullied because you are too honest in the workplace?
Error-tf. function-decorated function tried to create variables on non-first call
写在Doris毕业后的第一天
Configuration of ZABBIX API and PHP
tensorflow2-savedmodel convert to tflite
官宣:Apache Doris 顺利毕业,成为 ASF 顶级项目!
go-zero实战demo(一)
炎炎夏日,这份安全用气指南请街坊们收好!
Mongodb second call -- implementation of mongodb high availability cluster
What are the requirements for NPDP product manager international certification registration?
DirectX repair tool v4.1 public beta! [easy to understand]
Digital transformation: data visualization enables sales management
Introduction to MySQL audit plug-in
k8s部署redis哨兵的实现