当前位置:网站首页>RPA(影刀)无需写代码抓取某东的商品信息
RPA(影刀)无需写代码抓取某东的商品信息
2022-06-21 07:28:00 【Python和数据分析】
大家好,我是翔宇!
有的小伙伴不会写代码,但也想采集一些数据,RPA就是一个最好的选择。今天我就带大家用RPA(影刀)无需写代码抓取某东的商品信息,主要采集到的数据有以下字段,数据达到近5000条。
采集主页(翻页采集):

采集结果:当然这里就只单纯采集了三个字段,需要更多字段原理一致。
效果【视频】
视频在csdn上传了三次都上不来,请前往同名公众号观看
- 思路
RPA作为办公自动化的新方案,它的功能还是比较强大的。实际上,用影刀进行抓取网页上的数据下来,它和Python中的selenium着实很像,只是selenium用写代码的方式进行自动化操作,而RPA则是不需要你写代码(也不绝对不写代码,有些功能在里面写Python代码更方便,可以对比进行使用)。
整个采集的过程,模仿人用鼠标与键盘的操作,进入到数据信息所在的页面后,通过获取元素或者同时拿到相似元素之间的文本内容的方式进行获取数据,得到字段值后,通过写入csv或者xlsx的方式写入excel表格。
实践
2.1新建应用

2.2 设计流程
进入到数据所在的网页
拿到第一页中想要的几个字段数据。
例如获取一页中的价格信息
获取手机标题和评论条数同样原理
将第一页的数据存进excel表

循环从第二页开始采集每一页的数据存进excel表(csv)
- 结束语
通过20分钟左右的抓取,将近5000条数据顺利存进excel中,总的来说,配置用了近2个小时,数据成功拿到,整体效率还是比较高,对于一般的数据抓取需求还是比较容易满足,本次实践效果已经在文章开头展现
需要此RPA的配置流程的请在同名公众号后台回复【OPPO】获取。
我是翔宇,下期再见!
边栏推荐
- Research Report on market supply and demand and strategy of inorganic feed phosphate industry in China
- Deploy ZABBIX enterprise level distributed monitoring
- Google Earth engine (GEE) - US native lithology data set
- 模拟手机设备长按事件
- Crack the simple login system with NOP method
- Tensorrt notes (III) reference
- C # basic knowledge series 8 (const and readonly keywords)
- Japanese programming learning website
- Getting started with MATLAB
- Google Earth Engine(GEE)——美国本土岩性数据集
猜你喜欢

如何让mysql不区分大小写

传输层 TCP首部-序号和确认号

mysql存储过程中的循环语句怎么写

Transport layer TCP header - serial number and acknowledgement number

Easyexcel exclude display field-02

Google Earth Engine(GEE)——全球农田有机土壤碳和氮排放(1992-2018年度)数据集

Hisilicon series mass production hardware commissioning record
![[graduation season - advanced technology Er]: the technology sharing of senior college students and the future encouragement](/img/97/179029022f42df7e267466948dd4c2.png)
[graduation season - advanced technology Er]: the technology sharing of senior college students and the future encouragement

Getting started with MATLAB

Yield guild games and Walken reach cooperation
随机推荐
mysql的安装路径如何查看
Wechat applet_ 5. Page configuration
RDKit | 拓扑极性表面积(TPSA)
ETF operation practice record: February 22, 2022
Open up the connection between production and marketing and build a new digital supply chain of agricultural and sideline products
操作成功的提示信息动态添加
【蓝桥杯单片机组】串口通信
建设数字化工厂的四个必要步骤
Configuring the eigen3 development environment for vs2017 on win10
js操作Cookie,js设置Cookie值,js读取Cookie值
微信小程序_4,WXSS模板样式
Wechat applet_ 4. Wxss template style
[flutter special topic] 72 graphic minimalist custom running lamp acemarquee yyds dry goods inventory
【osg】osg开发(02)—基于MinGW编译构建osgQt库
如何安装Visual Studio Code编辑器?
SQL advanced challenge (26 - 30)
How to see who developed the applet (see the method of the applet development company)
[OSG] OSG development (02) - build osgqt Library Based on MinGW compilation
RDKIT | 基于分子指纹的分子相似性
MATLAB 三维图(非常规)