当前位置:网站首页>11 brève introduction et installation de la Bibliothèque d'analyse de soup beautiful
11 brève introduction et installation de la Bibliothèque d'analyse de soup beautiful
2022-06-21 19:16:00 【Andy Python notes d'étude】
11 Beautiful Soup Introduction et installation de la Bibliothèque d'analyse
Catalogue des articles
Nous avons besoin de ce qui suit pour accomplir une tâche de reptile3Étapes:
Étapes1:Obtenir une page web;Obtenir une page Web lance une demande de page web,Obtenir le code source de la page web.
Étapes2:Analyser la page web;L'analyse du réseau doit d'abord compléter l'analyse des données,Puis extraire les données.
Étapes3:Stockage des données.
Python À traitercsvDocumentation,J'ai besoin que Monsieur soit un Python Objet,C'est - à - dire: csv Objet.
Python Pour traiter ce qui a été obtenu HTML Page Web, Il faut aussi que Monsieur soit un Python Objet.
Le but de l'analyse des données est de HTMLLe document est converti en Python Le programme peut gérer Python Objet.
L'analyse des données nécessite l'utilisation d'une bibliothèque d'analyse et d'un analyseur pour .
Beautiful Soup EtXpath Sont des bibliothèques d'analyse utilisées pour analyser les données .
11.1 Beautiful Soup Introduction à la Bibliothèque d'analyse
11.1.1 Beautiful Soup Caractéristiques

1.APISimple.、Puissant
Beautiful Soup Offre quelques méthodes simples et Python Fonction de formule ,Pour parcourir、 Rechercher et modifier l'arbre de résolution ,C'est une boîte à outils,Fournir à l'utilisateur les données à saisir en analysant le document.
Beautiful Soup EtXpath Peut extraire des données du document .
Mais...Beautiful Soup Vous pouvez également modifier les données du document ,C'estXpath Fonctions non disponibles.
2. Prise en charge de plusieurs Analyseurs
Beautiful Soup Un analyseur doit être installé pour l'utiliser .
Beautiful Soup Prise en charge de plusieurs Analyseurs.
Y compris:PythonDans la Bibliothèque standardHTMLAnalyseur, Prise en charge des analyseurs tiers .
3. Automatiser la conversion des codes
Beautiful Soup Convertir automatiquement le document d'entrée en UnicodeType,Convertir le document de sortie enuft-8Codage.
Si aucun codage n'est spécifié dans le document , Il suffit de spécifier le Code .
11.2 Beautiful Soup Résoudre l'installation de la Bibliothèque
Pour l'instantBeautiful Soup La dernière version de4.x, Les versions précédentes ont cessé de se développer .
Donc, à l'avenir, l'analyse sera beautifulsoup4 .
beautifulsoup4 En brefbs4.
bs4 Cu Oui.PythonBibliothèque de tiers pour, Vous devez l'installer avant de l'importer avant de l'utiliser .
bs4 De 4 Représente la version.
Commandes d'installation
pip3 install beautifulsoup4
11.3 Beautiful Soup Analyseur

Méthode d'installation de l'analyseur
Installationlxml
Beautiful Soup DeLXML HTML L'analyseur dépend de lxmlDe la bibliothèque,Doit être installé avant utilisationlxmlBibliothèque.
Commandes d'installation
pips install lxml
Installationhtml5lib
Commandes d'installation
pips install html5lib
边栏推荐
- Gartner 网络研讨会 “九问数字化转型” 会后感
- 36氪首发 | 聚焦健康险产品创新,「英仕健康」已获4轮融资
- Day13QMainWindow2021-09-28
- Canvas dynamic background text luminous JS effect
- Canvas动态网状背景js特效
- 这篇寒门博士论文致谢火了:回首望过去,可怜无数山
- 什么是SSL证书,拥有一个SSL证书有什么好处?
- R language various logistic regression common conditions iptw
- Collaborative filtering
- 8.取目录函数/取文件函数 -dir / -notdir
猜你喜欢

【一起上水硕系列】Day One

Product graphic list description layout style

College Physics Chapter 9 vibration

Full screen menu animation effect expansion in the upper left corner of SVG

中国两颗风云气象“新星”主要数据产品将向全球用户开放共享

一篇文章彻底学会画数据流图

Collaborative filtering

Gartner 网络研讨会 “九问数字化转型” 会后感

From "village run enterprise" to "ten billion group", why did red star industry complete the "butterfly transformation"?

Must the database primary key be self incremented? What scenarios do not suggest self augmentation?
随机推荐
Metagenome (personal notes)
空中操作仅通过距离映射对遮挡目标进行鲁棒定位(RAL2022)
A test tool for recording and playback interface based on mitmproxy
In the new season, China Super League and Guoan are moving forward amid thorns
Second cloud's original fully compatible solution for Xinchuang is upgraded to help accelerate the implementation of Xinchuang industry
36 krypton launched | focusing on the innovation of health insurance products, and "Yingshi health" has obtained four rounds of financing
7.去空格函数-strip
equals空指针异常
Deep Copy
從“村辦企業”到“百億集團”,紅星實業何以完成“蝶變”?
Servlet学习(二)
互联网通信流程
Mvcc implementation principle of MySQL
文献分析 Citespace 6.1.2 下载及安装教程
左右两侧垂直带序号的时间轴
文件上传漏洞靶场分析 UPLOAD_LABS
Ant group's self-developed tee technology has passed the national financial technology product certification, and 47 tests have met the requirements
B-Tree
Servlet中Listener与Filter (监视器与拦截器)
This humble doctor's thesis is very popular: looking back, I feel sorry for countless mountains