網(wǎng)友評分: 9.4分
Beautiful Soup是款專門針對python推出的HTML/XML解析工具。它具有強(qiáng)大的解析功能,可以方便的處理不規(guī)范標(biāo)記并生成剖析樹,自動將輸入文檔轉(zhuǎn)換成Unicode編碼,適用于抓取網(wǎng)站數(shù)據(jù),大大提高工作效率。
1.Beautiful Soup提供了一些簡單的方法和Python術(shù)語,用于檢索和修改語法樹:一個用于解析文檔并提取相關(guān)信息的工具包。這樣你寫一個應(yīng)用不需要寫很多代碼。
2.Beautiful Soup自動將輸入文檔轉(zhuǎn)換為Unicode編碼,并將輸出文檔轉(zhuǎn)化為UTF-8編碼。你不需要考慮編碼,除非輸入文檔沒有指出其編碼并且Beautiful Soup無法自動檢測到,這時你需要指出原來的編碼方式。
3.Beautiful Soup位于一些流行的Python解析器比如lxml和html5lib的上層,這允許你使用不同的解析策略或者犧牲速度來換取靈活性。
1、解壓文件
將下載得到的壓縮包解壓到任意文件夾,路徑不含中文
2、打開cmd命令提示符
win+r,輸入cmd,回車
進(jìn)入解壓后的目錄,我這里是C:\Python27\bs4\beautifulsoup4-4.3.2
所以使用
cd C:\Python27\bs4\beautifulsoup4-4.3.2
然后
setup.py build
接著
setup.py install
完成安裝
3、測試
python
import bs4
沒有提示錯誤,成功!
關(guān)于本站|下載幫助|下載聲明|軟件發(fā)布|聯(lián)系我們
Copyright ? 2005-2024 m.daaijiaoyu.cn.All rights reserved.
浙ICP備06019006號-1 浙公網(wǎng)安備33038102330474號