在python爬虫程序开发之中,使用requests以及urllib这两个内置模块就可以很轻松的从网站上面将数据抓取回来,但是抓取回来的数据都是源码,需要经过进一步处理才能转为合理合规的数据。而Bs4库就是一个很好用的数据处理模块,下文会介绍安装它的几个方法。
一、pip在线安装
python所有的库都是可以通过pip这个包以及程序管理工具去实现安装、卸载、更新、启动等功能,而在线安装的意思指的就是通过pip工具从python库官网pypi上将库的压缩文件给下载好然后一键自动安装。
使用pip在线安装的话有几个前提条件,首先就是网络必须保持在一个较为良好的状态并且没有防护墙和内网等限制,其次就是DNS和host等网络配置不可以是被修改过的,否则发出的请求会无法识别。
那么上面这几个条件都满足之后就可以使用win+r打开运行窗口然后输入cmd回车启动命令提示符,输入以下命令并回车执行即可,示例如下:
pip3 install Beautifulsoup4
这里的pip3表示的就是python3版本,不加上数字也可以。而Beautifulsoup4则是Bs4库的全称,在下载安装它时就需要这么写。
二、离线下载pip安装
这种方法就比较适合网络情况不好的小伙伴了,它是先在Bs4官网上将这个库的压缩文件给下载好。然后再通过pip安装的命令将其给解压安装并配置到python环境之中。
浏览器里面进入http://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/#id8这个网址即可下载Bs4库压缩文件,下载完成之后将其解压到python安装目录之中的scripts文件夹中,然后在命令行执行如下命令:
python setup.py install
以上就是Python安装第三方库Bs4的具体方法了。