因为,有的时候直接请求请求不到数据,所以,只能模拟浏览器,但是,selenium 过于笨重,并且,配置复杂,所以,在搜索的过程中,找到了 Playwright 。
参考资料
- Playwright: 比 Puppeteer 更好用的浏览器自动化工具
- Playwright快速上手指南
- 微软开源 Python 自动化神器 Playwright
- Install system dependencies
安装
macbook
pip install playwright
python -m playwright install
这个是安装 playwright 浏览器内核
这个我安装的特别慢
ps: 我在测试的时候,安装的版本是 1.14.0
有的教程,安装浏览器内核的时候这样使用
playwright install
但是,如果,我们电脑上有很多独立的 python
版本这样就不好用了,除非是在一个独立的虚拟环境中。所以,可以用上面的安装方式。
另外,浏览器安装,一共安装的是三种,你也可以选择特定的浏览器。
playwright install webkit
我在 MacBook
这样操作后就好了。
ubuntu 18.04
这个安装方式也是
pip install playwright
python -m playwright install
但是,如果只是这样安装的话,使用的过程中会出错,这是因为缺少了 CI environments
。
我们可以这样安装
python -m playwright install-deps
当然,你依然可以安装某一特地浏览器版本。
python -m playwright install-deps chromium
使用
laywright
支持 Firefox
/ Chrome
/ WebKit(Safari)
.
其中 webkit
最轻量了,所以没有什么特殊需求最好使用 webkit
, 不要使用 chromium
.