admin管理员组文章数量:1319066
Selenium在请求过程中,会传递一些特有的属性,某些网站通过检测这些属性,鉴别出Selenium并实现反爬。
有反爬,自然有反反爬!
本文利用Chrome DevTools协议,它允许客户检查和调试Chrome浏览器,使Selenium接管手动打开的Chrome浏览器,实现反反爬。
文章目录
- 1 将google-chrome添加到环境变量PATH中
- 2 启动Chrome
- 3 Selenium代码
- 参考:
操作环境:
- Ubuntu 18.04LTS
- Python 3.6
- Selenium 3.141.0
- Chrome 76.0.3809
1 将google-chrome添加到环境变量PATH中
在~/.profile文件下添加该语句
export PATH="$PATH:/usr/bin/google-chrome"
在Terminal中执行
source ~/.profile
2 启动Chrome
在终端中执行以下命令,打开Chrome浏览器
google-chrome --remote-debugging-port=9222 --user-data-dir="/tmp/SeleniumData"
- –remote-debugging-port=9222:指定启动端口9222,也可以指定别的端口,在Selenium中会用到
- –user-data-dir="/tmp/SeleniumData/":指定浏览器数据存储目录
3 Selenium代码
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
chrome_options = Options()
chrome_options.add_experimental_option("debuggerAddress", "127.0.0.1:9222")
# 指定chromedriver
chrome_driver = "/usr/bin/chromedriver"
browser = webdriver.Chrome(chrome_driver, chrome_options=chrome_options)
browser.get('http://www.zhihu/')
print(browser.title)
会跳转到知乎,并打印知乎登录页的标题
参考:
https://wwwblogs/HJkoma/p/9936434.html
版权声明:本文标题:如何突破网站对Selenium的屏蔽(1)接管手动打开的Chrome浏览器 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.betaflare.com/biancheng/1737920960a2036058.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论