admin管理员组文章数量:1330567
1024
运行下述代码,将会自动打开百度图片搜索并开始无限下载所搜索到的图片,你不停,它不停,会保存至当前文件夹。
前提是使用python,然后安装了webdriver驱动器
from selenium import webdriver
import os
import time
import requests
import warnings
warnings.filterwarnings('ignore')# 相当于在百度图片的搜索上输入搜索关键字
name = input("输入一个要爬取的图片名称:")# 创建谷歌驱动器
driver = webdriver.Chrome(executable_path='chromedriver.exe')# 驱动谷歌浏览器打开连接
driver.get('/')
# 屏幕最大化
driver.maximize_window()# 定位到搜索输入框
input1 = driver.find_element_by_xpath('//input[@id="kw"]')
# 输入要搜索的关键字
input1.send_keys(name)
# 定位到搜索按钮并点击
driver.find_element_by_xpath('//span[@class="s_search"]').click()# 循环下载
a = 0
list1 = []
list2 = []
while True:# 每5秒控制页面下拉time.sleep(5)driver.execute_script('window.scrollTo(0,document.body.scrollHeight)')# 获取到每张图片list = driver.find_elements_by_xpath('//li[@class="imgitem"]')list1 = set(list) - set(list2)mpathjoin = namefor li in list1:# 获取每张图片的网址链接url_img = li.get_attribute('data-thumburl')# 访问图片链接response = requests.get(url_img)# 拼接图片下载路径mfilejoin = os.path.join(mpathjoin,name + str(list.index(li)) + '.jpg')if os.path.exists(mpathjoin):passelse:os.mkdir(mpathjoin)with open(mfilejoin,'wb') as fw:# 下载操作fw.write(response.content)print(url_img,mfilejoin,'已下载')a += 1list2 = list
本文标签: 1024
版权声明:本文标题:1024 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.betaflare.com/web/1687926387a158302.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论