admin管理员组

文章数量:1330567

1024

运行下述代码,将会自动打开百度图片搜索并开始无限下载所搜索到的图片,你不停,它不停,会保存至当前文件夹。
前提是使用python,然后安装了webdriver驱动器

from selenium import webdriver
import os
import time
import requests
import warnings
warnings.filterwarnings('ignore')# 相当于在百度图片的搜索上输入搜索关键字
name = input("输入一个要爬取的图片名称:")# 创建谷歌驱动器
driver = webdriver.Chrome(executable_path='chromedriver.exe')# 驱动谷歌浏览器打开连接
driver.get('/')
# 屏幕最大化
driver.maximize_window()# 定位到搜索输入框
input1 = driver.find_element_by_xpath('//input[@id="kw"]')
# 输入要搜索的关键字
input1.send_keys(name)
# 定位到搜索按钮并点击
driver.find_element_by_xpath('//span[@class="s_search"]').click()# 循环下载
a = 0
list1 = []
list2 = []
while True:# 每5秒控制页面下拉time.sleep(5)driver.execute_script('window.scrollTo(0,document.body.scrollHeight)')# 获取到每张图片list = driver.find_elements_by_xpath('//li[@class="imgitem"]')list1 = set(list) - set(list2)mpathjoin = namefor li in list1:# 获取每张图片的网址链接url_img = li.get_attribute('data-thumburl')# 访问图片链接response = requests.get(url_img)# 拼接图片下载路径mfilejoin = os.path.join(mpathjoin,name + str(list.index(li)) + '.jpg')if os.path.exists(mpathjoin):passelse:os.mkdir(mpathjoin)with open(mfilejoin,'wb') as fw:# 下载操作fw.write(response.content)print(url_img,mfilejoin,'已下载')a += 1list2 = list

本文标签: 1024