解决UI自动化过程中的图文验证码问题,过程大致分为两个步骤:
是暴力破解,是把所有的密码进行的遍历,也就是从1到。。。。无穷的列举出来
import itertools as its ##这个库,python自带的
import rarfile #这个是操作rar压缩包的,如果你需要破解别的密码的话,比如pdf,那么请你安装下pdf的第三方库
对于初学者来说还是需要有一定的基础作为铺垫的学习。我将从下方的思维导图中进行逐步的解析讲述。
#!/usr/bin/python# -*- coding: UTF-8 -*- import pandas as pdimport timeimport osfrom ftplib import FTP#下载文件def downfile(host,port,username,password,localpath,remotepath,filename): ftp = FTP() ftp.connect(host,port) 
之前要用到海量商标数据,看到中知慧智的数据比较全,于是想爬取,结果发现他的数据也是来自于其母公司知产出版社的,爬个几万就废了。from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys from seleni