一、简介
先来说说百度旋转验证码的历史。
1、百度旋转验证码
这是百度最早的旋转验证码,只有有限的数量,图片以风景为主,没有随机阴影,没有干扰线条等。所以这种验证码识别比较简单,正确率在99%左右。如下图所示
2、百度随机阴影验证码
这种验证码是第一种验证码的升级版,就是在上面图片的基础上增加的随机黑色阴影,图片种类有限,识别难度会比上面的大一些。正确率会在95%左右。如下图所示
3、百度随机白色线条验证码
这种验证码是第二中的升级版,干扰性大幅增加,识别难度也有较大提升,缺点也是种类有限,识别正确率可以做到90%左右,如下图所示
4、百度AI旋转验证码
这个是最近才出的最新验证码,内容主要以工厂、建筑、山峰、机器人、汽车、盆栽植物等为主。如下图所示
优点:
解决了图片种类有限的问题,AI验证码可以随机生成,生成种类无限多,每天都不一样,给识别造成很大困难。
缺点:
AI生成的图片可能不符合逻辑,甚至连真人都识别不了,会给用户体验带来不好的影响。如下图所示
二、百度AI旋转识别代码
我们经过几周的研究, 终于解决了百度AI旋转验证码的识别问题。下面是我们提供的识别代码,感兴趣的小伙伴可以把它转换成js逆向的方式进行验证。运行下面代码,会直接触发验证码。然后可以看到识别过程。
想要识别更多验证码请查看:得塔云
import base64
import requests
import datetime
from io import BytesIO
from PIL import Image
t1 = datetime.datetime.now()
#PIL图片保存为base64编码
def PIL_base64(img, coding='utf-8'):
img_format = img.format
if img_format == None:
img_format = 'JPEG'
format_str = 'JPEG'
if 'png' == img_format.lower():
format_str = 'PNG'
if 'gif' == img_format.lower():
format_str = 'gif'
if img.mode == "P":
img = img.convert('RGB')
if img.mode == "RGBA":
format_str = 'PNG'
img_format = 'PNG'
output_buffer = BytesIO()
# img.save(output_buffer, format=format_str)
img.save(output_buffer, quality=100, format=format_str)
byte_data = output_buffer.getvalue()
base64_str = 'data:image/' + img_format.lower() + ';base64,' + base64.b64encode(byte_data).decode(coding)
# base64_str = base64.b64encode(byte_data).decode(coding)
return base64_str
# 加载图片
img1 = Image.open(r'E:\Python\lixin_project\OpenAPI接口测试\test_img\44号模型测试图片.jpg')
# 图片转base64
img1_base64 = PIL_base64(img1)
# 验证码识别接口
url = "http://www.detayun.cn/openapi/verify_code_identify/"
data = {
# 用户的key
"key":"",
# 验证码类型
"verify_idf_id":"44",
# 样例图片
"img_base64":img1_base64,
# # 中文点选,空间语义类型验证码的文本描述(这里缺省为空字符串)
}
header = {"Content-Type": "application/json"}
if data['key'] == '':
print('请前往得塔云网站获取key:http://www.detayun.cn')
# 发送请求调用接口
response = requests.post(url=url, json=data, headers=header)
# 获取响应数据,识别结果
print(response.text)
print("耗时:", datetime.datetime.now() - t1)