接上节课内容
JS逆向 -- 分析某站buvid3和_uuid的加密过程
JS逆向 -- 分析某站b_lsid值加密过程
一、清除cookie信息,刷新网页,ctrl+f搜索sid,这样找到的数据是在url里或者响应信息里面,全局搜索找到的一般都是在js里面的数据,找到一个v2的数据包,里面有setcookie
二、该数据包是get请求,分析里面的请求数据
https://api.bilibili.com/x/player/wbi/v2?aid=400789390&cid=1119048652&w_rid=b18731f67c5be2da813395f8a884ccdd&wts=1683797034
1、aid和cid
刷新视频页面,ctrl+f搜索aid,发现aid和cid,还有视频阅读量,就在网页源码中,所以可以直接python代码实现
代码实现
import requests
import re
headers = {
'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.75 Safari/537.36'
}
url = 'https://www.bilibili.com/video/BV1TW4y1x73q/?spm_id_from=333.788.recommend_more_video.11'
响应数据 = requests.get(url, headers=headers).text
正则结果 = re.search('"stat":\{"aid":(?P<aid>\d+),"view":(?P<view>\d+),"danmaku', 响应数据)
aid=正则结果.group("aid")
视频播放量=正则结果.group("view")
cid=re.search('"cid":(.*?),"dimension"', 响应数据)
print(aid,cid.group(1),视频播放量)
2、w_rid
w_rid出现了三次,都不一样,我们要的是最下面的值v2里面的w_rid
在关键代码处全部下断
第一次断下
第二次断下
重新ctrl+f重新搜索w_rid,V2数据包中w_rid是第二次断下来的值
重新刷新页面,第二次断下,然后追数据,最后加密值来自于h
h = o()(p + i),p的值是:"aid=945189005&cid=892094702&wts=1684220967"
i第值是固定值:caa9ea6e1ec3e32c3efa79550f4b416a
最后的结果是32位数值,我们猜测是md5加密,经过测试,也确实是md5加密
三、重新构造数据包,实现V2的发送
import requests
import re
import execjs
import time
headers = {
'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.75 Safari/537.36'
}
url = 'https://www.bilibili.com/video/BV1TW4y1x73q/?spm_id_from=333.788.recommend_more_video.11'
响应数据 = requests.get(url, headers=headers).text
正则结果 = re.search('"stat":\{"aid":(?P<aid>\d+),"view":(?P<view>\d+),"danmaku', 响应数据)
aid=正则结果.group("aid")
视频播放量=正则结果.group("view")
cid=re.search('"cid":(.*?),"dimension"', 响应数据)
print(aid,cid.group(1),视频播放量)
def getwrid(aid,cid,r):
node = execjs.get()
fp = open('jiami.js', 'r', encoding='utf8')
ctx = node.compile(fp.read())
a="aid="+aid+"&cid="+cid+"wts="+str(r)+"caa9ea6e1ec3e32c3efa79550f4b416a"
res='MD5_Encrypt("%s")'%(a)
print(res)
return res
url='https://api.bilibili.com/x/player/wbi/v2'
r = int(time.time() * 1000)
print(r)
w_rid=getwrid(aid,cid.group(1),r)
print(w_rid)
参数={
'cid':cid.group(1),
'aid':aid,
'w_rid':w_rid,
'wts':r
}
res=requests.get(url,params=参数,headers=headers)
sid = res.cookies.get_dict()['sid']
print(sid)