Python抓包分析
抓包分析技术精讲
2. Fiddler安装与使用简介
3.使用Fiddler抓取HTTPS协议的网页
4.使用抓包分析获取腾讯视频评论数据
# 1, Fiddler安装与使用简介
Fiddler工作原理:所谓的抓包就是将访问网页的细节展示出来。
findall相当于代理服务器,IP:127.0.0.1,端口:8888
1)安装:下载,点击exe安装
2)配置:
安装后,最好找一个浏览器与fiddler搭配使用,以下以火狐为例,需要设置浏览器网络配置
选项,搜索网络:找到连接设置:手动代理配置,http代理=127.0.01,端口=8888
>左侧显示,所有访问的细节
>左侧下方,命令输入栏,最常用的命令clear,清掉链接
左侧选中一条后,右侧展示这一条相关的信息
右侧选中[Inspectors]右侧分上下两部分
>右侧上方:显示的是请求,网页请求(Request)
Headders:请求的头信息
textview:具体信息
>右侧下方:显示返回来的的响应
有时显示:Responsebody is encoded, Click to decode.(需要点击一下解码)
Headders:显示头信息
textview:显示返回的具体信息(网页的源代码)
3,如果用fiddler抓取https网页
1,从fiddler中导出一个证书:菜单-tools-(Telerik Fiddler)Option
打开https页,全部选中
然后点击右侧按钮:atctions,点击展开的Export Root Certificate to Desktop
2,安装到浏览器中
选项,搜索证书,点击【查看证书】-选择证书颁发机构,在下方选择导入,选中导出的文件,后导入成功。
点击确定。
3,重启fiddler和浏览器。
如果还出现问题参考博文:https://weibo.com/ttarticle/p/show?id=2309404103263770292716
4,使用抓包分析获取腾讯视频评论数据
目标站点: https://v.qq.com
目标数据:某部电影或电视剧的评论数据
要求:实现自动加载新评论
接下来进入实战介绍。
进入网站,打开电影,下面好多评论,打开网页源数据,查看评论内容,发现没有。
说明网站做了隐藏,这时候就需要使用抓包工具。
-点击加载评论,但网址没变。
1)把网址放到火狐浏览器中
2)fiddler中清掉clear,
import urllib.request
import re
cid="6375489932584768380"
for i in range(0,10):
print("第"+str(i+1)+"页的评论数据")
url="https://video.coral.qq.com/varticle/2461939412/comment/v2?caIIback=_var" # +str(cid)+
data=urllib.request.urlopen(urI).read().decode("utf-8","ignore")
pat1='"content":"(.*?)"'
comment=re.compile(pat1,re.S).findall(data)
for item in comment:
print(eval('u"'+str(item)+'"'))
print("------")
pat2='"last":"(.*?)"'
cid=re.compile(pat2,re.S).findall(data)[0]end;
Tag: Python 抓包 Fiddler