Python模拟微博登陆的实例讲解
- 更新时间:2020-03-24 20:45:31
- 编辑:富陶然
今天想做一个微博爬个人页面的工具,满足一些不可告人的秘密。那么首先就要做那件必做之事!模拟登陆……
我对代码进行了优化,重构成了Python 3.6 版本,并且加入了大量注释方便大家学习。
PC 登录新浪微博时, 在客户端用js预先对用户名、密码都进行了加密, 而且在POST之前会GET 一组参数,这也将作为POST_DATA 的一部分。 这样, 就不能用通常的那种简单方法来模拟POST 登录( 比如 人人网 )。
1、在提交POST请求之前, 需要GET 获取两个参数。
地址是:
http://login.sina.com.cn/sso/login.php?client=ssologin.js(v1.3.18)
得到的数据中有 servertime 和 nonce 的值, 是随机的,其他值貌似没什么用。
def get_servertime(): url = 'http://login.sina.com.cn/sso/prelogin.php?entry=weibo&callback=sinaSSOController.preloginCallBack&su=dW5kZWZpbmVk&client=ssologin.js(v1.3.18)&_=1329806375939' # 返回出来的是一个Response对象,无法直接获取,text后,可以通过正则匹配到 # 大概长这样子的:sinaSSOController.preloginCallBack({"retcode":0,"servertime":1545606770, ...}) data = requests.request('GET', url).text p = re.compile('\((.*)\)') try: json_data = p.search(data).group(1) data = json.loads(json_data) servertime = str(data['servertime']) nonce = data['nonce'] return servertime, nonce except: print('获取 severtime 失败!') return None
2、通过httpfox 观察POST 的数据, 参数较复杂,其中 “su" 是加密后的username, sp 是加密后的password。servertime 和 nonce 是上一步得到的。其他参数是不变的。
username 经过了BASE64 计算:
username = base64.encodestring( urllib.quote(username) )[:-1]
password 经过了三次SHA1 加密, 且其中加入了 servertime 和 nonce 的值来干扰。
即: 两次SHA1加密后, 将结果加上 servertime 和 nonce 的值, 再SHA1 算一次。
def get_pwd(pwd, servertime, nonce): # 第一次计算,注意Python3 的加密需要encode,使用bytes pwd1 = hashlib.sha1(pwd.encode()).hexdigest() # 使用pwd1的结果在计算第二次 pwd2 = hashlib.sha1(pwd1.encode()).hexdigest() # 使用第二次的结果再加上之前计算好的servertime和nonce值,hash一次 pwd3_ = pwd2 + servertime + nonce pwd3 = hashlib.sha1(pwd3_.encode()).hexdigest() return pwd3 def get_user(username): # 将@符号转换成url中能够识别的字符 _username = urllib.request.quote(username) # Python3中的base64计算也是要字节 # base64出来后,最后有一个换行符,所以用了切片去了最后一个字符 username = base64.encodebytes(_username.encode())[:-1] return username
3、将参数组织好, POST请求。 这之后还没有登录成功。
POST后得到的内容中包含一句:
location.replace("http://weibo.com/ajaxlogin.php?framelogin=1&callback=parent.sinaSSOController.feedBackUrlCallBack&retcode=101&reason=%B5%C7%C2%BC%C3%FB%BB%F2%C3%DC%C2%EB%B4%ED%CE%F3")
这是登录失败时的结果, 登录成功后结果与之类似, 不过retcode 的值是0 。
接下来再请求这个URL,这样就成功登录到微博了。
记得要提前build 缓存。
以上就是Python模拟微博登陆的方法介绍(附代码)的详细内容,更多请关注码农之家其它相关文章!
相关教程
-
python3+selenium实现126邮箱登陆发送功能
这篇文章主要为大家详细介绍了python3+selenium实现126邮箱登陆并发送邮件功能,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
发布时间:2019-06-11
-
Python装饰器模拟用户登陆验证的实现方法
这篇文章主要介绍了Python使用装饰器模拟用户登陆验证功能,结合登录验证实例形式分析了装饰器的简单使用技巧,需要的朋友可以参考下
发布时间:2020-01-20
-
Python强化学习实战(含源码)
Python强化学习实战:应用OpenAI Gym和TensorFlow精通强化学习和深度强化学习 PDF+源码 增强学习是这种关键的深度学习方式 ,在智能化体及预测分析等行业有很多运用。这书共13章,包括增强学习的
大小:98.5 MBPython电子书
-
Python核心编程
全方位包含现如今应用程序开发中的诸多行业为初级Python开发者出示优秀实践活动方式包含很多好用的编码实例每章结尾的练习题有利于推进所教专业知识 想全面提高Python编程水准?请详细分
大小:22.4 MBPython编程电子书
-
Python自动化运维:技术与最佳实践
这书在我国运维管理行业将有里程碑式的关键实际意义:不仅,它是中国第一本从纵、深和实践活动视角讨论Python在运维管理行业运用的经典著作;不仅这书的创作者是我国运维管理行业的超
大小:150.4 MBPython电子书
-
Python程序设计基础
本书共13章:第1章详细介绍Python基础知识与定义,Python开发工具配备与应用,拓展库安裝与应用;第2章解读Python运算符与关系式及其内嵌涵数的使用方法;第3章解读目录、元组、词典、结合等
大小:39.7 MBPython编程电子书
-
全国计算机等级考试二级教程:Python语言程序设计
这里整理了全国计算机等级考试二级教程-Python语言程序设计2018版,根据教育部考试中心制订的,介绍程序设计的基本方法、Python语言基本语法元素和基本数据类型、程序的控制结构等内容
大小:7.9 MB计算机等级考试电子书
-
Head First Python(第2版)
Python书就该像Python语言一样有趣,本书会带你轻松愉快地学习这种语言,并处理内置数据结构和函数,帮助你迅速成为一名Python程序员,欢迎下载
大小:86.9 MBPython入门电子书
-
可爱的Python
人生短暂,我用Python! 它是CPyuG(汉语Python用户群)的提倡。由于Python一起有着这种不凡魔法:平台的/充电电池内嵌的/面向对象编程的/高級数据类型内嵌的/表述型开发语言的/Pythoni
大小:7 MBPython电子书
-
Python高效开发实战:Django、Tornado、Flask、Twisted
也许你听说过全栈工程师,他们善于设计系统架构,精通数据库建模、通用网络协议、后端并发处理、前端界面设计,在学术研究或工程项目上能独当一面。通过对Python及其周边Web框架的学习
大小:107.6 MBPython电子书
-
Python计算机视觉编程
大小:4.8 MBPython编程电子书