当前位置:首页 > 编程教程 > Python技术文章 > Python模拟微博登陆的方法介绍

Python模拟微博登陆的实例讲解

  • 发布时间:
  • 作者:码农之家
  • 点击:79

这篇文章主要知识点是关于Python、模拟登陆、的内容,如果大家想对相关知识点有系统深入的学习,可以参阅以下电子书

精通Python网络爬虫
  • 类型:Python爬虫大小:108.6 MB格式:PDF作者:韦玮
立即下载

Python模拟微博登陆的方法介绍

本篇文章给大家带来的内容是关于Python模拟微博登陆的方法介绍(附代码),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。

 

今天想做一个微博爬个人页面的工具,满足一些不可告人的秘密。那么首先就要做那件必做之事!模拟登陆……

我对代码进行了优化,重构成了Python 3.6 版本,并且加入了大量注释方便大家学习。

PC 登录新浪微博时, 在客户端用js预先对用户名、密码都进行了加密, 而且在POST之前会GET 一组参数,这也将作为POST_DATA 的一部分。 这样, 就不能用通常的那种简单方法来模拟POST 登录( 比如 人人网 )。

1、在提交POST请求之前, 需要GET 获取两个参数。
地址是:

http://login.sina.com.cn/sso/login.php?client=ssologin.js(v1.3.18)

得到的数据中有 servertime 和 nonce 的值, 是随机的,其他值貌似没什么用。

def get_servertime():
   url = 'http://login.sina.com.cn/sso/prelogin.php?entry=weibo&callback=sinaSSOController.preloginCallBack&su=dW5kZWZpbmVk&client=ssologin.js(v1.3.18)&_=1329806375939'
   # 返回出来的是一个Response对象,无法直接获取,text后,可以通过正则匹配到
   # 大概长这样子的:sinaSSOController.preloginCallBack({"retcode":0,"servertime":1545606770, ...})
   data = requests.request('GET', url).text
   p = re.compile('\((.*)\)')
   try:
       json_data = p.search(data).group(1)
       data = json.loads(json_data)
       servertime = str(data['servertime'])
       nonce = data['nonce']
       return servertime, nonce
   except:
       print('获取 severtime 失败!')
       return None

2、通过httpfox 观察POST 的数据, 参数较复杂,其中 “su" 是加密后的username, sp 是加密后的password。servertime 和 nonce 是上一步得到的。其他参数是不变的。

username 经过了BASE64 计算:

username = base64.encodestring( urllib.quote(username) )[:-1]

password 经过了三次SHA1 加密, 且其中加入了 servertime 和 nonce 的值来干扰。
即: 两次SHA1加密后, 将结果加上 servertime 和 nonce 的值, 再SHA1 算一次。

def get_pwd(pwd, servertime, nonce):
   # 第一次计算,注意Python3 的加密需要encode,使用bytes
   pwd1 = hashlib.sha1(pwd.encode()).hexdigest()
   # 使用pwd1的结果在计算第二次
   pwd2 = hashlib.sha1(pwd1.encode()).hexdigest()
   # 使用第二次的结果再加上之前计算好的servertime和nonce值,hash一次
   pwd3_ = pwd2 + servertime + nonce
   pwd3 = hashlib.sha1(pwd3_.encode()).hexdigest()
   return pwd3


def get_user(username):
   # 将@符号转换成url中能够识别的字符
   _username = urllib.request.quote(username)
   # Python3中的base64计算也是要字节
   # base64出来后,最后有一个换行符,所以用了切片去了最后一个字符
   username = base64.encodebytes(_username.encode())[:-1]
   return username

3、将参数组织好, POST请求。 这之后还没有登录成功。

POST后得到的内容中包含一句:

location.replace("http://weibo.com/ajaxlogin.php?framelogin=1&callback=parent.sinaSSOController.feedBackUrlCallBack&retcode=101&reason=%B5%C7%C2%BC%C3%FB%BB%F2%C3%DC%C2%EB%B4%ED%CE%F3")

这是登录失败时的结果, 登录成功后结果与之类似, 不过retcode 的值是0 。

接下来再请求这个URL,这样就成功登录到微博了。
记得要提前build 缓存。

Python模拟微博登陆的方法介绍(附代码)

以上就是Python模拟微博登陆的方法介绍(附代码)的详细内容,更多请关注码农之家其它相关文章!

以上就是本次给大家分享的关于java的全部知识点内容总结,大家还可以在下方相关文章里找到相关文章进一步学习,感谢大家的阅读和支持。

您可能感兴趣的文章:

  • python3+selenium实现126邮箱登陆发送功能
  • Python装饰器模拟用户登陆验证的实现方法
  • Python 相关电子书
    学习笔记
    网友NO.972328

    python抓取需要扫微信登陆页面

    一,抓取情况描述 1.抓取的页面需要登陆,以公司网页为例,登陆网址https://app-ticketsys.hezongyun.com/index.php ,(该网页登陆方式微信扫码登陆) 2.需要抓取的内容如下图所示: 需要提取 工单对应编号,如TK-2960 工单发起时间,如2018-08-17 11:12:13 工单标题内容,如设备故障 工单正文内容,如最红框所示 二,网页分析 1.按按Ctrl + Shift + I或者鼠标右键点击检查进入开发人员工具。 可以看到页面显示如下: 主要关注点如上图框住和划线处 首先点击网络,记住以下信息将用于代码修改处。 Resquest URL:https: //app-ticketsys.hezongyun.com/index.php/ticket/ticket_list/init这个是需要爬取页面的信息请求Menthod:GET饼干:用于需要登陆页面User-Agent:Mozilla / 5.0(Windows NT 10.0; Win64; x64)AppleWebKit / 537.36(KHTML,类似Gecko)Chrome / 67.0.3396.62 Safari / 537.36 记住以上信息后粗略了解网页树形结……

    网友NO.739427

    分享利用python的Tkinter编写登陆注册实例

    这篇文章主要为大家详细介绍了基于python的Tkinter编写登陆注册界面,具有一定的参考价值,感兴趣的小伙伴们可以参考一下 tkinter创建登陆注册界面,供大家参考,具体内容如下 import tkinter as tkfrom tkinter import messagebox #设置窗口居中def window_info(): ws = window.winfo_screenwidth() hs = window.winfo_screenheight() x = (ws / 2) - 200 y = (hs / 2) - 200 print(%d,%d % (ws, hs)) return x,y #设置登陆窗口属性window = tk.Tk()window.title('欢迎使用停车场收费系统')a,b=window_info()window.geometry(450x300+%d+%d%(a,b)) #登陆界面的信息tk.Label(window,text=停车场收费系统,font=(宋体,32)).place(x=80,y=50)tk.Label(window,text=账号:).place(x=120,y=150)tk.Label(window,text=密码:).place(x=120,y=190)#显示输入框var_usr_name = tk.StringVar()#显示默认账号var_usr_name.set('1400370101')entry_usr_name=tk.Entry(window,textvariable=var_usr_name)entry_usr_name.place(x=190,y=150)var_usr_pwd ……

    网友NO.603537

    如何使用Python的Requests包实现模拟登陆

    这篇文章主要为大家详细介绍了使用Python的Requests包模拟登陆,具有一定的参考价值,感兴趣的小伙伴们可以参考一下 前段时间喜欢用python去抓一些页面玩,但都基本上都是用get请求一些页面,再通过正则去过滤。 今天试了一下,模拟登陆个人网站。发现也比较简单。读懂本文需要对http协议和http会话有一定的理解。 注明: 因为模拟登陆的是我的个人网站,所以以下代码对个人网站和账号密码做了处理。 网站分析 爬虫的必备第一步,分析目标网站。这里使用谷歌浏览器的开发者者工具分析。 通过登陆抓取,看到这样一个请求。 上方部分为请求头,下面部分为请求是传的参数。由图片可以看出,页面通过表单提交了三个参数。分别为_csrf,usermane,password。 其中csrf是为了预防跨域脚本伪造。原理很简单,就是每一次请求,服务器生成一串加密字符串。……

    网友NO.417326

    Python 模拟登陆的两种实现方法

    Python 模拟登陆的两种实现方法 有时候我们的抓取项目时需要登陆到某个网站上,才能看见某些内容的,所以模拟登陆功能就必不可少了,散仙这次写的文章,主要有2个例子,一个是普通写法写的,另外一个是基于面向对象写的。 模拟登陆的重点,在于找到表单真实的提交地址,然后携带cookie,post数据即可,只要登陆成功,我们就可以访问其他任意网页,从而获取网页内容。 方式一: import urllib.request import urllib.parse import http.cookiejar #post的内容 values={ 'logon.x':'linke', 'password':'xxxx', 'username':'xxxxx' } #登陆的地址 logUrl="http://192.168.32.112:8080/templates/index/hrlogon.do" #构建cook cook=http.cookiejar.CookieJar() #构建openner openner=urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cook)) #添加headers openner.addheaders = [('User-agent', 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like G……

    <
    1
    >

    Copyright 2018-2021 www.xz577.com 码农之家

    版权投诉 / 书籍推广 / 赞助:520161757@qq.com