当前位置:主页 > python教程 > Python使用爬虫抓取美女图片并保存到本地的方法【测试可用】

Python使用爬虫抓取美女图片的代码详解

发布:2020-07-24 13:57:51 130


给网友朋友们带来一篇相关的编程文章,网友段慧心根据主题投稿了本篇教程内容,涉及到Python、爬虫、抓取、美女图片、保存、Python使用爬虫抓取美女图片并保存到本地的方法【测试可用】相关内容,已被782网友关注,涉猎到的知识点内容可以在下方电子书获得。

Python使用爬虫抓取美女图片并保存到本地的方法【测试可用】

本文实例讲述了Python使用爬虫抓取美女图片并保存到本地的方法。分享给大家供大家参考,具体如下:

图片资源来自于www.qiubaichengren.com

代码基于Python 3.5.2

友情提醒:血气方刚的骚年。请

谨慎阅图!
谨慎阅图!!
谨慎阅图!!!

code:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import os
import urllib
import urllib.request
import re
from urllib.error import URLError
class QsSpider:
  def __init__(self):
    self.user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
    self.header = {'User-Agent': self.user_agent}
    self.save_dir = './pic'
    self.url = 'http://www.qiubaichengren.com/%s.html'
  def start(self):
    for i in range(1, 10):
      self.load_html(str(i))
  def load_html(self, page):
    try:
      web_path = self.url % page
      request = urllib.request.Request(web_path, headers=self.header)
      with urllib.request.urlopen(request) as f:
        html_content = f.read().decode('gb2312')
        # print(html_content)
        self.pick_pic(html_content)
    except URLError as e:
      print(e.reason)
    return
  def save_pic(self, img):
    print(img)
    save_path = self.save_dir + "/" + img.replace(':', '@').replace('/', '_')
    if not os.path.exists(self.save_dir):
      os.makedirs(self.save_dir)
    print(save_path)
    urllib.request.urlretrieve(img, save_path)
    pass
  def pick_pic(self, html_content):
    regex = r'src="(http:.*?\.(?:jpg|png|gif))'
    patten = re.compile(regex)
    pic_path_list = patten.findall(html_content)
    for i in pic_path_list:
      self.save_pic(str(i))
      print(i)
spider = QsSpider()
spider.start()

代码运行后可得到如下N多大饱眼福的美女图:

Python使用爬虫抓取美女图片并保存到本地的方法【测试可用】

希望本文所述对大家Python程序设计有所帮助。


参考资料

相关文章

  • python爬虫BeautifulSoup简单使用

    发布:2020-03-10

    文章给大家分享了关于python爬虫的相关实例以及相关代码,有兴趣的朋友们参考下。


  • 详解python爬虫 urllib模块发起post请求

    发布:2020-01-28

    这篇文章主要介绍了python爬虫 urllib模块发起post请求过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下


  • python构建基础的爬虫知识点总结

    发布:2019-06-19

    在本篇内容里小编给大家分享的是关于python构建基础的爬虫教学内容,需要的朋友们学习下。


  • Python3爬虫实现发送天气预报邮件

    发布:2020-01-14

    这篇文章主要给大家介绍了关于Python3爬虫教程之利用Python实现发送天气预报邮件的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友


  • PyV8在Python爬虫中执行js代码的方法

    发布:2020-04-13

    PyV8是chrome用来执行javascript的引擎,据说是最快的js引擎,通过pyv8的封装,可以在python中使用。下面这篇文章主要介绍了使用PyV8在Python爬虫中执行js代码的相关资料,需要的朋友可以参考下。


  • Python实现数据可视化监控爬虫状态

    发布:2019-06-06

    今天主要是来说一下怎么可视化来监控你的爬虫的状态。文中通过实例代码给大家分析了Python实现数据可视化看如何监控你的爬虫状态,感兴趣的朋友一起看看吧


  • python识别爬虫的实例方法

    发布:2019-11-02

    输入式验证码,推荐使用python第三方库tesserocr;滑动式验证码,可使用seleniium;宫格验证码,使用selenium模拟即可。


  • Python爬虫采集遇到403问题怎么办

    发布:2020-02-16

    在python写爬虫的时候,html.getcode()会遇到403禁止访问的问题,这是网站对自动化爬虫的禁止。这篇文章主要介绍了Angular2进阶之如何解决爬虫出现403问题的办法,小编觉得挺不错的,现在分享给大


  • python爬虫需要学哪些东西

    发布:2020-01-27

    学习Python爬虫,首先要掌握Python基础知识,了解爬虫的大概流程:爬取—解析—存储!接下来要学习html和MySQL的相关知识,最后将这些知识综合运用。


网友讨论