Python项目案例开发从入门到实战:爬虫、游戏和机器学习(从入门到实战·微课视频)

  • 更新时间:
  • 8425人关注
  • 点击下载

这是一个不错的Python案例类学习资源,由戌丝微提供,主要知识点是关于Python项目案例开发、入门到实战、爬虫、Python案例的内容,已被815人关注,同类资源中评分为7.6分。

Python项目案例开发从入门到实战以Python 3.5为编程环境,从基本的程序设计思想入手,逐步展开Python语言教学,是一本面向广大编程学习者的程序设计类图书。本书以案例带动知识点的讲解,将Python知识点分解到各个不同的案例,每个案例各有侧重点,同时展示实际项目的设计思想和设计理念,使读者可以举一反三。

案例具有实用性,例如校园网搜索引擎、小小翻译器、抓取百度图片这些爬虫案例略加修改可以应用到实际项目中;还有通过微信通信协议开发微信机器人、机器学习的文本分类、基于卷积神经网络的手写体识别等案例;另外是一些大家耳熟能详的游戏案例,例如连连看、推箱子、中国象棋、网络五子棋、两人麻将、人物拼图和飞机大战等游戏。通过本书,读者将掌握Python编程技术和技巧,学会面向对象的设计方法,了解程序设计的所有相关内容。本书不仅为读者列出了完整的代码,同时对所有的源代码都进行了非常详细的解释,通俗易懂、图文并茂。扫描每章提供的二维码可观看知识点的视频讲解。

适用于Python语言学习者、程序设计人员和游戏编程爱好者。

目录

  • 第1章 Python基础知识
  • 第2章 序列应用——猜单词游戏
  • 第3章 数据库应用——智力问答测试
  • 第4章 调用百度API应用——小小翻译器
  • 第5章 爬虫应用——校园网搜索引擎
  • 第6章 爬虫应用——抓取百度图片
  • 第7章 itchat应用——微信机器人
  • 第8章 微信网页版协议应用——微信机器人
  • 第9章 图像处理——生成二维码和验证码
  • 第10章 益智游戏——连连看游戏
  • 第11章 益智游戏——推箱子游戏
  • 第12章 娱乐游戏——两人麻将游戏
  • 第13章 网络编程案例——基于TCP的在线聊天程序
  • 第14章 网络通信案例——基于UDP的网络五子棋
  • 第15章 益智游戏——中国象棋
  • 第16章 娱乐游戏——人物拼图游戏
  • 第17章 基于Pygame的游戏设计
  • 第18章 机器学习案例——基于朴素贝叶斯算法的
  • 第19章 深度学习案例——基于卷积神经网络的
  • 第20章 词云实战——爬取豆瓣影评生成词云
精选笔记:Python 数据的累加与统计的示例代码

13小时44分钟前回答

问题

你需要处理一个很大的数据集并需要计算数据总和或其他统计量。

解决方案

对于任何涉及到统计、时间序列以及其他相关技术的数据分析问题,都可以考虑使用 Pandas库 。

为了让你先体验下,下面是一个使用Pandas来分析芝加哥城市的 老鼠和啮齿类动物数据库 的例子。 在我写这篇文章的时候,这个数据库是一个拥有大概74,000行数据的CSV文件。

>>> import pandas

>>> # Read a CSV file, skipping last line
>>> rats = pandas.read_csv('rats.csv', skip_footer=1)
>>> rats
<class 'pandas.core.frame.DataFrame'>
Int64Index: 74055 entries, 0 to 74054
Data columns:
Creation Date 74055 non-null values
Status 74055 non-null values
Completion Date 72154 non-null values
Service Request Number 74055 non-null values
Type of Service Request 74055 non-null values
Number of Premises Baited 65804 non-null values
Number of Premises with Garbage 65600 non-null values
Number of Premises with Rats 65752 non-null values
Current Activity 66041 non-null values
Most Recent Action 66023 non-null values
Street Address 74055 non-null values
ZIP Code 73584 non-null values
X Coordinate 74043 non-null values
Y Coordinate 74043 non-null values
Ward 74044 non-null values
Police District 74044 non-null values
Community Area 74044 non-null values
Latitude 74043 non-null values
Longitude 74043 non-null values
Location 74043 non-null values
dtypes: float64(11), object(9)

>>> # Investigate range of values for a certain field
>>> rats['Current Activity'].unique()
array([nan, Dispatch Crew, Request Sanitation Inspector], dtype=object)
>>> # Filter the data
>>> crew_dispatched = rats[rats['Current Activity'] == 'Dispatch Crew']
>>> len(crew_dispatched)
65676
>>>

>>> # Find 10 most rat-infested ZIP codes in Chicago
>>> crew_dispatched['ZIP Code'].value_counts()[:10]
60647 3837
60618 3530
60614 3284
60629 3251
60636 2801
60657 2465
60641 2238
60609 2206
60651 2152
60632 2071
>>>

>>> # Group by completion date
>>> dates = crew_dispatched.groupby('Completion Date')
<pandas.core.groupby.DataFrameGroupBy object at 0x10d0a2a10>
>>> len(dates)
472
>>>

>>> # Determine counts on each day
>>> date_counts = dates.size()
>>> date_counts[0:10]
Completion Date
01/03/2011 4
01/03/2012 125
01/04/2011 54
01/04/2012 38
01/05/2011 78
01/05/2012 100
01/06/2011 100
01/06/2012 58
01/07/2011 1
01/09/2012 12
>>>

>>> # Sort the counts
>>> date_counts.sort()
>>> date_counts[-10:]
Completion Date
10/12/2012 313
10/21/2011 314
09/20/2011 316
10/26/2011 319
02/22/2011 325
10/26/2012 333
03/17/2011 336
10/13/2011 378
10/14/2011 391
10/07/2011 457
>>>

嗯,看样子2011年10月7日对老鼠们来说是个很忙碌的日子啊!^_^

讨论

Pandas是一个拥有很多特性的大型函数库,我在这里不可能介绍完。 但是只要你需要去分析大型数据集合、对数据分组、计算各种统计量或其他类似任务的话,这个函数库真的值得你去看一看。

以上就是Python 数据的累加与统计的方法的详细内容,更多关于Python 数据的累加与统计的资料请关注码农之家其它相关文章!

展开阅读

相关资源

  • Python 全栈开发之数据分析

    大数据时代,数据的重要性不言而喻,掌握数据者得天下。很多同学可能对一堆数据不知如何进行处理分析得到有用的信息,本文详细的介绍了数据分析的三剑客numpy,pandas,matplotlib。 Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。它主要用来回事图形,用来展现一些数据,更加直观的展示,让你第一眼就只要数据的呈现趋势 NumPy 是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大

    大小:21.6 MBPython

    立即下载
  • 物联网Python开发实战

    物联网Python开发实战

    本书在介绍物联网的组成、典型架构和应用的基础上,采用实例代码讲述python编程基础和应用实例,感兴趣的可以下载学习

    大小:80.7 MB物联网

    立即下载
  • Python程序设计开发宝典

    Python程序设计开发宝典

    本书深入剖析Python 3.5.x、Python 3.6.x及更新版本的内置对象和标准库对象高级用法,150个案例源代码和超过1000个演示性代码片段,可以作为Python程序设计教材

    大小:42.8 MBPython

    立即下载
  • Python3程序开发指南

    Python3程序开发指南

    本书全面深入地讲解了Python语言,讲述了构成Python语言的8个关键要素,包含数据类型、控制结构与函数、模块、正则表达式、GUI程序设计等各个方面

    大小:419.2 MBPython

    立即下载
  • Python3网络爬虫开发实战

    Python3网络爬虫开发实战

    本书教你学会如何用Python 3开发爬虫,通过多个案例介绍了不同场景下如何实现数据爬取,最后介绍了pyspider框架、Scrapy框架和分布式爬虫等

    大小:375.5 MBPython爬虫

    立即下载
  • Python项目开发案例集锦:实战项目代码+配套文件

    Python项目开发案例集锦:实战项目代码+配套文件

    Python项目开发案例集锦 涵盖8个开发方向、23个项目,循序渐进地让读者在实践中学习,在实践中提升实际开发能力。 全书共8篇:控制台程序、小游戏、实用小工具、网络爬虫、数据分析、人工智能、Web开发和微信小程序,内容包括:学生信息管理系统、企业编码生成系统、简易五子棋游戏(控制台版)、玛丽冒险、彩图版飞机大战、DIY字符画、超级画板、Word助手、图片批量处理器、RCQ读者书库、火车票分析助手、高德地图+58租房、开心麻花影视作品分

    大小:1.05 GBPython

    立即下载
  • Python测试驱动开发(第2版)

    Python测试驱动开发(第2版)

    这本书从最基础的知识开始,讲解Web开发的整个流程,展示如何使用Python做测试驱动开发,全部使用Python 3,并针对新版Django全面升级,欢迎下载

    大小:12.4 MBPython开发

    立即下载

学习笔记

1小时3分钟前回答

python中有关数据结构如何链表的详解

下面小编就为大家带来一篇python数据结构之链表的实例讲解。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧 在程序中,经常需要将⼀组(通常是同为某个类型的)数据元素作为整体 管理和使⽤,需要创建这种元素组,⽤变量记录它们,传进传出函数等。 ⼀组数据中包含的元素个数可能发⽣变化(可以增加或删除元素)。 对于这种需求,最简单的解决⽅案便是将这样⼀组元素看成⼀个序列,⽤ 元素在序列⾥的位置和顺序,表示实际应⽤中的某种有意义的信息,或者 表示数据之间的某种关系。 这样的⼀组序列元素的组织形式,我们可以将其抽象为线性表。⼀个线……

13小时52分钟前回答

python调用百度语音识别实现大音频文件语音识别功能

本文为大家分享了python实现大音频文件语音识别功能的具体代码,供大家参考,具体内容如下 实现思路:先用ffmpeg将其他非wav格式的音频转换为wav格式,并转换音频的声道(百度支持声道为1),采样率(值为8000),格式转换完成后,再用ffmpeg将音频切成百度。 支持的时长(30秒和60秒2种,本程序用的是30秒)。 # coding: utf-8import jsonimport timeimport base64from inc import rtysdbimport urllib2import requestsimport osimport uuidfrom inc import db_config class BaiduRest: def __init__(self, cu_id, api_key, api_secert): self.token_url = "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentialsclient_secret=%s" self.getvoice_url = "http://tsn.baidu.com/text2audio?tex=%scuid=%st……