标签分类
当前位置:首页 > 其它计算机电子书 > Pandas电子书网盘下载
Pandas Cookbook 中文参考手册 Pandas Cookbook 中文参考手册
流水不毒

流水不毒 提供上传

资源
17
粉丝
28
喜欢
204
评论
14

    Pandas Cookbook 中文参考手册 PDF 影印版

    Pandas电子书
    • 发布时间:

    给大家带来的一篇关于Pandas相关的电子书资源,介绍了关于Pandas、Cookbook方面的内容,本书是由Packt Publishing出版,格式为PDF,资源大小38.1 MB,Theodore Petrou编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:7.8,更多相关的学习资源可以参阅 其它计算机电子书、等栏目。

  • Pandas Cookbook 中文参考手册 PDF 下载
  • 下载地址:https://pan.baidu.com/s/1ucwVkO93kFaefVv0AQPgTw
  • 分享码:wjj9
  • Pandas Cookbook 中文参考手册

    读者评价

    pandas是Python在数据分析领域中的一颗明星,pandas 中文手册,便于初学者大致了解pandas大致功能。

    相较于《利用Python进行数据分析》,本书最大的特点是所有操作都变成了分解动作,而且每步都有详细讲解。但是,书写的有点啰嗦。

    读书笔记

    pandas 透视表中文字段排序方法

    前几天有一个需求,透视表中的年级这一列要按照一年级,二年级这样的序列进行排序,但是用过透视表的人都知道,透视表对中文的排序不是太理想,放弃pandas自带的排序方法。测试了很久,想到一个办法。先把dataframe中需要特殊排序的列中的汉字转换成数字,然后生成透视表,生成透视表之后,再把透视表的index或者columns中的数字替换成相应的汉字,透视表的结果就会按照你想要的顺序进行排序。

     def get_special_sort_data(self, groupby, columns):
     # 获取需要特殊处理的字段的信息
     special_sort_cols = None
     cols_in_index_or_column = None # 判断特殊排序字段在index还是column中
     if self.datasource.has_special_sort_cols:
      # 获取表需要处理的特殊字段信息
      special_sort_cols = self.datasource.get_sort_columns() # {"grade_name": {}}
    
      if special_sort_cols:
      i_intersection = list(set(groupby) & set(special_sort_cols.keys()))
      c_intersection = list(set(columns) & set(special_sort_cols.keys()))
      if i_intersection:
       cols_in_index_or_column = ('index', i_intersection)
      elif c_intersection:
       cols_in_index_or_column = ('column', c_intersection)
     return cols_in_index_or_column, special_sort_cols
    cols_in_index_or_column, special_sort_cols = self.get_special_sort_data(groupby, columns) # special_sort_cols:{"grade_name": {"一年级": 1, "二年级":2, "三年级": 3 ....}}
    
    if cols_in_index_or_column:
     for col in cols_in_index_or_column[1]:
     df[col] = df[col].replace(special_sort_cols.get(col)) # 替换df
    
    # 获取透视表
    if cols_in_index_or_column:
     if cols_in_index_or_column[0] == 'index':
      if len(groupby) == 1:
       col_name = cols_in_index_or_column[1][0]
       sort_info = special_sort_cols.get(col_name)
       r_sort_info = {v:k for k, v in zip(sort_info.keys(), sort_info.values())}
       index_1 = df.index.tolist()
       index_1 = [r_sort_info.get(item) for item in index_1]
       df.index = Index(index_1, name=df.index.name)
      else:
       for item in cols_in_index_or_column[1]:
       ix = df.index.names.index(item)
       index_1 = df.index.levels[ix].tolist()
       sort_info = special_sort_cols.get(item)
       r_sort_info = {v: k for k, v in zip(sort_info.keys(), sort_info.values())}
       index_1 = [r_sort_info.get(item) for item in index_1]
       df.index = df.index.set_levels(index_1, level=ix)
     else:
      for item in cols_in_index_or_column[1]:
      ix = df.columns.names.index(item)
      col_1 = df.columns.levels[ix].tolist()
      sort_info = special_sort_cols.get(item)
      r_sort_info = {v: k for k, v in zip(sort_info.keys(), sort_info.values())}
      col_1 = [r_sort_info.get(item) for item in col_1]
      df.columns = df.columns.set_levels(col_1, level=ix)
    

    以上这篇pandas 透视表中文字段排序方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持码农之家。

    上一篇:Office 2019办公应用实战从入门到精通  下一篇:游戏开发的数学和物理

    展开 +

    收起 -

    Pandas相关电子书
    学习笔记
    网友NO.196240

    pandas使用apply多列生成一列数据的实例

    如下所示: import pandas as pddef my_min(a, b): return min(abs(a),abs(b)) s = pd.Series([10.0247,10.0470, 10.0647,10.0761,15.0800,10.0761,10.0647,10.0470,10.0247,10.0,9.9753,9.9530,9.9353,9.9239,18.92,9.9239,9.9353,9.9530,9.9753,10.0])df = pd.DataFrame(s)df.columns=['value']df['val_1'] = df['value'].diff()df['val_2'] = df['val_1'].shift(-1)df['val'] = df.apply(lambda row: my_min(row['val_1'], row['val_2']), axis=1) 以上这篇pandas使用apply多列生成一列数据的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持码农之家。 ……

    网友NO.238619

    Python3.5 Pandas模块中Series用法详解

    本文实例讲述了Python3.5 Pandas模块之Series用法。分享给大家供大家参考,具体如下: 1、Pandas模块引入与基本数据结构 2、Series的创建 #!/usr/bin/env python# -*- coding:utf-8 -*-# Author:ZhengzhengLiu#模块引入import numpy as npimport pandas as pdfrom pandas import Series,DataFrame#1.Series通过numpy一维数组创建print(=========Series通过numpy一维数组创建==========)arr = np.array([1,2,3,4,5])s1 = pd.Series(arr)print(s1)print(s1.index)print(s1.values)#2.Series直接通过一维数组创建print(=========Series直接通过一维数组创建==========)s2 = pd.Series([10.5,20,38,40])print(s2)#修改索引值s2.index = [a,b,c,d]print(s2)#Series通过一维数组创建,可以在创建的同时自定义索引值,# 也可以之后通过赋值的形式去修改print(=========Series创建的同时自定义索引值和数据类型==========)s3 = pd.Series(data=[89,78,90,87],dtype=np.float64, index=[语文,数学,英语,科学])print(s3)#3.Series通过字典创建,字典的键对应索引,值对应数据print(=========Series通过字典创建==========)dict = {a:1,b:2,c:3,d:4}s4 = pd.Series(dict)print(s4) 运行结果: =========Series通过numpy一维数组创建========== 0 1 1 2 2 3 3 4 4 5 dtype: int32 RangeIndex(start=0, stop=5, step=1) [1 2 3 4 5] =========Series直接通过一维数组创建========== 0 10.5 1 20.0 2 38.0 3 40.0 dtype: float64 a 10.5 b 20.0 c 38.0 d 40.0 dtype: float64 =========Series创建的同时自定……

    网友NO.730395

    对pandas处理json数据的方法详解

    今天展示一个利用pandas将json数据导入excel例子,主要利用的是pandas里的read_json函数将json数据转化为dataframe。 先拿出我要处理的json字符串: strtext='[{"ttery":"min","issue":"20130801-3391","code":"8,4,5,2,9","code1":"297734529","code2":null,"time":1013395466000},\{"ttery":"min","issue":"20130801-3390","code":"7,8,2,1,2","code1":"298058212","code2":null,"time":1013395406000},\{"ttery":"min","issue":"20130801-3389","code":"5,9,1,2,9","code1":"298329129","code2":null,"time":1013395346000},\{"ttery":"min","issue":"20130801-3388","code":"3,8,7,3,3","code1":"298588733","code2":null,"time":1013395286000},\{"ttery":"min","issue":"20130801-3387","code":"0,8,5,2,7","code1":"298818527","code2":null,"time":1013395226000}]' pandas.read_json的语法如下: pandas.read_json(path_or_buf=None, orient=None, typ='frame', dtype=True, convert_axes=True, convert_dates=True, keep_default_dates=True, numpy=False, precise_float=False, date_unit=None, encoding=None, lines=False, chunksize=None, compression='infer') 第一参数就是json文件路径或者json格式的字符串。 第二参数orient是表明预期的json字符串格式。orient的设置有以下几个值: (1).'split' : dict like {index - [index], columns - [columns], data - [values]} 这种就是有索引,有列字段,和数据矩阵构成的json格式。key名称只能是index,columns和data。 'records' : list like [{column - value}, ... , {column - value}] 这种就是成员为字典的……

    Copyright 2018-2019 xz577.com 码农之家

    版权责任说明