标签分类
技术文章
当前位置:主页 > 计算机编程 > python > pandas修改DataFrame列名的方法介绍

pandas修改DataFrame列名的实例代码

  • 发布时间:
  • 作者:码农之家原创
  • 点击:205

pandas修改DataFrame列名的方法介绍

这篇文章主要知识点是关于python,pandas,pandas修改DataFrame列名的方法介绍,Python pandas.DataFrame调整列顺序及修改index名的方法 的内容,如果大家想对相关知识点有系统深入的学习,可以参阅以下电子书

跟老齐学Python:轻松入门
  • 类型:Python大小:46.6 MB格式:PDF出版:电子工业出版社作者:齐伟
立即下载

本篇文章给大家带来的内容是关于pandas修改DataFrame列名的方法介绍(代码示例),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。

本文参考自:pandas 修改 DataFrame 列名
原博客针对每个DataFrame.columns中的元素做相同的修改操作
而拙作是对每个元素做不同操作的生搬硬套, 请大家不吝赐教

提出问题

存在一个名为dataset的DataFrame

>>> dataset.columns
Index(['age', 'job', 'marital', 'education', 'default', 'housing', 'loan',
       'contact', 'month', 'day_of_week', 'duration', 'campaign', 'pdays',
       'previous', 'poutcome', 'emp.var.rate', 'cons.price.idx',
       'cons.conf.idx', 'euribor3m', 'nr.employed', 'y'],
      dtype='object')

现在, 我要将其columns名字改为:

>>> new_columns
Index(['age_0', 'job_1', 'marital_2', 'education_3', 'default_4', 'housing_5',
       'loan_6', 'contact_7', 'month_8', 'day_of_week_9', 'duration_10',
       'campaign_11', 'pdays_12', 'previous_13', 'poutcome_14',
       'emp.var.rate_15', 'cons.price.idx_16', 'cons.conf.idx_17',
       'euribor3m_18', 'nr.employed_19', 'y_20'],
      dtype='object')

该如何操作?

解决

一.通过DataFrame.columns类的自身属性修改:

1.无脑赋值直接修改

>>> # 先解决`new_columns`的推导问题
>>> # 列表推导
>>> new_columns_list = [column_str+'_'+str(i) for i ,column_str in enumerate(dataset.columns)]
>>> # 类型转换
>>> new_columns = pd.core.indexes.base.Index(new_columns_list)
>>> dataset.columns = new_columns

2.通过.map(mapper, na_action=None)函数来修改

>>> # 注:mapper 多运用 lambda 表达式
>>> # 但我似乎没有找到在 lambda 表达式中改变两个值的方法
>>> # 所以只能蹩脚地用一个全局变量i, 和映射函数mapper()
>>> # 希望大家能帮我找到方法

>>> i = 0
>>> def mapper(x): # 映射函数即 mapper
    global i
    x += '_' + str(i)
    i += 1
    return x
>>> dataset.columns.map(mapper)

3.参考博客用到了DataFrame.columns.str对象

help(DataFrame.columns.str)翻遍了文档,
也没能找到可以被我拿来套用的方法, 想着抽时间把这段文档翻译一下

二.通过DataFrame.rename()函数来修改

1.暴力字典法(好处:可以只修改特定的列)

>>> # 此处先用字典推导法
>>> new_dict = {
    key:key+'_'+str(i)
    for i, key in enumerate(dataset.columns)
    }
>>> dataset.rename(columns=new_dict, inplace=True)

2.映射修改法

>>> # 原博文依然用到了 lambda 表达式
>>> # 我就再生搬硬套一次, 把上面的复制过来
>>> # 蹩脚地用一个全局变量i, 和映射函数mapper()

>>> i = 0
>>> def mapper(x): # 映射函数即 mapper
    global i
    x += '_' + str(i)
    i += 1
    return x
dataset.rename(columns=mapper, inplace=True)

稍微总结一下 : 字典推导和列表推导的使用方法很类似, 最大的区别是选择中括号还是大括号

Python pandas.DataFrame调整列顺序及修改index名的方法

1. 从字典创建DataFrame

>>> import pandas
>>> dict_a = {'user_id':['webbang','webbang','webbang'],'book_id':['3713327','4074636','26873486'],'rating':['4','4','4'],'mark_date':['2017-03-07','2017-03-07','2017-03-07']}
>>> df = pandas.DataFrame(dict_a) # 从字典创建DataFrame
>>> df # 创建好的df列名默认按首字母顺序排序,和字典中的先后顺序并不一样,字典中是'user_id','book_id','rating','mark_date'
 book_id mark_date rating user_id
0 3713327 2017-03-07  4 webbang
1 4074636 2017-03-07  4 webbang
2 26873486 2017-03-07  4 webbang

2. 调整列顺序

>>> df = df[['user_id','book_id','rating','mark_date']] # 调整列顺序为'user_id','book_id','rating','mark_date'
>>> df
 user_id book_id rating mark_date
0 webbang 3713327  4 2017-03-07
1 webbang 4074636  4 2017-03-07
2 webbang 26873486  4 2017-03-07

3. 调整index为从1开始

>>> df.index = range(1,len(df) + 1) # 将index改成从1开始
>>> df
 user_id book_id rating mark_date
1 webbang 3713327  4 2017-03-07
2 webbang 4074636  4 2017-03-07
3 webbang 26873486  4 2017-03-07

DataFrame操作汇总:https://www.jb51.net/article/163645.htm

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持码农之家。

以上就是本次给大家分享的全部知识点内容总结,大家还可以在下方相关文章里找到等python文章进一步学习,感谢大家的阅读和支持。

上一篇:python3安装pip方法和代码

下一篇:python表示根号运算的方法

展开 +

收起 -

学习笔记
网友NO.375894

pandas.DataFrame删除/选取含有特定数值的行或列实例

1.删除/选取某列含有特殊数值的行 import pandas as pdimport numpy as np a=np.array([[1,2,3],[4,5,6],[7,8,9]])df1=pd.DataFrame(a,index=['row0','row1','row2'],columns=list('ABC'))print(df1)df2=df1.copy() #删除/选取某列含有特定数值的行#df1=df1[df1['A'].isin([1])]#df1[df1['A'].isin([1])] 选取df1中A列包含数字1的行 df1=df1[~df1['A'].isin([1])]#通过~取反,选取不包含数字1的行print(df1) 运行结果: 2.删除/选取某行含有特殊数值的列 #删除/选取某行含有特定数值的列cols=[x for i,x in enumerate(df2.columns) if df2.iat[0,i]==3]#利用enumerate对row0进行遍历,将含有数字3的列放入cols中print(cols) #df2=df2[cols] 选取含有特定数值的列df2=df2.drop(cols,axis=1) #利用drop方法将含有特定数值的列删除print(df2) 运行结果: 3.删除含有空值的行或列 实现思路:利用pandas.DateFrame.fillna对空值赋予特定值,再利用上文介绍的方法找到这些含有特定值的行或列去除即可。 import pandas as pdimport numpy as np df1 = pd.DataFrame( [ [np.nan, 2, np.nan, 0], [3, 4, np.nan, 1], [np.nan, np.nan, np.nan, 5], [np.nan, 3, np.nan, 4] ],columns=list('ABCD'))print(df1)df2=df1.copy() df1['A']=df1['A'].fillna('null') #将df中A列所有空值赋值为'null'print(df1)df1=df1[~df1['A'].isin(['null'])]print(df1) #删除某行空值所在列 df2[0:1]=df2[0:1].fillna('null')print(df2)cols=[x for i,x in enumerate(df2.columns) if df2.iat[0,i]=='null']print(cols)df……

网友NO.893734

Pandas过滤dataframe中包含特定字符串数据的方法整理

假如有一列全是字符串的dataframe,希望提取包含特定字符的所有数据,该如何提取呢? 因为之前尝试使用filter,发现行不通,最终找到这个行得通的方法。 举例说明: 我希望提取所有包含Mr.的人名 1、首先将他们进行字符串化,并得到其对应的布尔值: bool = df.str.contains(Mr\.) #不要忘记正则表达式的写法,.在里面要用\.表示 print(bool : \n, bool) 2、通过dataframe的基本操作将其选取出来: filter_data = df[bool] print(filter data : \n, filter_data) 总结: 这样就成功将特定数据选取出来了,将代码汇总一下就是 bool = df.str.contains(Mr\.) filter_data = df[bool] ……

网友NO.784558

在Pandas中DataFrame数据合并,连接(concat,merge,join)的实例

最近在工作中,遇到了数据合并、连接的问题,故整理如下,供需要者参考~ 一、concat:沿着一条轴,将多个对象堆叠到一起 concat方法相当于数据库中的全连接(union all),它不仅可以指定连接的方式(outer join或inner join)还可以指定按照某个轴进行连接。与数据库不同的是,它不会去重,但是可以使用drop_duplicates方法达到去重的效果。 concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, copy=True): pd.concat()只是单纯的把两个表拼接在一起,参数axis是关键,它用于指定是行还是列,axis默认是0。 当axis=0时,pd.concat([obj1, obj2])的效果与obj1.append(obj2)是相同的;当axis=1时,pd.concat([obj1, obj2], axis=1)的效果与pd.merge(obj1, obj2, left_index=True, right_index=True, how='outer')是相同的。 merge方法的介绍请参看下文。 参数介绍: objs:需要连接的对象集合,一般是列表或字典; axis:连接轴向; join:参数为‘outer'或‘inner'; join_axes=[]:指定自定义的索引; keys=[]:创建层次化索引; ignore_index=True:重建索引 举例: df1=DataFrame(np.random.randn(3,4),columns=['a','b','c','d']) df2=DataFrame(np.random.randn(2,3),columns=['b','d','a']) pd.concat([df1,df2]) a b c d 0 -0.848557 -1.163877 -0.306148 -1.163944 1 1.358759 1.159369 -0.532110 2.183934 2 0.532117 0.788350 0.……

网友NO.744265

Python pandas.DataFrame调整列顺序及修改index名的方法

1. 从字典创建DataFrame import pandas dict_a = {'user_id':['webbang','webbang','webbang'],'book_id':['3713327','4074636','26873486'],'rating':['4','4','4'],'mark_date':['2017-03-07','2017-03-07','2017-03-07']} df = pandas.DataFrame(dict_a) # 从字典创建DataFrame df # 创建好的df列名默认按首字母顺序排序,和字典中的先后顺序并不一样,字典中是'user_id','book_id','rating','mark_date' book_id mark_date rating user_id0 3713327 2017-03-07 4 webbang1 4074636 2017-03-07 4 webbang2 26873486 2017-03-07 4 webbang 2. 调整列顺序 df = df[['user_id','book_id','rating','mark_date']] # 调整列顺序为'user_id','book_id','rating','mark_date' df user_id book_id rating mark_date0 webbang 3713327 4 2017-03-071 webbang 4074636 4 2017-03-072 webbang 26873486 4 2017-03-07 3. 调整index为从1开始 df.index = range(1,len(df) + 1) # 将index改成从1开始 df user_id book_id rating mark_date1 webbang 3713327 4 2017-03-072 webbang 4074636 4 2017-03-073 webbang 26873486 4 2017-03-07 DataFrame操作汇总:https://www.jb51.net/article/163645.htm 以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持码农之家。 ……

<
1
>

Copyright 2018-2019 xz577.com 码农之家

版权责任说明