标签分类
技术文章
当前位置:主页 > 计算机编程 > python > 使用pandas批量处理矢量化字符串的实例讲解

pandas批量处理矢量化字符串实例分析

  • 发布时间:
  • 作者:码农之家原创
  • 点击:61

使用pandas批量处理矢量化字符串的实例讲解

这篇文章主要知识点是关于pandas,矢量化,字符串,使用pandas批量处理矢量化字符串的实例讲解,的内容,如果大家想对相关知识点有系统深入的学习,可以参阅以下电子书

Pandas Cookbook 中文参考手册
  • 类型:Pandas大小:38.1 MB格式:PDF出版:Packt Publishing作者:Theodore Petrou
立即下载

更多相关的学习资源可以参阅 程序设计电子书Python电子书、等栏目。

进行已经矢量化后的字符串数据,可以使用pandas的Series数据对象的map方法。这样,对于未经矢量化的数据也可以先进行数据的矢量化转换然后再进行相应的处理。

举例实现字符串数据的操作,编写代码如下:

#!/usr/bin/python
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
seriers_data = Series(['Hello','Python','Data','World'])
print(seriers_data.map(str.lower))

程序的运行结果如下:

GreydeMac-mini:chapter07 greyzhang$ vim series_map.py
GreydeMac-mini:chapter07 greyzhang$ python series_map.py 
0   hello
1  python
2   data
3   world
dtype: object

上面的例子中,先对列表形式的数据进行了向量化的处理,讲数据处理成pandas的Series对象类型,然后进行矢量化的操作。通过Series的map方法对每个字符串进行了全都转换成小写字母的操作。

以上这篇使用pandas批量处理矢量化字符串的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持码农之家。

以上就是本次给大家分享的全部知识点内容总结,大家还可以在下方相关文章里找到vue项目中使用md5加密以及、 儿童python编程入门书籍推、 解决axios.interceptors.respon、 等python文章进一步学习,感谢大家的阅读和支持。

上一篇:Python如何实现图片拼接

下一篇:Python生成便签图片的方法总结

展开 +

收起 -

学习笔记
网友NO.391082

Pandas实现数据类型转换的一些技巧

这篇文章主要介绍了关于Pandas实现数据类型转换的一些技巧,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下 前言 Pandas是Python当中重要的数据分析工具,利用Pandas进行数据分析时,确保使用正确的数据类型是非常重要的,否则可能会导致一些不可预知的错误发生。 Pandas 的数据类型:数据类型本质上是编程语言用来理解如何存储和操作数据的内部结构。例如,一个程序需要理解你可以将两个数字加起来,比如 5 + 10 得到 15。或者,如果是两个字符串,比如「cat」和「hat」,你可以将它们连接(加)起来得到「cathat」。尚学堂•百战程序员陈老师指出有关 Pandas 数据类型的一个可能令人困惑的地方是,Pandas、Python 和 numpy 的数据类型之间有一些重叠。 大多数情况下,你不必担心是否应该明确地将熊猫类型强制转换为对应的 NumPy 类型。一般来说使用 Pandas 的默认 int64 和 float64 就可以。我列出此表的唯一原因是,有时你可能会在代码行间或自己的分析过程中看到 Numpy 的类型。 数据类型是在你遇到错误或意外结果之前并不会关心的事情之一。不过当你将新数据加载到 Pandas 进行进一步分析时,这也是你应该检查的第一件事情。 笔者使用Pandas已经有一段时间了,但是还是会在一些小问题上犯错误,追根溯源发现……

网友NO.683566

对pandas的算术运算和数据对齐实例详解

pandas可以对不同索引的对象进行算术运算,如果存在不同的索引对,结果的索引就是该索引对的并集。 一、算术运算 a、series的加法运算 s1 = Series([1,2,3],index=["a","b","c"]) s2 = Series([4,5,6],index=["a","c","e"]) print(s1+s2) ''' a 5.0 b NaN c 8.0 e NaN ''' sereis相加会自动进行数据对齐操作,在不重叠的索引处会使用NA(NaN)值进行填充,series进行算术运算的时候,不需要保证series的大小一致。 b、DataFrame的加法运算 d1 = np.arange(1,10).reshape(3,3) dataFrame1 = DataFrame(d1,index=["a","b","c"],columns=["one","two","three"]) d2 = np.arange(1,10).reshape(3,3) dataFrame2 = DataFrame(d2,index=["a","b","e"],columns=["one","two","four"]) print(dataFrame1+dataFrame2) ''' four one three two a NaN 2.0 NaN 4.0 b NaN 8.0 NaN 10.0 c NaN NaN NaN NaN e NaN NaN NaN NaN ''' dataFrame相加时,对齐操作需要行和列的索引都重叠的时候才回相加,否则会使用NA值进行填充。 二、指定填充值 s1 = Series([1,2,3],index=["a","b","c"]) s2 = Series([4,5,6],index=["a","c","e"]) print( s1.add(s2,fill_value=0)) ''' a 5.0 b 2.0 c 8.0 e 6.0 ''' 需要注意的时候,使用add方法对两个series进行相加的时候,设置fill_value的值是对于不存在索引的series用指定值进行填充后再进行相加。除了加法add,还有sub减法,div除法,mul乘法,使用方式与add相同。DataFrame与series一样。 s1 = Series([1,2,3],index=["a","b","c"]) s2 = Se……

网友NO.384353

pandas通过索引进行排序的示例

如下所示: import pandas as pddf = pd.DataFrame([1, 2, 3, 4, 5], index=[10, 52, 24, 158, 112], columns=['S'])df.sort_index(inplace=True)print df 以上这篇pandas通过索引进行排序的示例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持码农之家。 ……

<
1
>

Copyright 2018-2019 xz577.com 码农之家

版权责任说明