技术文章
当前位置:首页 > Python技术文章 > Pandas过滤dataframe中包含特定字符串数据

Pandas过滤dataframe中包含特定字符串数据的方法整理

  • 发布时间:
  • 作者:码农之家原创
  • 点击:472

这篇文章主要知识点是关于Pandas、过滤、dataframe、特定字符串数据、Python+Pandas 获取数据库并加入DataFrame的实例 的内容,如果大家想对相关知识点有系统深入的学习,可以参阅以下电子书

Python机器学习基础教程
  • 类型:Python3大小:28.3 MB格式:PDF出版:人民邮电出版社作者:安德里亚斯·穆勒
立即下载
从零开始学Python网络爬虫
  • 类型:Python爬虫大小:143.9 MB格式:PDF出版:机械工业出版社作者:罗攀
立即下载

更多Python相关的学习资源可以参阅 Python电子书程序设计电子书 等栏目。

Pandas过滤dataframe中包含特定字符串数据

假如有一列全是字符串的dataframe,希望提取包含特定字符的所有数据,该如何提取呢?

因为之前尝试使用filter,发现行不通,最终找到这个行得通的方法。

举例说明:

我希望提取所有包含'Mr.'的人名

Pandas过滤dataframe中包含特定字符串的数据方法

1、首先将他们进行字符串化,并得到其对应的布尔值:

>>> bool = df.str.contains('Mr\.') #不要忘记正则表达式的写法,'.'在里面要用'\.'表示
>>> print('bool : \n', bool)

Pandas过滤dataframe中包含特定字符串的数据方法

2、通过dataframe的基本操作将其选取出来:

>>> filter_data = df[bool]
>>> print('filter data : \n', filter_data)

Pandas过滤dataframe中包含特定字符串的数据方法

总结:这样就成功将特定数据选取出来了,将代码汇总一下就是

>>> bool = df.str.contains('Mr\.')
>>> filter_data = df[bool]

 

Python+Pandas 获取数据库并加入DataFrame的实例

实例如下所示:

import pandas as pd
import sys
import imp
imp.reload(sys)
from sqlalchemy import create_engine
import cx_Oracle
 
db=cx_Oracle.connect('userid','password','10.10.1.10:1521/dbinstance')
print db.version
cr=db.cursor()
sql='select * from sys_user'
cr.execute(sql)
rs=cr.fetchall()
zz=pd.DataFrame(rs);
print zz
 
db.close()

以上这篇Python+Pandas 获取数据库并加入DataFrame的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持码农之家。

以上就是本次给大家分享的关于Python的全部知识点内容总结,大家还可以在下方相关文章里找到python字符串与url编码转换、 python里dict变成list的实例方、 Python3结合Dlib实现人脸识别、 等python文章进一步学习,感谢大家的阅读和支持。

上一篇:python2与python3的区别点总结

下一篇:Python3实现取图片中特定的像素替换指定的颜色方法

展开 +

收起 -

相关电子书
学习笔记
网友NO.694553

pandas 空的dataframe 插入列名的示例

如下所示: colum = ['性别','年龄','M','样本类型'] + muta_list + ['B']data1 = pd.DataFrame(columns=colum) 以上这篇pandas 空的dataframe 插入列名的示例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持码农之家。 ……

网友NO.768618

Python3.5 Pandas模块之DataFrame用法实例分析

本文实例讲述了Python3.5 Pandas模块之DataFrame用法。分享给大家供大家参考,具体如下: 1、DataFrame的创建 (1)通过二维数组方式创建 #!/usr/bin/env python# -*- coding:utf-8 -*-# Author:ZhengzhengLiuimport numpy as npimport pandas as pdfrom pandas import Series,DataFrame#1.DataFrame通过二维数组创建print("======DataFrame直接通过二维数组创建======")d1 = DataFrame([["a","b","c","d"],[1,2,3,4]])print(d1)print("======DataFrame借助array二维数组创建======")arr = np.array([ ["jack",78], ["lili",86], ["amy",97], ["tom",100]])d2 = DataFrame(arr,index=["01","02","03","04"],columns=["姓名","成绩"])print(d2)print("========打印行索引========")print(d2.index)print("========打印列索引========")print(d2.columns)print("========打印值========")print(d2.values) 运行结果: ======DataFrame直接通过二维数组创建====== 0 1 2 3 0 a b c d 1 1 2 3 4 ======DataFrame借助array二维数组创建====== 姓名 成绩 01 j……

网友NO.960562

将pandas.dataframe的数据写入到文件中的方法

导入实验常用的python包。如图2所示。 【import pandas as pd】pandas用来做数据处理。【import numpy as np】numpy用来做高维度矩阵运算.【import matplotlib.pyplot as plt】matplotlib用来做数据可视化。 pandas数据写入到csv文件中: 【names = [‘Bob','Jessica','Mary','John','Mel']】创建一个names列表【 births = [968,155,77,578,973]】创建一个births 列表【DataSet = list(zip(names,births))】用 zip 函数将这两个列表合并在一起【DataSet】查看生成的数据【df = pd.DataFrame(data = DataSet ,columns=[‘Names','Births'])】用生成的数据生成一个DataFrame对象【df】查看生成的dataFrame 将创建的数据写入到/opt/births1880.csv文件中, 【df.to_csv(‘/opt/births1880.csv', index=False, header=False )】将df写入到文件中【ls /opt/births1880.csv】查看文件是否存在【cat /opt/births1880.csv】查看文件内容 pandas读取csv中的数据 读取步骤3生成的数据,如图5所示……

网友NO.382331

pandas DataFrame 删除重复的行的实现方法

1. 建立一个DataFrame C=pd.DataFrame({'a':['dog']*3+['fish']*3+['dog'],'b':[10,10,12,12,14,14,10]}) 2. 判断是否有重复项 用duplicated( )函数判断 C.duplicated() 3. 有重复项,则可以用drop_duplicates()移除重复项 C.drop_duplicates() 4.Duplicated( )和drop_duplicates( )方法是以默认的方式判断全部的列(上面的例子中是看两个变量a和b是否都是重复出现)。 我们也可以对特定的列进行重复项判断。 C.duplicated(['a']) C.drop_duplicates(['a']) C.duplicated(['b']) C.drop_duplicates(['b']) 5. norepeat_df = df.drop_duplicates(subset=['A_ID', 'B_ID'], keep='first') #上面的命令去掉UNIT_ID和KPI_ID列中重复的行,并保留重复出现的行中第一次出现的行 补充: 当keep=False时,就是去掉所有的重复行 当keep=‘first'时,就是保留第一次出现的重复行 当keep='last'时就是保留最后一次出现的重复行。 (注意,这里的参数是字符串,要加引号!!……

<
1
>

Copyright 2018-2020 xz577.com 码农之家

电子书资源由网友、会员提供上传,本站记录提供者的基本信息及资源来路

鸣谢: “ 码小辫 ” 公众号提供回调API服务、“ 脚本CDN ”提供网站加速(本站寻求更多赞助支持)

版权投诉 / 书籍推广 / 赞助:520161757@qq.com

上传资源(网友、会员均可提供)

查看最新会员资料及资源信息