Pandas 可以说是实用数据筛选数详绍 在Python数据科学领域应用最为广泛的工具之一。Pandas是细介一种高效的数据处理库,它以 dataframe 和 series 为基本数据类型,实用数据筛选数详绍呈现出类似excel的细介二维数据。在数据处理过程中,实用数据筛选数详绍咱们经常会用到数据筛选,细介Pandas 中提供了数据筛选的实用数据筛选数详绍多种方法,这里,细介来给大家分享下 在Pandas中应用 query 函数来进行数据筛选。实用数据筛选数详绍query 函数的细介一般用法如下: 文中的代码是在 Jupyter Notebook 中运行的(也可以是其他IDE),本次使用的实用数据筛选数详绍 Pandas 版本是 1.3.0 版,如下: import pandas as pd print(fpandas version: { pd.__version__}) 在开始之前,细介先创建一份数据,实用数据筛选数详绍供后续使用: data = { brand:[Python数据之道,细介价值前瞻,菜鸟数据之道,Python,Java], A:[10,2,5,20,16], B:[4,6,8,12,10], C:[8,12,18,8,2], D:[6,18,14,6,12], till years:[4,1,1,30,30] } df = pd.DataFrame(data=data) 数据如下: 筛选 "brand" 列中值为 "Python数据之道" 的行,如下: 结果如下: 说明一下,实用数据筛选数详绍上面代码中的单引号和双引号是可以互换的,下面的亿华云写法,其结果也是一样的: 上面用 query 函数筛选数据,用下面的方法也是可以实现的: 上面是筛选字符串的值,也可以是筛选数字,如下: 除了直接通过等于某个值来筛选, query 函数还支持通过数学表达式来进行数据筛选,包括 >、 <、 +、 -、 *、 / 等。 示例如下: 在程序比较长的时候,经常会使用变量来作为筛选条件, query 函数在使用变量作为判断标准时,通过在变量前面添加 @ 符号来实现,示例如下: # 通过变量来筛选数据,在变量前使用 @ 符号即可 name = Python数据之道 当需要在某列中筛选多个符合要求的值的时候,可以通过列表(list)来实现,示例如下: # 需要注意下 双引号 和 单引号的分开使用 df.query(brand in ["Python数据之道","价值前瞻"]) 有很多情况下,咱们需要通过多个条件来筛选数据,高防服务器query 函数支持多种条件的组合, 示例如下: 当 dataframe 的列名称中有空格或其他特殊符号的时候,需要使用 反引号(backtick mark),即键盘ESC键下面的按键(就是键盘上第二排第一个按键,有‘~’这个符号的按键) 来将列名包裹起来,示例如下: 注意,如果使用单引号,将会报错,如下: 在数据筛选后,还可以选择需要的数据列,如下: 以上就是关于 Pandas 中 query 函数的主要内容介绍,应用 query函数进行数据筛选,其语言还是比较简洁的,尤其是当条件比较多的时候,会显得更优雅。 比如下面的对比,服务器托管假设都是三个筛选条件(假设数据量较多,符合的结果也较多): 没有使用query函数时 可以看出上面的表达式是比较长的,略显繁琐。 使用query函数时 相对来说,使用query 函数会显得更加简洁,如果觉得这个功能不错,就赶紧用起来吧~~常用方法
通过数学表达式筛选
通过变量筛选
列表数据筛选
多条件筛选
列名称有空格的情况
筛选后选取数据列
小结