整理了十个经典的Pandas数据查询案例!("精选10个Pandas数据查询实战案例,助你高效处理数据!")

原创
ithorizon 7个月前 (10-20) 阅读数 16 #后端开发

精选10个Pandas数据查询实战案例,助你高效处理数据!

在数据分析领域,Pandas 是一个非常强劲的库,可以帮助我们高效地进行数据处理和查询。本文将为您介绍10个经典的Pandas数据查询案例,帮助您在实际工作中更加熟练地运用这个库。

1. 查询某列的值

假设我们有一个DataFrame,名为df,包含以下数据:

import pandas as pd

data = {

'Name': ['Alice', 'Bob', 'Charlie', 'David'],

'Age': [25, 30, 35, 40],

'Salary': [50000, 54000, 70000, 68000]

}

df = pd.DataFrame(data)

要查询名为 "Name" 的列中所有值,可以使用以下代码:

name_list = df['Name']

print(name_list)

2. 查询某行的值

要查询DataFrame中索引为0的行的值,可以使用以下代码:

row_0 = df.iloc[0]

print(row_0)

3. 查询满足条件的行

查询年龄大于30的行,可以使用以下代码:

age_over_30 = df[df['Age'] > 30]

print(age_over_30)

4. 查询多个列

查询 "Name" 和 "Salary" 两个列,可以使用以下代码:

name_salary = df[['Name', 'Salary']]

print(name_salary)

5. 查询多个条件

查询年龄大于30且薪资大于60000的行,可以使用以下代码:

age_salary_condition = df[(df['Age'] > 30) & (df['Salary'] > 60000)]

print(age_salary_condition)

6. 查询缺失值

假设DataFrame中存在缺失值,可以使用以下代码查询哪些行有缺失值:

df['NewColumn'] = [None, None, 'Value', 'Value']

missing_values = df[df.isnull().any(axis=1)]

print(missing_values)

7. 排序查询

按照薪资降序排列DataFrame,可以使用以下代码:

sorted_df = df.sort_values(by='Salary', ascending=False)

print(sorted_df)

8. 分组查询

按照年龄分组,并计算每个年龄组的平均薪资,可以使用以下代码:

grouped = df.groupby('Age')['Salary'].mean()

print(grouped)

9. 累计查询

计算薪资的累计总和,可以使用以下代码:

cumulative_salary = df['Salary'].cumsum()

print(cumulative_salary)

10. 繁复查询

结合多个查询操作,例如先按年龄分组,然后查询年龄大于30的组,并计算每个组的薪资总和,可以使用以下代码:

age_group = df[df['Age'] > 30].groupby('Age')['Salary'].sum()

print(age_group)

通过以上10个案例,我们可以看到Pandas在数据查询方面的强劲功能。在实际工作中,灵活运用这些查询技巧,可以大大节约数据处理高效能。期望这些案例对您有所帮助!


本文由IT视界版权所有,禁止未经同意的情况下转发

文章标签: 后端开发


热门