整理了十个经典的Pandas数据查询案例!("精选10个Pandas数据查询实战案例,助你高效处理数据!")
原创
在数据分析领域,Pandas 是一个非常强劲的库,可以帮助我们高效地进行数据处理和查询。本文将为您介绍10个经典的Pandas数据查询案例,帮助您在实际工作中更加熟练地运用这个库。
1. 查询某列的值
假设我们有一个DataFrame,名为df,包含以下数据:
import pandas as pd
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David'],
'Age': [25, 30, 35, 40],
'Salary': [50000, 54000, 70000, 68000]
}
df = pd.DataFrame(data)
要查询名为 "Name" 的列中所有值,可以使用以下代码:
name_list = df['Name']
print(name_list)
2. 查询某行的值
要查询DataFrame中索引为0的行的值,可以使用以下代码:
row_0 = df.iloc[0]
print(row_0)
3. 查询满足条件的行
查询年龄大于30的行,可以使用以下代码:
age_over_30 = df[df['Age'] > 30]
print(age_over_30)
4. 查询多个列
查询 "Name" 和 "Salary" 两个列,可以使用以下代码:
name_salary = df[['Name', 'Salary']]
print(name_salary)
5. 查询多个条件
查询年龄大于30且薪资大于60000的行,可以使用以下代码:
age_salary_condition = df[(df['Age'] > 30) & (df['Salary'] > 60000)]
print(age_salary_condition)
6. 查询缺失值
假设DataFrame中存在缺失值,可以使用以下代码查询哪些行有缺失值:
df['NewColumn'] = [None, None, 'Value', 'Value']
missing_values = df[df.isnull().any(axis=1)]
print(missing_values)
7. 排序查询
按照薪资降序排列DataFrame,可以使用以下代码:
sorted_df = df.sort_values(by='Salary', ascending=False)
print(sorted_df)
8. 分组查询
按照年龄分组,并计算每个年龄组的平均薪资,可以使用以下代码:
grouped = df.groupby('Age')['Salary'].mean()
print(grouped)
9. 累计查询
计算薪资的累计总和,可以使用以下代码:
cumulative_salary = df['Salary'].cumsum()
print(cumulative_salary)
10. 繁复查询
结合多个查询操作,例如先按年龄分组,然后查询年龄大于30的组,并计算每个组的薪资总和,可以使用以下代码:
age_group = df[df['Age'] > 30].groupby('Age')['Salary'].sum()
print(age_group)
通过以上10个案例,我们可以看到Pandas在数据查询方面的强劲功能。在实际工作中,灵活运用这些查询技巧,可以大大节约数据处理高效能。期望这些案例对您有所帮助!