python 如何group by

原创
ithorizon 8个月前 (09-29) 阅读数 44 #Python

Python中如何使用GROUP BY进行数据处理

在Python中,使用pandas库可以方便地对数据进行分组处理,GROUP BY是SQL中的一个概念,用于将查询结果按照某个或多个列进行分组,以便对每个组执行聚合函数(如求和、平均值等)。

在pandas中,可以使用groupby()函数来实现类似的功能。groupby()函数可以接受一个或多个列名作为参数,也可以接受一个函数作为参数,该函数将被应用于每个组。

下面是一个简单的示例,假设我们有一个包含员工姓名、部门和薪水的DataFrame:

import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Department': ['HR', 'IT', 'IT', 'HR'],
        'Salary': [5000, 7000, 8000, 6000]}
df = pd.DataFrame(data)

我们可以使用groupby()函数按照部门分组,并计算每个部门的平均薪水:

grouped = df.groupby('Department')['Salary'].mean()
print(grouped)

输出结果为:

Department
HR     5500.0
IT     7500.0
Name: Salary, dtype: float64

可以看到,groupby()函数将员工按照部门进行了分组,并计算了每个部门的平均薪水,除了使用mean()函数外,还可以使用其他聚合函数,如sum()median()等。groupby()函数还可以接受其他参数,如axis参数指定分组列的位置,sort参数指定是否对分组结果进行排序等。



热门