用Python处理Excel的14个常用操作("Python高效处理Excel：14个必备实用操作指南")

原创

ithorizon 7个月前 (10-19) 阅读数 16 #后端开发

Python高效处理Excel：14个必备实用操作指南

1. 读取Excel文件

在Python中，我们通常使用`pandas`库来读取Excel文件。以下是一个基本的例子：


import pandas as pd
# 读取Excel文件
df = pd.read_excel('example.xlsx')
print(df)

2. 写入Excel文件

将DataFrame写入Excel文件，可以使用`to_excel`方法。


# 创建一个DataFrame
df = pd.DataFrame({
    'Column1': [1, 2, 3],
    'Column2': ['A', 'B', 'C']
})
# 写入Excel文件
df.to_excel('output.xlsx', index=False)

3. 修改Excel文件中的数据

首先读取Excel文件，然后修改DataFrame中的数据，最后将其写回Excel文件。


# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 修改数据
df['Column1'] = df['Column1'] * 2
# 写回Excel文件
df.to_excel('example.xlsx', index=False)

4. 添加新的列

在DataFrame中添加新的列非常明了，只需要赋值即可。


# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 添加新列
df['NewColumn'] = df['Column1'] + df['Column2']
# 写回Excel文件
df.to_excel('example.xlsx', index=False)

5. 删除列

可以使用`drop`方法删除列。


# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 删除列
df = df.drop('Column2', axis=1)
# 写回Excel文件
df.to_excel('example.xlsx', index=False)

6. 按条件筛选数据

使用布尔索引来筛选数据。


# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 筛选条件
condition = df['Column1'] > 5
# 应用筛选条件
filtered_df = df[condition]
# 写回Excel文件
filtered_df.to_excel('filtered.xlsx', index=False)

7. 数据排序

使用`sort_values`方法对DataFrame进行排序。


# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 按Column1列升序排序
sorted_df = df.sort_values(by='Column1')
# 写回Excel文件
sorted_df.to_excel('sorted.xlsx', index=False)

8. 数据分组

使用`groupby`方法对数据进行分组。


# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 按Column2列分组，并计算Column1的平均值
grouped_df = df.groupby('Column2')['Column1'].mean().reset_index()
# 写回Excel文件
grouped_df.to_excel('grouped.xlsx', index=False)

9. 数据合并

使用`merge`方法将两个DataFrame合并在一起。


# 读取两个Excel文件
df1 = pd.read_excel('example1.xlsx')
df2 = pd.read_excel('example2.xlsx')
# 合并数据
merged_df = pd.merge(df1, df2, on='Key')
# 写回Excel文件
merged_df.to_excel('merged.xlsx', index=False)

10. 数据透视表

使用`pivot_table`方法创建数据透视表。


# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 创建数据透视表
pivot_df = df.pivot_table(values='Column1', index='Column2', columns='Column3')
# 写回Excel文件
pivot_df.to_excel('pivot.xlsx')

11. 数据去重

使用`drop_duplicates`方法去除重复数据。


# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 去除重复数据
unique_df = df.drop_duplicates()
# 写回Excel文件
unique_df.to_excel('unique.xlsx', index=False)

12. 数据填充

使用`fillna`方法填充缺失数据。


# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 填充缺失数据
filled_df = df.fillna('default_value')
# 写回Excel文件
filled_df.to_excel('filled.xlsx', index=False)

13. 数据转换

使用`apply`方法对DataFrame中的数据进行转换。


# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 转换数据
df['Column1'] = df['Column1'].apply(lambda x: x * 2)
# 写回Excel文件
df.to_excel('transformed.xlsx', index=False)

14. 数据导出为CSV格式

将DataFrame导出为CSV文件。


# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 导出为CSV文件
df.to_csv('output.csv', index=False)

以上就是使用Python处理Excel的14个常用操作，这些操作可以帮助你高效地处理Excel数据。在实际应用中，你可以选用需要灵活运用这些方法，以满足不同的数据处理需求。

文章标签：后端开发

上一篇：向Java开战?别搞错了对象("挑战Java？认清目标：别误伤友军，专注正确方向") 下一篇：Java程序员必备的15个框架，前3个地位无可动摇！("Java开发者必掌握的15大框架，前三甲地位坚不可摧！")