用Python处理Excel的14个常用操作("Python操作Excel的14个实用技巧大全")
原创
1. 读取Excel文件
使用Python操作Excel的第一步是读取Excel文件。这里我们使用pandas库来实现。
import pandas as pd
# 读取Excel文件
df = pd.read_excel('example.xlsx')
print(df)
2. 写入Excel文件
将数据写入Excel文件,同样使用pandas库。
# 创建DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)
# 写入Excel文件
df.to_excel('output.xlsx', index=False)
3. 修改Excel文件中的数据
修改Excel文件中的数据,首先需要读取文件,然后修改数据,最后保存。
# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 修改数据
df['Age'] = df['Age'] + 1
# 写入Excel文件
df.to_excel('example.xlsx', index=False)
4. 添加行到Excel文件
向Excel文件中添加行数据。
# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 添加行数据
new_data = {'Name': 'David', 'Age': 40}
df = df.append(new_data, ignore_index=True)
# 写入Excel文件
df.to_excel('example.xlsx', index=False)
5. 删除Excel文件中的行
删除Excel文件中的指定行。
# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 删除第2行
df = df.drop(2)
# 写入Excel文件
df.to_excel('example.xlsx', index=False)
6. 添加列到Excel文件
向Excel文件中添加列数据。
# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 添加列数据
df['Salary'] = [5000, 6000, 7000]
# 写入Excel文件
df.to_excel('example.xlsx', index=False)
7. 删除Excel文件中的列
删除Excel文件中的指定列。
# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 删除'Salary'列
df = df.drop('Salary', axis=1)
# 写入Excel文件
df.to_excel('example.xlsx', index=False)
8. 合并Excel文件
合并多个Excel文件。
import pandas as pd
# 读取两个Excel文件
df1 = pd.read_excel('example1.xlsx')
df2 = pd.read_excel('example2.xlsx')
# 合并两个DataFrame
df = pd.concat([df1, df2])
# 写入Excel文件
df.to_excel('merged.xlsx', index=False)
9. 拆分Excel文件
将一个Excel文件拆分为多个文件。
import pandas as pd
# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 拆分为多个文件
df1 = df[df['Age'] < 30]
df2 = df[df['Age'] >= 30]
df1.to_excel('younger.xlsx', index=False)
df2.to_excel('older.xlsx', index=False)
10. 筛选Excel文件中的数据
基于条件筛选Excel文件中的数据。
# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 筛选年龄大于30的数据
filtered_df = df[df['Age'] > 30]
print(filtered_df)
11. 排序Excel文件中的数据
对Excel文件中的数据进行排序。
# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 按年龄降序排序
df = df.sort_values(by='Age', ascending=False)
# 写入Excel文件
df.to_excel('sorted.xlsx', index=False)
12. 统计Excel文件中的数据
对Excel文件中的数据进行统计。
# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 计算平均年龄
average_age = df['Age'].mean()
print('Average Age:', average_age)
13. 数据可视化
使用matplotlib库对Excel文件中的数据进行可视化。
import pandas as pd
import matplotlib.pyplot as plt
# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 绘制年龄分布图
plt.hist(df['Age'], bins=5)
plt.xlabel('Age')
plt.ylabel('Frequency')
plt.title('Age Distribution')
plt.show()
14. 保存Excel文件的副本
保存Excel文件的副本,以便原始数据不被修改。
# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 保存副本
df.to_excel('example_copy.xlsx', index=False)