用Python处理Excel的14个常用操作("Python操作Excel的14个实用技巧大全")

原创
ithorizon 7个月前 (10-20) 阅读数 13 #后端开发

Python操作Excel的14个实用技巧大全

1. 读取Excel文件

使用Python操作Excel的第一步是读取Excel文件。这里我们使用pandas库来实现。

import pandas as pd

# 读取Excel文件

df = pd.read_excel('example.xlsx')

print(df)

2. 写入Excel文件

将数据写入Excel文件,同样使用pandas库。

# 创建DataFrame

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}

df = pd.DataFrame(data)

# 写入Excel文件

df.to_excel('output.xlsx', index=False)

3. 修改Excel文件中的数据

修改Excel文件中的数据,首先需要读取文件,然后修改数据,最后保存。

# 读取Excel文件

df = pd.read_excel('example.xlsx')

# 修改数据

df['Age'] = df['Age'] + 1

# 写入Excel文件

df.to_excel('example.xlsx', index=False)

4. 添加行到Excel文件

向Excel文件中添加行数据。

# 读取Excel文件

df = pd.read_excel('example.xlsx')

# 添加行数据

new_data = {'Name': 'David', 'Age': 40}

df = df.append(new_data, ignore_index=True)

# 写入Excel文件

df.to_excel('example.xlsx', index=False)

5. 删除Excel文件中的行

删除Excel文件中的指定行。

# 读取Excel文件

df = pd.read_excel('example.xlsx')

# 删除第2行

df = df.drop(2)

# 写入Excel文件

df.to_excel('example.xlsx', index=False)

6. 添加列到Excel文件

向Excel文件中添加列数据。

# 读取Excel文件

df = pd.read_excel('example.xlsx')

# 添加列数据

df['Salary'] = [5000, 6000, 7000]

# 写入Excel文件

df.to_excel('example.xlsx', index=False)

7. 删除Excel文件中的列

删除Excel文件中的指定列。

# 读取Excel文件

df = pd.read_excel('example.xlsx')

# 删除'Salary'列

df = df.drop('Salary', axis=1)

# 写入Excel文件

df.to_excel('example.xlsx', index=False)

8. 合并Excel文件

合并多个Excel文件。

import pandas as pd

# 读取两个Excel文件

df1 = pd.read_excel('example1.xlsx')

df2 = pd.read_excel('example2.xlsx')

# 合并两个DataFrame

df = pd.concat([df1, df2])

# 写入Excel文件

df.to_excel('merged.xlsx', index=False)

9. 拆分Excel文件

将一个Excel文件拆分为多个文件。

import pandas as pd

# 读取Excel文件

df = pd.read_excel('example.xlsx')

# 拆分为多个文件

df1 = df[df['Age'] < 30]

df2 = df[df['Age'] >= 30]

df1.to_excel('younger.xlsx', index=False)

df2.to_excel('older.xlsx', index=False)

10. 筛选Excel文件中的数据

基于条件筛选Excel文件中的数据。

# 读取Excel文件

df = pd.read_excel('example.xlsx')

# 筛选年龄大于30的数据

filtered_df = df[df['Age'] > 30]

print(filtered_df)

11. 排序Excel文件中的数据

对Excel文件中的数据进行排序。

# 读取Excel文件

df = pd.read_excel('example.xlsx')

# 按年龄降序排序

df = df.sort_values(by='Age', ascending=False)

# 写入Excel文件

df.to_excel('sorted.xlsx', index=False)

12. 统计Excel文件中的数据

对Excel文件中的数据进行统计。

# 读取Excel文件

df = pd.read_excel('example.xlsx')

# 计算平均年龄

average_age = df['Age'].mean()

print('Average Age:', average_age)

13. 数据可视化

使用matplotlib库对Excel文件中的数据进行可视化。

import pandas as pd

import matplotlib.pyplot as plt

# 读取Excel文件

df = pd.read_excel('example.xlsx')

# 绘制年龄分布图

plt.hist(df['Age'], bins=5)

plt.xlabel('Age')

plt.ylabel('Frequency')

plt.title('Age Distribution')

plt.show()

14. 保存Excel文件的副本

保存Excel文件的副本,以便原始数据不被修改。

# 读取Excel文件

df = pd.read_excel('example.xlsx')

# 保存副本

df.to_excel('example_copy.xlsx', index=False)


本文由IT视界版权所有,禁止未经同意的情况下转发

文章标签: 后端开发


热门