【Python】用 Python 处理 Excel 的 14 个常用操作

原创
admin 1个月前 (09-08) 阅读数 73 #Python
文章标签 Python

以下是涉及“用 Python 处理 Excel 的 14 个常用操作”的文章内容使用 HTML 的 P 标签进行排版,代码使用 PRE 标签

```HTML

用 <a target="_blank" href="https://www.ithorizon.cn/tag/Python/"style="color:#2E2E2E">Python</a> 处理 Excel 的 14 个<a target="_blank" href="https://www.ithorizon.cn/tag/%E5%B8%B8%E7%94%A8/"style="color:#2E2E2E">常用</a><a target="_blank" href="https://www.ithorizon.cn/tag/%E6%93%8D%E4%BD%9C/"style="color:#2E2E2E">操作</a>

1. 安装必要的库

在使用 Python 处理 Excel 文件之前,需要安装一个强劲的库——pandas。此外,还可以使用 openpyxl 或 xlrd 来读取和写入 Excel 文件

pip install pandas openpyxl xlrd

2. 导入库

在起初处理 Excel 文件之前,需要导入 pandas 库。

import pandas as pd

3. 读取 Excel 文件

使用 pandas 的 read_excel 方法读取 Excel 文件。

df = pd.read_excel('example.xlsx')

4. 查看数据几行

使用 head 方法查看数据的前几行

print(df.head())

5. 选择一列数据

使用列名选择数据中的一列。

column = df['Column Name']

6. 选择多列数据

使用列名列表选择数据中的多列。

columns = df[['Column Name 1', 'Column Name 2']]

7. 选择行数

使用 loc 或 iloc 方法选择行数据。

rows = df.loc[df['Column Name'] == some_value]

8. 获取行数和列数

使用 shape 属性获取数据框的行数和列数。

rows, columns = df.shape

9. 添加新列

直接通过赋值操作添加新列。

df['New Column'] = df['Column Name'] * 10

10. 删除列

使用 drop 方法删除列。

df = df.drop('Column Name', axis=1)

11. 保存到 Excel 文件

使用 to_excel 方法将数据框保存为 Excel 文件。

df.to_excel('new_example.xlsx', index=False)

12. 数据排序

使用 sort_values 方法对数据进行排序。

df = df.sort_values(by='Column Name', ascending=True)

13. 数据分组和聚合

使用 groupby 方法对数据进行分组,然后进行聚合操作。

grouped = df.groupby('Column Name').sum()

14. 数据透视

使用 pivot_table 方法创建数据透视表。

pivot = pd.pivot_table(df, values='Column Name', index=['Index 1'], columns=['Index 2'])

```

注意:以上代码和描述仅为示例实际使用时需要凭借具体的 Excel 数据和需求进行调整。此外,在 HTML 页面中,代码通常不需要额外添加换行和缩进,但为了可读性,这里还是保留了这些格式

本文由IT视界版权所有,禁止未经同意的情况下转发

热门