一.读取Excel文件

在Python中，你可以使用pandas库来读取Excel文件。首先，确保你已经安装了pandas和openpyxl库。如果没有安装，可以使用以下命令进行安装：

pip install pandas openpyxl

安装完成后，你可以使用以下代码来读取Excel文件：

import pandas as pd  

# 读取Excel文件  

file_path = r"C:\path\to\your\file.xlsx"  

data = pd.read_excel(file_path)  


# 显示数据  

print(data)

这段代码将读取指定路径的Excel文件，并将其存储在一个名为data的pandas数据帧中。你可以使用print(data)来查看数据。

如果你需要读取特定的工作表，可以在read_excel函数中指定sheet_name参数：

# 读取特定工作表  

sheet_name = 'Sheet1'  

data = pd.read_excel(file_path, sheet_name=sheet_name, engine='openpyxl')

如果你需要读取多个工作表，可以将它们存储在一个字典中，并使用read_excel函数来读取每个工作表：

# 读取多个工作表  

sheets = {'Sheet1': 1, 'Sheet2': 2}  

data = pd.read_excel(file_path, sheet_name=sheets)

你已经成功地使用pandas库从Excel文件中读取数据，并将数据存储在名为"data"的DataFrame对象中。接下来，你可以使用这个DataFrame对象进行各种数据操作和分析。

下面是一些基本的操作示例：

    1、查看数据的前五行：

print(data.head())

   2、 查看数据的列名（表头）：

print(data.columns)

   3、 查看数据的基本信息，如数据类型、非空值、最小值、最大值等：

print(data.info())

    4、如果你想对数据进行筛选或选择特定的行和列，你可以使用DataFrame的索引功能。例如，如果你想查看所有"Age"列大于等于30的行：

filtered_data = data[data['Age'] >= 30]  

print(filtered_data)

   5、你还可以使用DataFrame的聚合函数进行数据汇总。例如，如果你想计算所有人的平均年龄：

average_age = data['Age'].mean()  
print(average_age)

重点：row是一个包含该行所有列数据的Pandas Series对象。你可以通过索引访问其中的每一个元素，

for index, row in data.iterrows():
    # row是每一行的数据
    第一个单元格 = row[0]
    第二个单元格 = row[1]
    第三个单元格 = row[2]
    ...
    # 超出会报错

JZTXT

python处理Excel文件

一.读取Excel文件