pandas dataframe使用方法

发布时间 2023-04-03 21:02:05作者: FrostyForest

使用 Pandas DataFrame 的步骤如下:

导入 Pandas 模块

python

import pandas as pd

创建 DataFrame

python

df = pd.DataFrame({
	'姓名': ['张三', '李四', '王五'],
	'年龄': [18, 25, 30],
	'性别': ['男', '女', '男']
})

这将创建一个包含三行数据和三列的 DataFrame,其中包括姓名、年龄和性别。

访问 DataFrame 数据

可以使用 DataFrame 的 .head() 方法查看 DataFrame 的前几行数据。

python

print(df.head())

输出:

   姓名  年龄 性别
0  张三  18  男
1  李四  25  女
2  王五  30  男

使用 DataFrame 的 .loc[] 方法可以根据行和列的标签来访问数据。

python

print(df.loc[0, '姓名']) # 输出:张三

使用 DataFrame 的 .iloc[] 方法可以根据行和列的位置来访问数据。

python

print(df.iloc[0, 0]) # 输出:张三

处理 DataFrame 数据

DataFrame 可以通过多种方式进行处理,例如:

选择特定列:可以使用列名称或列索引来选择特定列。

python

print(df['姓名']) # 输出:0    张三\n1    李四\n2    王五\nName: 姓名, dtype: object

选择特定行:可以使用 .loc[] 或 .iloc[] 方法来选择特定行。

python

print(df.loc[0]) # 输出:姓名    张三\n年龄    18\n性别     男\nName: 0, dtype: object

过滤数据:可以使用布尔索引来过滤数据。

python

print(df[df['年龄'] > 20]) # 输出:姓名    李四\n年龄    25\n性别     女\nName: 1, dtype: object\n姓名    王五\n年龄    30\n性别     男\nName: 2, dtype: object

对数据进行排序:可以使用 .sort_values() 方法对数据进行排序。

python

    print(df.sort_values('年龄', ascending=False)) # 输出:姓名    王五\n年龄    30\n性别     男\nName: 2, dtype: object\n姓名    李四\n年龄    25\n性别     女\nName: 1, dtype: object\n姓名    张三\n年龄    18\n性别     男\nName: 0, dtype: object

以上是使用 Pandas DataFrame 的基本步骤,根据具体需求和场景,还可以进行更多的数据处理和操作。