Pandas
pandas python re模块匹配不同的sheet_name
3 You can use pandas.ExcelFile to have a peek at the sheet names, then select the sheets to keep with any method (here your regex), finally load with ......
Ceil and floor of the dataframe in Pandas Python – Round up and Truncate
In this article, we will discuss getting the ceil and floor values of the Pandas Dataframe. First, Let’s create a dataframe. Example: Python3 # import ......
【pandas小技巧】--拆分列
拆分列是`pandas`中常用的一种数据操作,它可以将一个包含多个值的列按照指定的规则拆分成多个新列,方便进行后续的分析和处理。拆分列的使用场景比较广泛,以下是一些常见的应用场景: 1. 处理日期数据:在日期数据中,经常会将年、月、日等信息合并成一列,通过拆分列可以将其拆分成多个新列,方便进行时间序 ......
【pandas小技巧】--反转行列顺序
反转`pandas` `DataFrame`的行列顺序是一种非常实用的操作。在实际应用中,当我们需要对数据进行排列或者排序时,通常会使用到Pandas的行列反转功能。这个过程可以帮助我们更好地理解数据集,发现其中的规律和趋势。同时,行列反转还可以帮助我们将数据可视化,使得图表更加易于理解。 除了常规 ......
pandas模块------------------------筛选条件loc(多条件选择)
loc 在选择时应用条件。 单条件:选择大于90成绩的学生信息: import pandas as pdsource = pd.read_excel('C:/Users/Administrator/Desktop/source.xlsx')print(source)da = source.loc[( ......
pandas模块--------------------------------相同(不同)文件夹下相同格式的Excel表格数据,汇总到一张表里面
上代码:import pandas as pdimport os#文件路径file_dir = r'C:/Users/Administrator/Desktop/test/'#构建新的表格名称new_filename = file_dir + '/new_file.xlsx'#找到文件路径下的所有表 ......
盘点一个Pandas中df转列表处理基础知识
大家好,我是皮皮。 ### 一、前言 前几天在Python黄金群【东哥】问了一个`Pandas`基础的问题,这里拿出来给大家分享下。 #文件路径a=lambda x : x.mean(1).round(2) #lambda函数m=a(df.il ......
pandas模块---------------------求和,求平均
求和,求平均import pandas as pdstudent = pd.read_excel('C:/Users/Administrator/Desktop/1.xlsx')student = student.set_index('ID')temp = student[['Test_1','Te ......
【pandas小技巧】--按类型选择列
本篇介绍的是`pandas`选择列数据的一个小技巧。之前已经介绍了很多选择列数据的方式,比如`loc`,`iloc`函数,按列名称选择,按条件选择等等。 这次介绍的是按照列的**数据类型**来选择列,按类型选择列可以帮助你快速选择正确的数据类型,提高数据分析的效率。 # 1. 类型种类 `panda ......
pandas模块--------------------基础篇学习
1.读取Excel数据 Python通过pandas库可以轻松地读取Excel数据。pandas库是一个专门用于数据分析和处理的库,它可以将Excel中的数据读取为DataFrame格式,便于进行后续的数据分析和操作。 import pandas as pddata = pd.read_excel( ......
pandas模块-------------------一次读取多个excel文件并合并
合并不同excel表格的内容: 代码如下: import pandas as pdimport osinputdir=r'C:\\Users\\Administrator\\Desktop\\test'df_empty=pd.DataFrame(columns=['名称','列1','列2'])fo ......
odoo pandas
fieldstr = '''id,debit,credit,balance''' self.env.cr.execute('''select %s from account_move_line order by id desc''' % fieldstr) try: a = self.env.cr. ......
pandas模块-----------比对不同数据(部分相同)
代码如下: import pandas as pd# 学生成绩表df_grade = pd.read_excel("find.xlsx")df_grade.head()# 学生信息表df_sinfo = pd.read_excel("data.xlsx")df_sinfo.head()# 只筛选第二 ......
Pandas学习笔记之常用功能
一、数值计算和统计 1.数学计算方法 # 主要数学计算方法,可用于Series和DataFrame(1) df = pd.DataFrame({'key1':np.arange(10), 'key2':np.random.rand(10)*10}) print(df) print(' ') prin ......
Pandas学习笔记之时间处理
一、Pandas时刻数据 时刻数据代表时间点,是pandas的数据类型,是将值与时间点相关联的最基本类型的时间序列数据 1.pd.Timestamp date1 = datetime.datetime(2016,12,1,12,45,30) # 创建一个datetime.datetime date2 ......
Pandas学习笔记之Dataframe
一、Dataframe基本概念 # 二维数组"Dataframe:是一个表格型的数据结构,包含一组有序的列,其列的值类型可以是数值、字符串、布尔值等。 data = {'name': ['Jack', 'Tom', 'Mary'], 'age': [18, 19, 20], 'gender': [' ......
【pandas小技巧】--随机挑选子集
在 `pandas` 中,如果遇到数据量特别大的情况,随机挑选 DataFrame 的子集可以帮助我们更深入地了解数据,从而更好地进行数据分析和决策。 随机挑选子集的用途主要有: 1. 评估数据质量:随机挑选 DataFrame 的子集可以帮助我们检查数据集的质量,以便进一步探索和挖掘数据。例如,我 ......
Pandas学习笔记之Series
一、Series基本概念及创建 1.基本概念 # Series 数据结构 # Series 是带有标签的一维数组,可以保存任何数据类型(整数,字符串,浮点数,Python对象等),轴标签统称为索引 # 导入numpy、pandas模块 import numpy as np import pandas ......
使用pandas.to_html时怎么自定义表格样式
# 一、通过标签名设置`css`样式 使用`pd.to_html()`方法如果不指定文件路径,该函数会返回一个格式化的`html`字符串,我们可以对这个字符串进行自定义操作,比如直接用我们设置的`css`样式加上这个格式化的`html`,就可以实现自定义表格样式,如下: ```python data ......
【864】pandas dataframe根据规则批量赋值
ref: Pandas新增一列并按条件赋值? 把下图中的 NaN 都赋值为 0 df.loc[条件判断, 'value'] = 0 m = pd.merge(gdf_africa, df_af_mp, how='left', on='country') m.loc[m['value'].isna() ......
pandas-2023-07-20
1、用pandas读取文件,如果是字符串类型会被当做object类型。 2、用head可以传入要输出显示的行数,但是指定行数不包括表头(并且观察到表头行不作为索引值0),另外,如果不传入参数时会默认输出表头加5行表格内容,weather.csv文件引用自以下博客https://blog.csdn.n ......
【pandas小技巧】--读取多个文件
日常分析数据时,只有单一数据文件的情况其实很少见,更多的情况是,我们从同一个数据来源定期或不定期的采集了很多数据文件;或者从不同的数据源采集多种不同格式的数据文件。 在这样的情况下,分析数据之前,需要将不同的数据集合并起来。合并数据一般有两个维度,一是同构的数据集合并后行数增加;一是异构的数据集合并 ......
pandas把csv文件数据按列排序
原本的数据类型凌乱不按照日期排序,不利于数据分析 import pandas as pd#读取文件数据df = pd.read_csv('clientinfo-截止2019-12-20:00:00.csv')#按照列值排序data=df.sort_values(by="createtime" , a ......
Python3 Pandas DataFrame 对某一列求和
在操作pandas的DataFrame的时候,常常会遇到某些列是字符串,某一些列是数值的情况,如果直接使用df_obj.apply(sum)往往会出错使用如下方式即可对其中某一列进行求和 dataf_test1['diff'].sum() // diff为要求和的列 ......
如何用python中pandas模块在csv文件中添加表头
如何用python中pandas模块在csv文件中添加表头 话不多说,直接上代码: python 复制代码 import pandas as pd df = pd.read_csv('tf.csv',header=None,names=['a','b','c','d','e','f','g','h' ......
Python pandas.DataFrame.iat函数方法的使用
DataFrame.iat 按整数位置访问行/列对的单个值。 与iloc类似,两者都提供基于整数的查找。如果只需要在DataFrame或Series中获取或设置一个值,则使用iat。 Raises: 当整数位置超出界限时抛出IndexError 例子: >>> df = pd.DataFrame([ ......
pandas处理重复、NaN数据及读取excel空值
1.删除重复的数据 df.drop_duplicates();默认删除完全一样的行数据。 2.删除NaN数据 df.dropna() ;默认删除掉行数据,只要一行中有NaN; 3.pandas读取excel空白单元格默认设置修改 pandas读取excel表格空值为NaN;用df.fillna没有效 ......