pandas数据结构
Series数据
DataFrame数据
索引对象

pandas索引操作
重新索引
更换索引
索引和选取(iloc,loc,ix)
操作行和列
pandas数据运算
算术运算
函数应用和映射
排序
汇总与统计
唯一值和值计数
在数据分析实战中,常常会对数据进行较复杂的数据运算,这时需要定义函数。定义好的函数可以应用到pandas数据中,其中有三种方法:map函数,将函数套用在Series的每个元素中;apply函数,将函数套用到DataFrame的行与列上;applymap函数,将函数套用到DataFrame的每个元素上
层次化索引
算层次化索引
重排分级顺序
汇总统计
pandas可视化
线形图
柱状图
直方图和密度图
散点图
综合案例:小费数据集
数据分析的流程通常情况下分为五步。第一步:收集数据,在这步中,需要对收集的数据有一定的认知,各字段的含义和背景知识都要有着足够的理解;第二步:定义问题,根据各自的行业和业务知识,对数据定义多个待解决的问题;第三步:数据清洗与整理,由于各种问题,获取的数据不够干净,需通过各种手段对数据进行清洗与整理,以便得到准确的分析结果;第四步:数据探索,通过可视化等手段,对数据进行分析和探索,得出结论;第五步:数据展示,这部分用于输出,或撰写数据分析报告、或汇报给上级、或绘制PPT。