pandas的分列操作str.split()

发布时间 2023-08-21 16:10:30作者: Oops!#

本文主要是在pandas中如何对字符串进行切分。我们考虑一下下面的应用场景。

 


这个是我们的数据集(data),可以看到,数据集中某一列(name)是某个行业的分类。各个行业之间用符号 ‘|’分割。
我们要把用每个‘|’进行分割的内容抽取出来。
pandas有个一步到到位的方法,非常方便。

import pandas as pd
data['name'].str.split('|',expand=True)
  • 1
  • 2

关键是参数expand,这个参数取True时,会把切割出来的内容当做一列。 如果不需要pandas为你分好列,expand=False就可以了。
通过上面一步,我们可以得到下面的结果。

 

这个时候已经切成3列了。

然后,我们如果只想要第一列的话,只需要做:

data['name'].str.split('|',expand=True)[0]

AppName_column = df['名称'].str.split('-',expand=True)[0]