一、字段抽取
slice(start,stop)
start 表示开始位置
stop 表示结束位置
用法:
df.[列名].str.slice(开始位置,结束位置)
使用测试数据,我们读取“号码”一列,得到下图
当我们需要从号码中抽取前3位(前3位可知道号码所属的运营商),代码如下:
df = pd.read_excel(io='//mac/Home/Desktop/test/test.xlsx')
df['号码'] = df['号码'].astype(str) # 属性转成字符串格式
df1 = df['号码'].str.slice(0,3)
print(df1)
得到上图,代码中,可以看到我们将“号码”这一列的属性转成了字符串,https://support.i-search.com.cn/article/1572445123916 ,最后也说过,若对int 类型直接操作,会报错。
好处: 在处理Excel某列提取其中固定的字段,我们就不用使用循环的方式去切割了。
二、字段拆分
split(sep,n,expand=Fal