经常碰见发送过来的数据格式不一致,然后导致无法统计等问题,split这一次很有效,让我们来看一下比如有一栏中间以空格方式出现。
运行如下代码可以分开
import pandas as pd
employees = pd.read_excel('Employees.xlsx', index_col='ID')
df = employees['Full Name'].str.split(” “,expand=True)
employees['First Name'] = df[0]
employees['Last Name'] = df[1].str.upper()
print(employees)
以此类推,假如中间是/或者逗号,那我们代码的运行可以这样
import pandas as pd
employees = pd.read_excel('Employees.xlsx', index_col='ID')
df = employees['Full Name'].str.split(”“, expand=True) #""直接计入/或者,
employees['First Name'] = df[0]
employees['Last Name'] = df[1].str.upper()
print(employees)
原创文章(本站视频密码:66668888),作者:xujunzju,如若转载,请注明出处:https://zyicu.cn/?p=7136