pandas.get_dummies 的用法

get_dummies 是利用pandas实现one hot encode的方式。官方文档:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.get_dummies.html

pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None)

以以下数据集为例:

1、写入数据

import pandas as pd
from pathlib import Path

# 获取目标文件下的所有文件列表
file_path = Path('/Users/xujun/Desktop/Alice_20201112164834.csv')
df = pd.read_csv(file_path)
print(df)
pandas.get_dummies 的用法

2、已ICU进行分组生成one hot encode

df_div_group = pd.get_dummies(df, columns=['ICU'], prefix='group')

print(df_div_group)
pandas.get_dummies 的用法

3、假如是已某两列生成one hot encode

import pandas as pd
df = pd.DataFrame([  
            ['green' , 'A'],   
            ['red'   , 'B'],   
            ['blue'  , 'A']])  

df.columns = ['color',  'group'] 
print(df)

df = pd.get_dummies(df) 
print(df)

pandas.get_dummies 的用法

4、将指定列进行get_dummies 后合并到元数据中

import pandas as pd
df = pd.DataFrame([  
            ['green' , 'A'],   
            ['red'   , 'B'],   
            ['blue'  , 'A']])  

df.columns = ['color',  'group'] 
print(df)

df = df.join(pd.get_dummies(df.color))
print(df)
pandas.get_dummies 的用法

    原创文章(本站视频密码:66668888),作者:xujunzju,如若转载,请注明出处:https://zyicu.cn/?p=11722

    (0)
    打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
    xujunzju管理者
    上一篇 2022年4月10日 16:13
    下一篇 2022年4月22日 23:25

    相关推荐

    发表回复

    登录后才能评论
    联系我们
    邮箱:
    xujunzju@gmail.com
    公众号:
    xujunzju6174
    捐赠本站
    捐赠本站
    分享本页
    返回顶部