本文同步发表于小弟自架网站:微确幸资讯站
原始资料:
将武功简历中有学过的标示为「1」,没学过的标示为「0」。
预期结果:
import pandas as pddf = pd.DataFrame({'武功简历': {'杨过': '全真剑法,弹指神通,九阴真经,黯然销魂掌', '黄药师': '落英神剑掌,弹指神通', '王重阳': '全真剑法,先天功,一阳指', '一灯大师': '一阳指,先天功,九阴真经'}} )df
# pandas explode 配合 pipe 及 get_dummies后的状况df['武功简历'].str.split(',').explode().pipe(pd.get_dummies)
# 最终程式以人物 groupby 后,对所有的武功做加总得到结果df.join(df['武功简历'].str.split(',').explode().pipe(pd.get_dummies).groupby(level=0).sum())