Python学习笔记: Pandas MultiIndex 快速建立资料-58码农网

本文同步发表于小弟自架网站：微确幸资讯站

资料建立目标：

学年：108, 109, 110
学期：1, 2
学制："博士班", "硕士班", "大学部"
性别："女", "男"

以上的栏位建构后，呈现「学生人数」。
资料笔数总共为len("学年")*len("学期")*len("学制")*len("性别")，计算后为36笔。

以下为一般冗长方式建构：

import pandas as pdimport numpy as nparrays = [    ["108", "108", "108", "108", "108", "108", "108", "108", "108", "108", "108", "108",     "109", "109", "109", "109", "109", "109", "109", "109", "109", "109", "109", "109",     "110", "110", "110", "110", "110", "110", "110", "110", "110", "110", "110", "110"],    ["1", "1", "1", "1", "1", "1", "2", "2", "2", "2", "2", "2",     "1", "1", "1", "1", "1", "1", "2", "2", "2", "2", "2", "2",     "1", "1", "1", "1", "1", "1", "2", "2", "2", "2", "2", "2",],    ["博士班", "博士班", "硕士班", "硕士班", "大学部", "大学部", "博士班", "博士班", "硕士班", "硕士班", "大学部", "大学部",     "博士班", "博士班", "硕士班", "硕士班", "大学部", "大学部", "博士班", "博士班", "硕士班", "硕士班", "大学部", "大学部",     "博士班", "博士班", "硕士班", "硕士班", "大学部", "大学部", "博士班", "博士班", "硕士班", "硕士班", "大学部", "大学部"],    ["女", "男", "女", "男", "女", "男", "女", "男", "女", "男", "女", "男",      "女", "男", "女", "男", "女", "男", "女", "男", "女", "男", "女", "男",      "女", "男", "女", "男", "女", "男", "女", "男", "女", "男", "女", "男"],]tuples = list(zip(*arrays))tuples

index = pd.MultiIndex.from_tuples(tuples, names=["学年", "学期", "学制", "性别"])df = pd.DataFrame(np.random.randint(300,size=(36,1)),index=index,columns=["学生人数"])df

输出结果太长，只截图一部份：

以下为快速方式建构：

year = [108, 109, 110]semester = [1, 2]academic = ['博士班', '硕士班', '大学部']gender = ['男', '女']index = pd.MultiIndex.from_product([year, semester, academic, gender],                           names=['学年', '学期', '学制', '性别'])index

输出结果太长，只截图一部份：

df = pd.DataFrame(np.random.randint(300,size=(36,1)),index=index,columns=["学生人数"])df

输出结果太长，只截图一部份：

上面的方式就能快速得到所需建构的资料。

但MultiIndex的资料其实在读取及处理上不是很直觉，
可以加个程式码将MultiIndex取代掉，看起来就很像Excel的格式。

后续处理

df = df.reset_index()df

输出结果太长，只截图一部份：

资料建立目标：

以下为一般冗长方式建构：

以下为快速方式建构：

后续处理

给这篇文章的作者打赏

关于作者: 网站小编

相关文章

HBO Max vs.Netflix：当你负担不起两者时如何选择

课内笔记整理---作业系统实务(资安相关篇)

excel vba捞网页数据问题

热门文章

1Python学习笔记: Pandas MultiIndex 快速建立资料

2无所事事的陪伴

3浅谈『模拟』(Simulation) 【2】-- 视觉化

4Wikipedia 内建的 Dark Mode 与其他外观排版

5Java Jackson ObjectMapper 教学与注意事项