前言
在数据分析中,我们经常需要对数据进行堆叠操作,但 Pandas 提供的 df.stack() 只能按默认索引进行操作,同时堆叠后的列名无法指定,本列我们就来解决这些问题。
读入数据
代码如下(示例):
import pandas as pd
df = pd.DataFrame({
'a': ['a1', 'a2', 'a3'],
'b': [11, 22, 33],
'c': [44, 55, 66]
})
df
#思路:先设置堆叠时在列上示变的列为索引,然后进行堆叠操作,最后重刷索引并指定新的列名。
(
df.set_index('a') # 重新设置索引
.stack() # 堆叠
.reset_index() # 重置索引
# 指定列名
.set_axis(['x', 'y', 'z'], axis=1)
)
总结
以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。