电脑装配网

Pandas面板(Panel)

 人阅读 | 作者yiyi | 时间:2023-08-04 19:14

面板(Panel)是3D容器的数据。面板数据一词来源于计量经济学,部分源于名称:Pandas - pan(el)-da(ta)-s。

3轴(axis)这个名称旨在给出描述涉及面板数据的操作的一些语义。它们是 -

items - axis 0,每个项目对应于内部包含的数据帧(DataFrame)。major_axis - axis 1,它是每个数据帧(DataFrame)的索引(行)。minor_axis - axis 2,它是每个数据帧(DataFrame)的列。

1. pandas.Panel()

可以使用以下构造函数创建面板 -

pandas.Panel(data, items, major_axis, minor_axis, dtype, copy)Python

构造函数的参数如下 -

data 数据采取各种形式,如:ndarray,series,map,lists,dict,constant和另一个数据帧(DataFrame)

items axis=0

major_axis axis=1

minor_axis axis=2

dtype 每列的数据类型

copy 复制数据,默认 - false

2. 创建面板

可以使用多种方式创建面板 -

从ndarrays创建从DataFrames的dict创建

2.1 从3D ndarray创建

# creating an empty panelimport pandas as pdimport numpy as npdata = np.random.rand(2,4,5)p = pd.Panel(data)print pPython

执行上面示例代码,得到以下结果 -

<class 'pandas.core.panel.Panel'>Dimensions: 2 (items) x 4 (major_axis) x 5 (minor_axis)Items axis: 0 to 1Major_axis axis: 0 to 3Minor_axis axis: 0 to 4Shell

注意 - 观察空面板和上面板的尺寸大小,所有对象都不同。

2.2 从DataFrame对象的dict创建面板

#creating an empty panelimport pandas as pdimport numpy as npdata = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 'Item2' : pd.DataFrame(np.random.randn(4, 2))}p = pd.Panel(data)print pPython

执行上面示例代码,得到以下结果 -

<class 'pandas.core.panel.Panel'>Dimensions: 2 (items) x 4 (major_axis) x 5 (minor_axis)Items axis: 0 to 1Major_axis axis: 0 to 3Minor_axis axis: 0 to 4Shell

2.3 创建一个空面板

可以使用Panel的构造函数创建一个空面板,如下所示:

#creating an empty panelimport pandas as pdp = pd.Panel()print pPython

执行上面示例代码,得到以下结果 -

<class 'pandas.core.panel.Panel'>Dimensions: 0 (items) x 0 (major_axis) x 0 (minor_axis)Items axis: NoneMajor_axis axis: NoneMinor_axis axis: NoneShell

3. 从面板中选择数据

要从面板中选择数据,可以使用以下方式 -

ItemsMajor_axisMinor_axis

使用Items

# creating an empty panelimport pandas as pdimport numpy as npdata = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 'Item2' : pd.DataFrame(np.random.randn(4, 2))}p = pd.Panel(data)print p['Item1']Python

执行上面示例代码,得到以下结果 -

0 1 20 0.488224 -0.128637 0.9308171 0.417497 0.896681 0.5766572 -2.775266 0.571668 0.2900823 -0.400538 -0.144234 1.110535Shell

上面示例有两个数据项,这里只检索item1。结果是具有4行和3列的数据帧(DataFrame),它们是Major_axis和Minor_axis维。

使用major_axis

可以使用panel.major_axis(index)方法访问数据。参考以下示例代码 -

# creating an empty panelimport pandas as pdimport numpy as npdata = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 'Item2' : pd.DataFrame(np.random.randn(4, 2))}p = pd.Panel(data)print p.major_xs(1)Python

执行上面示例代码,得到以下结果 -

Item1 Item20 0.417497 0.7484121 0.896681 -0.5573222 0.576657 NaNShell

使用minor_axis

可以使用panel.minor_axis(index)方法访问数据。参考以下示例代码 -

# creating an empty panelimport pandas as pdimport numpy as npdata = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 'Item2' : pd.DataFrame(np.random.randn(4, 2))}p = pd.Panel(data)print p.minor_xs(1)Python

执行上面示例代码,得到以下结果 -

Item1 Item20 -0.128637 -1.0470321 0.896681 -0.5573222 0.571668 0.4319533 -0.144234 1.302466Shell

注意 - 观察尺寸大不的变化。


文章标签:

本文链接:『转载请注明出处』