# <font color='blue'>Data Science Academy</font>
# <font color='blue'>Big Data Real-Time Analytics com Python e Spark</font>

# <font color='blue'>Capítulo 2</font>

## Panel - Representa Objetos de 3 dimensões

In [1]:
# Versão da Linguagem Python
from platform import python_version
print('Versão da Linguagem Python Usada Neste Jupyter Notebook:', python_version())

Versão da Linguagem Python Usada Neste Jupyter Notebook: 3.7.6


In [2]:
# Importando as bibliotecas que serão usadas
import pandas as pd
import numpy as np
import warnings
warnings.filterwarnings ("ignore")

In [3]:
# Versão do Pandas
print(pd.__version__)

0.24.2


In [4]:
# Versão do Numpy
print(np.__version__)

1.16.5


In [5]:
# Criando um conjunto de dados de forma aleatória
data = np.random.randint(1, 10, (5, 3, 2))

In [6]:
# Usando Panel, e indicando as dimensões 
painel = pd.Panel(data,
    items = ['item {}'.format(i) for i in range(1,6)],
    major_axis = [2015, 2016, 2017],
    minor_axis = ['US', 'UK'])

In [7]:
# Exibindo o tipo do objeto e suas dimensões
print(painel)

<class 'pandas.core.panel.Panel'>
Dimensions: 5 (items) x 3 (major_axis) x 2 (minor_axis)
Items axis: item 1 to item 5
Major_axis axis: 2015 to 2017
Minor_axis axis: US to UK


In [8]:
# Realizando reshape do dataframe
data = data.reshape(5,6).T

In [9]:
# forma alternativa ao Panel para criar um objeto com 3 dimensões, usando o pacote MultiIndex
df = pd.DataFrame(
    data = data,
    index = pd.MultiIndex.from_product([[2015, 2016, 2017], ['US', 'UK']]),
    columns=['item {}'.format(i) for i in range (1,6)])

In [10]:
# Exibindo na tela o Objeto com 3 dimensões
df

Unnamed: 0,Unnamed: 1,item 1,item 2,item 3,item 4,item 5
2015,US,3,8,8,2,9
2015,UK,3,1,7,5,7
2016,US,5,4,4,4,9
2016,UK,1,8,2,4,5
2017,US,9,8,6,8,4
2017,UK,1,5,3,8,5


## Criando Objetos Multidimensionais com Panel

In [11]:
# Criando um DataFrame (Objeto Bidimensional)
USData = pd.DataFrame(np.array([[249.62, 8900],
                               [282.16,12680],
                               [309.35,14940]]),
                     columns=['População(M)', 'PIB($B)'],
                     index= [1995,2005,2015])

In [12]:
# Retornando os dados da Matriz
USData

Unnamed: 0,População(M),PIB($B)
1995,249.62,8900.0
2005,282.16,12680.0
2015,309.35,14940.0


In [13]:
# Criando um DataFrame (Objeto Bidimensional)
ChinaData = pd.DataFrame(np.array([[1133.68, 390.28],
                               [1266.83,1198.48],
                               [1339.72, 9923.47]]),
                     columns=['População(M)', 'PIB($B)'],
                     index= [1995,2005,2015])

In [14]:
# Retornando os dados da Matriz
ChinaData

Unnamed: 0,População(M),PIB($B)
1995,1133.68,390.28
2005,1266.83,1198.48
2015,1339.72,9923.47


In [15]:
# Unindo os dois DataFrame, para criar um objeto Multidimensional
US_ChinaData = {'US' : USData,
               'China' : ChinaData}

In [16]:
# Retornando os dados do DataFrame Multidimensional
US_ChinaData

{'US':       População(M)  PIB($B)
 1995        249.62   8900.0
 2005        282.16  12680.0
 2015        309.35  14940.0,
 'China':       População(M)  PIB($B)
 1995       1133.68   390.28
 2005       1266.83  1198.48
 2015       1339.72  9923.47}

In [17]:
# Exibindo o tipo do objeto e suas dimensões
pd.Panel (US_ChinaData)

<class 'pandas.core.panel.Panel'>
Dimensions: 2 (items) x 3 (major_axis) x 2 (minor_axis)
Items axis: US to China
Major_axis axis: 1995 to 2015
Minor_axis axis: População(M) to PIB($B)

In [18]:
# Exibindo o tipo do objeto
type(pd.Panel(US_ChinaData))

pandas.core.panel.Panel

## Convertendo DataFrame para Panel

In [19]:
# Criando objeto MultiIndex
mIdx = pd.MultiIndex(levels = [['US', 'China'], [1995,2005,2015]],
                    labels = [[1,1,1,0,0,0],[0,1,2,0,1,2]])

In [20]:
# Retornando os elementos do Objeto
mIdx

MultiIndex(levels=[['US', 'China'], [1995, 2005, 2015]],
           codes=[[1, 1, 1, 0, 0, 0], [0, 1, 2, 0, 1, 2]])

In [21]:
# Convertendo os dados em DataFrame e usando o objeto MultiIndex como Indice 
ChinaUSDF = pd.DataFrame({'População(M)':[1133.68, 1266.83, 1339.72, 249.62, 282.16, 309.35],
                         'PIB($B)':[390.28, 1198.48, 6988.47, 8900, 12680, 14940]},
                        index = mIdx)

In [22]:
# Retornando os elementos do Objeto de 3 dimensões
ChinaUSDF

Unnamed: 0,Unnamed: 1,População(M),PIB($B)
China,1995,1133.68,390.28
China,2005,1266.83,1198.48
China,2015,1339.72,6988.47
US,1995,249.62,8900.0
US,2005,282.16,12680.0
US,2015,309.35,14940.0


In [23]:
# ChinaUSDF.to_panel()
#!pip install xarray

In [24]:
ChinaUSDF.to_xarray()

## Fim