In [None]:
import numpy as np
import pandas as pd
import seaborn as sns
from scipy import stats

In [None]:
class Walmart():
    """
        Você foi contratado pelo Walmart para fazer um levantamento do
        faturamento das lojas nos USA e apontar qual loja seria melhor para
        expandir seu tamanho.
        
        É preciso analisar as vendas semanais de cada loja, calcular algumas
        informações importantes que serão perguntadas e ao ﬁnal de tudo, indicar
        em qual loja deva ser investida.
    """

    def __init__(self):
        path = r'data/Walmart.csv'
        self.df = pd.read_csv(
            filepath_or_buffer=path,
            date_parser='Date',
            sep=',',
            decimal='.',
        )

    def amostra(self):
        df = self.df.sample(1800)

        display(
            df.head(10)
        )

    def df_descrição(self):
        df = self.df[
            [
            'Weekly_Sales',
            'Temperature',
            'Fuel_Price',
            'CPI',
            'Unemployment',
            ]
        ]
        df = df.describe()
        df = df.round(decimals=2)
        display(
            df
        )

    def convertendo_a_coluna_date_para_o_tipo_datetime(self):
        self.df['Date'] = pd.to_datetime(
            arg=self.df['Date'],
            format='%d-%m-%Y'
        )

    def preço_médio_semanal_por_loja(self):
        df = self.df[
            [
                'Store',
                'Weekly_Sales'
            ]
        ]

        df = df[(np.abs(stats.zscore(df['Weekly_Sales'])) < 3)]
        df = df.groupby('Store').agg({'Weekly_Sales':'mean'}).astype(int).reset_index()

        average_weekly_sales = []

        for store in self.df['Store']:
            aws = df[
                (df['Store'] == store)
            ]['Weekly_Sales'].iloc[0]

            average_weekly_sales.append(aws)

        self.df['average_weekly_sales'] = average_weekly_sales
        display(df.sort_values(by='Weekly_Sales', ascending=False).head(5))

    def preço_médio_anual_por_loja(self):
        df = self.df[
            [
                'Date',
                'Store',
                'Weekly_Sales'
            ]
        ]
        
        df = df[(np.abs(stats.zscore(df['Weekly_Sales'])) < 3)]
        df['year'] = df['Date'].dt.year
        df = df.groupby(['Store', 'year']).mean().astype(int).reset_index()
        display(df.sort_values(by='Weekly_Sales', ascending=False).head(5))

    def preço_médio_nos_últimos_3_anos_por_loja(self):
        df = self.df[
            [
                'Date',
                'Store',
                'Weekly_Sales'
            ]
        ]

        df = df[(np.abs(stats.zscore(df['Weekly_Sales'])) < 3)]
        df = df.groupby('Store').agg({'Weekly_Sales':'mean'}).astype(int).reset_index()
        display(df.sort_values(by='Weekly_Sales', ascending=False).head(5))

    def faturamento_por_loja_nos_últimos_3_anos(self):
        df = self.df[
            [
                'Date',
                'Store',
                'Weekly_Sales'
            ]
        ]

        df['year'] = df['Date'].dt.year
        df = df.groupby('Store').agg({'Weekly_Sales':'sum'}).astype(int).reset_index()

        Turnover_in_the_last_3_years = []
        for store in self.df['Store']:
            titl3y = df[
                (df['Store'] == store)
            ]['Weekly_Sales'].iloc[0]

            Turnover_in_the_last_3_years.append(titl3y)
            
        self.df['Turnover_in_the_last_3_years'] = Turnover_in_the_last_3_years
        display(df.sort_values(by='Weekly_Sales', ascending=False).head(5))

    def faturamento_anual_por_loja(self):
        df = self.df[
            [
                'Date',
                'Store',
                'Weekly_Sales'
            ]
        ]

        df['year'] = df['Date'].dt.year
        df = df.groupby(['Store', 'year']).sum().astype(int).reset_index()


        faturamento = []


        for store, date in zip(self.df['Store'], self.df['Date'].dt.year):
            titl3y = df[
                (df['Store'] == store) &
                (df['year'] == date)
            ]['Weekly_Sales'].iloc[0]

            faturamento.append(titl3y)
            
        self.df['faturamento'] = faturamento



        display(df.sort_values(by='Weekly_Sales', ascending=False).head(5))
    
    def venda_nos_feriado_anualmente_por_loja(self):
        df = self.df[
            [
                'Date',
                'Store',
                'Weekly_Sales',
                'Holiday_Flag',
            ]
        ]

        df = df[
            (df['Holiday_Flag'] == 1)
        ]

        df['year'] = df['Date'].dt.year
        df = df.groupby(['Store', 'year']).sum().astype(int).reset_index()
        display(df.sort_values(by='Weekly_Sales', ascending=False).head(5))

    def venda_nos_feriado_por_loja_nos_últimos_3_anos(self):
        df = self.df[
            [
                'Date',
                'Store',
                'Weekly_Sales',
                'Holiday_Flag',
            ]
        ]

        df = df[
            (df['Holiday_Flag'] == 1)
        ]

        df = df.groupby('Store').agg({'Weekly_Sales':'sum'}).astype(int).reset_index()
        display(df.sort_values(by='Weekly_Sales', ascending=False).head(5))

    def filtrando_as_melhores_lojas(self):
        # Maior faturamento nos últimos 3 anos.
        # Maior preço médio semanal nos últimos 3 anos.
        # Maior venda nos feriados nos últimos 3 anos.
        # Lojas com tendencia de crescimento de faturamento.
        # Lojas com tendencia de crescimento de preço médio por semana.
        # Maior faturamento em 2010.
        # Maior faturamento em 2011.
        # Maior faturamento em 2012.
        # Criar uma coluna faturamento em 2010.
        # Criar uma coluna faturamento em 2011.
        # Criar uma coluna faturamento em 2012.
        # Criar uma coluna faturamento nos ultimos 3 anos.


        df = self.df[
            (self.df['Date'].dt.year == 2011)
        ].sort_values(by='Turnover_in_the_last_3_years', ascending=False)

        display(df)

    def modificando_dataframe(self):
        pass


if __name__ == '__main__':
    walmart = Walmart()