# Relatório da Análise de Vendas
\
Este projeto analisou o dataset "Sample - Superstore", de origem educacional do Kaggle, para identificar os produtos mais lucrativos por categoria na Amazon. Após uma etapa de limpeza que removeu outliers significativos, a análise revelou que categorias como "Copiadoras" e "Fichários" têm lucro concentrado em poucos itens, enquanto "Mesas" e "Estantes" apresentam produtos com prejuízo, sugerindo uma necessidade de revisão estratégica.

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import gdown
plt.style.use('ggplot')

In [2]:
Amazon = pd.read_csv("Amazon-2_Raw.csv", index_col=0)

FileNotFoundError: [Errno 2] No such file or directory: 'Amazon-2_Raw.csv'

In [None]:
Amazon.head()

Problema: Analisar produtos que são mais contribuem para o lucro de cada categória.






In [None]:
Amazon.shape

#Limpeza de dados

**Análise inicial do data frame.**

In [None]:
Amazon.info()

É possível verificar que não há valores nulos e que os tipos dos dados estão corretos.

**Verificação se há dados duplicados.**

In [None]:
Amazon.duplicated()

Não tem dados duplicados.

**Analíse geral das variáveis quantitativas.**

In [None]:
Amazon.describe()

Focando na média, valores máximos e mínimos em relação a 'quantidade' não se percebe nenhuma inconsistência. Porém, nas vendas e lucros é perceptível valores fora do padrão.

**Observando as vendas.**

In [None]:
Amazon[['Sales']].plot(kind='box')
plt.show()

Tem dois produtos especificamente que se destoam bastante do padrão.

Ordenando o data frame em relação a vendas para obter informações desses dois produtos. Podemos ver que são da categoria "copiadoras" e "suprimentos".

In [None]:
Amazon.sort_values(by=['Sales'], ascending=False).head(5)

**Entrando mais em detalhes na categoria de copiadoras.**

In [None]:
Copiadoras = Amazon.loc[Amazon['Category'] == 'Copiers']
Copiadoras.sort_values(by=['Sales'], ascending=False).head(5)

Nas copiadoras a diferença é ainda maior, sendo a segunda mais vendida no mesmo ano com 3359.95 vendas. Então, esse dado provavelmente está incorreto.

Exlucindo dado do data frame.

In [None]:
Amazon = Amazon[(Amazon['Sales'] < 13999.96)]

**Em relação ao produto da categoria de suprimentos.**

In [None]:
Suprimentos = Amazon.loc[Amazon['Category'] == 'Supplies']
Suprimentos.sort_values(by=['Sales'], ascending=False).head(5)

Por mais que o priemiro e segundo produto sejam o mesmo, com o primeiro tendo quase o dobro de vendas, esse dado não pode ser considerado falso. Já que as amostras são de anos diferntes, sendo um de 2011 e outro de 2013, o que pode explicar a diferença da quantidade de vendas do mesmo produto.

**Observando o lucro.**

In [None]:
Amazon[['Profit']].plot(kind='box')
plt.show()

In [None]:
Amazon.sort_values(by=['Profit'], ascending=True).head(5)

O produto com pior lucro tem uma diferença muito grande do segundo. Por isso provavelmente é um dado incorreto.

Removendo esse produto.

In [None]:
Amazon = Amazon[(Amazon['Profit'] > -3399.98)]

Depois dessas alterações, o data frame ficou da seguinte forma.

In [None]:
Amazon.describe()

In [None]:
Amazon[['Profit', "Sales"]].plot(kind='box')
plt.show()

Os atributos "Ship date", "Email ID" e "Geography" não serão relevantes para analise do lucro, então vamos remover eles.

In [None]:
del Amazon['Ship Date']
del Amazon['EmailID']
del Amazon['Geography']

In [None]:
Amazon.head()

#Porcentagem de Lucro por categoria

In [None]:
print(Amazon['Category'].unique())

Categoria

#Lucro Labels (Rótulos)

Separando categoria 'Labels'


In [None]:
Labels = Amazon.loc[Amazon['Category'] == 'Labels']

criando uma coluna de porcentagem do lucro

In [None]:
Labels['% profit'] = (Labels['Profit'] / Labels['Profit'].sum()) * 100

Ordenando de forma descrecente

In [None]:
Labels = Labels.sort_values(by=['% profit'], ascending=False)

In [None]:
Labels.head(10)

A table acima mostra os maiores lucros em ordem

In [None]:
Labels.describe()

Dá para perceber que pela forma como o lucro esta destribuido que valores a cima de 1.7 são os mais significantes para o lucro. O suqe contribuem mais de 1,7%.

In [None]:
Labels['% profit'].value_counts().plot(kind='pie', autopct='%1.1f%%', labels = Labels['Product Name'])
plt.show()

Gráfico de pizza dos lucros (Errado por enquanto)

#Lucro Furnishings (Móveis)

Separando categoria 'Furnishings'

In [None]:
Moveis = Amazon.loc[Amazon['Category'] == 'Furnishings']

criando uma coluna de porcentagem do lucro

In [None]:
Moveis['% profit'] = (Moveis['Profit'] / Moveis['Profit'].sum()) * 100

Ordenando de forma descrecente

In [None]:
Moveis = Moveis.sort_values(by=['% profit'], ascending=False)

In [None]:
Moveis.head(10)

A table acima mostra os maiores lucros em ordem

In [None]:
Moveis.describe()

Dá para perceber que nessa categoria os lucros são bem mais regulares, apenas se destacando os de 2.5 para cima, ou 2,5%.

Nesse casso como os valores progridem de forma bem constante não faz sentido colcoar em uma grafico, pois ele seria de forma bem divida e de varios elementos.

#Lucro Art (Arte)

Separando categoria 'Art'

In [None]:
Arte = Amazon.loc[Amazon['Category'] == 'Art']

criando uma coluna de porcentagem do lucro

In [None]:
Arte['% profit'] = (Arte['Profit'] / Arte['Profit'].sum()) * 100

Ordenando de forma descrecente

In [None]:
Arte = Arte.sort_values(by=['% profit'], ascending=False)

In [None]:
Arte.head(10)

A table acima mostra os maiores lucros em ordem

In [None]:
Arte.describe()

Essa categoria tem valores constantes que crescem de maneira lenta. Tendo um aumento mais brusco a partir de 3,3%.

#Lucro Phones (Telefones)

Separando categoria 'Phones'

In [None]:
Telefones = Amazon.loc[Amazon['Category'] == 'Phones']

criando uma coluna de porcentagem do lucro

In [None]:
Telefones['% profit'] = (Telefones['Profit'] / Telefones['Profit'].sum()) * 100

Ordenando de forma descrecente

In [None]:
Telefones = Telefones.sort_values(by=['% profit'], ascending=False)

In [None]:
Telefones.head(10)

A table acima mostra os maiores lucros em ordem

In [None]:
Telefones.describe()

Essa categoria tem valores constantes que crescem de maneira lenta.

#Lucro Binders (Fichários)

Separando categoria 'Phones'

In [None]:
Ficharios = Amazon.loc[Amazon['Category'] == 'Binders']

criando uma coluna de porcentagem do lucro

In [None]:
Ficharios['% profit'] = (Ficharios['Profit'] / Ficharios['Profit'].sum()) * 100

Ordenando de forma descrecente

In [None]:
Ficharios = Ficharios.sort_values(by=['% profit'], ascending=False)

In [None]:
Ficharios.head(10)

A table acima mostra os maiores lucros em ordem

In [None]:
Ficharios.describe()

É possível perceber uma variação muito grande a partir de 5.4%, assim os 5 primeiros itens representam uma grande parte do lucro dessa categória.

#Appliances (Eletrodomésticos)

Separando categoria 'Appliances'

In [None]:
Eletro = Amazon.loc[Amazon['Category'] == 'Appliances']

criando uma coluna de porcentagem do lucro

In [None]:
Eletro['% profit'] = (Eletro['Profit'] / Eletro['Profit'].sum()) * 100

Ordenando de forma descrecente

In [None]:
Eletro = Eletro.sort_values(by=['% profit'], ascending=False)

In [None]:
Eletro.head(10)

A table acima mostra os maiores lucros em ordem

In [None]:
Eletro.describe()

Uma categoria consistente que aumenta os valores de maneira lenta, não tendo um elemento tão significativo para o lucro

#Lucro Tables (Mesas)

Separando categoria 'Tables'

In [None]:
Mesas = Amazon.loc[Amazon['Category'] == 'Tables']

criando uma coluna de porcentagem do lucro

In [None]:
Mesas['% profit'] = (Mesas['Profit'] / Mesas['Profit'].sum()) * 100

Ordenando de forma descrecente

In [None]:
Mesas = Mesas.sort_values(by=['% profit'], ascending=False)
Mesas.head(10)

A table acima mostra os maiores lucros em ordem

In [None]:
Mesas.describe()

Os dois primeiros elementos fazem parte da maior parte do lucro desas categoria.

#Lucro Storage (Amazenamento)

Separando categoria 'Storage'

In [None]:
Armazenamento = Amazon.loc[Amazon['Category'] == 'Storage']

criando uma coluna de porcentagem do lucro

In [None]:
Armazenamento['% profit'] = (Armazenamento['Profit'] / Armazenamento['Profit'].sum()) * 100

Ordenando de forma descrecente

In [None]:
Armazenamento = Armazenamento.sort_values(by=['% profit'], ascending=False)
Armazenamento.head(10)

A table acima mostra os maiores lucros em ordem

In [None]:
Armazenamento.describe()

Uma cateogria bem consistente com valores aumentando de maneira lenta.

#Lucro Accessories (Acessórios)

Separando categoria 'Accessories'

In [None]:
Acessorios = Amazon.loc[Amazon['Category'] == 'Accessories']

criando uma coluna de porcentagem do lucro

In [None]:
Acessorios['% profit'] = (Acessorios['Profit'] / Acessorios['Profit'].sum()) * 100

Ordenando de forma descrecente

In [None]:
Acessorios = Acessorios.sort_values(by=['% profit'], ascending=False)
Acessorios.head(10)

A table acima mostra os maiores lucros em ordem

In [None]:
Acessorios.describe()

Cateogria bem consistente com valores que aumentam de manira lenta.

#Lucro Paper (Papel)

Separando categoria 'Paper'

In [None]:
Papel = Amazon.loc[Amazon['Category'] == 'Paper']

criando uma coluna de porcentagem do lucro

In [None]:
Papel['% profit'] = (Papel['Profit'] / Papel['Profit'].sum()) * 100

Ordenando de forma descrecente

In [None]:
Papel = Papel.sort_values(by=['% profit'], ascending=False)
Papel.head(10)

A table acima mostra os maiores lucros em ordem

In [None]:
Papel.describe()

Cateogria bem consistente com valores que aumentam de manira lenta.

#Lucro Chairs (Cadeiras)

Separando categoria 'Chairs'

In [None]:
Cadeiras = Amazon.loc[Amazon['Category'] == 'Chairs']

criando uma coluna de porcentagem do lucro

In [None]:
Cadeiras['% profit'] = (Cadeiras['Profit'] / Cadeiras['Profit'].sum()) * 100

Ordenando de forma descrecente

In [None]:
Cadeiras = Cadeiras.sort_values(by=['% profit'], ascending=False)
Cadeiras.head(10)

A table acima mostra os maiores lucros em ordem

In [None]:
Cadeiras.describe()

Essa categória tem uma consistencia média, com os três primeiros elemntos representando a maior parte de lucro, sendo 17% do lucro

#Lucro Fasteners (Fixadores)

Separando categoria 'Fasteners'

In [None]:
Fixadores = Amazon.loc[Amazon['Category'] == 'Fasteners']

criando uma coluna de porcentagem do lucro

In [None]:
Fixadores['% profit'] = (Fixadores['Profit'] / Fixadores['Profit'].sum()) * 100

Ordenando de forma descrecente

In [None]:
Fixadores = Fixadores.sort_values(by=['% profit'], ascending=False)
Fixadores.head(10)

A table acima mostra os maiores lucros em ordem

In [None]:
Fixadores.describe()

Essa categoria tem uma boa consistencia, com os valores crescendo de maneira lenta

#Lucro Supplies (Suprimentos)

Separando categoria 'Supplies'

In [None]:
Suprimentos = Amazon.loc[Amazon['Category'] == 'Supplies']

criando uma coluna de porcentagem do lucro

In [None]:
Suprimentos['% profit'] = (Suprimentos['Profit'] / Suprimentos['Profit'].sum()) * 100

Ordenando de forma descrecente

In [None]:
Suprimentos = Suprimentos.sort_values(by=['% profit'], ascending=False)
Suprimentos.head(10)

A table acima mostra os maiores lucros em ordem

In [None]:
Suprimentos.describe()

Consistencia muito baixa, os ultimos dois valores representando a maior parte do lucro, e tendo um item com um lucro negativo muito alto.

#Lucro Envelopes (Envelopes)

Separando categoria 'Supplies'

In [None]:
Envelopes = Amazon.loc[Amazon['Category'] == 'Envelopes']

criando uma coluna de porcentagem do lucro

In [None]:
Envelopes['% profit'] = (Envelopes['Profit'] / Envelopes['Profit'].sum()) * 100

Ordenando de forma descrecente

In [None]:
Envelopes = Envelopes.sort_values(by=['% profit'], ascending=False)
Envelopes.head(10)

A table acima mostra os maiores lucros em ordem

In [None]:
Envelopes.describe()

Consistencia baixa pois o primeiro item representa 10% do lucro da categoria, que ainda possui valores mais discrepantes até o quarto item.

#Lucro Copiers (Copiadoras)

Separando categoria 'Copiers'

In [None]:
Copiadoras = Amazon.loc[Amazon['Category'] == 'Copiers']

criando uma coluna de porcentagem do lucro

In [None]:
Copiadoras['% profit'] = (Copiadoras['Profit'] / Copiadoras['Profit'].sum()) * 100

Ordenando de forma descrecente

In [None]:
Copiadoras = Copiadoras.sort_values(by=['% profit'], ascending=False)
Copiadoras.head(10)

A table acima mostra os maiores lucros em ordem

In [None]:
Copiadoras.describe()

Categoria muito inconsitente com os dois primeiros itens representando aproximadamente 20% do lucro da categoria.

#Lucro Bookcases (Estantes)

Separando categoria 'Bookcases'

In [None]:
Estantes = Amazon.loc[Amazon['Category'] == 'Bookcases']

criando uma coluna de porcentagem do lucro

In [None]:
Estantes['% profit'] = (Estantes['Profit'] / Estantes['Profit'].sum()) * 100

Ordenando de forma descrecente

In [None]:
Estantes = Estantes.sort_values(by=['% profit'], ascending=False)
Estantes.head(10)

A table acima mostra os maiores lucros em ordem

In [None]:
Estantes.describe()

Uma categoria bem inconsistente onde os porudots em lucros positivos e negativos bem assentuados e os valores de lucro mudando de maneira mais drástica

#Lucro Machines (Máquinas)

Separando categoria 'Machines'

In [None]:
Maquinas = Amazon.loc[Amazon['Category'] == 'Machines']

criando uma coluna de porcentagem do lucro

In [None]:
Maquinas['% profit'] = (Maquinas['Profit'] / Maquinas['Profit'].sum()) * 100

Ordenando de forma descrecente

In [None]:
Maquinas = Maquinas.sort_values(by=['% profit'], ascending=False)
Maquinas.head(10)

A table acima mostra os maiores lucros em ordem

In [None]:
Maquinas.describe()

Categoria muito inconsistente com os primeiros elementos representando a maior parte do lucro da categoria, e tendo um item com lucro negativo muito grande