In [None]:
#!pip install pandas
import pandas as pd
print('Pandas instalado e importado com sucesso! Versão:', pd.__version__)

In [None]:
# Criando um DataFrame de exemplo com dados de vendas
sales_data = {
    'Produto': ['Laptop', 'Mouse', 'Teclado', 'Monitor', 'Cadeira'],
    'Quantidade': [100, 500, 300, 200, 150],
    'Preço': [1500, 20, 50, 300, 100]
}
sales_df = pd.DataFrame(sales_data)

# Visualizando as primeiras linhas do DataFrame
sales_df.head()

In [None]:
# Obtendo informações sobre o DataFrame
print('Informações sobre o DataFrame:')
print(sales_df.info())

# Obtendo estatísticas descritivas
print('\nEstatísticas Descritivas:')
print(sales_df.describe())

In [None]:
import numpy as np

# Criando um DataFrame com valores ausentes (NaN)
nan_data = {
    'A': [10, 20, np.nan],
    'B': [5, np.nan, 15],
    'C': [1, 2, 3]
}
nan_df = pd.DataFrame(nan_data)
nan_df

In [None]:
# Identificando valores ausentes
print('Valores Ausentes:')
print(nan_df.isna())

# Removendo linhas com valores ausentes
print('\nRemovendo Linhas com Valores Ausentes:')
print(nan_df.dropna())

# Preenchendo valores ausentes com 0
print('\nPreenchendo Valores Ausentes com 0:')
print(nan_df.fillna(0))

In [None]:
# Criando um DataFrame com tipos de dados mistos
data_mixed = {
    'Id': ['1', '2', '3'],
    'Nome': ['Alice', 'Roberto', 'Carlos'],
    'Idade': [25, 30, 22]
}
mixed_df = pd.DataFrame(data_mixed)

# Convertendo a coluna 'Id' para int
mixed_df['Id'] = mixed_df['Id'].astype(int)

# Renomeando colunas
mixed_df.rename(columns={'Nome': 'Nome Completo', 'Idade': 'Idade (anos)'}, inplace=True)

# Reorganizando colunas
mixed_df = mixed_df[['Nome Completo', 'Idade (anos)', 'Id']]
mixed_df

In [None]:
# Criando um DataFrame representando clientes
customer_data = {
    'Id': range(1, 11),
    'Idade': [28, 35, 29, 40, 23, 45, 36, 30, 34, 26],
    'Renda Anual (mil)': [50, 60, 40, 80, 30, 85, 55, 45, 70, 32],
    'Pontuação de Gastos (1-100)': [40, 60, 50, 70, 20, 80, 55, 42, 75, 30]
}
customer_df = pd.DataFrame(customer_data)
customer_df

In [None]:
# Função para segmentar clientes com base na pontuação de gastos
def segment_customer(score):
    if score <= 40:
        return 'Baixa Pontuação'
    elif score <= 70:
        return 'Média Pontuação'
    else:
        return 'Alta Pontuação'

# Aplicando a função de segmentação à coluna 'Pontuação de Gastos (1-100)'
customer_df['Segmento'] = customer_df['Pontuação de Gastos (1-100)'].apply(segment_customer)
customer_df

In [None]:
# Criando um DataFrame representando campanhas de marketing
campaign_data = {
    'Campanha': ['Email', 'Redes Sociais', 'Pesquisa Paga', 'Display', 'SEO'],
    'Orçamento (mil)': [5, 10, 8, 3, 2],
    'Cliques': [500, 800, 600, 300, 400],
    'Conversões': [50, 100, 60, 20, 40],
    'Receita (mil)': [10, 25, 15, 5, 8]
}
campaign_df = pd.DataFrame(campaign_data)
campaign_df

In [None]:
# Calculando Custo por Clique (CPC)
campaign_df['CPC (mil)'] = campaign_df['Orçamento (mil)'] / campaign_df['Cliques']

# Calculando Taxa de Conversão
campaign_df['Taxa de Conversão (%)'] = (campaign_df['Conversões'] / campaign_df['Cliques']) * 100

# Calculando Retorno sobre o Investimento (ROI)
campaign_df['ROI (%)'] = ((campaign_df['Receita (mil)'] - campaign_df['Orçamento (mil)']) / campaign_df['Orçamento (mil)']) * 100
campaign_df

In [None]:
# Criando um DataFrame representando perfis de consumidores
consumer_data = {
    'Id': range(1, 11),
    'Idade': [28, 35, 22, 40, 23, 45, 36, 30, 34, 26],
    'Gênero': ['F', 'M', 'F', 'M', 'F', 'M', 'F', 'M', 'F', 'F'],
    'Localização': ['Cidade A', 'Cidade B', 'Cidade A', 'Cidade B', 'Cidade A', 'Cidade B', 'Cidade A', 'Cidade B', 'Cidade A', 'Cidade A'],
    'Categoria Preferida': ['Eletrônicos', 'Roupas', 'Roupas', 'Alimentos', 'Eletrônicos', 'Alimentos', 'Roupas', 'Eletrônicos', 'Alimentos', 'Roupas'],
    'Frequência de Compra (meses)': [1, 2, 1, 3, 2, 1, 2, 3, 1, 2]
}
consumer_df = pd.DataFrame(consumer_data)
consumer_df

In [None]:
# Segmentando consumidores por categoria de produto preferida
segmented_by_category = consumer_df.groupby('Categoria Preferida') #.mean()#.describe()
segmented_by_category

In [None]:
import matplotlib.pyplot as plt

# Criando um histograma para a frequência de compra dos consumidores
plt.hist(consumer_df['Frequência de Compra (meses)'], bins=[1, 2, 3, 4], edgecolor='black')
plt.title('Distribuição da Frequência de Compra dos Consumidores')
plt.xlabel('Frequência de Compra (meses)')
plt.ylabel('Número de Consumidores')
plt.xticks([1, 2, 3])
plt.show()

In [None]:
# Criando um DataFrame representando vendas mensais
sales_data = {
    'Mês': ['Jan', 'Fev', 'Mar', 'Abr', 'Mai', 'Jun', 'Jul', 'Ago', 'Set', 'Out', 'Nov', 'Dez'],
    'Produto A': [100, 150, 200, 150, 300, 400, 500, 450, 300, 200, 250, 300],
    'Produto B': [200, 250, 300, 250, 200, 150, 100, 150, 200, 250, 300, 350],
    'Produto C': [300, 350, 400, 350, 300, 250, 200, 250, 300, 350, 400, 450]
}
sales_df = pd.DataFrame(sales_data)
sales_df

In [None]:
# Criando um gráfico de linhas para visualizar as tendências de vendas
plt.figure(figsize=(10, 6))
plt.plot(sales_df['Mês'], sales_df['Produto A'], label='Produto A')
plt.plot(sales_df['Mês'], sales_df['Produto B'], label='Produto B')
plt.plot(sales_df['Mês'], sales_df['Produto C'], label='Produto C')
plt.title('Tendências de Vendas Mensais')
plt.xlabel('Mês')
plt.ylabel('Vendas')
plt.legend()
plt.show()

In [None]:
# Calculando a venda total de cada produto durante o ano
total_sales = sales_df[['Produto A', 'Produto B', 'Produto C']].sum()
total_sales

In [None]:
# Custos unitários para os produtos
unit_costs = {'Produto A': 2, 'Produto B': 3, 'Produto C': 4}

# Calculando o custo total para cada produto
for product, cost in unit_costs.items():
    sales_df[f'Custo {product}'] = sales_df[product] * cost

# Calculando o lucro para cada produto
for product in unit_costs.keys():
    sales_df[f'Lucro {product}'] = sales_df[product] - sales_df[f'Custo {product}']

sales_df

In [None]:
# Calculando a margem de lucro para cada produto
profit_margin = {}
for product in unit_costs.keys():
    profit_margin[product] = (sales_df[f'Lucro {product}'].sum() / sales_df[product].sum()) * 100

# Criando um gráfico de barras para visualizar a margem de lucro
plt.bar(profit_margin.keys(), profit_margin.values(), color=['blue', 'green', 'orange'])
plt.title('Margem de Lucro por Produto')
plt.xlabel('Produto')
plt.ylabel('Margem de Lucro (%)')
plt.show()