In [3]:
import json

# Criando um dicionário
data = {
    "nome": "Joao",
    "idade": 30,
    "cidade": "Sao Paulo",
    "habilidades": ["Python", "JavaScript", "SQL"]
}

# Convertendo o dicionário para JSON
json_data = json.dumps(data, indent=4)

# Exibindo o JSON
print(json_data)


{
    "nome": "Joao",
    "idade": 30,
    "cidade": "Sao Paulo",
    "habilidades": [
        "Python",
        "JavaScript",
        "SQL"
    ]
}


In [2]:
import json

# Supondo que temos um arquivo 'dados.json' com um conteúdo JSON
with open('exemplo.json', 'r') as file:
    data = json.load(file)

# Exibindo os dados lidos
print(data)


{'Rodrigo': {'CPF': '222.222.333-47', 'Sexo': 'Masculino', 'Endereco': 'Rua maranhoes', 'Idade': 34}, 'Ferando': {'CPF': '111.333.444-47', 'Sexo': 'Masculino', 'Endereco': 'Rua souza', 'Idade': 30}}


In [4]:
import json

# Estrutura JSON mais complexa
data = {
    "empresa": "TechCorp",
    "funcionarios": [
        {
            "nome": "Carlos",
            "cargo": "Desenvolvedor",
            "salario": 5000
        },
        {
            "nome": "Maria",
            "cargo": "Designer",
            "salario": 4500
        }
    ],
    "localizacao": "Sao Paulo"
}

# Convertendo para JSON
json_data = json.dumps(data, indent=4)

# Exibindo o JSON gerado
print(json_data)


{
    "empresa": "TechCorp",
    "funcionarios": [
        {
            "nome": "Carlos",
            "cargo": "Desenvolvedor",
            "salario": 5000
        },
        {
            "nome": "Maria",
            "cargo": "Designer",
            "salario": 4500
        }
    ],
    "localizacao": "Sao Paulo"
}


In [6]:
import json

# Dicionário com tipo de dado incompatível (set)
data = {
    "nomes": {"João", "Carlos", "Ana"}
}

# Convertendo para JSON (set será convertido para lista)
json_data = json.dumps(data, indent=4)

# Exibindo o JSON
print(json_data)


TypeError: Object of type set is not JSON serializable

In [10]:
import json
from collections import defaultdict

# Exemplo de dados JSON de pessoas
data = '''
[
    {"nome": "Joao", "idade": 30, "cidade": "Sao Paulo"},
    {"nome": "Maria", "idade": 25, "cidade": "Rio de Janeiro"},
    {"nome": "Carlos", "idade": 30, "cidade": "Sao Paulo"},
    {"nome": "Ana", "idade": 25, "cidade": "Belo Horizonte"}
]
'''

# Carregar o JSON em um objeto Python
pessoas = json.loads(data)

# Agrupar pessoas pela idade
grupo_por_idade = defaultdict(list)
for pessoa in pessoas:
    grupo_por_idade[pessoa['idade']].append(pessoa)

# Exibindo o resultado
print(json.dumps(grupo_por_idade, indent=4))


{
    "30": [
        {
            "nome": "Joao",
            "idade": 30,
            "cidade": "Sao Paulo"
        },
        {
            "nome": "Carlos",
            "idade": 30,
            "cidade": "Sao Paulo"
        }
    ],
    "25": [
        {
            "nome": "Maria",
            "idade": 25,
            "cidade": "Rio de Janeiro"
        },
        {
            "nome": "Ana",
            "idade": 25,
            "cidade": "Belo Horizonte"
        }
    ]
}


In [12]:
import json

# Dados JSON de produtos
data = '''
{
    "produtos": [
        {"nome": "Notebook", "preco": 3000, "categoria": "Eletronicos"},
        {"nome": "Smartphone", "preco": 1500, "categoria": "Eletronicos"},
        {"nome": "Fones de ouvido", "preco": 200, "categoria": "Acessórios"},
        {"nome": "Cadeira gamer", "preco": 1200, "categoria": "Moveis"}
    ]
}
'''

# Carregar os dados JSON
produtos = json.loads(data)

# Filtrando produtos com preço superior a 1000
produtos_filtrados = [produto for produto in produtos['produtos'] if produto['preco'] > 1000]

# Exibindo os produtos filtrados
print(json.dumps(produtos_filtrados, indent=4))


[
    {
        "nome": "Notebook",
        "preco": 3000,
        "categoria": "Eletronicos"
    },
    {
        "nome": "Smartphone",
        "preco": 1500,
        "categoria": "Eletronicos"
    },
    {
        "nome": "Cadeira gamer",
        "preco": 1200,
        "categoria": "Moveis"
    }
]


In [13]:
import json

# Dados JSON de um usuário
data = '''
{
    "usuario": {
        "nome": "Ricardo",
        "idade": 28,
        "cidade": "Curitiba"
    }
}
'''

# Carregar o JSON
usuario = json.loads(data)

# Atualizando a cidade do usuário
usuario['usuario']['cidade'] = "Sao Paulo"

# Exibindo o JSON atualizado
print(json.dumps(usuario, indent=4))


{
    "usuario": {
        "nome": "Ricardo",
        "idade": 28,
        "cidade": "Sao Paulo"
    }
}


In [14]:
import json

# Dados JSON de clientes
clientes_data = '''
{
    "clientes": [
        {"id": 1, "nome": "Lucas", "email": "lucas@email.com"},
        {"id": 2, "nome": "Maria", "email": "maria@email.com"}
    ]
}
'''

# Dados JSON de pedidos
pedidos_data = '''
{
    "pedidos": [
        {"cliente_id": 1, "produto": "Notebook", "quantidade": 1},
        {"cliente_id": 2, "produto": "Smartphone", "quantidade": 2}
    ]
}
'''

# Carregar os dados
clientes = json.loads(clientes_data)
pedidos = json.loads(pedidos_data)

# Mesclando os dados de clientes com os pedidos
for pedido in pedidos['pedidos']:
    for cliente in clientes['clientes']:
        if cliente['id'] == pedido['cliente_id']:
            pedido['cliente_nome'] = cliente['nome']
            pedido['cliente_email'] = cliente['email']

# Exibindo os pedidos com informações completas
print(json.dumps(pedidos['pedidos'], indent=4))


[
    {
        "cliente_id": 1,
        "produto": "Notebook",
        "quantidade": 1,
        "cliente_nome": "Lucas",
        "cliente_email": "lucas@email.com"
    },
    {
        "cliente_id": 2,
        "produto": "Smartphone",
        "quantidade": 2,
        "cliente_nome": "Maria",
        "cliente_email": "maria@email.com"
    }
]


In [15]:
import json
from jsonschema import validate, ValidationError

# Exemplo de esquema JSON esperado
schema = {
    "type": "object",
    "properties": {
        "nome": {"type": "string"},
        "idade": {"type": "integer"},
        "cidade": {"type": "string"}
    },
    "required": ["nome", "idade", "cidade"]
}

# Dados JSON a serem validados
data = '''
{
    "nome": "Carlos",
    "idade": 30,
    "cidade": "Rio de Janeiro"
}
'''

# Carregar os dados JSON
user_data = json.loads(data)

# Validando os dados com o esquema
try:
    validate(instance=user_data, schema=schema)
    print("JSON válido!")
except ValidationError as e:
    print(f"Erro na validação: {e.message}")


JSON válido!


In [17]:
import json

# Dados JSON de produtos
data = '''
{
    "produtos": [
        {"nome": "Notebook", "preco": 3000, "categoria": "Eletronicos"},
        {"nome": "Smartphone", "preco": 1500, "categoria": "Eletronicos"},
        {"nome": "Fones de ouvido", "preco": 200, "categoria": "Acessorios"},
        {"nome": "Cadeira gamer", "preco": 1200, "categoria": "Moveis"}
    ]
}
'''

# Carregar os dados JSON
produtos = json.loads(data)

# Ordenando os produtos pelo preço de forma crescente
produtos_ordenados = sorted(produtos['produtos'], key=lambda x: x['preco'])

# Exibindo os produtos ordenados
print(json.dumps(produtos_ordenados, indent=4))


[
    {
        "nome": "Fones de ouvido",
        "preco": 200,
        "categoria": "Acessorios"
    },
    {
        "nome": "Cadeira gamer",
        "preco": 1200,
        "categoria": "Moveis"
    },
    {
        "nome": "Smartphone",
        "preco": 1500,
        "categoria": "Eletronicos"
    },
    {
        "nome": "Notebook",
        "preco": 3000,
        "categoria": "Eletronicos"
    }
]


In [18]:
import json
from collections import Counter

# Dados JSON de vendas
data = '''
{
    "vendas": [
        {"produto": "Notebook", "quantidade": 1},
        {"produto": "Smartphone", "quantidade": 2},
        {"produto": "Notebook", "quantidade": 3},
        {"produto": "Smartphone", "quantidade": 1},
        {"produto": "Cadeira gamer", "quantidade": 2}
    ]
}
'''

# Carregar os dados JSON
vendas = json.loads(data)

# Contando as ocorrências de cada produto
contador_produtos = Counter([venda['produto'] for venda in vendas['vendas']])

# Exibindo o resultado
print(json.dumps(contador_produtos, indent=4))


{
    "Notebook": 2,
    "Smartphone": 2,
    "Cadeira gamer": 1
}


In [19]:
import json
from collections import defaultdict

# Dados JSON de vendas
data = '''
{
    "vendas": [
        {"produto": "Notebook", "quantidade": 1},
        {"produto": "Smartphone", "quantidade": 2},
        {"produto": "Notebook", "quantidade": 3},
        {"produto": "Smartphone", "quantidade": 1},
        {"produto": "Cadeira gamer", "quantidade": 2}
    ]
}
'''

# Carregar os dados JSON
vendas = json.loads(data)

# Agregando as vendas por produto e somando as quantidades
total_vendas = defaultdict(int)
for venda in vendas['vendas']:
    total_vendas[venda['produto']] += venda['quantidade']

# Exibindo o resultado
print(json.dumps(total_vendas, indent=4))


{
    "Notebook": 4,
    "Smartphone": 3,
    "Cadeira gamer": 2
}


In [20]:
import json

# Dados JSON de produtos
data = '''
{
    "produtos": [
        {"nome": "Notebook", "preco": 3000, "categoria": "Eletronicos"},
        {"nome": "Smartphone", "preco": 1500, "categoria": "Eletronicos"},
        {"nome": "Fones de ouvido", "preco": 200, "categoria": "Acessorios"},
        {"nome": "Cadeira gamer", "preco": 1200, "categoria": "Moveis"}
    ]
}
'''

# Carregar os dados JSON
produtos = json.loads(data)

# Atualizando o preço de todos os produtos na categoria 'Eletrônicos'
for produto in produtos['produtos']:
    if produto['categoria'] == 'Eletronicos':
        produto['preco'] *= 1.10  # Aumento de 10% no preço

# Exibindo os produtos com os preços atualizados
print(json.dumps(produtos['produtos'], indent=4))


[
    {
        "nome": "Notebook",
        "preco": 3300.0000000000005,
        "categoria": "Eletronicos"
    },
    {
        "nome": "Smartphone",
        "preco": 1650.0000000000002,
        "categoria": "Eletronicos"
    },
    {
        "nome": "Fones de ouvido",
        "preco": 200,
        "categoria": "Acessorios"
    },
    {
        "nome": "Cadeira gamer",
        "preco": 1200,
        "categoria": "Moveis"
    }
]


In [21]:
import json

# Dados JSON de pessoas
data = '''
{
    "pessoas": [
        {"nome": "João", "idade": 30, "cidade": "Sao Paulo"},
        {"nome": "Maria", "idade": 25, "cidade": "Rio de Janeiro"},
        {"nome": "Carlos", "idade": 35, "cidade": "Sao Paulo"},
        {"nome": "Ana", "idade": 28, "cidade": "Belo Horizonte"},
        {"nome": "Pedro", "idade": 40, "cidade": "Sao Paulo"}
    ]
}
'''

# Carregar os dados JSON
pessoas = json.loads(data)

# Buscando pessoas com idade maior que 30
pessoas_maiores_30 = [pessoa for pessoa in pessoas['pessoas'] if pessoa['idade'] > 30]

# Exibindo as pessoas que atendem ao critério
print(json.dumps(pessoas_maiores_30, indent=4))


[
    {
        "nome": "Carlos",
        "idade": 35,
        "cidade": "Sao Paulo"
    },
    {
        "nome": "Pedro",
        "idade": 40,
        "cidade": "Sao Paulo"
    }
]


In [22]:
import json

# Dados JSON de clientes
clientes_data = '''
{
    "clientes": [
        {"id": 1, "nome": "Lucas", "email": "lucas@email.com"},
        {"id": 2, "nome": "Maria", "email": "maria@email.com"}
    ]
}
'''

# Dados JSON de compras
compras_data = '''
{
    "compras": [
        {"cliente_id": 1, "produto": "Notebook", "quantidade": 1},
        {"cliente_id": 2, "produto": "Smartphone", "quantidade": 2}
    ]
}
'''

# Carregar os dados JSON
clientes = json.loads(clientes_data)
compras = json.loads(compras_data)

# Mesclando os dados de clientes com suas compras
for compra in compras['compras']:
    for cliente in clientes['clientes']:
        if cliente['id'] == compra['cliente_id']:
            compra['cliente_nome'] = cliente['nome']
            compra['cliente_email'] = cliente['email']

# Exibindo as compras com as informações dos clientes
print(json.dumps(compras['compras'], indent=4))


[
    {
        "cliente_id": 1,
        "produto": "Notebook",
        "quantidade": 1,
        "cliente_nome": "Lucas",
        "cliente_email": "lucas@email.com"
    },
    {
        "cliente_id": 2,
        "produto": "Smartphone",
        "quantidade": 2,
        "cliente_nome": "Maria",
        "cliente_email": "maria@email.com"
    }
]


In [25]:
import json
from collections import defaultdict

# Dados JSON de transações financeiras
data = '''
{
    "transacoes": [
        {"categoria": "Alimentacao", "valor": 120.50, "data": "2025-01-01"},
        {"categoria": "Transporte", "valor": 50.75, "data": "2025-01-02"},
        {"categoria": "Alimentacao", "valor": 80.30, "data": "2025-01-03"},
        {"categoria": "Saude", "valor": 200.00, "data": "2025-01-04"},
        {"categoria": "Transporte", "valor": 30.00, "data": "2025-01-05"}
    ]
}
'''

# Carregar os dados JSON
transacoes = json.loads(data)

# Agregando os valores das transações por categoria
gastos_por_categoria = defaultdict(float)
for transacao in transacoes['transacoes']:
    gastos_por_categoria[transacao['categoria']] += transacao['valor']

# Exibindo os gastos por categoria
print(json.dumps(gastos_por_categoria, indent=4))


{
    "Alimentacao": 200.8,
    "Transporte": 80.75,
    "Saude": 200.0
}


In [27]:
import json

# Dados JSON de usuários
data = '''
{
    "usuarios": [
        {"nome": "João", "idade": 28, "cidade": "Sao Paulo"},
        {"nome": "Maria", "idade": 35, "cidade": "Rio de Janeiro"},
        {"nome": "Carlos", "idade": 40, "cidade": "Sao Paulo"},
        {"nome": "Ana", "idade": 25, "cidade": "Belo Horizonte"}
    ]
}
'''

# Carregar os dados JSON
usuarios = json.loads(data)

# Filtrando usuários com idade superior a 30 e cidade São Paulo
usuarios_filtrados = [
    usuario for usuario in usuarios['usuarios'] 
    if usuario['idade'] > 30 and usuario['cidade'] == "Sao Paulo"
]

# Atualizando a cidade dos usuários filtrados
for usuario in usuarios_filtrados:
    usuario['cidade'] = "Rio de Janeiro"  # Mudando cidade para todos os usuários filtrados

# Exibindo os usuários filtrados e atualizados
print(json.dumps(usuarios_filtrados, indent=4))


[
    {
        "nome": "Carlos",
        "idade": 40,
        "cidade": "Rio de Janeiro"
    }
]


In [28]:
import json

# Dados JSON de inventário
data = '''
{
    "produtos": [
        {"id": 1, "nome": "Notebook", "estoque": 5, "preco": 3000},
        {"id": 2, "nome": "Smartphone", "estoque": 2, "preco": 1500},
        {"id": 3, "nome": "Fones de ouvido", "estoque": 8, "preco": 200},
        {"id": 4, "nome": "Cadeira gamer", "estoque": 1, "preco": 1200}
    ]
}
'''

# Carregar os dados JSON
inventario = json.loads(data)

# Definindo o limite mínimo de estoque
estoque_minimo = 3

# Verificando e reabastecendo produtos abaixo do estoque mínimo
for produto in inventario['produtos']:
    if produto['estoque'] < estoque_minimo:
        produto['estoque'] = estoque_minimo  # Reabastecendo para o nível mínimo

# Exibindo o inventário atualizado
print(json.dumps(inventario['produtos'], indent=4))


[
    {
        "id": 1,
        "nome": "Notebook",
        "estoque": 5,
        "preco": 3000
    },
    {
        "id": 2,
        "nome": "Smartphone",
        "estoque": 3,
        "preco": 1500
    },
    {
        "id": 3,
        "nome": "Fones de ouvido",
        "estoque": 8,
        "preco": 200
    },
    {
        "id": 4,
        "nome": "Cadeira gamer",
        "estoque": 3,
        "preco": 1200
    }
]


In [30]:
import json

# Dados JSON de usuários
usuarios_data = '''
{
    "usuarios": [
        {"id": 1, "nome": "Joao", "email": "joao@email.com"},
        {"id": 2, "nome": "Maria", "email": "maria@email.com"}
    ]
}
'''

# Dados JSON de compras
compras_data = '''
{
    "compras": [
        {"usuario_id": 1, "produto": "Notebook", "quantidade": 1},
        {"usuario_id": 2, "produto": "Smartphone", "quantidade": 2},
        {"usuario_id": 1, "produto": "Fones de ouvido", "quantidade": 3}
    ]
}
'''

# Carregar os dados JSON
usuarios = json.loads(usuarios_data)
compras = json.loads(compras_data)

# Criando um dicionário de compras por usuário
compras_por_usuario = {}
for compra in compras['compras']:
    usuario_id = compra['usuario_id']
    if usuario_id not in compras_por_usuario:
        compras_por_usuario[usuario_id] = []
    compras_por_usuario[usuario_id].append(compra)

# Mesclando os dados de compras com os dados de usuários
for usuario in usuarios['usuarios']:
    usuario['compras'] = compras_por_usuario.get(usuario['id'], [])

# Exibindo os dados mesclados
print(json.dumps(usuarios['usuarios'], indent=4))


[
    {
        "id": 1,
        "nome": "Joao",
        "email": "joao@email.com",
        "compras": [
            {
                "usuario_id": 1,
                "produto": "Notebook",
                "quantidade": 1
            },
            {
                "usuario_id": 1,
                "produto": "Fones de ouvido",
                "quantidade": 3
            }
        ]
    },
    {
        "id": 2,
        "nome": "Maria",
        "email": "maria@email.com",
        "compras": [
            {
                "usuario_id": 2,
                "produto": "Smartphone",
                "quantidade": 2
            }
        ]
    }
]


In [33]:
import pandas as pd
import json

def carregar_json_para_dataframe(json_data):
    """
    Função para carregar dados JSON em um DataFrame do pandas.
    """
    # Carregar os dados JSON
    data = json.loads(json_data)
    
    # Converter o JSON para um DataFrame
    df = pd.json_normalize(data)
    
    # Exibir as primeiras linhas do DataFrame
    return df.head()

# Exemplo de uso
json_data = '''
{
    "clientes": [
        {"id": 1, "nome": "Joao", "idade": 28, "cidade": "São Paulo"},
        {"id": 2, "nome": "Maria", "idade": 35, "cidade": "Rio de Janeiro"},
        {"id": 3, "nome": "Carlos", "idade": 40, "cidade": "São Paulo"}
    ]
}
'''

df = carregar_json_para_dataframe(json_data)
print(df)


                                            clientes
0  [{'id': 1, 'nome': 'Joao', 'idade': 28, 'cidad...


In [53]:
def filtrar_clientes_por_idade(idade_minima):
    """
    Função para filtrar clientes com idade superior ao limite definido.
    """
        # Exemplo de uso
    json_data = '''
    {
        "clientes": [
            {"id": 1, "nome": "Joao", "idade": 28},
            {"id": 2, "nome": "Maria", "idade": 35},
            {"id": 3, "nome": "Carlos", "idade": 40}
        ]
    }
    '''
    # Carregar os dados JSON
    data = json.loads(json_data)
    
    # Converter o JSON para um DataFrame
    df = pd.json_normalize(data)
    
    # Filtrar os dados com base na idade
    df_filtrado = df[df['idade'] > idade_minima]
    
    return df_filtrado

# Exemplo de uso
df_filtrado = filtrar_clientes_por_idade(json_data)
print(df_filtrado)


KeyError: 'idade'

In [35]:
def agrupar_por_cidade_e_calcular_media_idade(json_data):
    """
    Função para agrupar os clientes por cidade e calcular a média de idade por cidade.
    """
    # Carregar os dados JSON
    data = json.loads(json_data)
    
    # Converter o JSON para um DataFrame
    df = pd.json_normalize(data)
    
    # Agrupar por cidade e calcular a média da idade
    df_agrupado = df.groupby('cidade')['idade'].mean().reset_index()
    
    return df_agrupado

# Exemplo de uso
df_agrupado = agrupar_por_cidade_e_calcular_media_idade(json_data)
print(df_agrupado)


KeyError: 'cidade'

In [None]:
def atualizar_idade_clientes(json_data, idade_adicional):
    """
    Função para adicionar uma idade adicional a todos os clientes.
    """
    # Carregar os dados JSON
    data = json.loads(json_data)
    
    # Converter o JSON para um DataFrame
    df = pd.json_normalize(data)
    
    # Atualizar a idade de todos os clientes
    df['idade'] = df['idade'] + idade_adicional
    
    # Converter de volta para JSON
    return dataframe_para_json(df)

# Exemplo de uso
json_atualizado = atualizar_idade_clientes(json_data, 2)
print(json_atualizado)


In [37]:
import json 
import os 

compras_data = '''
{
    "compras": [
        {"id_cliente": 1, "produto": "Notebook", "quantidade": 1},
        {"id_cliente": 2, "produto": "Smartphone", "quantidade": 2},
        {"id_cliente": 3, "produto": "Cadeira gamer", "quantidade": 1}
    ]
}
'''

def mesclar_clientes_com_compras(clientes_json, compras_json):
    """
    Função para mesclar os dados de clientes e compras em um único DataFrame.
    """
    # Carregar os dados JSON
    clientes_data = json.loads(clientes_json)
    compras_data = json.loads(compras_json)
    
    # Converter ambos os JSONs para DataFrames
    df_clientes = pd.json_normalize(clientes_data)
    df_compras = pd.json_normalize(compras_data)
    
    # Mesclar os DataFrames com base no id_cliente
    df_merged = pd.merge(df_clientes, df_compras, left_on='id', right_on='id_cliente', how='inner')
    
    return df_merged

# Exemplo de uso
df_mesclado = mesclar_clientes_com_compras(json_data, compras_data)
print(df_mesclado)


KeyError: 'id_cliente'


Caching the list of root modules, please wait!
(This will only be done once - type '%rehashx' to reset cache!)



  ip.db['rootmodules_cache'] = rootmodules_cache


In [38]:
import pandas as pd
import json

def filtrar_vendas_por_mes_e_valor(json_data, mes, valor_minimo):
    """
    Função para filtrar as vendas com base no mês e valor mínimo.
    """
    # Carregar os dados JSON
    data = json.loads(json_data)
    
    # Converter o JSON para um DataFrame
    df = pd.json_normalize(data)
    
    # Filtrar os dados de vendas por mês e valor mínimo
    df_filtrado = df[(df['data'].str.contains(mes)) & (df['valor'] >= valor_minimo)]
    
    return df_filtrado

# Exemplo de dados JSON de vendas
vendas_data = '''
{
    "vendas": [
        {"id": 1, "produto": "Laptop", "valor": 3500, "data": "2025-01-15"},
        {"id": 2, "produto": "Smartphone", "valor": 1500, "data": "2025-02-10"},
        {"id": 3, "produto": "Fones de ouvido", "valor": 200, "data": "2025-02-15"},
        {"id": 4, "produto": "Cadeira gamer", "valor": 1200, "data": "2025-02-20"}
    ]
}
'''

# Exemplo de uso
df_filtrado = filtrar_vendas_por_mes_e_valor(vendas_data, "02", 1000)
print(df_filtrado)


KeyError: 'data'

In [None]:
import pandas as pd
import json
import os

def carregar_multipos_arquivos_json(diretorio):
    """
    Função para carregar múltiplos arquivos JSON de um diretório e combinar em um único DataFrame.
    """
    # Lista para armazenar os DataFrames
    dfs = []
    
    # Percorrer todos os arquivos no diretório
    for arquivo in os.listdir(diretorio):
        if arquivo.endswith('.json'):
            caminho_arquivo = os.path.join(diretorio, arquivo)
            
            # Abrir e carregar o arquivo JSON
            with open(caminho_arquivo, 'r') as f:
                data = json.load(f)
                
            # Converter JSON para DataFrame
            df = pd.json_normalize(data)
            dfs.append(df)
    
    # Combinar todos os DataFrames em um único
    df_completo = pd.concat(dfs, ignore_index=True)
    
    return df_completo

# Exemplo de uso
# Diretorio com arquivos JSON (você precisa criar e colocar seus arquivos JSON)
diretorio = 'Python_Data_Engineer_new'  # Exemplo de caminho
df_completo = carregar_multipos_arquivos_json(diretorio)
print(df_completo.head())


FileNotFoundError: [WinError 3] O sistema não pode encontrar o caminho especificado: '/Python_Data_Engineer_new'

In [42]:
def dividir_por_produto_e_salvar(json_data):
    """
    Função para dividir os dados JSON de vendas por produto e salvar em arquivos JSON separados.
    """
    # Carregar os dados JSON
    data = json.loads(json_data)
    
    # Converter o JSON para DataFrame
    df = pd.json_normalize(data)
    
    # Dividir os dados por produto
    grupos = df.groupby('produto')
    
    # Salvar os dados de cada grupo em arquivos JSON separados
    for produto, grupo in grupos:
        arquivo_saida = f"{produto.replace(' ', '_').lower()}.json"
        grupo.to_json(arquivo_saida, orient='records', lines=True)
        print(f"Arquivo salvo: {arquivo_saida}")

# Exemplo de dados JSON de vendas
vendas_data = '''
{
    "vendas": [
        {"id": 1, "produto": "Laptop", "valor": 3500, "data": "2025-01-15"},
        {"id": 2, "produto": "Smartphone", "valor": 1500, "data": "2025-02-10"},
        {"id": 3, "produto": "Fones de ouvido", "valor": 200, "data": "2025-02-15"},
        {"id": 4, "produto": "Cadeira gamer", "valor": 1200, "data": "2025-02-20"},
        {"id": 5, "produto": "Smartphone", "valor": 1600, "data": "2025-03-01"}
    ]
}
'''

# Exemplo de uso
dividir_por_produto_e_salvar(vendas_data)


KeyError: 'produto'

In [None]:
def calcular_lucro_e_imposto(json_data, custo_produto, taxa_imposto):
    """
    Função para calcular o lucro (valor - custo) e o valor do imposto em cada venda.
    """
    # Carregar os dados JSON
    data = json.loads(json_data)
    
    # Converter o JSON para um DataFrame
    df = pd.json_normalize(data)
    
    # Calcular lucro (valor da venda - custo do produto)
    df['lucro'] = df['valor'] - custo_produto
    
    # Calcular o imposto (lucro * taxa de imposto)
    df['imposto'] = df['lucro'] * (taxa_imposto / 100)
    
    return df

# Exemplo de dados JSON de vendas
vendas_data = '''
{
    "vendas": [
        {"id": 1, "produto": "Laptop", "valor": 3500, "data": "2025-01-15"},
        {"id": 2, "produto": "Smartphone", "valor": 1500, "data": "2025-02-10"},
        {"id": 3, "produto": "Fones de ouvido", "valor": 200, "data": "2025-02-15"},
        {"id": 4, "produto": "Cadeira gamer", "valor": 1200, "data": "2025-02-20"}
    ]
}
'''

# Exemplo de uso
df_com_lucro_imposto = calcular_lucro_e_imposto(vendas_data, custo_produto=1000, taxa_imposto=10)
print(df_com_lucro_imposto)


In [None]:
def calcular_metricas_de_vendas(json_data):
    """
    Função para calcular as métricas de desempenho de vendas, como total, média e produto mais vendido.
    """
    # Carregar os dados JSON
    data = json.loads(json_data)
    
    # Converter o JSON para um DataFrame
    df = pd.json_normalize(data)
    
    # Calcular total de vendas
    total_vendas = df['valor'].sum()
    
    # Calcular valor médio das vendas
    media_vendas = df['valor'].mean()
    
    # Encontrar o produto mais vendido
    produto_mais_vendido = df.groupby('produto')['valor'].sum().idxmax()
    
    return total_vendas, media_vendas, produto_mais_vendido

# Exemplo de uso
total, media, produto_mais_vendido = calcular_metricas_de_vendas(vendas_data)
print(f"Total de Vendas: {total}")
print(f"Valor Médio das Vendas: {media}")
print(f"Produto Mais Vendido: {produto_mais_vendido}")
def salvar_em_diferentes_formatos(df, nome_arquivo_base):
    """
    Função para salvar o DataFrame em formatos diferentes (JSON, CSV, Excel).
    """
    # Salvar como JSON
    df.to_json(f'{nome_arquivo_base}.json', orient='records', lines=True)
    print(f"Arquivo JSON salvo: {nome_arquivo_base}.json")
    
    # Salvar como CSV
    df.to_csv(f'{nome_arquivo_base}.csv', index=False)
    print(f"Arquivo CSV salvo: {nome_arquivo_base}.csv")
    
    # Salvar como Excel
    df.to_excel(f'{nome_arquivo_base}.xlsx', index=False)
    print(f"Arquivo Excel salvo: {nome_arquivo_base}.xlsx")

# Exemplo de uso
salvar_em_diferentes_formatos(df_com_lucro_imposto, 'vendas_com_lucro')


In [None]:
import pandas as pd
import json

def analisar_vendas_comissao(json_data):
    """
    Função para calcular comissões totais por vendedor, total de vendas por categoria e valor médio por transação.
    """
    # Carregar os dados JSON
    data = json.loads(json_data)
    
    # Converter o JSON para DataFrame
    df = pd.json_normalize(data)
    
    # Calcular comissão total por vendedor
    df['comissao_total'] = df['quantidade'] * df['preco_unitario'] * df['comissao']
    
    # Calcular total de vendas por categoria
    total_vendas_categoria = df.groupby('categoria')['quantidade'].sum().reset_index(name='total_vendas')
    
    # Calcular valor médio de cada transação
    valor_medio_transacao = df.groupby('id_transacao')['total'].mean().reset_index(name='valor_medio')
    
    return df[['id_vendedor', 'comissao_total']], total_vendas_categoria, valor_medio_transacao

# Exemplo de dados JSON de vendas
vendas_data = '''
{
    "vendas": [
        {"id_transacao": 1, "id_vendedor": 101, "categoria": "Eletrônicos", "quantidade": 2, "preco_unitario": 1500, "comissao": 0.1, "total": 3000},
        {"id_transacao": 2, "id_vendedor": 102, "categoria": "Móveis", "quantidade": 1, "preco_unitario": 1200, "comissao": 0.08, "total": 1200},
        {"id_transacao": 3, "id_vendedor": 101, "categoria": "Eletrônicos", "quantidade": 1, "preco_unitario": 1500, "comissao": 0.1, "total": 1500},
        {"id_transacao": 4, "id_vendedor": 103, "categoria": "Eletrônicos", "quantidade": 3, "preco_unitario": 700, "comissao": 0.12, "total": 2100}
    ]
}
'''

# Exemplo de uso
comissao_vendedores, vendas_categoria, transacoes_media = analisar_vendas_comissao(vendas_data)

print("Comissão total por vendedor:")
print(comissao_vendedores)

print("\nTotal de vendas por categoria:")
print(vendas_categoria)

print("\nValor médio por transação:")
print(transacoes_media)


In [None]:
import pandas as pd
import json

def analisar_vendas_comissao(json_data):
    """
    Função para calcular comissões totais por vendedor, total de vendas por categoria e valor médio por transação.
    """
    # Carregar os dados JSON
    data = json.loads(json_data)
    
    # Converter o JSON para DataFrame
    df = pd.json_normalize(data)
    
    # Calcular comissão total por vendedor
    df['comissao_total'] = df['quantidade'] * df['preco_unitario'] * df['comissao']
    
    # Calcular total de vendas por categoria
    total_vendas_categoria = df.groupby('categoria')['quantidade'].sum().reset_index(name='total_vendas')
    
    # Calcular valor médio de cada transação
    valor_medio_transacao = df.groupby('id_transacao')['total'].mean().reset_index(name='valor_medio')
    
    return df[['id_vendedor', 'comissao_total']], total_vendas_categoria, valor_medio_transacao

# Exemplo de dados JSON de vendas
vendas_data = '''
{
    "vendas": [
        {"id_transacao": 1, "id_vendedor": 101, "categoria": "Eletrônicos", "quantidade": 2, "preco_unitario": 1500, "comissao": 0.1, "total": 3000},
        {"id_transacao": 2, "id_vendedor": 102, "categoria": "Móveis", "quantidade": 1, "preco_unitario": 1200, "comissao": 0.08, "total": 1200},
        {"id_transacao": 3, "id_vendedor": 101, "categoria": "Eletrônicos", "quantidade": 1, "preco_unitario": 1500, "comissao": 0.1, "total": 1500},
        {"id_transacao": 4, "id_vendedor": 103, "categoria": "Eletrônicos", "quantidade": 3, "preco_unitario": 700, "comissao": 0.12, "total": 2100}
    ]
}
'''

# Exemplo de uso
comissao_vendedores, vendas_categoria, transacoes_media = analisar_vendas_comissao(vendas_data)

print("Comissão total por vendedor:")
print(comissao_vendedores)

print("\nTotal de vendas por categoria:")
print(vendas_categoria)

print("\nValor médio por transação:")
print(transacoes_media)


In [None]:
def limpar_dados_usuarios(json_data):
    """
    Função para limpar e transformar dados de usuários: remover registros inválidos, preencher valores ausentes.
    """
    # Carregar os dados JSON
    data = json.loads(json_data)
    
    # Converter o JSON para DataFrame
    df = pd.json_normalize(data)
    
    # Preencher valores ausentes com valores padrão (exemplo: 0 para id_usuario, 'Desconhecido' para nome)
    df['id_usuario'].fillna(0, inplace=True)
    df['nome'].fillna('Desconhecido', inplace=True)
    
    # Converter a coluna 'data_nascimento' para tipo datetime, e preencher valores inválidos com 'unknown'
    df['data_nascimento'] = pd.to_datetime(df['data_nascimento'], errors='coerce')
    df['data_nascimento'].fillna('unknown', inplace=True)
    
    # Remover registros com IDs de usuário faltando
    df = df[df['id_usuario'] != 0]
    
    return df

# Exemplo de dados JSON de usuários
usuarios_data = '''
{
    "usuarios": [
        {"id_usuario": 101, "nome": "João", "data_nascimento": "1990-05-15", "email": "joao@email.com"},
        {"id_usuario": null, "nome": "Maria", "data_nascimento": "1985-03-22", "email": "maria@email.com"},
        {"id_usuario": 103, "nome": null, "data_nascimento": "invalid_date", "email": "carlos@email.com"},
        {"id_usuario": 104, "nome": "Ana", "data_nascimento": "1992-07-30", "email": "ana@email.com"}
    ]
}
'''

# Exemplo de uso
df_limpo = limpar_dados_usuarios(usuarios_data)
print(df_limpo)


In [None]:
import pandas as pd
import json
from statsmodels.tsa.arima.model import ARIMA
import matplotlib.pyplot as plt

def prever_vendas(json_data):
    """
    Função para prever vendas futuras com base em dados históricos de vendas.
    """
    # Carregar os dados JSON
    data = json.loads(json_data)
    
    # Converter o JSON para DataFrame
    df = pd.json_normalize(data)
    
    # Garantir que a coluna 'data' seja do tipo datetime
    df['data'] = pd.to_datetime(df['data'])
    
    # Agrupar as vendas por data
    df_agrupado = df.groupby('data')['total'].sum().reset_index()
    
    # Definir a série temporal como a coluna de vendas (total)
    series = df_agrupado.set_index('data')['total']
    
    # Ajustar o modelo ARIMA
    model = ARIMA(series, order=(5, 1, 0))
    model_fit = model.fit()
    
    # Prever as vendas para os próximos 7 dias
    previsao = model_fit.forecast(steps=7)
    
    # Plotar as vendas históricas e a previsão
    plt.figure(figsize=(10, 6))
    plt.plot(series, label='Vendas Históricas')
    plt.plot(pd.date_range(series.index[-1], periods=8, freq='D')[1:], previsao, label='Previsão de Vendas', color='red')
    plt.title('Previsão de Vendas para os Próximos 7 Dias')
    plt.xlabel('Data')
    plt.ylabel('Vendas Totais')
    plt.legend()
    plt.show()
    
    return previsao

# Exemplo de dados JSON de vendas
vendas_data = '''
{
    "vendas": [
        {"data": "2025-01-01", "total": 1000},
        {"data": "2025-01-02", "total": 1200},
        {"data": "2025-01-03", "total": 1500},
        {"data": "2025-01-04", "total": 1300},
        {"data": "2025-01-05", "total": 1100},
        {"data": "2025-01-06", "total": 1600},
        {"data": "2025-01-07", "total": 1700}
    ]
}
'''

# Exemplo de uso
previsao = prever_vendas(vendas_data)
print(f"Previsão de vendas para os próximos 7 dias: {previsao}")


In [None]:
import requests

def integrar_dados_api_com_json(json_data, api_url):
    """
    Função para integrar dados JSON com dados externos de uma API.
    """
    # Carregar os dados JSON
    data = json.loads(json_data)
    
    # Converter o JSON para DataFrame
    df = pd.json_normalize(data)
    
    # Fazer uma requisição à API
    response = requests.get(api_url)
    dados_api = response.json()
    
    # Converter os dados da API em DataFrame
    df_api = pd.json_normalize(dados_api)
    
    # Exemplo de integração: adicionar a coluna de preços ao DataFrame original
    df['preco_externo'] = df_api['preco']  # Supondo que a API forneça o campo 'preco'
    
    return df

# Exemplo de dados JSON de vendas
vendas_data = '''
{
    "vendas": [
        {"id": 1, "produto": "Smartphone", "quantidade": 2, "total": 3000},
        {"id": 2, "produto": "Laptop", "quantidade": 1, "total": 2500}
    ]
}
'''

# Exemplo de uso
# Supondo que a URL da API forneça o preço atual do produto
api_url = "https://api.exemplo.com/precos"
df_integrado = integrar_dados_api_com_json(vendas_data, api_url)
print(df_integrado)
