## <font color='Blue'>Dados de Mercado Financeiro</font>
---
## <font color='black'>Tratamento de dados utilizando python</font>
---
### <font color='black'>Análise do mercado de ações para as 5 maiores empresas dos Estados Unidos em 2023, no período de 5 anos.</font>
---

### <font color='gray'>Etapa 1) Importando os arquivos .csv </font>

In [11]:
import pandas as pd

# Defina o caminho da pasta onde os arquivos CSV estão armazenados
folder_path = "C:/Users/Pichau/Documents/Power_BI/Projeto_Mercado_Financeiro/_yrs_csv/"

# Definição do dicionario para os arquivos .csv
arquivos = {
    'Apple' : folder_path + 'apple.csv',
    'Amazon' : folder_path + 'amazon.csv',
    'Google' : folder_path + 'google.csv',
    'Microsoft' : folder_path + 'microsoft.csv',
    'Nvidia' : folder_path + 'nvidia.csv'
}

# Criação de lista para armazenamento dos DataFrames
df_list = []

### <font color='gray'>Etapa 2) Realizando a formatação dos dados. </font>

In [12]:

# Função para tratar cada DataFrame
def tratar_dados(df, nome_empresa):
    # Adicionando uma coluno com o nome de cada empresa listada
    df['Company'] = nome_empresa

    # Garantir que as colunas de preço sejam strings antes da substituição
    df['Close/Last'] = df['Close/Last'].astype(str)
    df['Open'] = df['Open'].astype(str)
    df['High'] = df['High'].astype(str)
    df['Low'] = df['Low'].astype(str)

    # Remover o símbolo de dólar ($) e converter para número
    df['Close/Last'] = df['Close/Last'].str.replace('$','',regex=False).str.replace(',','').astype(float)
    df['Open'] = df['Open'].str.replace('$','',regex=False).str.replace(',','').astype(float)
    df['High'] = df['High'].str.replace('$','',regex=False).str.replace(',','').astype(float)
    df['Low'] = df['Low'].str.replace('$','',regex=False).str.replace(',','').astype(float)

    # Ajuste do separador decimal para vírgula
    df['Close/Last'] = df['Close/Last'].map(lambda x: f"{x:.2f}".replace('.',','))
    df['Open'] = df['Open'].map(lambda x: f"{x:.2f}".replace('.',','))
    df['High'] = df['High'].map(lambda x: f"{x: .2f}".replace('.',','))
    df['Low'] = df['Low'].map(lambda x: f"{x: .2f}".replace('.',','))

    return df


### <font color='gray'>Etapa 3) Processamento dos arquivos, união das planilhas e salvamento na pasta.</font>

In [13]:
# Loop "for" percorre cada empresa e seu respectivo arquivo CSV no dicionário de arquivos.
for empresa, arquivo in arquivos.items():
    try:
        df = pd.read_csv(arquivo)
        df_tratado = tratar_dados(df,empresa)
        df_list.append(df_tratado)
    except Exception as e:
        print(f"Erro ao processar {empresa}: {e}")

# Concatenar todos os DataFrames tratados em um único DataFrame
df_completo = pd.concat(df_list, ignore_index=True)
print(df_completo.head())

# Salvar o DataFrame concatenado e tratado em um novo arquivo CSV
df_completo.to_csv('dados_tratados.csv', index=False)


         Date Close/Last    Volume    Open     High      Low Company
0  09/16/2024     216,32  59357430  216,54   217,22   213,92   Apple
1  09/13/2024     222,50  36766620  223,58   224,04   221,91   Apple
2  09/12/2024     222,77  37498230  222,50   223,55   219,82   Apple
3  09/11/2024     222,66  44587070  221,46   223,09   217,89   Apple
4  09/10/2024     220,11  51591030  218,92   221,48   216,73   Apple
