#### IMPORTACAO DE BIBLIOTECAS

In [None]:
##### BIBLIOTECA PARA MANIPULAÇÃO DE DADOS

import pandas as pd
import numpy as np
import datetime
from datetime import date
import seaborn as sns

##### CONFIGURAÇÃO DE UTILIZAÇÃO DO DRIVE
import warnings

##### VERIFICAÇÃO DE ENCONDING DE ARQUIVO
import chardet

#### CARREGANDO OS DADOS

##### BUSCANDO QUAL É O ENCODING DO ARQUIVO

In [None]:
"""ERRO 1 - UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc3 in position 14: invalid continuation byte

--> Erro pelo encoding do arquivo ser diferente
"""

##### Função para detectar o encoding do arquivo
def detectar_encoding(arquivo, sample_size=10000):
    with open(arquivo, 'rb') as f:
        # Lê apenas uma amostra inicial do arquivo
        sample = f.read(sample_size)
    return chardet.detect(sample)['encoding']

# Uso
encoding_arquivo = detectar_encoding('RemuneracaoAtivos.csv')
print(f"Encoding detectado: {encoding_arquivo}")

##### CARREGANDO OS DADOS COM O ENCODING E DELIMITADOR CORRETOS

In [None]:
"""ERRO 2 - ParserError: Error tokenizing data. C error: Expected 8 fields in line 230, saw 9

--> Erro pelo arquivo estar sem delimitador
"""
# Carregar o arquivo usando o encoding detectado e delimitador

ativos = pd.read_csv('RemuneracaoAtivos.csv', 
                     encoding=encoding_arquivo,
                     delimiter=";",
                     on_bad_lines='warn',

)

##### TRATAMENTO DE DADOS NA BASE

##### RENOMEANDO COLUNAS

In [None]:
# VENDO A BASE

ativos.head(2)
ativos_alter = ativos.copy()


""""
PQ USAR O .copy()?

1.2 - Explicar por que o código está causando o problema
Quando você cria ativos_alter2 a partir de ativos sem usar .copy(), 
o Pandas pode criar uma "view" (uma referência aos dados originais) 
em vez de uma cópia independente. Assim, alterar ativos_alter2 modifica 
também o DataFrame original ativos. Isso é um comportamento clássico do Pandas 
chamado "SettingWithCopyWarning".
"""


# RENOMEANDO COLUNAS

# Remove espaços e tabs no final dos nomes das colunas
#strip = tira

ativos_alter.columns.str.strip()

# Agora renomeie (sem os caracteres extras)
ativos_alter.rename(
    columns={
        "ORGÃO": "ORGAO",
        "REMUNERAÇÃO DO MÊS": "REMUNERACAO_MES",
        "FÉRIAS E 13º SALÁRIO": "FERIAS_E_13",
        "PAGAMENTOS EVENTUAIS": "PAGAMENTOS_EVENTUAIS",
        "LICENÇA PRÊMIO INDENIZADA": "LICENCA_PREMIUM_INDENIZADA",
        "ABONO PERMANÊNCIA & OUTRAS INDENIZAÇÕES": "ABONO_PERM_E_OUTRAS_INDENIZ",
        "REDUTOR SALARIAL": "REDUTOR_SALARIAL",
        "TOTAL LIQUÍDO (R$)": "TOTAL_LIQUIDO"
    }, 
    inplace=True
)

ativos_alter.head(2)


##### VALIDANDO TIPO DE DADOS

In [None]:
# VERIFICANDO TIPAGEM DE TODAS AS COLUNAS

# ativos_alter.info()

# ALTERANDO TIPAGEM DE VARIAS COLUNAS

colunas_string = ["NOME", "CARGO", "ORGAO", "GRUPOS"]
ativos_alter[colunas_string] = ativos_alter[colunas_string].astype("string")


# TIPAGENS FORAM MUDADAS
ativos_alter.info()







# ativos_alter['REMUNERACAO_MES'] = pd.to_numeric(ativos_alter['REMUNERACAO_MES'], errors='coerce')
# ativos_alter['FERIAS_E_13'] = pd.to_numeric(ativos_alter['FERIAS_E_13'], errors='coerce')
# ativos_alter['PAGAMENTOS_EVENTUAIS'] = pd.to_numeric(ativos_alter['PAGAMENTOS_EVENTUAIS'], errors='coerce')
# ativos_alter['LICENCA_PREMIUM_INDENIZADA'] = pd.to_numeric(ativos_alter['LICENCA_PREMIUM_INDENIZADA'], errors='coerce')
# ativos_alter.info()

#### COMANDOS GIT AUXILIO

In [None]:
"""
COMANDOS TERMINAL

cd.. --> retorna para a pasta anterior
cd nome da pasta --> entra na pasta
ls ou dir --> descreve o que tem dentro do diretorio


COMANDOS GIT (DIA-A-DIA)

git --help --> ajuda monstrando todos os comandos do git
git pull --> traz os dados do repositorio remoto para o repositorio local
git status --> mostra o estado do repositorio
git add nome_do_arquivo --> adiciona um arquivo para stage (commitar)
git add . --> adiciona todos arquivos para stage (commitar)
git commit -m 'mensagem do commit' --> cria um commit com a mensagem
git push --> envia os commits para o repositorio remoto

COMO CRIAR UM ARQUIVO .gitignore

1° Executar no terminal --> New-Item -Path .gitignore -ItemType File
2° Adicionar os nomes dos arquivos ou pastas que você não quer versionar no arquivo .gitignore
3° Abra o arquivo .gitignore e escreva *.csv (Assim todos os arquivos com .csv serão ignorados como stage, para arquivos especificos, tirar o *)
4° Salvar o arquivo.gitignore


COMANDOS GIT (TODOS)
git init --> inicializa um repositorio novo
git clone url_do_repositorio --> clona um repositorio do github
git status --> mostra o estado do repositorio
git add nome_do_arquivo --> adiciona um arquivo ao commit
git commit -m 'mensagem do commit' --> cria um commit com a mensagem
git push --> envia os commits para o repositorio remoto
git checkout nome_da_branch --> muda para uma branch existente
git checkout -b nome_da_nova_branch --> cria uma nova branch e muda para ela
git merge nome_da_branch --> mescla a branch atual com a branch fornecida
git branch -d nome_da_branch --> deleta a branch fornecida
git stash --> salva o estado atual do repositorio em uma pilha de trabalho
git stash pop --> restaura o estado anterior do repositorio da pilha de trabalho
git log --> mostra os commits realizados
git diff nome_do_arquivo --> mostra as diferenças entre o arquivo e seu estado anterior
git blame nome_do_arquivo --> mostra o que foi feito por cada commit em um arquivo
git reset --hard HEAD~n --> desfaz as últimas n commits
git reflog --> mostra todos os commits realizados com um link para cada commit
git remote add origin url_do_repositorio --> adiciona um novo remote ao repositório
git push -u origin nome_da_nova_branch --> adiciona o novo remote ao repositório e envia a nova branch para o repositório remoto
git pull origin nome_da_nova_branch --> atualiza a branch com as alterações do repositório remoto
git tag nome_da_tag --> cria uma tag com o nome fornecido
git push origin --tags --> envia todas as tags para o repositório remoto
git checkout nome_da_tag --> muda para a tag fornecida
git revert nome_do_commit --> desfaz o commit fornecido
git clean -df --> remove todos os arquivos e diretórios não versionados
git config --global core.autocrlf true --> configura git para conseguir aceitar mudanças de CRLF
git config --global core.safecrlf false --> configura git para não conseguir aceitar mudanças de CRLF
git config --global diff.tool meld --> configura git para usar o meld como difftool
git config --global merge.tool meld --> configura git para usar o meld como merge tool
git config --global difftool.meld.path "C:\Program Files (x86)\Meld\Meld.exe" --> configura o caminho do meld como difftool
git config --global merge.tool.meld.cmd "meld --diff %O %A" --> configura o comando do meld como merge tool
git config --global difftool.meld.opts "--output %f -d %o %a" --> configura os argumentos do meld para difftool
git config --global mergetool.meld.keepTempFiles false --> configura git para não manter os temp files do meld
git config --global mergetool.meld.trustExitCode false --> configura git para não verificar o exit code do meld
git config --global mergetool.meld.keepTempFiles false --> configura git para não manter os temp files do meld
git config --global mergetool.meld.trustExitCode false --> configura git para não verificar o exit code do meld
git config --global mergetool.meld.keepTempFiles false --> configura git para não manter os temp files do meld
git config --global mergetool.meld.trustExitCode false --> configura git para não verificar o exit code do meld
git config --global mergetool.meld.keepTempFiles false --> configura git para não manter os temp files do meld
git config --global mergetool.meld.trustExitCode false --> configura git para não verificar o exit code do meld
git config --global mergetool.meld.keepTempFiles false --> configura git para não manter os temp files do meld
git config --global mergetool.meld.trustExitCode false --> configura git para não verificar o exit code do meld
git config --global mergetool.meld.keepTempFiles false --> configura git para não manter os temp files do meld
git config --global mergetool.meld.trustExitCode false --> configura git para não verificar o exit code do meld


"""

##### PROMPT IA GENERATIVA

In [None]:
"""

1 - Você é um especialista em datascience com enfase em python
2 - voce ira me auxiliar nas analises de dado que eu preciso 
3 - voce ira primeiramente compreender a minha necessidade que estará sempre no item 5
4 - voce ira observar o código que estou tentando executar (se possuir), se existir estará no item 6 
4 - voce ira responder o problema em etapas sendo elas: 1.1 - compreender o que estou pedindo, 1.2 - explicar pq o meu codigo esta errado, 1.3 - mostrar como deveria ser feito
5 - Surgiu um problema conforme resposta anterior, pois, foi alterado o dataframe ativos_alter2, entretanto, o ativos também teve sua tipagem alterada
6 - O código que tentei executar é --> ativos_alter2["NOME"] = ativos_alter2["NOME"].astype('string')
7 - Por fim, apresente as fontes que utilizou para responder essas questões em forma de tabela

"""