# Anonimizar dados em um DataFrame

Função para anonimizar dados em um DataFrame, substituindo os valores das colunas especificadas por hashes SHA-256.

Parâmetros:
dataframe (pd.DataFrame): O DataFrame contendo os dados a serem anonimizados.
columns_to_anonymize (list): Uma lista de strings contendo o nome das colunas a serem anonimizadas.

Retorna:
pd.DataFrame: O DataFrame anonimizado.

In [2]:
import pandas as pd
from hashlib import sha256

def anonymize_data(dataframe, columns_to_anonymize):
    anonymized_df = dataframe.copy()
    for col in columns_to_anonymize:
        anonymized_df[col] = anonymized_df[col].apply(lambda x: sha256(str(x).encode()).hexdigest())
    return anonymized_df

# Exemplo de uso
if __name__ == "__main__":
    # Suponha que você tenha um DataFrame com dados sensíveis
    data = {
        'Nome': ['Alice', 'Bob', 'Carol'],
        'Email': ['alice@example.com', 'bob@example.com', 'carol@example.com'],
        'CPF': ['123.456.789-00', '987.654.321-00', '555.666.777-00']
    }
    df = pd.DataFrame(data)

    # Lista de colunas que devem ser anonimizadas (por exemplo, Nome e CPF)
    columns_to_anonymize = ['Nome', 'CPF']

    # Chamada da função para anonimizar as colunas selecionadas
    anonymized_df = anonymize_data(df, columns_to_anonymize)

    print("Dados originais:")
    print(df)
    print("\nDados anonimizados:")
    print(anonymized_df)

Dados originais:
    Nome              Email             CPF
0  Alice  alice@example.com  123.456.789-00
1    Bob    bob@example.com  987.654.321-00
2  Carol  carol@example.com  555.666.777-00

Dados anonimizados:
                                                Nome              Email  \
0  3bc51062973c458d5a6f2d8d64a023246354ad7e064b1e...  alice@example.com   
1  cd9fb1e148ccd8442e5aa74904cc73bf6fb54d1d54d333...    bob@example.com   
2  b2dd7d8a70567a0e23308a6a77b38d603eaf2baca5da32...  carol@example.com   

                                                 CPF  
0  f788964b0ba012d64ae6d4c20c698d86821b8fbe725e17...  
1  22b9abad406a7473e4314cfe3a7f030e18988b8fa1f916...  
2  5b9cfd2716a97da5dad98b9ec481aa1a1d7a555392745b...  
