📊 Comparação de Arquivos Excel Usando Coluna SELB <br>

Versão 1 📌

Este repositório contém um código Python que realiza a comparação entre dois arquivos Excel utilizando uma coluna comum chamada SELB.<br><br>


🎯 Objetivo<br>

O objetivo deste código é identificar e listar:<br><br>

🔄 Valores da coluna SELB que estão presentes em ambos os arquivos.<br>

🔍 Valores da coluna SELB que estão presentes apenas em um dos arquivos.<br>
Além disso, o programa gera um novo arquivo Excel unificado com as seguintes colunas:<br><br>

📝 SELB: Contendo todos os valores da coluna SELB encontrados em ambos os arquivos.<br><br>

🗒️ Observação: Indicando se cada valor da coluna SELB está presente em ambos os arquivos com "em conformidade" ou apenas em um dos arquivos com "não está em conformidade".<br><br>

✅ Critérios para a Coluna Observação<br>

"Em conformidade": Se o valor da coluna SELB estiver presente em ambos os arquivos.<br>
"Não está em conformidade": Se o valor da coluna SELB estiver presente apenas em um dos arquivos.<br>

In [24]:
import pandas as pd

# Load the two Excel files
file1 = pd.read_excel('perus.xlsx')
file2 = pd.read_excel('perus1.xlsx')

# Merge the two files on the SELB column
merged = pd.merge(file1, file2, on='SELB', how='outer', indicator=True)

# Identify values present in both files
common_values = merged[merged['_merge'] == 'both']['SELB'].unique()

# Identify values present only in one file
only_in_file1 = merged[merged['_merge'] == 'left_only']['SELB'].unique()
only_in_file2 = merged[merged['_merge'] == 'right_only']['SELB'].unique()

# Create a new Excel file with the unified columns
unified = pd.DataFrame({
    'SELB': pd.concat([file1['SELB'], file2['SELB']]).unique(),
    'Observação': ['em conformidade' if value in common_values else 'não está em conformidade' for value in pd.concat([file1['SELB'], file2['SELB']]).unique()]
})

# Save the unified file to a new Excel file
unified.to_excel('unified.xlsx', index=False)

print("Valores da coluna SELB presentes em ambos os arquivos:")
print(common_values)

print("\nValores da coluna SELB presentes apenas em um dos arquivos:")
print("Apenas em file1:", only_in_file1)
print("Apenas em file2:", only_in_file2)

Valores da coluna SELB presentes em ambos os arquivos:
[1120 '10HX' '113X' '12JI' '12MF' '13GV' '13JI' '14YX' '15MF' '16GV'
 '176U' '177T' '17BR' '17GV' '17JI' '18FQ' '18GL' '19GS' '200Z' '201Z'
 '202Z' '204Z' '205Z' '206O' '206Z' '207Z' '208Z' '209Z' '20JI' '211Z'
 '212N' '212Z' '213Z' '215Z' '216N' '216Z' '217Z' '218Z' '219Z' '21GA'
 '21GB' '21GV' '220Z' '221Z' '222Z' '22GV' '22QD' '233Z' '234Z' '235Z'
 '236Z' '237Z' '238Z' '23GS' '23RT' '240Z' '241Z' '242Z' '243Z' '246Z'
 '247Z' '248Z' '249Z' '24HK' '250Z' '252R' '254Z' '255Z' '258R' '258Z'
 '259Z' '25CR' '260R' '260Z' '261Z' '265N' '265Z' '266Z' '267Z' '269Z'
 '26GC' '270Z' '271Z' '272Z' '275Z' '277Z' '278Z' '283Z' '284Z' '285Z'
 '286Z' '287Z' '289Z' '28GV' '290Z' '291Z' '292Z' '298N' '300W' '30HD'
 '320X' '34QD' '35QD' '36GV' '393I' '39IJ' '423N' '42GV' '434Q' '43GC'
 '459Y' '45DP' '45DT' '45MR' '46BA' '46IJ' '473R' '479T' '481I' '485I'
 '501X' '509X' '51JE' '52AO' '52JE' '54GB' '54MG' '565X' '568X ' '56JE'
 '56LR' '57MA' '587X' '

Versão 2 📌

In [25]:
import pandas as pd

# Load the two Excel files
file1 = pd.read_excel('tablet05/tablet.xlsx')
file2 = pd.read_excel('tablet05/tablet2.xlsx')

# Merge the two files on the SELB column
merged = pd.merge(file1, file2, on='SELB', how='outer', indicator=True)

# Identify values present in both files
common_values = merged[merged['_merge'] == 'both']['SELB'].unique()

# Identify values present only in one file
only_in_file1 = merged[merged['_merge'] == 'left_only']['SELB'].unique()
only_in_file2 = merged[merged['_merge'] == 'right_only']['SELB'].unique()

# Create a new Excel file with the unified columns
unified = pd.DataFrame({
    'SELB': merged['SELB'],
    'Observação': ['em conformidade' if value in common_values else 'não está em conformidade' for value in merged['SELB']]
})

# Add the other columns from both files to the unified dataframe
unified = pd.concat([unified, merged.drop(['SELB', '_merge'], axis=1)], axis=1)

# Save the unified file to a new Excel file
unified.to_excel('tablet05/unified.xlsx', index=False)

print("Valores da coluna SELB presentes em ambos os arquivos:")
print(common_values)

print("\nValores da coluna SELB presentes apenas em um dos arquivos:")
print("Apenas em file1:", only_in_file1)
print("Apenas em file2:", only_in_file2)

unified1 = pd.DataFrame(only_in_file1)
unified1.to_excel('tablet05/only_in_file1.xlsx', index=False)

unified2 = pd.DataFrame(only_in_file2)
unified2.to_excel('tablet05/only_in_file2.xlsx', index=False)

Valores da coluna SELB presentes em ambos os arquivos:
['10ZA' '10ZB' '10ZD' '10ZT' '10ZV' '11ZA' '11ZB' '12ZA' '12ZB' '12ZV'
 '13XO' '13ZA' '13ZB' '13ZV' '14XD' '14ZB' '14ZV' '15XD' '15ZA' '15ZB'
 '15ZV' '16XD' '16YA' '16ZA' '16ZB' '16ZT' '16ZV' '17XD' '17YA' '17ZA'
 '17ZB' '17ZV' '18ZA' '18ZB' '19ZA' '20XD' '20YA' '20ZA' '21XD' '21YA'
 '21ZA' '22XD' '22ZA' '22ZG' '23XD' '23YA' '23ZA' '23ZG' '23ZH' '24ZA'
 '24ZG' '24ZH' '25ZD' '25ZG' '25ZH' '26WW' '26ZA' '26ZG' '26ZH' '27ZA'
 '27ZG' '27ZH' '28ZA' '28ZG' '28ZH' '29WW' '29ZB' '29ZG' '29ZH' '30YE'
 '30ZA' '30ZB' '30ZG' '30ZH' '31XN' '31YE' '31ZB' '31ZG' '31ZH' '32YE'
 '32ZB' '32ZH' '33YE' '33ZH' '34YE' '34ZH' '35YE' '35ZB' '35ZH' '36XG'
 '36YE' '36ZB' '36ZH' '37XG' '37YE' '37ZB' '38YE' '38ZB' '38ZC' '38ZH'
 '38ZV' '39YE' '39ZC' '39ZH' '39ZV' '40ZC' '40ZH' '40ZV' '41ZC' '41ZH'
 '41ZV' '42ZC' '42ZH' '42ZV' '43ZA' '43ZC' '43ZV' '44ZA' '44ZC' '44ZV'
 '45ZA' '45ZC' '45ZV' '46ZA' '46ZC' '46ZV' '47ZA' '47ZC' '47ZV' '48ZA'
 '48ZT' '49XN' '49ZA' 