In [7]:
!unzip /content/OMS-main.zip

Processing ./OMS-main.zip
[31mERROR: file:///content/OMS-main.zip does not appear to be a Python project: neither 'setup.py' nor 'pyproject.toml' found.[0m[31m
[0m

In [27]:
import sys
import importlib.util

# Adiciona o caminho principal do projeto ao sys.path
sys.path.append('/content/OMS-main')





In [30]:
from dataset.leitura_dataset import LeitorDataset
from modelos.modelagaem_expectativa_vida import ExpectativaVidaMLP
from analise_exploratoria.consumo_alcool import ConsumoAlcool
from analise_exploratoria.correlacao_mapa import MatrizRelacao
from analise_exploratoria.expectativa_scaterplot import VisualizacaoScaterPlot
from analise_exploratoria.tendencia_varias_variaveis import TendenciaVariasVariaveis
from analise_exploratoria.visualizacao_expectativa_vida import VisualizadorExpectativaVida
from preprocessamento.analise.dataframe_final import DataFrameFinal
from preprocessamento.analise.duplicatas import Duplicatas
from preprocessamento.analise.valores_ausentes import AnaliseValoresAusentes
from preprocessamento.limpeza.colunas_redundantes import RemovendoColunas
from preprocessamento.limpeza.limpeza_dataset import PreenchendoKNN
from preprocessamento.outliers.outliers import Outlier

In [32]:
class Principal:
    def __init__(self):
        leitor_df = LeitorDataset("/content/OMS-main/dataset/dataset_LE.csv")
        self.df = leitor_df.executar_leitura()

    def duplicatas(self):
        dupli = Duplicatas(self.df)
        dupli.executar_analise_duplicatas()

    def valores_nulos(self):
        valor_n = AnaliseValoresAusentes(self.df)
        valor_n.executar_analise_valores_ausentes()

    def outliers(self):
        outli = Outlier(self.df)
        self.df = outli.executar_outliers()

    def preencher_valor_ausente(self):
        valor_ause = PreenchendoKNN(self.df)
        self.df = valor_ause.executar_limpeza_dados()

    def dataframefinal(self):
        final = DataFrameFinal(self.df)
        self.df = final.executar_analise_dataframe_final()

    def visualizar_expectativa_vida(self):
        visualizar = VisualizadorExpectativaVida(self.df)
        visualizar.executar_visualizacao_tendencia_vida()

    def tendencia_variavel(self):
        tendencia = TendenciaVariasVariaveis(self.df)
        tendencia.executar_visualizacao_varias_variaveis()

    def consumo_alcool(self):
        alcool = ConsumoAlcool(self.df)
        alcool.executar_visualizacao_consumo_alcool()

    def scatter_plot(self):
        scatter = VisualizacaoScaterPlot(self.df)
        scatter.executar_visualizar_correlacao_bmi_vida()

    def matriz_relacao(self):
        matriz = MatrizRelacao(self.df)
        matriz.executar_matriz_relacao()

    def colunas_redundantes(self):
        colunas = RemovendoColunas(self.df)
        self.df = colunas.executar_remover_colunas()

    def rede_neural(self):
        rede = ExpectativaVidaMLP(self.df)
        rede.executar_pipeline()

    def executar_tudo(self):
        """
        Executa todo o pipeline de processamento, análise e modelagem da expectativa de vida,
        permitindo que o usuário pressione ENTER para avançar para cada etapa.

        Este método encapsula todas as etapas do pipeline, incluindo:
        1. Leitura e carregamento do dataset.
        2. Análise de duplicatas e valores ausentes.
        3. Detecção e tratamento de outliers.
        4. Preenchimento de valores ausentes usando KNN.
        5. Análise do DataFrame final após a limpeza.
        6. Visualizações exploratórias da expectativa de vida e outras variáveis.
        7. Análise do consumo de álcool e sua relação com expectativa de vida.
        8. Geração de scatter plots e análise de correlação.
        9. Remoção de colunas redundantes.
        10. Treinamento e avaliação da rede neural.

        Returns:
            None: Apenas exibe os resultados das análises e modelagens.

        Example:
            >>> pipeline = Principal()
            >>> pipeline.executar_tudo()
        """

        def aguardar_usuario():
            input("\n🔹 Pressione ENTER para continuar...")

        print("\n📌 **Iniciando Pipeline Completo...**")

        print("\n🔍 1. Analisando duplicatas...")
        self.duplicatas()
        aguardar_usuario()

        print("\n📊 2. Analisando valores nulos...")
        self.valores_nulos()
        aguardar_usuario()

        print("\n🚀 3. Detectando e tratando outliers...")
        self.outliers()
        aguardar_usuario()

        print("\n🛠️ 4. Preenchendo valores ausentes com KNN...")
        self.preencher_valor_ausente()
        aguardar_usuario()

        print("\n✅ 5. Exibindo análise final do DataFrame...")
        self.dataframefinal()
        aguardar_usuario()

        print("\n📈 6. Visualizando tendência da expectativa de vida...")
        self.visualizar_expectativa_vida()
        aguardar_usuario()

        print("\n📊 7. Analisando tendências de múltiplas variáveis...")
        self.tendencia_variavel()
        aguardar_usuario()

        print("\n🥂 8. Visualizando consumo de álcool e impacto na expectativa de vida...")
        self.consumo_alcool()
        aguardar_usuario()

        print("\n📉 9. Gerando Scatter Plot (Correlação BMI vs Expectativa de Vida)...")
        self.scatter_plot()
        aguardar_usuario()

        print("\n📊 10. Criando Matriz de Correlação...")
        self.matriz_relacao()
        aguardar_usuario()

        print("\n🗑️ 11. Removendo colunas redundantes...")
        self.colunas_redundantes()
        aguardar_usuario()

        print("\n🤖 12. Iniciando treinamento da Rede Neural para previsão de Expectativa de Vida...")
        self.rede_neural()
        aguardar_usuario()

        print("\n🎉 **Pipeline Finalizado com Sucesso!** ✅")



In [33]:
mineracao = Principal()

✅ Arquivo '/content/OMS-main/dataset/dataset_LE.csv' carregado com sucesso!

📌 Informações do Dataset:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2938 entries, 0 to 2937
Data columns (total 22 columns):
 #   Column                           Non-Null Count  Dtype  
---  ------                           --------------  -----  
 0   Country                          2938 non-null   object 
 1   Year                             2938 non-null   int64  
 2   Status                           2938 non-null   object 
 3   Life expectancy                  2928 non-null   float64
 4   Adult Mortality                  2928 non-null   float64
 5   infant deaths                    2938 non-null   int64  
 6   Alcohol                          2744 non-null   float64
 7   percentage expenditure           2938 non-null   float64
 8   Hepatitis B                      2385 non-null   float64
 9   Measles                          2938 non-null   int64  
 10   BMI                             2904 non

In [34]:
mineracao.executar_tudo()


📌 **Iniciando Pipeline Completo...**

🔍 1. Analisando duplicatas...
🔍 Total de registros duplicados considerando ['Country', 'Year']: 0

📊 Contagem de valores únicos por coluna categórica:
Country    193
Status       2
dtype: int64

🔹 Pressione ENTER para continuar...

📊 2. Analisando valores nulos...

📉 Contagem de valores ausentes por coluna:
Country                              0
Year                                 0
Status                               0
Life expectancy                     10
Adult Mortality                     10
infant deaths                        0
Alcohol                            194
percentage expenditure               0
Hepatitis B                        553
Measles                              0
 BMI                                34
under-five deaths                    0
Polio                               19
Total expenditure                  226
Diphtheria                          19
 HIV/AIDS                            0
GDP                         

KeyboardInterrupt: Interrupted by user