In [None]:
# 📁 notebooks/00_complete_analysis.ipynb
# %% [markdown]
"""
# Análise Completa: Educação e Crescimento Econômico

Análise em tempo real usando APIs diretas para investigar a relação entre educação e crescimento econômico.
"""

# %%
# ==================== CONFIGURAÇÃO E IMPORTS ====================
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import requests
import json
from scipy import stats
import statsmodels.api as sm
from statsmodels.formula.api import ols
from sklearn.preprocessing import StandardScaler
from sklearn.cluster import KMeans
from sklearn.decomposition import PCA
from concurrent.futures import ThreadPoolExecutor, as_completed
import warnings
warnings.filterwarnings('ignore')

# Configuração de visualização
plt.style.use('seaborn-v0_8-whitegrid')
sns.set_palette("husl")
pd.set_option('display.max_columns', 50)
pd.set_option('display.width', 1000)

# %%
# ==================== CLASSE PRINCIPAL DE ANÁLISE ====================
class EducationEconomicAnalysis:
    def __init__(self):
        self.raw_data = None
        self.processed_data = None
        self.results = {}
        self.countries = ['BRA', 'USA', 'CHN', 'IND', 'DEU', 'FRA', 'GBR', 'JPN', 'ZAF', 'MEX']
        
    def fetch_worldbank_data(self, indicator, countries):
        """Busca dados diretamente da API do Banco Mundial"""
        url = f"http://api.worldbank.org/v2/country/{';'.join(countries)}/indicator/{indicator}?format=json&per_page=10000"
        
        try:
            response = requests.get(url, timeout=30)
            if response.status_code == 200:
                data = response.json()
                if len(data) > 1:
                    return [
                        {
                            'country': item['country']['id'],
                            'country_name': item['country']['value'],
                            'indicator': indicator,
                            'year': int(item['date']),
                            'value': float(item['value']) if item['value'] else None
                        }
                        for item in data[1] if item['value'] is not None
                    ]
        except Exception as e:
            print(f"Erro ao buscar {indicator}: {e}")
        return []

    def collect_all_data(self):
        """Coleta dados de todos os indicadores em paralelo"""
        indicators = {
            'education': [
                'SE.SEC.ENRR',      # Taxa de matrícula secundária
                'SE.XPD.TOTL.GD.ZS', # Gasto em educação (% PIB)
                'SE.TER.ENRR',      # Taxa de matrícula terciária
                'SE.ADT.LITR.ZS',   # Taxa de alfabetização
            ],
            'economic': [
                'NY.GDP.PCAP.CD',   # PIB per capita
                'NY.GDP.MKTP.KD.ZG', # Crescimento do PIB
                'SL.UEM.TOTL.ZS',   # Taxa de desemprego
                'NE.EXP.GNFS.ZS',   # Exportações (% PIB)
            ]
        }

        all_data = []
        
        with ThreadPoolExecutor(max_workers=10) as executor:
            futures = []
            for category, ind_list in indicators.items():
                for indicator in ind_list:
                    futures.append(executor.submit(self.fetch_worldbank_data, indicator, self.countries))
            
            for future in as_completed(futures):
                result = future.result()
                if result:
                    all_data.extend(result)
        
        self.raw_data = pd.DataFrame(all_data)
        return self.raw_data

    def preprocess_data(self):
        """Preprocessa e transforma os dados"""
        if self.raw_data is None:
            self.collect_all_data()
        
        # Converter para formato wide
        wide_data = self.raw_data.pivot_table(
            index=['country', 'country_name', 'year'],
            columns='indicator',
            values='value'
        ).reset_index()
        
        # Remover anos com muitos missing values
        wide_data = wide_data.dropna(thresh=8)
        
        # Engenharia de features
        wide_data['edu_investment_ratio'] = wide_data['SE.XPD.TOTL.GD.ZS'] / wide_data['NY.GDP.PCAP.CD'].clip(lower=100)
        wide_data['enrollment_ratio'] = wide_data['SE.TER.ENRR'] / wide_data['SE.SEC.ENRR'].clip(lower=1)
        
        # Calcular crescimento anual
        wide_data = wide_data.sort_values(['country', 'year'])
        for col in ['NY.GDP.PCAP.CD', 'SE.SEC.ENRR', 'SE.XPD.TOTL.GD.ZS']:
            wide_data[f'{col}_growth'] = wide_data.groupby('country')[col].pct_change()
        
        self.processed_data = wide_data
        return self.processed_data

    def perform_statistical_analysis(self):
        """Realiza análise estatística completa"""
        if self.processed_data is None:
            self.preprocess_data()
        
        df = self.processed_data.dropna()
        
        # 1. Correlações
        corr_matrix = df[['SE.SEC.ENRR', 'SE.XPD.TOTL.GD.ZS', 'NY.GDP.PCAP.CD', 
                         'NY.GDP.MKTP.KD.ZG', 'edu_investment_ratio']].corr()
        
        # 2. Regressão linear
        X = df[['SE.SEC.ENRR', 'SE.XPD.TOTL.GD.ZS']]
        X = sm.add_constant(X)
        y = df['NY.GDP.PCAP.CD']
        
        model = sm.OLS(y, X).fit()
        
        # 3. Análise por país
        country_correlations = {}
        for country in df['country'].unique():
            country_data = df[df['country'] == country]
            if len(country_data) > 5:
                corr = country_data['SE.SEC.ENRR'].corr(country_data['NY.GDP.PCAP.CD'])
                country_correlations[country] = corr
        
        self.results = {
            'correlation_matrix': corr_matrix,
            'regression_model': model,
            'country_correlations': country_correlations,
            'summary_stats': df.describe()
        }
        
        return self.results

    def clustering_analysis(self):
        """Análise de clusters de países"""
        df = self.processed_data.dropna()
        
        # Dados médios por país
        country_means = df.groupby('country').agg({
            'SE.SEC.ENRR': 'mean',
            'NY.GDP.PCAP.CD': 'mean',
            'SE.XPD.TOTL.GD.ZS': 'mean',
            'edu_investment_ratio': 'mean'
        }).dropna()
        
        # Normalizar dados
        scaler = StandardScaler()
        scaled_data = scaler.fit_transform(country_means)
        
        # K-means clustering
        kmeans = KMeans(n_clusters=3, random_state=42, n_init=10)
        clusters = kmeans.fit_predict(scaled_data)
        
        country_means['cluster'] = clusters
        
        # PCA para visualização
        pca = PCA(n_components=2)
        pca_result = pca.fit_transform(scaled_data)
        
        self.results['clustering'] = {
            'country_means': country_means,
            'pca_result': pca_result,
            'explained_variance': pca.explained_variance_ratio_
        }
        
        return country_means

    def time_series_analysis(self):
        """Análise de séries temporais"""
        df = self.processed_data.dropna()
        
        # Calcular elasticidades ao longo do tempo
        elasticities = {}
        years = sorted(df['year'].unique())
        
        for year in years:
            year_data = df[df['year'] == year]
            if len(year_data) > 5:
                try:
                    # Regressão cross-section para cada ano
                    X = year_data[['SE.SEC.ENRR', 'SE.XPD.TOTL.GD.ZS']]
                    X = sm.add_constant(X)
                    y = year_data['NY.GDP.PCAP.CD']
                    
                    model = sm.OLS(y, X).fit()
                    elasticities[year] = {
                        'enrollment_coef': model.params['SE.SEC.ENRR'],
                        'spending_coef': model.params['SE.XPD.TOTL.GD.ZS'],
                        'r_squared': model.rsquared
                    }
                except:
                    continue
        
        self.results['time_series'] = elasticities
        return elasticities

    def create_visualizations(self):
        """Cria todas as visualizações"""
        if self.processed_data is None:
            self.preprocess_data()
        
        df = self.processed_data.dropna()
        
        fig, axes = plt.subplots(3, 2, figsize=(15, 18))
        
        # 1. Gráfico de dispersão principal
        for country in df['country'].unique():
            country_data = df[df['country'] == country]
            axes[0, 0].scatter(country_data['SE.SEC.ENRR'], country_data['NY.GDP.PCAP.CD'],
                              alpha=0.6, label=country, s=50)
        axes[0, 0].set_xlabel('Taxa de Matrícula Secundária (%)')
        axes[0, 0].set_ylabel('PIB per Capita (USD)')
        axes[0, 0].set_title('Relação entre Educação e PIB per Capita')
        axes[0, 0].legend(bbox_to_anchor=(1.05, 1), loc='upper left')
        
        # 2. Evolução temporal
        for country in ['BRA', 'USA', 'CHN', 'IND']:
            country_data = df[df['country'] == country]
            if not country_data.empty:
                axes[0, 1].plot(country_data['year'], country_data['SE.SEC.ENRR'],
                               label=country, linewidth=2)
        axes[0, 1].set_title('Evolução da Taxa de Matrícula Secundária')
        axes[0, 1].set_xlabel('Ano')
        axes[0, 1].set_ylabel('Taxa de Matrícula (%)')
        axes[0, 1].legend()
        axes[0, 1].grid(True, alpha=0.3)
        
        # 3. Correlações por país
        correlations = self.results.get('country_correlations', {})
        if correlations:
            axes[1, 0].bar(correlations.keys(), correlations.values())
            axes[1, 0].set_title('Correlação Educação-PIB por País')
            axes[1, 0].set_ylabel('Coeficiente de Correlação')
            axes[1, 0].tick_params(axis='x', rotation=45)
        
        # 4. Heatmap de correlações
        corr_matrix = self.results.get('correlation_matrix', pd.DataFrame())
        if not corr_matrix.empty:
            sns.heatmap(corr_matrix, annot=True, cmap='coolwarm', center=0,
                       ax=axes[1, 1])
            axes[1, 1].set_title('Matriz de Correlação')
        
        # 5. Análise de clusters
        clustering = self.results.get('clustering', {})
        if clustering:
            pca_result = clustering['pca_result']
            country_means = clustering['country_means']
            scatter = axes[2, 0].scatter(pca_result[:, 0], pca_result[:, 1],
                                       c=country_means['cluster'], cmap='viridis', s=100)
            for i, country in enumerate(country_means.index):
                axes[2, 0].annotate(country, (pca_result[i, 0], pca_result[i, 1]),
                                   xytext=(5, 5), textcoords='offset points', fontsize=8)
            axes[2, 0].set_title('Análise de Clusters de Países')
            axes[2, 0].set_xlabel(f'PC1 ({clustering["explained_variance"][0]:.1%} var.)')
            axes[2, 0].set_ylabel(f'PC2 ({clustering["explained_variance"][1]:.1%} var.)')
        
        # 6. Elasticidades ao longo do tempo
        time_series = self.results.get('time_series', {})
        if time_series:
            years = list(time_series.keys())
            enrollment_coefs = [time_series[year]['enrollment_coef'] for year in years]
            axes[2, 1].plot(years, enrollment_coefs, marker='o', linewidth=2)
            axes[2, 1].set_title('Elasticidade Educação-PIB ao Longo do Tempo')
            axes[2, 1].set_xlabel('Ano')
            axes[2, 1].set_ylabel('Coeficiente de Elasticidade')
            axes[2, 1].grid(True, alpha=0.3)
        
        plt.tight_layout()
        plt.savefig('complete_analysis.png', dpi=300, bbox_inches='tight')
        plt.show()

    def _convert_to_serializable(self, obj):
        """Converte objetos numpy/pandas para tipos serializáveis JSON"""
        if isinstance(obj, (np.integer, np.int64)):
            return int(obj)
        elif isinstance(obj, (np.floating, np.float64)):
            return float(obj)
        elif isinstance(obj, np.ndarray):
            return obj.tolist()
        elif isinstance(obj, pd.DataFrame):
            return obj.to_dict()
        elif isinstance(obj, pd.Series):
            return obj.to_dict()
        elif hasattr(obj, 'to_json'):
            return obj.to_json()
        elif hasattr(obj, '__dict__'):
            return {k: self._convert_to_serializable(v) for k, v in obj.__dict__.items()}
        else:
            return obj

    def generate_report(self):
        """Gera relatório completo da análise"""
        if not self.results:
            self.perform_statistical_analysis()
            self.clustering_analysis()
            self.time_series_analysis()
        
        # Converter todos os valores para tipos serializáveis
        report = {
            'timestamp': pd.Timestamp.now().isoformat(),
            'countries_analyzed': self.countries,
            'data_points': len(self.processed_data) if self.processed_data is not None else 0,
            'time_period': {
                'start': int(self.processed_data['year'].min()) if self.processed_data is not None else None,
                'end': int(self.processed_data['year'].max()) if self.processed_data is not None else None
            },
            'correlation_summary': {
                'education_gdp': float(self.results['correlation_matrix'].loc['SE.SEC.ENRR', 'NY.GDP.PCAP.CD']),
                'spending_gdp': float(self.results['correlation_matrix'].loc['SE.XPD.TOTL.GD.ZS', 'NY.GDP.PCAP.CD'])
            },
            'regression_results': {
                'rsquared': float(self.results['regression_model'].rsquared),
                'params': {k: float(v) for k, v in self.results['regression_model'].params.items()},
                'pvalues': {k: float(v) for k, v in self.results['regression_model'].pvalues.items()}
            },
            'country_correlations': {k: float(v) for k, v in self.results['country_correlations'].items()}
        }
        
        # Adicionar clustering se disponível
        if 'clustering' in self.results:
            report['clustering_summary'] = {
                'n_clusters': int(self.results['clustering']['country_means']['cluster'].nunique()),
                'cluster_sizes': self.results['clustering']['country_means']['cluster'].value_counts().to_dict()
            }
        
        # Adicionar time series se disponível
        if 'time_series' in self.results:
            report['time_series_summary'] = {
                'years_analyzed': len(self.results['time_series']),
                'avg_enrollment_coef': float(np.mean([v['enrollment_coef'] for v in self.results['time_series'].values()])),
                'avg_r_squared': float(np.mean([v['r_squared'] for v in self.results['time_series'].values()]))
            }
        
        # Salvar relatório
        with open('analysis_report.json', 'w') as f:
            json.dump(report, f, indent=2)
        
        return report

# %%
# ==================== EXECUÇÃO DA ANÁLISE COMPLETA ====================

# Instanciar e executar análise
print("🚀 Iniciando análise completa...")
analyzer = EducationEconomicAnalysis()

print("📊 Coletando dados das APIs...")
raw_data = analyzer.collect_all_data()
print(f"✅ Dados coletados: {len(raw_data)} registros")

print("🔧 Processando dados...")
processed_data = analyzer.preprocess_data()
print(f"✅ Dados processados: {processed_data.shape}")

print("📈 Realizando análise estatística...")
results = analyzer.perform_statistical_analysis()
print("✅ Análise estatística concluída")

print("👥 Executando análise de clusters...")
clusters = analyzer.clustering_analysis()
print("✅ Análise de clusters concluída")

print("⏰ Realizando análise de séries temporais...")
time_series = analyzer.time_series_analysis()
print("✅ Análise temporal concluída")

print("🎨 Gerando visualizações...")
analyzer.create_visualizations()
print("✅ Visualizações salvas")

print("📋 Gerando relatório final...")
report = analyzer.generate_report()
print("✅ Relatório gerado")

# %%
# ==================== RESULTADOS E INSIGHTS ====================

print("\n" + "="*60)
print("📊 RESULTADOS PRINCIPAIS DA ANÁLISE")
print("="*60)

# Correlação educação-PIB
corr_edu_gdp = report['correlation_summary']['education_gdp']
print(f"📈 Correlação Educação-PIB: {corr_edu_gdp:.3f}")

# Resultados da regressão
rsquared = report['regression_results']['rsquared']
edu_coef = report['regression_results']['params']['SE.SEC.ENRR']
edu_pvalue = report['regression_results']['pvalues']['SE.SEC.ENRR']

print(f"🔍 R² do modelo: {rsquared:.3f}")
print(f"📚 Coeficiente Educação: {edu_coef:.3f} (p-value: {edu_pvalue:.4f})")

# Análise de clusters
if 'clustering_summary' in report:
    print(f"👥 Países agrupados em {report['clustering_summary']['n_clusters']} clusters")
    for cluster, count in report['clustering_summary']['cluster_sizes'].items():
        print(f"   Cluster {cluster}: {count} países")

# Análise por país
print("\n🇧🇷 Análise específica do Brasil:")
brazil_data = analyzer.processed_data[analyzer.processed_data['country'] == 'BRA'].dropna()
if not brazil_data.empty:
    latest_year = brazil_data['year'].max()
    latest_data = brazil_data[brazil_data['year'] == latest_year].iloc[0]
    
    print(f"   Ano mais recente: {int(latest_year)}")
    print(f"   PIB per capita: USD {float(latest_data['NY.GDP.PCAP.CD']):,.0f}")
    print(f"   Matrícula secundária: {float(latest_data['SE.SEC.ENRR']):.1f}%")
    print(f"   Gasto em educação: {float(latest_data['SE.XPD.TOTL.GD.ZS']):.1f}% do PIB")

# %%
# ==================== ANÁLISE COMPARATIVA ====================

print("\n" + "="*60)
print("🌍 ANÁLISE COMPARATIVA ENTRE PAÍSES")
print("="*60)

# Primeiro, vamos verificar quais colunas estão disponíveis
print("Colunas disponíveis no processed_data:")
print(analyzer.processed_data.columns.tolist())

# Dados mais recentes por país - usando os nomes corretos das colunas
latest_data = []
for country in analyzer.countries:
    country_data = analyzer.processed_data[analyzer.processed_data['country'] == country].dropna()
    if not country_data.empty:
        latest_year = country_data['year'].max()
        latest_row = country_data[country_data['year'] == latest_year].iloc[0]
        
        # Usar os nomes corretos das colunas do World Bank
        latest_data.append({
            'country': country,
            'year': int(latest_year),
            'NY.GDP.PCAP.CD': float(latest_row['NY.GDP.PCAP.CD']) if 'NY.GDP.PCAP.CD' in latest_row else None,
            'SE.SEC.ENRR': float(latest_row['SE.SEC.ENRR']) if 'SE.SEC.ENRR' in latest_row else None,
            'SE.XPD.TOTL.GD.ZS': float(latest_row['SE.XPD.TOTL.GD.ZS']) if 'SE.XPD.TOTL.GD.ZS' in latest_row else None
        })

latest_df = pd.DataFrame(latest_data)

# Remover linhas com valores nulos
latest_df = latest_df.dropna()

# Top países em diferentes métricas - usando os nomes corretos das colunas
if not latest_df.empty and 'NY.GDP.PCAP.CD' in latest_df.columns:
    print("\n🏆 Top 5 países por PIB per capita:")
    top_gdp = latest_df.nlargest(5, 'NY.GDP.PCAP.CD')[['country', 'NY.GDP.PCAP.CD']].copy()
    top_gdp['NY.GDP.PCAP.CD'] = top_gdp['NY.GDP.PCAP.CD'].apply(lambda x: f"USD {x:,.0f}")
    print(top_gdp.to_string(index=False))

if not latest_df.empty and 'SE.SEC.ENRR' in latest_df.columns:
    print("\n🎓 Top 5 países por matrícula secundária:")
    top_edu = latest_df.nlargest(5, 'SE.SEC.ENRR')[['country', 'SE.SEC.ENRR']].copy()
    top_edu['SE.SEC.ENRR'] = top_edu['SE.SEC.ENRR'].apply(lambda x: f"{x:.1f}%")
    print(top_edu.to_string(index=False))

if not latest_df.empty and 'SE.XPD.TOTL.GD.ZS' in latest_df.columns:
    print("\n💰 Top 5 países por gasto em educação (% PIB):")
    top_spend = latest_df.nlargest(5, 'SE.XPD.TOTL.GD.ZS')[['country', 'SE.XPD.TOTL.GD.ZS']].copy()
    top_spend['SE.XPD.TOTL.GD.ZS'] = top_spend['SE.XPD.TOTL.GD.ZS'].apply(lambda x: f"{x:.1f}%")
    print(top_spend.to_string(index=False))

# %%
# ==================== TESTES ESTATÍSTICOS AVANÇADOS ====================

print("\n" + "="*60)
print("📊 TESTES ESTATÍSTICOS AVANÇADOS")
print("="*60)

# Verificar se temos dados suficientes para análise
if not latest_df.empty and 'NY.GDP.PCAP.CD' in latest_df.columns and 'SE.SEC.ENRR' in latest_df.columns:
    
    # Teste de diferenças entre grupos de renda
    # Classificar países por renda
    latest_df['income_group'] = pd.qcut(latest_df['NY.GDP.PCAP.CD'], 3, labels=['Baixa', 'Média', 'Alta'])
    
    # ANOVA para diferenças na matrícula entre grupos de renda
    groups = []
    for group in ['Baixa', 'Média', 'Alta']:
        group_data = latest_df[latest_df['income_group'] == group]['SE.SEC.ENRR'].dropna()
        if len(group_data) > 0:
            groups.append(group_data)
    
    if len(groups) >= 2:
        f_stat, p_value = stats.f_oneway(*groups)
        print(f"📊 ANOVA - Diferenças na matrícula por grupo de renda:")
        print(f"   F-statistic: {f_stat:.3f}, p-value: {p_value:.4f}")
    
    # Correlação e teste de significância
    corr_test = stats.pearsonr(latest_df['SE.SEC.ENRR'], latest_df['NY.GDP.PCAP.CD'])
    print(f"🔍 Correlação Educação-PIB: {corr_test.statistic:.3f}")
    print(f"📋 Teste de significância da correlação:")
    print(f"   p-value: {corr_test.pvalue:.4f}")
    
    # Correlação parcial (controlando por gastos em educação)
    if 'SE.XPD.TOTL.GD.ZS' in latest_df.columns:
        # Usar regressão linear para correlação parcial
        X = latest_df[['SE.SEC.ENRR', 'SE.XPD.TOTL.GD.ZS']].dropna()
        y = latest_df['NY.GDP.PCAP.CD'].loc[X.index]
        
        if len(X) > 5:
            X = sm.add_constant(X)
            model = sm.OLS(y, X).fit()
            partial_corr = model.params['SE.SEC.ENRR']
            print(f"📈 Coeficiente parcial Educação-PIB (controlando gastos): {partial_corr:.3f}")

# %%
# ==================== SALVANDO RESULTADOS COMPLETOS ====================

# Salvar dados processados
analyzer.processed_data.to_csv('processed_education_economic_data.csv', index=False)

# Salvar resultados estatísticos detalhados
statistical_results = {
    'correlation_matrix': analyzer.results['correlation_matrix'].to_dict(),
    'regression_summary': {
        'rsquared': float(analyzer.results['regression_model'].rsquared),
        'rsquared_adj': float(analyzer.results['regression_model'].rsquared_adj),
        'f_statistic': float(analyzer.results['regression_model'].fvalue),
        'f_pvalue': float(analyzer.results['regression_model'].f_pvalue),
        'params': {k: float(v) for k, v in analyzer.results['regression_model'].params.items()},
        'pvalues': {k: float(v) for k, v in analyzer.results['regression_model'].pvalues.items()}
    },
    'country_correlations': {k: float(v) for k, v in analyzer.results['country_correlations'].items()}
}

with open('statistical_results.json', 'w') as f:
    json.dump(statistical_results, f, indent=2)

print("\n✅ Análise completa concluída!")
print("📁 Arquivos salvos:")
print("   - processed_education_economic_data.csv")
print("   - statistical_results.json")
print("   - analysis_report.json")
print("   - complete_analysis.png")

# %%
# ==================== INSIGHTS FINAIS ====================

print("\n" + "="*60)
print("💡 INSIGHTS E RECOMENDAÇÕES")
print("="*60)

# Insights baseados nos resultados
if corr_edu_gdp > 0.5:
    print("🎯 Insight 1: Forte correlação positiva entre educação e crescimento econômico")
    print("   → Investimentos em educação têm impacto significativo no PIB")
elif corr_edu_gdp > 0.3:
    print("🎯 Insight 1: Correlação moderada entre educação e crescimento econômico")
    print("   → Educação é um dos fatores importantes para o desenvolvimento")
else:
    print("🎯 Insight 1: Correlação fraca entre educação e crescimento econômico")
    print("   → Outros fatores podem ter maior impacto no crescimento")

if edu_pvalue < 0.05:
    print("🎯 Insight 2: Relação estatisticamente significativa (p < 0.05)")
    print("   → Os resultados não são devidos ao acaso")
else:
    print("🎯 Insight 2: Relação não estatisticamente significativa")
    print("   → Resultados podem ser devido a variação aleatória")

# Recomendações baseadas nos clusters
if 'clustering_summary' in report:
    cluster_sizes = report['clustering_summary']['cluster_sizes']
    if len(cluster_sizes) > 1:
        print("🎯 Insight 3: Países se agrupam em perfis distintos de desenvolvimento")
        print("   → Políticas educacionais devem ser adaptadas a cada perfil")

print("\n📋 Recomendações para políticas públicas:")
print("   1. Aumentar investimentos em educação secundária e terciária")
print("   2. Focar na qualidade do ensino além da quantidade de matrículas")
print("   3. Desenvolver políticas específicas para cada grupo de países")
print("   4. Monitorar continuamente a relação educação-crescimento")

print("\n🔮 Próximos passos para pesquisa:")
print("   1. Investigar causalidade (educação → crescimento ou crescimento → educação?)")
print("   2. Analisar o papel de variáveis intermediárias (tecnologia, inovação)")
print("   3. Estudo longitudinal de países específicos")
print("   4. Análise de políticas educacionais bem-sucedidas")