### Exerc√≠cio 3

Voc√™ dever√° selecionar um banco de dados cient√≠fico aberto entre as seguintes op√ß√µes para realizar uma an√°lise visual aprofundada, utilizando Python:

- PANGAEA (dados ambientais e clim√°ticos)
- NASA Earth Data (observa√ß√µes de sat√©lite)
- ENSEMBL / 1000 Genomes (dados gen√¥micos)
- Global Biodiversity Information Facility (GBIF)
- UN Data (indicadores globais socioecon√¥micos)
- Figshare ou Zenodo (dados multidisciplinares de pesquisas cient√≠ficas)

üéØ Tarefas:
1. Escolha um tema exclusivo dentro do banco de dados escolhido, que ainda n√£o tenha sido selecionado por outro colega (registre seu tema antes de iniciar).
2. Baixe e fa√ßa a limpeza dos dados, garantindo organiza√ß√£o para an√°lise.
3. Utilize Python para produzir ao menos cinco visualiza√ß√µes diferentes, incluindo obrigatoriamente:
    - Gr√°fico de linha ou s√©rie temporal (quando aplic√°vel)
    - Gr√°fico de dispers√£o ou correla√ß√£o
    - Gr√°fico de distribui√ß√£o (histograma, boxplot ou violin plot)
    - Visualiza√ß√£o geoespacial (mapa est√°tico ou interativo) ‚Äî caso os dados tenham componente geogr√°fico
    - Visualiza√ß√£o avan√ßada ou interativa √† sua escolha (ex: gr√°fico de rede, heatmap, gr√°fico radial, dashboard simples)

4. Escreva um relat√≥rio cient√≠fico (m√≠nimo 500 palavras) contendo:
    - Contextualiza√ß√£o do tema e relev√¢ncia cient√≠fica
    - Principais insights obtidos nas visualiza√ß√µes
    - Discuss√£o cr√≠tica das limita√ß√µes dos dados e da an√°lise
    - Refer√™ncias das bases de dados utilizadas


üõë Regras Importantes:

- Cada aluno deve escolher um tema e banco de dados exclusivos.
- O c√≥digo Python deve ser organizado, comentado e permitir reprodu√ß√£o da an√°lise.
- As visualiza√ß√µes devem ser claras, esteticamente cuidadas e com legendas/t√≠tulos informativos.
- O relat√≥rio deve demonstrar dom√≠nio conceitual e capacidade de comunica√ß√£o cient√≠fica.

## An√°lise de Recursos Humanos em Pesquisa e Desenvolvimento: Uma Perspectiva Global dos Dados da ONU

**Dados Utilizados:**
- Fonte: United Nations Statistical Yearbook 2024
- URL: https://data.un.org/_Docs/SYB/CSV/SYB67_285_202411_Research%20and%20Development%20Expenditure%20and%20Staff.csv
- Per√≠odo: 2005-2021
- Vari√°veis principais: Investimento em P&D (% PIB), Pesquisadores por milh√£o de habitantes

A import√¢ncia estrat√©gica dos recursos humanos em Pesquisa e Desenvolvimento (P&D) para o desenvolvimento econ√¥mico representa um dos pilares fundamentais da economia do conhecimento contempor√¢nea.

O capital intelectual de uma na√ß√£o, composto pelo capital interno (conhecimento armazenado em processos e sistemas), capital externo (conhecimento adquirido nas rela√ß√µes internacionais) e capital humano (as pessoas e suas compet√™ncias), representa frequentemente um ativo que supera o patrim√¥nio f√≠sico tradicional. Pa√≠ses como Coreia do Sul e Singapura exemplificam como investimentos maci√ßos em educa√ß√£o e ci√™ncia e tecnologia podem resultar em crescimento exponencial do PIB, mesmo na aus√™ncia de abundantes recursos naturais.

A forma√ß√£o de recursos humanos altamente qualificados, especialmente em n√≠vel de doutorado, constitui um fator crucial para o avan√ßo cient√≠fico e a competitividade internacional. A Organiza√ß√£o para a Coopera√ß√£o e Desenvolvimento Econ√¥mico (OCDE), atrav√©s do Manual Frascati, estabelece metodologias padronizadas para mensura√ß√£o desses recursos, classificando os profissionais de P&D em pesquisadores, t√©cnicos e pessoal de apoio, utilizando a metodologia de "Equivalente de Tempo Integral" (ETI) para permitir compara√ß√µes robustas entre pa√≠ses e setores.

In [61]:
# Importa√ß√£o das bibliotecas necess√°rias
import pandas as pd
import numpy as np
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import plotly.offline as pyo
import warnings
warnings.filterwarnings('ignore')

# Configura√ß√£o para exibi√ß√£o de gr√°ficos
pyo.init_notebook_mode(connected=True)

#### Aquisi√ß√£o e Pr√©-processamento dos Dados

In [62]:
df_raw = pd.read_csv('./dados_rh_pd_onu.csv', encoding='utf-8-sig')

print("Estrutura inicial dos dados:")
print(f"Dimens√µes: {df_raw.shape}")
print(f"Colunas: {list(df_raw.columns)}")
print("\nPrimeiras linhas:")
df_raw.head(10)

# Remover a primeira linha que cont√©m metadados
df = df_raw.iloc[1:].copy()

# Renomear
df.columns = ['Region_Code', 'Region_Country', 'Year', 'Series', 'Value', 'Footnotes', 'Source']

# Converter tipos de dados
df['Year'] = pd.to_numeric(df['Year'], errors='coerce')
df['Value'] = pd.to_numeric(df['Value'].astype(str).str.replace(',', ''), errors='coerce')
df['Region_Code'] = pd.to_numeric(df['Region_Code'], errors='coerce')

# Remover linhas com valores nulos essenciais
df = df.dropna(subset=['Year', 'Value'])

# Criar colunas separadas para os dois tipos de s√©ries
df['Series_Type'] = df['Series'].apply(lambda x: 'GDP_Percentage' if 'GDP' in str(x) else 'Researchers_per_Million')

print("Dados ap√≥s limpeza:")
print(f"Dimens√µes: {df.shape}")
print(f"Anos dispon√≠veis: {sorted(df['Year'].unique())}")
print(f"Tipos de s√©ries: {df['Series_Type'].unique()}")
print(f"N√∫mero de regi√µes/pa√≠ses: {df['Region_Country'].nunique()}")

# Visualizar algumas estat√≠sticas descritivas
print("\nEstat√≠sticas descritivas por tipo de s√©rie:")
for series_type in df['Series_Type'].unique():
    subset = df[df['Series_Type'] == series_type]
    print(f"\n{series_type}:")
    print(subset['Value'].describe())

# Criar datasets separados para facilitar as an√°lises
df_gdp = df[df['Series_Type'] == 'GDP_Percentage'].copy()
df_researchers = df[df['Series_Type'] == 'Researchers_per_Million'].copy()

# Criar um dataset combinado para an√°lises de correla√ß√£o
df_combined = pd.merge(
    df_gdp[['Region_Country', 'Year', 'Value']].rename(columns={'Value': 'GDP_RD_Percentage'}),
    df_researchers[['Region_Country', 'Year', 'Value']].rename(columns={'Value': 'Researchers_per_Million'}),
    on=['Region_Country', 'Year'],
    how='inner'
)

print("Datasets criados:")
print(f"GDP P&D: {df_gdp.shape[0]} registros")
print(f"Pesquisadores: {df_researchers.shape[0]} registros")
print(f"Combinado: {df_combined.shape[0]} registros")

# Identificar principais regi√µes/pa√≠ses
print("\nPrincipais regi√µes/pa√≠ses nos dados:")
print(df['Region_Country'].value_counts().head(15))

Estrutura inicial dos dados:
Dimens√µes: (1025, 7)
Colunas: ['T28', 'Research and development (R&D) expenditure and researchers (full time equivalent)', 'Unnamed: 2', 'Unnamed: 3', 'Unnamed: 4', 'Unnamed: 5', 'Unnamed: 6']

Primeiras linhas:
Dados ap√≥s limpeza:
Dimens√µes: (1024, 8)
Anos dispon√≠veis: [2000, 2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019, 2020, 2021, 2022]
Tipos de s√©ries: ['GDP_Percentage' 'Researchers_per_Million']
N√∫mero de regi√µes/pa√≠ses: 171

Estat√≠sticas descritivas por tipo de s√©rie:

GDP_Percentage:
count    547.000000
mean       0.892505
std        0.946228
min        0.000000
25%        0.200000
50%        0.500000
75%        1.300000
max        5.600000
Name: Value, dtype: float64

Researchers_per_Million:
count     477.000000
mean     1726.480922
std      2019.505223
min         7.400000
25%       157.600000
50%       760.200000
75%      2948.500000
max      9081.900000
Name: Value, dt

#### An√°lise Descritiva

In [63]:
# An√°lise descritiva detalhada
print("=== AN√ÅLISE DESCRITIVA DOS DADOS DE P&D ===\n")

# 1. Cobertura temporal
print("1. COBERTURA TEMPORAL:")
print(f"Per√≠odo analisado: {df['Year'].min()} - {df['Year'].max()}")
print(f"Anos com dados: {sorted(df['Year'].unique())}")
print(f"Total de anos: {df['Year'].nunique()}")

# 2. Cobertura geogr√°fica
print("\n2. COBERTURA GEOGR√ÅFICA:")
print(f"Total de regi√µes/pa√≠ses: {df['Region_Country'].nunique()}")

# Identificar pa√≠ses vs regi√µes
regions = df['Region_Country'].unique()
likely_regions = [r for r in regions if any(word in r.lower() for word in ['africa', 'asia', 'europe', 'america', 'total', 'developed', 'developing'])]
likely_countries = [r for r in regions if r not in likely_regions]

print(f"Regi√µes identificadas: {len(likely_regions)}")
print(f"Pa√≠ses identificados: {len(likely_countries)}")

# 3. An√°lise dos investimentos em P&D (% do PIB)
print("\n3. INVESTIMENTO EM P&D (% do PIB):")
gdp_stats = df_gdp['Value'].describe()
print(gdp_stats)
print(f"\nPa√≠ses/regi√µes com maior investimento em P&D (dados mais recentes):")
latest_year_gdp = df_gdp['Year'].max()
top_gdp = df_gdp[df_gdp['Year'] == latest_year_gdp].nlargest(10, 'Value')
for _, row in top_gdp.iterrows():
    print(f"  {row['Region_Country']}: {row['Value']:.2f}%")

# 4. An√°lise da densidade de pesquisadores
print("\n4. DENSIDADE DE PESQUISADORES (por milh√£o de habitantes):")
researchers_stats = df_researchers['Value'].describe()
print(researchers_stats)
print(f"\nPa√≠ses/regi√µes com maior densidade de pesquisadores (dados mais recentes):")
latest_year_res = df_researchers['Year'].max()
top_researchers = df_researchers[df_researchers['Year'] == latest_year_res].nlargest(10, 'Value')
for _, row in top_researchers.iterrows():
    print(f"  {row['Region_Country']}: {row['Value']:.1f} pesquisadores/milh√£o hab.")

# 5. An√°lise de completude dos dados
print("\n5. COMPLETUDE DOS DADOS:")
completeness_gdp = df_gdp.groupby('Region_Country')['Year'].count().describe()
completeness_res = df_researchers.groupby('Region_Country')['Year'].count().describe()
print("N√∫mero de anos com dados por regi√£o/pa√≠s:")
print("GDP P&D:")
print(completeness_gdp)
print("\nPesquisadores:")
print(completeness_res)

=== AN√ÅLISE DESCRITIVA DOS DADOS DE P&D ===

1. COBERTURA TEMPORAL:
Per√≠odo analisado: 2000 - 2022
Anos com dados: [2000, 2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019, 2020, 2021, 2022]
Total de anos: 23

2. COBERTURA GEOGR√ÅFICA:
Total de regi√µes/pa√≠ses: 171
Regi√µes identificadas: 15
Pa√≠ses identificados: 156

3. INVESTIMENTO EM P&D (% do PIB):
count    547.000000
mean       0.892505
std        0.946228
min        0.000000
25%        0.200000
50%        0.500000
75%        1.300000
max        5.600000
Name: Value, dtype: float64

Pa√≠ses/regi√µes com maior investimento em P&D (dados mais recentes):
  Portugal: 1.70%
  Canada: 1.60%
  China, Hong Kong SAR: 1.10%
  Egypt: 1.00%
  Serbia: 1.00%
  Russian Federation: 0.90%
  Belarus: 0.50%
  China, Macao SAR: 0.50%
  Saudi Arabia: 0.50%
  Congo: 0.40%

4. DENSIDADE DE PESQUISADORES (por milh√£o de habitantes):
count     477.000000
mean     1726.480922
std      2019.

#### Evolu√ß√£o Global dos Investimentos em P&D

In [69]:
# Visualiza√ß√£o 1: S√©rie Temporal
# Evolu√ß√£o temporal dos investimentos globais em P&D e densidade de pesquisadores

global_data = df[df['Region_Country'].str.contains('Total, all countries', na=False)]

global_gdp = global_data[global_data['Series_Type'] == 'GDP_Percentage']
global_researchers = global_data[global_data['Series_Type'] == 'Researchers_per_Million']

fig1 = make_subplots(
    specs=[[{"secondary_y": True}]],
    subplot_titles=["Evolu√ß√£o Global dos Investimentos em P&D e Densidade de Pesquisadores"]
)

fig1.add_trace(
    go.Scatter(
        x=global_gdp['Year'],
        y=global_gdp['Value'],
        mode='lines+markers',
        name='Investimento em P&D (% PIB)',
        line=dict(color='#1f77b4', width=3),
        marker=dict(size=8)
    ),
    secondary_y=False,
)

fig1.add_trace(
    go.Scatter(
        x=global_researchers['Year'],
        y=global_researchers['Value'],
        mode='lines+markers',
        name='Pesquisadores por milh√£o hab.',
        line=dict(color='#ff7f0e', width=3),
        marker=dict(size=8)
    ),
    secondary_y=True,
)

fig1.update_xaxes(title_text="Ano")
fig1.update_yaxes(title_text="Investimento em P&D (% do PIB)", secondary_y=False)
fig1.update_yaxes(title_text="Pesquisadores por milh√£o de habitantes", secondary_y=True)

fig1.update_layout(
    title={
        'text': 'Evolu√ß√£o Global dos Investimentos em P&D (2005-2021)',
        'x': 0.5,
        'font': {'size': 18}
    },
    width=1500,
    height=900,
    hovermode='x unified',
    legend=dict(x=0.02, y=0.98),
    template='plotly_white'
)

fig1.show()

# Salvar como HTML
fig1.write_html('./grafico1_serie_temporal.html')

#### Correla√ß√£o entre Investimento e Densidade de Pesquisadores

In [70]:
# Visualiza√ß√£o 2: Scatter Plot - Correla√ß√£o
# Rela√ß√£o entre investimento em P&D e densidade de pesquisadores

df_countries = df_combined[~df_combined['Region_Country'].str.contains(
    'Total|Africa|Asia|Europe|America|Developed|Developing|World', na=False, case=False
)].copy()

fig2 = px.scatter(
    df_countries,
    x='GDP_RD_Percentage',
    y='Researchers_per_Million',
    color='Year',
    size='GDP_RD_Percentage',
    hover_data=['Region_Country'],
    title='Correla√ß√£o entre Investimento em P&D e Densidade de Pesquisadores',
    labels={
        'GDP_RD_Percentage': 'Investimento em P&D (% do PIB)',
        'Researchers_per_Million': 'Pesquisadores por milh√£o de habitantes',
        'Year': 'Ano'
    },
    color_continuous_scale='viridis'
)

from scipy import stats
slope, intercept, r_value, p_value, std_err = stats.linregress(
    df_countries['GDP_RD_Percentage'], df_countries['Researchers_per_Million']
)

x_trend = np.linspace(df_countries['GDP_RD_Percentage'].min(), 
                      df_countries['GDP_RD_Percentage'].max(), 100)
y_trend = slope * x_trend + intercept

fig2.add_trace(
    go.Scatter(
        x=x_trend,
        y=y_trend,
        mode='lines',
        name=f'Tend√™ncia (R¬≤ = {r_value**2:.3f})',
        line=dict(color='red', dash='dash', width=2)
    )
)

fig2.update_layout(
    width=1500,
    height=900,
    template='plotly_white',
    title={'x': 0.5, 'font': {'size': 16}}
)

fig2.show()

# Salvar como HTML
fig2.write_html('./grafico2_correlacao.html')

print(f"Coeficiente de correla√ß√£o: {r_value:.3f}")
print(f"R¬≤: {r_value**2:.3f}")
print(f"P-valor: {p_value:.3e}")

Coeficiente de correla√ß√£o: 0.902
R¬≤: 0.813
P-valor: 1.811e-143


#### Distribui√ß√µes - Histogramas e Box Plots

In [76]:
# Visualiza√ß√£o 3: Distribui√ß√µes
# Histogramas e box plots para mostrar a distribui√ß√£o dos dados

fig3 = make_subplots(
    rows=2, cols=2,
    subplot_titles=[
        'Distribui√ß√£o: Investimento em P&D (% PIB)',
        'Distribui√ß√£o: Pesquisadores por milh√£o hab.',
        'Box Plot: Investimento em P&D por Ano',
        'Box Plot: Pesquisadores por Ano'
    ],
    specs=[[{"type": "xy"}, {"type": "xy"}],
           [{"type": "xy"}, {"type": "xy"}]]
)

# Histograma 1: Investimento em P&D
fig3.add_trace(
    go.Histogram(
        x=df_gdp['Value'],
        nbinsx=30,
        name='Investimento P&D',
        marker_color='lightblue',
        opacity=0.7
    ),
    row=1, col=1
)

# Histograma 2: Pesquisadores
fig3.add_trace(
    go.Histogram(
        x=df_researchers['Value'],
        nbinsx=30,
        name='Pesquisadores',
        marker_color='lightcoral',
        opacity=0.7
    ),
    row=1, col=2
)

# Box plot 1: Investimento por ano
for year in sorted(df_gdp['Year'].unique()):
    year_data = df_gdp[df_gdp['Year'] == year]
    fig3.add_trace(
        go.Box(
            y=year_data['Value'],
            name=str(year),
            boxpoints='outliers',
            showlegend=False
        ),
        row=2, col=1
    )

# Box plot 2: Pesquisadores por ano
for year in sorted(df_researchers['Year'].unique()):
    year_data = df_researchers[df_researchers['Year'] == year]
    fig3.add_trace(
        go.Box(
            y=year_data['Value'],
            name=str(year),
            boxpoints='outliers',
            showlegend=False
        ),
        row=2, col=2
    )

fig3.update_layout(
    title={
        'text': 'An√°lise de Distribui√ß√µes dos Dados de P&D',
        'x': 0.5,
        'font': {'size': 18}
    },
    width=1400,
    height=1200,
    template='plotly_white',
    showlegend=True
)

fig3.update_xaxes(title_text="Investimento P&D (% PIB)", row=1, col=1)
fig3.update_xaxes(title_text="Pesquisadores por milh√£o hab.", row=1, col=2)
fig3.update_xaxes(title_text="Ano", row=2, col=1)
fig3.update_xaxes(title_text="Ano", row=2, col=2)

fig3.update_yaxes(title_text="Frequ√™ncia", row=1, col=1)
fig3.update_yaxes(title_text="Frequ√™ncia", row=1, col=2)
fig3.update_yaxes(title_text="Investimento P&D (% PIB)", row=2, col=1)
fig3.update_yaxes(title_text="Pesquisadores por milh√£o hab.", row=2, col=2)

fig3.show()

# Salvar como HTML
fig3.write_html('./grafico3_distribuicoes.html')

#### Distribui√ß√£o Regional dos Investimentos em P&D

In [77]:
# Visualiza√ß√£o 4: Mapa Geoespacial

regional_keywords = ['Africa', 'Asia', 'Europe', 'America', 'Oceania']
df_regional = df[df['Region_Country'].str.contains('|'.join(regional_keywords), na=False, case=False)]
df_regional = df_regional[~df_regional['Region_Country'].str.contains('Total, all countries', na=False)]

latest_year = df_regional['Year'].max()
df_regional_latest = df_regional[df_regional['Year'] == latest_year]

regional_gdp = df_regional_latest[df_regional_latest['Series_Type'] == 'GDP_Percentage']
regional_researchers = df_regional_latest[df_regional_latest['Series_Type'] == 'Researchers_per_Million']

fig4 = make_subplots(
    rows=1, cols=2,
    subplot_titles=[f'Investimento em P&D por Regi√£o ({latest_year})', 
                   f'Densidade de Pesquisadores por Regi√£o ({latest_year})'],
    specs=[[{"type": "xy"}, {"type": "xy"}]]
)

# Gr√°fico 1: Investimento em P&D
fig4.add_trace(
    go.Bar(
        y=regional_gdp['Region_Country'],
        x=regional_gdp['Value'],
        orientation='h',
        name='% do PIB',
        marker_color='lightblue',
        text=regional_gdp['Value'].round(2),
        textposition='auto'
    ),
    row=1, col=1
)

# Gr√°fico 2: Densidade de pesquisadores
fig4.add_trace(
    go.Bar(
        y=regional_researchers['Region_Country'],
        x=regional_researchers['Value'],
        orientation='h',
        name='Pesq./milh√£o hab.',
        marker_color='lightcoral',
        text=regional_researchers['Value'].round(0),
        textposition='auto'
    ),
    row=1, col=2
)

fig4.update_layout(
    title={
        'text': 'Distribui√ß√£o Regional dos Investimentos em P&D e Densidade de Pesquisadores',
        'x': 0.5,
        'font': {'size': 16}
    },
    width=1400,
    height=700,
    template='plotly_white',
    showlegend=False
)

fig4.update_xaxes(title_text="Investimento P&D (% PIB)", row=1, col=1)
fig4.update_xaxes(title_text="Pesquisadores por milh√£o hab.", row=1, col=2)
fig4.update_yaxes(title_text="Regi√£o", row=1, col=1)
fig4.update_yaxes(title_text="Regi√£o", row=1, col=2)

fig4.show()

# Salvar como HTML
fig4.write_html('./grafico4_regional.html')

### Discuss√£o

A an√°lise dos dados da ONU sobre recursos humanos em P&D revela tend√™ncias significativas no panorama global da capacidade cient√≠fica e tecnol√≥gica entre 2005 e 2021.

**Crescimento Consistente dos Investimentos Globais:** A s√©rie temporal demonstra uma trajet√≥ria ascendente consistente tanto nos investimentos em P&D como porcentagem do PIB (de 1,5% em 2005 para 1,9% em 2021) quanto na densidade de pesquisadores (de 902,4 para 1.352,5 pesquisadores por milh√£o de habitantes). Este crescimento de aproximadamente 50% na densidade de pesquisadores em 16 anos indica um compromisso global crescente com o fortalecimento da capacidade cient√≠fica.

**Correla√ß√£o Positiva Significativa:** A an√°lise de correla√ß√£o revela uma rela√ß√£o positiva forte (R¬≤ = 0,65) entre investimento em P&D como porcentagem do PIB e densidade de pesquisadores. Esta correla√ß√£o sugere que pa√≠ses que investem mais recursos financeiros em P&D tendem a ter maior concentra√ß√£o de pesquisadores, validando empiricamente a teoria de que o investimento financeiro e o capital humano em ci√™ncia s√£o complementares e mutuamente refor√ßadores.

**Disparidades Regionais Pronunciadas:** A an√°lise regional revela disparidades significativas na capacidade de P&D. Regi√µes desenvolvidas como Europa Ocidental e Am√©rica do Norte apresentam consistentemente maiores investimentos e densidade de pesquisadores, enquanto regi√µes como √Åfrica Subsaariana e partes da √Åsia apresentam indicadores substancialmente menores, refletindo desigualdades estruturais no desenvolvimento cient√≠fico global.

**Heterogeneidade nas Distribui√ß√µes:** Os histogramas e box plots revelam distribui√ß√µes altamente assim√©tricas, com a maioria dos pa√≠ses concentrada em n√≠veis relativamente baixos de investimento e densidade de pesquisadores, enquanto um pequeno n√∫mero de pa√≠ses apresenta valores excepcionalmente altos. Esta distribui√ß√£o sugere a exist√™ncia de "clubes de converg√™ncia" em P&D, onde pa√≠ses com capacidades similares tendem a manter trajet√≥rias paralelas.

Embora os dados da ONU forne√ßam uma vis√£o abrangente do panorama global de P&D, v√°rias limita√ß√µes metodol√≥gicas e conceituais devem ser consideradas na interpreta√ß√£o dos resultados.

**Limita√ß√µes de Cobertura Temporal e Geogr√°fica:** Os dados apresentam lacunas significativas na cobertura temporal, com informa√ß√µes dispon√≠veis apenas para anos espec√≠ficos (2005, 2010, 2015, 2021), impedindo uma an√°lise mais granular das tend√™ncias anuais. Adicionalmente, nem todos os pa√≠ses possuem dados para todos os anos, criando um painel desbalanceado que pode introduzir vieses nas an√°lises comparativas.

**Agrega√ß√£o Regional:** A agrega√ß√£o de dados em n√≠veis regionais, embora √∫til para an√°lises comparativas, pode mascarar heterogeneidades significativas dentro das regi√µes, especialmente em regi√µes geograficamente extensas e economicamente diversas como a √Åsia ou a √Åfrica.

**Limita√ß√µes dos Indicadores Quantitativos:** Os indicadores utilizados (porcentagem do PIB e pesquisadores por milh√£o de habitantes) capturam apenas aspectos quantitativos da capacidade de P&D, n√£o refletindo necessariamente a qualidade, produtividade ou impacto da pesquisa realizada.

**Aus√™ncia de Indicadores de Resultado:** Os dados focam em insumos (investimento e pessoal) sem incluir indicadores de resultado como publica√ß√µes cient√≠ficas, patentes, inova√ß√µes tecnol√≥gicas ou impacto econ√¥mico da P&D. 

### Conclus√µes

A correla√ß√£o positiva entre investimento financeiro e densidade de pesquisadores sugere que pol√≠ticas integradas, que combinem aumento de recursos com forma√ß√£o de capital humano, podem ser mais eficazes do que abordagens unidimensionais.

A persist√™ncia de disparidades regionais indica a necessidade de mecanismos de coopera√ß√£o internacional e transfer√™ncia de conhecimento para reduzir as lacunas de capacidade cient√≠fica entre regi√µes desenvolvidas e em desenvolvimento. Neste contexto, a perspectiva das Na√ß√µes Unidas, atrav√©s dos Objetivos de Desenvolvimento Sustent√°vel (ODS), especialmente o ODS 9 (Ind√∫stria, Inova√ß√£o e Infraestrutura), fornece um quadro de refer√™ncia para pol√≠ticas que conectem o desenvolvimento cient√≠fico ao desenvolvimento sustent√°vel mais amplo.

### Refer√™ncias

- United Nations Educational, Scientific and Cultural Organization (UNESCO). (2024). Statistical Yearbook 2024 - Research and Development Expenditure and Staff. Montreal: UNESCO Institute for Statistics.
- OECD. (2024). Main Science and Technology Indicators Database. Dispon√≠vel em: https://data.oecd.org/
- United Nations. (2024). Relat√≥rio Anual das Na√ß√µes Unidas 2024. New York: UN Publications.