# Análisis de la producción científica de Cuba desde 1996 a 2018. 

El siguiente análisis muestra la evolución de la producción científico y técnica de Cuba en las últimas dos décadas (1996-2018). Para realizar este análisis se escogieron diferentes métricas como: 

Artículos científicos (fuente - https://www.scimagojr.com/): 

- Número de Artículos científicos citables
- Cantidad de citaciones (una citación es el uso del artículo por una investigador externo al trabajo)
- Cantidad de citaciones por artículo 

Patentes: 


In [4]:
import plotly_express as px
import pandas as pd
import seaborn as sns
from matplotlib import pyplot as plt
from ipywidgets import interact, interactive, fixed, interact_manual
import ipywidgets as widgets
import numpy as np
import matplotlib.pyplot as plt

import plotly.graph_objects as go
from plotly.offline import iplot

## Evolución de artículos científicos cubanos (1996-2018)

El siguiente gráfico muestra la relación entre cantidad de artículos científicos (eje x) y la cantidad de citaciones (eje y) en el período comprendido entre 1996-2018 para diferentes países. El tamaño de las esferas corresponde al número de citaciones por artículo. 

En este primer análisis se incluyeron solo los países que tenían en 1996 cerca de 100 artículos y menos de 60 mil citaciones (en la siguiente se analizan los países con más de mil artículos en 1996). 

In [5]:
data_publications_low = pd.read_csv('../publications-low.csv')
px.scatter(data_publications_low, x="Citable documents", y="Citations", animation_frame="Year", animation_group="Country",
           size="Citations per document", color="Country", hover_name="Country", facet_col="continent", 
           log_x = True, 
           size_max=45, range_x=[50,20000], range_y=[1,60000])

En el gráfico se puede observar producción de artículos cietíficos para diferentes regiones. Podemos sacar algunas conclusiones más detalladas con respecto a **Cuba** y comparar con algunos países de la región.

Por ejemplo, en el siguiente gráfico de barras se puede ver la producción científica para los países sudamericanos. 

In [6]:
america = data_publications_low.loc[data_publications_low['continent'] == 'South America']

fig = go.Figure()
for region, geo_region in america.groupby('Country'):
    fig.add_trace(go.Bar(x=geo_region.Year, y=geo_region['Citable documents'], name=region))

fig.update_layout(title="Número de artículos por año para países Latinoamericanos")
iplot(fig)

In [7]:
plt.figure(figsize=(20,10))

import plotly.graph_objects as go

fig = go.Figure()
for region, geo_region in america.groupby('Country'):
    fig.add_trace(go.Bar(x=geo_region.Year, y=geo_region['Citations per document'], name=region))

fig.update_layout(title="Número de citaciones por artículo científico para países Latinoamericanos")
iplot(fig)

<Figure size 1440x720 with 0 Axes>

Algunas conclusiones:

- Los países que más crecen en la región económicamente (Colombia, Chile, Perú) también crecen en producción científica.

- En 1996 Cuba producía 798 artículos científicos, en 2013 (2468) y 2018 (1806) lo que demuestra una tendencia a retroceso en la producción científica. Venezuela muestra similares resultados. 

- El número de citaciones por artículo científico para Cuba es uno de los más bajos entre todos los países de la región. 



### Análisis de los países con mayor producción científica en el Mundo

Los gráficos anteriors muestras países en vías de desarrolo con producción científica entre 100 - 10 mil artículos (período 1996 - 2018). Ahora bien, existen un grupo de países (mayormente países desarrollados y con alto nivel técnologico) que producen artículos científicos en tres ordenes de mágnitud mayor que los países sub-desarrollados. 

**Importante**: Tres países de la región Argentina, Brazil y Mexico se encuentran en este grupo.


In [8]:
data_publications_high = pd.read_csv('../publications-high.csv')
px.scatter(data_publications_high, x="Citable documents", y="Citations", animation_frame="Year", animation_group="Country",
           size="Citations per document", color="Country", hover_name="Country", facet_col="continent",  
           log_x = True, 
           size_max=45, range_x=[2000,1000000], range_y=[20000,4000000])

# Evolución de patentes en el Mundo

El siguiente análisis estudia la evolución en el Mundo, de las patentes internacionales aplicadas por residentes. La fuente de información https://data.worldbank.org/. En algunos años no existe información. 

In [9]:
data_patents = pd.read_csv('../number-patents.csv')
data_patents['Year'] =  pd.to_datetime(data_patents['Year'], format='%Y')
data_patents = data_patents.set_index(data_patents.Year)


values = data_patents[data_patents['Continent'].str.contains('Asia')]
values_high = values[values['Country'].str.contains('China|Japan|Korea|India|Australia')]
values_low = values[~values['Country'].str.contains('China|Japan|Korea|India|Australia')]

fig = go.Figure()
for region, geo_region in values_high.groupby('Country'):
    fig.add_scatter(x=geo_region.Year, y=geo_region.Patents, name=region, mode='lines', connectgaps=True)

fig.update_layout(title="Número de Patentes internacionles para países Asiáticos altamente ( 1k < # patentes)")
iplot(fig)

In [10]:
fig = go.Figure()
for region, geo_region in values_low.groupby('Country'):
    fig.add_scatter(x=geo_region.Year, y=geo_region.Patents, name=region, mode='lines', connectgaps=True)

fig.update_layout(title="Número de Patentes internacionles para países Asiáticos ( 1 < # patentes < 1k)")
iplot(fig)

In [11]:
values = data_patents[data_patents['Continent'].str.contains('South America')]
values_high = values[values['Country'].str.contains('Brazil|Mexico|Argentina|Venezuela|Chile|Colombia|Panama')]

fig = go.Figure()
for region, geo_region in values_high.groupby('Country'):
    fig.add_scatter(x=geo_region.Year, y=geo_region.Patents, name=region, mode='lines', connectgaps=True)

fig.update_layout(title="Número de Patentes internacionles para países Latinoamericanos (100 < #patentes)")

iplot(fig)

In [12]:
values_low = values[~values['Country'].str.contains('Brazil|Mexico|Argentina|Venezuela|Chile|Colombia|Panama')]
fig = go.Figure()
for region, geo_region in values_low.groupby('Country'):
    fig.add_scatter(x=geo_region.Year, y=geo_region.Patents, name=region, mode='lines', connectgaps=True)

fig.update_layout(title="Número de Patentes internacionles para países Latinoamericanos ( 1 < # patentes < 200)")

iplot(fig)

In [13]:
values = data_patents[data_patents['Continent'].str.contains('Europe')]
values_high = values[values['Country'].str.contains('United Kingdom|France|Italy|Germany|Russia|Ukraine|Poland|Turkey')]

fig = go.Figure()
for region, geo_region in values_high.groupby('Country'):
    fig.add_scatter(x=geo_region.Year, y=geo_region.Patents, name=region, mode='lines', connectgaps=True)

fig.update_layout(title="Número de Patentes internacionles para países Europeos (1000 < #patentes)",title_x=0.5)

iplot(fig)

In [14]:
values = data_patents[data_patents['Continent'].str.contains('Europe')]
values_low = values[~values['Country'].str.contains('United Kingdom|France|Italy|Germany|Russia|Ukraine|Poland|Turkey')]

fig = go.Figure()
for region, geo_region in values_low.groupby('Country'):
    fig.add_scatter(x=geo_region.Year, y=geo_region.Patents, name=region, mode='lines', connectgaps=True)

fig.update_layout(title="Número de Patentes internacionles para países Europeos (100 < #patentes < 3000)",title_x=0.5)

iplot(fig)