# **Proyecto Diplomado**

*Mateo Arias  
Estudiante de Economía, FCE  
Diplomado en Inteligencia Artificial y Aprendizaje Profundo*  

# **Justificación**

El propósito de este trabajo es encontrar variables que expliquen la innovación entre países.
  
Con este objetivo, se consultó la literatura económica existente, particularmente los escritos de *Schumpeter (1942)* sobre el tema definen la innovación como "algún elemento tórico, organizacional o productivo que permite la obtención de un monopolio temporal y permite desarrollar una ventaja comercial o económica".  
  
Utilizando la anterior definición, estudios de *Corredor, Forero y Somaya (2016)*, muestran que para el sector privado colombiano de 1996 a 2006 no hay una relación directa entre el gasto en investigación y desarrollo (R+D, de ahora en adelante), pero sí la hay con las patentes, el nivel de la calidad académica local y la capacidad de las firmas de asimilar la información académica. *Kapudani & Luci (2019)*, evaluan este fenómeno para el sector financiero de 15 países latinoamericanos entre 1996 y 2016, muestran que buenos derechos de propiedad, mayor gasto educativo y mayor número de patentes solicitadas están correlacionados con un mejor desempeño innovativo, sin embargo, está poco relacionado con el gasto en R+D debido a dificultades estructurales de financiamiento. Así mismo, *Lerner et al (2021)* y *Sidhu (2016)* obtienen resultados similares sobre el gasto neto en R+D y el otorgamiento de patentes, pero encuentran que lo anterior depende del PIB. 
  
Utilizando el Manual de Oslo de la *OECD (2020)* y acercamientos de los papers mencionados, se identificaron las variables principales que probablemente afecten las capacidades innovativas de las firmas y países: el gasto en R+D, el PIB, la cantidad de patentes solicitadas y otorgadas, la cantidad de papers en SCOPUS yla capacidad de absorción de conocimiento.

# **Recolección de datos**
  
 Una vez identificadas las variables anteriormente mencionadas, se propone una metodología simple pero que trata de capturar lo anterior en 4 variables compuestas:
   
 1. Calidad del gasto en R+D: Esta variable pretende caputurar la efectividad del gasto en R+D ajustado por PIB en relación a la cantidad de patentes que se solicitan. $RDSOL= \frac{R+D_{i}/PIB_{i}}{Patentes Solicitadas_{i}}$ 
 2. Calidad de las patentes: Se estima como proporción de aprobación entre patentes otorgadas y solicitadas. $APROBPAT= \frac{Patentes Otorgadas_{i}}{Patentes Solicitadas_{i}}$ 
 3. Absorción del conocimiento: Debido a lo ambiguo del concepto, la *OECD* recomienda que se vea como la cantidad de papers publicados en SCOPUS en relación al gasto en R+D ajustado por PIB. $SCOPUSRD= \frac{SCOPUS_{i}}{R+D_{i}/PIB{i}}$
 4. Altura de la innovación: Otro de los indicadores propuestos por la *OECD*, con este se busca mostrar el grado de complejidad de las patentes, usando la cantidad de papers publicados en un año por su sumatoria en todo el periodo observado, en relación a la cantidad de patentes otorgadas en un año por su sumatoria. $ALTINNO= \frac{SCOPUS_{i} \sum SCOPUS_{i}}{Patentes Otorgadas_{i} \sum Patentes Otorgadas_{i}}$
   
Sabiendo los datos necesitados para la elaboración de las variables compuestas, se procede a consultar las bases de datos de la *OECD, el FMI y la RICyT* para recolectar la información. Debido a la disponibilidad de datos incompleta, se pudo realizar el estudio entre los años 2010 y 2019 sobre 18 individuos: Argentina, Brasil, Canada, Chile, Colombia, Cuba, El Salvador, España, Estados Unidos, Guatemala, México, Panamá, Paraguay, Perú, Portugal, Uruguay, Iberoamérica y Latinoamérica y el Caribe.
  
Se eligen Estados Unidos, Iberoamérica, Latinoamérica y el Caribe, como individuos de control debido a sus altos valores en todos los indicadores, de esta manera funcionar como máximos relativos.

# **Metodología**
Con la orientación del profesor Campo Elías Pardo se eligió un modelo de Análisis Factorial Múltiple (MFA). 
  
Para el mejor entendimiento teoríco de este método, se consultó el "libro rojo" de *Escofier & Pagès (1994)*, así como el material del curso y el libro de estadística multivariada del profesor *Pardo (2020)*. 
  
Complementariamente para entender mejor el código en R, se vieron bastantes tutoriales en youtube de *François Husson (2015-2021)*, creador del paquete Factoshiny, el cual permite un uso mucho más accesible de las librerías Factoclass, FactomineR y Factoextra.
  
El MFA es una técnica de reducción de dimensionalidad que facilita el análisis para varios grupos con múltiples fuentes de información, comparando individos fila por variables columna, separadas por grupos, en este caso años. Esto permite estudiar las similaridades entre individuos con respecto a todos los datos y las relaciones entre variables. Simplificando el análisis de trayectorias separadas y conjuntas de individuos, grupos y variables.
  
Se recopilan los datos crudos y se crean las variables compuestas. Debido a la diferencia de unidades de medida, se estandarizan los datos por grupo, posteriormente, para garantizar que no haya un sesgo de ponderación de las variables, se hace una descomposición en valores singulares por grupo. Se agrupan los años y se ubican horizontalmente a los individuos. 
  
Se adjunta un ejemplo, clarificando que se extiende hasta 2019.
  
![ejemplotabla.png](attachment:ejemplotabla.png)

Posteriormente se corre en R el código correspondiente para el MFA.
![R.png](attachment:R.png)

# **Resultados**
  
![GraphVar.jpg](attachment:GraphVar.jpg)
  
Mediante la lecutra del círculo de correlaciones, se encontró que las dos dimensiones que mejor explicaban los datos de los 10 grupos eran la calidad del gasto en R+D (*RDSOL*) y la absorción del conocimiento (SCOPUSRD), capturando el 41.01% y el 21.66% de los datos, respectivamente. Esto es congruente con la literatura consultada.

  
![GraphInd%20%281%29.jpg](attachment:GraphInd%20%281%29.jpg)
  
Para simplificar la interpretación, se eligen los 7 individuos que más contribuyen a la inercia y se grafican sus puntos parciales para entender mejor su trayectoria. 
  
El mapa de individuos muestra lo esperado sobre los individuos de control, al agrupar a Estados Unidos, Iberoamérica, Latinoamérica y el Caribe, los datos parecen indicar que estos países encuentran su éxito innovador por debido a una mayor absorción de conocimiento (Dim 2), pero muestran una mala calidad del gasto (Dim1). 
  
Panamá muestra un pésimo desempeño en ambas dimensiones. 
  
Uruguay presenta una mejor calidad del gasto y una incipiente absorción de conocimiento, esto posiblemente debido a su reducido tamaño y poca complejidad económica.
  
Cuba es un caso curioso, pues presenta una buena calidad del gasto, pero una mala absorción de conocimiento. Revisando los datos brutos sobre esta variable, se puede evidenciar que esto se debe al bajo número de patentes otorgadas anualmente, el denominador de SCOPUSRD. Esta combinación se podría deber a que la mayoría de avances innovativos de La Isla están concentrados en el sector salud, donde se niegan a patentar sus avances, como lo hicieron con los métodos de prevención del contagio postparto de ETS, y la vacuna SOBERANA 02.
  
Por último, Portugal se desempeña excelentemente en ambas dimensiones, de nuevo, revisando los datos, este país presenta las observaciones máximas en absorción de conocimiento y calidad del gasto. Se verificaron las fuentes para descartar error del investigador. Una posible explicación podría ser un mal  reporte de datos por parte de los estadísticos de Portugal, aunque revisando literatura al respecto, parece ser que este país es el número 19 a nivel mundial en innovación, caracterizándose por altas tasas de inversión en educación y tecnologías verdes, como muestra *Forbes (2020)* y la comisión ecológica de la *Unión Europea (2019)*, esto sería congruente con los resultados anteriores y la literatura consultada, pero de todas formas no deja de causar escepticismo.

También se adjunta una medición de la UE que descompone el índice de Eco-Innovación para Portugal.
![portugal.png](attachment:portugal.png)

![GraphGroup.jpg](attachment:GraphGroup.jpg)
   
   
El mapa de representación de grupos muestra que la trayectoria en ambas dimensiones no ha cambiado mucho en los últimos 10 años y tiende a rondar una zona similar. No obstante ha mostrado un crecimiento leve desde 2016.

![GraphPartial.jpg](attachment:GraphPartial.jpg)

Finalmente la descomposición de los grupos por sus ejes parciales, muestra una tendencia sostenida para la mayoría de años a estar explicados casi que totalmente por la calidad del gasto, sin embargo cabe destacar que en 2016 y 2017 tienen mayor explicación positiva en la absorción de conocimiento, y negativa en 2019 y 2013.

# Conclusiones
  
  
En general, los resultados son satisfactorios, pues validan la evidencia de otros investigadores. Se podrían especificar de mejor manera las variables compuestas, así como incluir variables suplementarias como directamente el gasto en educación superior, variación anual del PIB, ingreso per capita y demás, para poder tener resultados más robustos. 

# **Bibliografía**
  
1. Schumpeter, Joseph A. (1994) [1942]. Capitalism, Socialism and Democracy. London: Routledge. pp. 82–83. ISBN 978-0-415-10762-4.
2. Sidhu, I., et al (2016) Berkeley Innovation Index: An approach for measuring and diagnosing individual’s and organizations’ innovation capabilities.
3. Kapidani, M., & Luci, E. (2019). The Effects on Innovation from Financial Sector Development: Evidence from Developing Countries.
4. Lerner, et al. (2021) FINANCIAL INNOVATION IN THE 21ST CENTURY: EVIDENCE FROM U.S. PATENT. 
5. Corredor, Forero & Somaya (2016). HOW EXTERNAL AND INTERNAL SOURCES OF KNOWLEDGE IMPACT NOVEL AND IMITATIVE INNOVATION IN EMERGING MARKETS: EVIDENCE FROM COLOMBIA. 
6. Escofier, B & Pagès, J (1994). Análisis factoriales simples y múltiples: objetivos, métodos e interpretación.
7. Pardo, C (2020). Estadística descriptiva multivariada.
8. OECD (2020). Manual de Oslo: Guía para la recogida e interpretación de datos sobre innovación.
9. OECD (1 de noviembre, 2020). Estadísticas. https://stats.oecd.org/
10. IMF (1 de noviembre, 2020). Estadísticas. https://data.imf.org/?sk=388DFA60-1D26-4ADE-B505-A05A558D9A42&sId=1479329132316
11. RICyT (1 de noviembre, 2020). Indicadores. http://www.ricyt.org/category/indicadores/
12. UE (2019). ECO-INNOVATION in Europe. https://ec.europa.eu/environment/ecoap/portugal_en
13. Forbes (2020).How A New Innovation Program Aims To Help Portugal Get Back On Its Feet After The Coronavirus Crisis. https://www.forbes.com/sites/annabel/2020/06/22/how-a-new-innovation-program-aims-to-help-portugal-get-back-on-its-feet-after-the-coronavirus-crisis/?sh=663b1d0424fb
14. Husson, F. [https://www. youtube. com/channel/UCyz4M1pwJBNfjMFaUCHCNUQ]. (2020, April 1). Canal de R aplicado y estadística descriptiva multivariada [Video]. MFA - Multiple Factor Analyis with R (FactoMineR & Factoshiny). https://www.youtube.com/channel/UCyz4M1pwJBNfjMFaUCHCNUQ