Languages: R, Python, SQL, sh/bash.
Value-Added Decomposition of the OECD's Analytical AMNE: Implements the value-added trade measurement framework using data from the OECD's Analytical AMNE (Activities of Multinational Enterprises) database. The decomposition is performed using the decompr R package, and strategies are outlined to estimate value-added trade within sector-to-sector relationships.
Mistral API: Information Extraction with JSON Mode: I offer a straightforward comparison of the performance of models in the Mistral family, focusing specifically on extracting information using JSON mode and JSON schemas. I also demonstrate how to integrate the Codestral API into a Python workflow, focusing on the service's FIM (fill in the middle) and chat completion features.
Data Science: Job Simulation Project: Extended: Data Science workflow. It covers problem framing, hypothesis formulation, data pre-processing, model training and evaluation, and presenting findings to a non-technical audience.
Data Science: Machine Learning Classification Model: Designed and implemented a case feature similarity (ML) model that serves as the basis for guiding a movie recommendation system.
Data Engineering: Led the development of the automation of the extraction, transformation, loading within the Google Cloud environment by means of Python and Bash scripts.
Data Analytics: Cryptocurrencies: Employed descriptive statistics tools to analyze the relative volatility of a subset of cryptocurrencies.
Lenguajes: R, Python, SQL, sh/bash.
Descomposición del valor agregado aplicado a aAMNE de la OECD: Implemento un método de medición del intercambio de valor agregado a la base de datos aAMNE (Actividades de las Empresas Multinacionales) de la OCDE. La descomposición se realiza utilizando el paquete decompr de R, y se esbozan estrategias para estimar el intercambio de valor agregado entre sectores.
Mistral API: Ofrecemos una comparación sencilla del rendimiento de los modelos de la familia Mistral, enfocándonos específicamente en la extracción de información utilizando el modo JSON y esquemas JSON. También demostramos cómo integrar la API de Codestral en un flujo de trabajo de Python, centrándonos en las características de FIM (relleno en el medio) y finalización de chat.
Data Science: Proyecto de Simulación de Trabajo: Ampliado: Flujo de trabajo en Ciencia de Datos. Cubre la formulación de problemas, formulación de hipótesis, preprocesamiento de datos, entrenamiento y evaluación de modelos, y la presentación de hallazgos a una audiencia no técnica.
Data Science: Modelo de Clasificación de Aprendizaje Automático: Diseñé e implementé un modelo de similitud de características (ML) que sirve como base para guiar un sistema de recomendación de películas.
Ingeniería de Datos: Lideré el desarrollo de la automatización de la extracción, transformación y carga dentro del entorno de Google Cloud mediante scripts de Python y Bash.
Análisis de Datos: Criptomonedas: Utilicé herramientas de estadística descriptiva para analizar la volatilidad relativa de un subconjunto de criptomonedas.