Manuel Valderrama-Florez mmvvff

Manuel Valderrama Flórez

Data science portfolio

Languages: R, Python, SQL, sh/bash.

Khipu - Dairy Farm Data Extraction System: Khipu is a Python-based system that automates the extraction of data from handwritten dairy farm records. It uses Claude AI's image processing capabilities to convert handwritten tables into structured data, processes the extracted information, and generates standardized Excel reports for dairy farm management. Outcome: Improved data ingestion time by ~ 80% compared to manual processing.

Value-Added Decomposition of the OECD's Analytical AMNE: Implements the value-added trade measurement framework using data from the OECD's Analytical AMNE (Activities of Multinational Enterprises) database. The decomposition is performed using the decompr R package, and strategies are outlined to estimate value-added trade within sector-to-sector relationships.

Mistral API: Information Extraction with JSON Mode: I offer a straightforward comparison of the performance of models in the Mistral family, focusing specifically on extracting information using JSON mode and JSON schemas. I also demonstrate how to integrate the Codestral API into a Python workflow, focusing on the service's FIM (fill in the middle) and chat completion features.

Data Science: Job Simulation Project: Extended: Data Science workflow. It covers problem framing, hypothesis formulation, data pre-processing, model training and evaluation, and presenting findings to a non-technical audience.

Data Science: Machine Learning Classification Model: Designed and implemented a case feature similarity (ML) model that serves as the basis for guiding a movie recommendation system.

Data Engineering: Led the development of the automation of the extraction, transformation, loading within the Google Cloud environment by means of Python and Bash scripts.

Data Analytics: Cryptocurrencies: Employed descriptive statistics tools to analyze the relative volatility of a subset of cryptocurrencies.

Portafolio de Ciencia de Datos

Lenguajes: R, Python, SQL, sh/bash.

Khipu - Sistema de extracción de datos para granja lechera: Khipu es un sistema desarrollado en Python que automatiza la extracción de datos de registros manuscritos de explotación lechera. Utiliza las capacidades de procesamiento de imágenes de Claude AI para convertir tablas manuscritas en datos estructurados, procesa la información extraída y genera informes estandarizados en Excel para la gestión de informes de explotación lechera. Resultado: Mejora del tiempo de ingestión de datos en ~ 80% en comparación con el procesamiento manual.

Descomposición del valor agregado aplicado a aAMNE de la OECD: Implemento un método de medición del intercambio de valor agregado a la base de datos aAMNE (Actividades de las Empresas Multinacionales) de la OCDE. La descomposición se realiza utilizando el paquete decompr de R, y se esbozan estrategias para estimar el intercambio de valor agregado entre sectores.

Mistral API: Ofrecemos una comparación sencilla del rendimiento de los modelos de la familia Mistral, enfocándonos específicamente en la extracción de información utilizando el modo JSON y esquemas JSON. También demostramos cómo integrar la API de Codestral en un flujo de trabajo de Python, centrándonos en las características de FIM (relleno en el medio) y finalización de chat.

Data Science: Proyecto de Simulación de Trabajo: Ampliado: Flujo de trabajo en Ciencia de Datos. Cubre la formulación de problemas, formulación de hipótesis, preprocesamiento de datos, entrenamiento y evaluación de modelos, y la presentación de hallazgos a una audiencia no técnica.

Data Science: Modelo de Clasificación de Aprendizaje Automático: Diseñé e implementé un modelo de similitud de características (ML) que sirve como base para guiar un sistema de recomendación de películas.

Ingeniería de Datos: Lideré el desarrollo de la automatización de la extracción, transformación y carga dentro del entorno de Google Cloud mediante scripts de Python y Bash.

Análisis de Datos: Criptomonedas: Utilicé herramientas de estadística descriptiva para analizar la volatilidad relativa de un subconjunto de criptomonedas.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Manuel Valderrama-Florez mmvvff

Achievements

Achievements

Block or report mmvvff

Manuel Valderrama Flórez

Data science portfolio

Portafolio de Ciencia de Datos

Pinned Loading