# Primera entrega ML

# Predicción de la Valoración de Startups Unicornio Utilizando Machine Learning


### Este proyecto busca desarrollar un modelo de machine learning para predecir la valoración de las startups unicornio, esas empresas privadas valoradas en más de mil millones de dólares. El modelo se basará en diversos factores como la ubicación de la empresa, la industria, los inversores, y otros datos relevantes.


En los últimos años, el término "startup unicornio" se ha vuelto cada vez más común en el mundo de los negocios. Estas empresas, que han alcanzado una valoración de mil millones de dólares mientras aún son privadas, están redefiniendo industrias y cambiando la forma en que operan los mercados.

Sin embargo, predecir qué startups alcanzarán este estatus es un desafío complejo. Existen muchos factores que pueden influir en el éxito de una startup, desde la industria en la que operan hasta su ubicación geográfica y los inversores que las respaldan. A través del aprendizaje automático, esperamos identificar patrones y relaciones en estos factores que puedan indicarnos qué startups tienen más probabilidades de convertirse en unicornios.

Para este proyecto, hemos recopilado un conjunto de datos que incluye información sobre diversas startups unicornio, incluyendo su valoración, la fecha en que alcanzaron el estatus de unicornio, su país y ciudad de origen, la industria en la que operan, y los inversores que las respaldan. Utilizaremos este conjunto de datos para entrenar un modelo de machine learning que pueda predecir la valoración de una startup basándose en estas características.

Al finalizar este proyecto, esperamos haber desarrollado un modelo de machine learning sólido y efectivo que pueda usarse para predecir la valoración de las startups unicornio. Este modelo no solo podría ser una herramienta útil para los inversores y emprendedores, sino que también podría proporcionar una visión fascinante de las características que definen a estas empresas de rápido crecimiento.


### Datasets y fuentes alternativas de datos
Incluye aquí una breve descripción del dataset o datasets para tu proyecto. Incluye también las fuentes de cada uno de ellos.

In [2]:
tipo_ml = "Regresión" 

target_descr = "La variable objetivo en este proyecto es la 'valoración' de la startup. Esta es una variable continua que representa la valoración en miles de millones de dólares de una startup en el momento en que se convierte en un unicornio."

metricas = ['MAE', 'MSE', 'RMSE', 'R2'] 


Dataset utilizado: [Conjunto de datos de Startups Unicornio a nivel mundial en Kaggle](https://www.kaggle.com/datasets/uzairrehman/world-wide-unicorn-startups)


In [4]:
import numpy as np
import pandas as pd
from scipy import stats
import seaborn as sns
import matplotlib.pyplot as plt
import os 

In [5]:
unicornios = pd.read_csv('C:/Users/horta/Desktop/EDA/World_Wide_Unicorn_Startups.csv')

In [6]:
unicornios.head(10)

Unnamed: 0,Company,Valuation,Date,Country,City,Industry,Investors,year,month,day
0,Bytedance,140.0,4/7/2017,China,Beijing,Artificial intelligence,"0 Sequoia Capital China, SIG Asia Investm...",2017,7,4
1,SpaceX,100.3,12/1/2012,United States,Hawthorne,Other,"0 Sequoia Capital China, SIG Asia Investm...",2012,1,12
2,Stripe,95.0,1/23/2014,United States,San Francisco,Fintech,"0 Sequoia Capital China, SIG Asia Investm...",2014,23,1
3,Klarna,45.6,12/12/2011,Sweden,Stockholm,Fintech,"0 Sequoia Capital China, SIG Asia Investm...",2011,12,12
4,Canva,40.0,1/8/2018,Australia,Surry Hills,Internet software & services,"0 Sequoia Capital China, SIG Asia Investm...",2018,8,1
5,Instacart,39.0,12/30/2014,United States,San Francisco,"Supply chain, logistics, & delivery","0 Sequoia Capital China, SIG Asia Investm...",2014,30,12
6,Databricks,38.0,2/5/2019,United States,San Francisco,Data management & analytics,"0 Sequoia Capital China, SIG Asia Investm...",2019,5,2
7,Revolut,33.0,4/26/2018,United Kingdom,London,Fintech,"0 Sequoia Capital China, SIG Asia Investm...",2018,26,4
8,Nubank,30.0,3/1/2018,Brazil,Sao Paulo,Fintech,"0 Sequoia Capital China, SIG Asia Investm...",2018,1,3
9,Epic Games,28.7,10/26/2018,United States,Cary,Other,"0 Sequoia Capital China, SIG Asia Investm...",2018,26,10
