# Proyecto del Día 6 - Análisis de Medallas Olímpicas

### Objetivo
Realizar un análisis exploratorio de datos (EDA) sobre un conjunto de datos de medallas olímpicas utilizando Pandas. Este proyecto te permitirá aplicar los conceptos aprendidos sobre **Series**, **DataFrames**, **limpieza de datos**, **operaciones básicas**, **filtrado** y **agregación** en Pandas.

### Consigna
Vas a trabajar con el conjunto de datos *medallas.csv*, que descargarás de la lección **Proyecto del Día 6**, y que incluye información sobre las medallas de oro, plata, bronce y el total obtenido por cada país en los Juegos Olímpicos.

Vas a realizar una serie de tareas básicas, que te permitirán responder a las preguntas del **cuestionario** que encontrarás al final del día. Las tareas que realizarás son:

1. **Cargar los Datos**: Importar los datos desde el archivo CSV a un DataFrame de Pandas.

2. **Exploración Inicial**: Utilizar métodos básicos para explorar el tamaño, las columnas y los tipos de datos del DataFrame.

3. **Limpieza de Datos**: Identificar y manejar valores faltantes o incorrectos, especialmente en las columnas de medallas donde los valores faltantes indican cero medallas.

4. **Análisis de Medallas de Oro por País**: Realiza las operaciones que sean necesarias para identificar cuáles fueron los 3 países con más medallas de Oro en total (vas a necesitar investigar los métodos de dataframes para encontrar cuál te permite ordenar los valores de mayor a menor o viceversa).

5. **Análisis de Medallas Totales por País**: Obtener un dataframe que contenga sólo los países que ganaron más de 10 medallas en total.


Una vez que hayas realizado estos pasos, realiza el **cuestionario del día**, que contiene preguntas que solo podrás responder tras haber explorado los datos siguiendo los pasos anteriores.

¡Mucha suerte!

In [1]:
# 1. **Cargar los Datos**: Importar los datos desde el archivo CSV a un DataFrame de Pandas.
import pandas as pd
df = pd.read_csv("C:\\AmaruAyelen\\proyectos\\PythonDataScienceMachineLearning\\PythonDataScienceMachineLearning\\Files\\medallas.csv")
df

Unnamed: 0,Oro,Plata,Bronce,Total,Pais
0,,1.0,2.0,3,Argentina
1,,2.0,2.0,4,Armenia
2,17.0,7.0,22.0,46,Australia
3,1.0,1.0,5.0,7,Austria
4,,3.0,4.0,7,Azerbaijan
...,...,...,...,...,...
88,,1.0,,1,Turkmenistan
89,2.0,1.0,1.0,4,Uganda
90,1.0,6.0,12.0,19,Ukraine
91,3.0,,2.0,5,Uzbekistan


In [9]:
# 2. **Exploración Inicial**: Utilizar métodos básicos para explorar el tamaño, las columnas y los tipos de datos del DataFrame.
import pandas as pd
print("Columnas y tipos de datos del dataframe")
print("==================================")
df.info()
print("==================================")
# tamaño del dataframe
print("Tamaño del dataframe:", df.shape)
# Indica cantidad de null
print(df.isnull())
print(df.isnull().sum()) 

Columnas y tipos de datos del dataframe
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 93 entries, 0 to 92
Data columns (total 5 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   Oro     65 non-null     float64
 1   Plata   69 non-null     float64
 2   Bronce  76 non-null     float64
 3   Total   93 non-null     int64  
 4   Pais    93 non-null     object 
dtypes: float64(3), int64(1), object(1)
memory usage: 3.8+ KB
Tamaño del dataframe: (93, 5)
      Oro  Plata  Bronce  Total   Pais
0    True  False   False  False  False
1    True  False   False  False  False
2   False  False   False  False  False
3   False  False   False  False  False
4    True  False   False  False  False
..    ...    ...     ...    ...    ...
88   True  False    True  False  False
89  False  False   False  False  False
90  False  False   False  False  False
91  False   True   False  False  False
92  False  False    True  False  False

[93 rows x 5 columns]
Oro       28
Pla

In [10]:
# 3. **Limpieza de Datos**: Identificar y manejar valores faltantes o incorrectos, 
# especialmente en las columnas de medallas donde los valores faltantes indican cero medallas.
# Cambiar valores nulos por 0
# df_faltantes = df.fillna(0)
valores_medallas = {"Oro":"0","Plata":"0","Bronce":"0"}
df_con_nuevos_valores = df.fillna(valores_medallas)
print(df_con_nuevos_valores)

     Oro Plata Bronce  Total          Pais
0      0   1.0    2.0      3     Argentina
1      0   2.0    2.0      4       Armenia
2   17.0   7.0   22.0     46     Australia
3    1.0   1.0    5.0      7       Austria
4      0   3.0    4.0      7    Azerbaijan
..   ...   ...    ...    ...           ...
88     0   1.0      0      1  Turkmenistan
89   2.0   1.0    1.0      4        Uganda
90   1.0   6.0   12.0     19       Ukraine
91   3.0     0    2.0      5    Uzbekistan
92   1.0   3.0      0      4     Venezuela

[93 rows x 5 columns]


In [17]:
# 4. **Análisis de Medallas de Oro por País**: Realiza las operaciones que sean necesarias para identificar 
# cuáles fueron los 3 países con más medallas de Oro en total (vas a necesitar investigar los métodos de dataframes 
# para encontrar cuál te permite ordenar los valores de mayor a menor o viceversa).
# ordenar dataframe df_con_nuevos_valores por columna Total de mayor a menor

df_con_nuevos_valores
print("Países con mayor cantidad de Medallas: ")
df_orden_Medallas = df_con_nuevos_valores.sort_values(by='Total', ascending=False).head(3)
df_orden_Medallas


Países con mayor cantidad de Medallas: 


Unnamed: 0,Oro,Plata,Bronce,Total,Pais
25,39.0,41.0,33.0,113,Estados Unidos de America
72,38.0,32.0,18.0,88,Republica Popular de China
73,2.0,28.0,23.0,71,ROC


In [27]:
# 5. **Análisis de Medallas Totales por País**: Obtener un dataframe que contenga sólo los países que ganaron más de 10 medallas en total.
seire_medallas = df.Total
seire_medallas
df_paises_con_mas_10  = df[df['Total'] > 10]
df_paises_con_mas_10

Unnamed: 0,Oro,Plata,Bronce,Total,Pais
2,17.0,7.0,22.0,46,Australia
11,7.0,6.0,8.0,21,Brazil
14,7.0,6.0,11.0,24,Canada
15,2.0,4.0,6.0,12,Chinese Taipei
19,7.0,3.0,5.0,15,Cuba
20,4.0,4.0,3.0,11,Czech Republic
21,3.0,4.0,4.0,11,Denmark
25,39.0,41.0,33.0,113,Estados Unidos de America
30,1.0,12.0,11.0,33,France
32,1.0,11.0,16.0,37,Germany
