# [Estadística descriptiva con python](https://medium.com/@noyomedicen/estad%C3%ADstica-descriptiva-con-python-23e26ca035d5)  

De la teoría a la práctica: cómo aplicar estadística descriptiva en tus análisis de datos

<img src = 'https://miro.medium.com/v2/resize:fit:1100/format:webp/1*f7d3naH5WmFwgBmhw0HxLA.png'>

La estadística descriptiva es la base sobre la que se construye cualquier análisis de datos. 

Se trata de un conjunto de técnicas que nos permiten resumir y entender la información contenida en nuestros datos, transformándola en insights valiosos. 

En un mundo donde los datos numéricos abundan, saber cómo analizarlos es una habilidad esencial para cualquier profesional.

Python, con su ecosistema robusto y herramientas especializadas, se ha convertido en una de las mejores opciones para realizar estos análisis. Este lenguaje no solo es accesible y poderoso, sino que también cuenta con librerías que facilitan la aplicación de la estadística descriptiva de manera eficiente y efectiva.

## Conceptos Clave de la Estadística Descriptiva
Antes de adentrarnos en el código, es crucial entender los conceptos que forman el núcleo de la estadística descriptiva. Estos incluyen las medidas de tendencia central, las medidas de dispersión y la forma en que se distribuyen los datos.



### Medidas de Tendencia Central:   

Cómo Identificar el Corazón de tus Datos.  

Las medidas de tendencia central, como la media, la mediana y la moda, nos indican dónde se concentra la mayor parte de nuestros datos. Son herramientas que nos ayudan a resumir el conjunto de datos con un solo valor representativo.

* La media es el promedio de todos los valores.
* La mediana es el valor medio que divide los datos en dos partes iguales.
* La moda es el valor que aparece con mayor frecuencia.

## Medidas de Dispersión:  
### Evaluando la Variabilidad en tus Datos  

Mientras que las medidas de tendencia central nos muestran el punto central de nuestros datos, las medidas de dispersión nos indican cuán dispersos o concentrados están alrededor de ese punto.

* El rango muestra la diferencia entre el valor más alto y el más bajo.  
* La varianza y la desviación estándar nos ofrecen una idea de cuánto varían los datos con respecto a la media.

# Distribución de los Datos: Entendiendo la Forma y Dispersión de tus Datos  

La forma en que los datos están distribuidos es otro aspecto crucial de la estadística descriptiva. Aquí entran en juego conceptos como la simetría y la curtosis, que nos permiten entender si nuestros datos están sesgados hacia un lado o si tienen una concentración anormal de valores extremos.  


Una distribución simétrica indica que los datos están balanceados alrededor de la media.
Una distribución sesgada sugiere una tendencia hacia un extremo.
La curtosis, por otro lado, nos indica si los datos tienen más o menos valores extremos de lo que sería esperado en una distribución normal.

<img src = 'https://miro.medium.com/v2/resize:fit:1100/format:webp/1*mpkyxIjLp0yIies0iXr7mA.jpeg'>

# Cómo Realizar un Análisis Descriptivo con Python  

Ahora que tienes todo listo, es hora de aplicar la estadística descriptiva a tus datos. Utilizando Google Colab, no es necesario instalar librerías adicionales, ya que este entorno ya incluye las herramientas necesarias.



## Cálculo de Medidas de Tendencia Central con Python
Podemos calcular rápidamente la media, mediana y moda utilizando pandas. Cada una de estas medidas nos ofrece una perspectiva única sobre la distribución de nuestros datos:

In [None]:
import pandas as pd

# Importar datos
data = pd.read_csv('tus_datos.csv')

# Cálculo de medidas de tendencia central
media = data['columna_de_interés'].mean()
mediana = data['columna_de_interés'].median()
moda = data['columna_de_interés'].mode()[0]

print(f"Media: {media}, Mediana: {mediana}, Moda: {moda}")