<p style="font-size:40px; font-weight:bold;"> Estadística descriptiva con Python </p>

# Jupyter notebooks

## Tutoriales

- <a href="https://www.programaenpython.com/miscelanea/tutorial-de-jupyter-notebook/" target="blank">Tutorial de Jupyter Notebook</a>

## Aplicaciones

- <a href="https://www.anaconda.com/products/individual" target="blank">Anaconda distribution</a>
- <a href="https://code.visualstudio.com/" target="blank">Microsoft Visual Studio Code</a>
- <a href="https://colab.research.google.com/" target="blank">Google Colab</a>

## Tutoriales de Python (en español)

- <a href="https://docs.python.org/es/3/tutorial/index.html" target="blank">Python.Org</a>
- <a href="https://www.learnpython.org/es/" target="blank">LearnPython.Org</a>

# Tipos de datos

## Datos numéricos

Los datos numéricos pueden corresponder a números enteros o números decimales. Los números enteros corresponden al tipo `int` mientras que los números decimales correspondel al tipo `float`.

### Asignación de números a variables

In [6]:
x = 1
print(x)

1


In [3]:
type(x)

int

In [4]:
y = 1.2
print(y)

1.2


In [8]:
type(y)

float

### Operaciones con números

In [12]:
# Suma
3 + 4

7

In [13]:
# Resta
3 - 4

-1

In [10]:
# Multiplicación
3 * 4

12

In [11]:
# División
3 / 4

0.75

In [14]:
# Potenciación
3 ** 4

81

## Datos de texto

Los datos de texto se almacenan como "cadenas" (*strings*) y corresponden al tipo `str`. Los datos de texto deben ir siempre entre comillas simples o dobles.

### Asignación de cadenas a variables

In [15]:
a = 'Hola, mundo'
print(a)

Hola, mundo


In [16]:
type(a)

str

### Operaciones con cadenas

In [19]:
b = 'Hola '
b + b

'Hola Hola '

In [20]:
b * 3

'Hola Hola Hola '

## Datos lógicos

Los datos lógicos pueden tomar uno de dos valores, falso (`True`) o verdadero (`False`), y corresponden al tipo `bool` (booleano). Internamente, estos valores corresponden a `1` y `0`, respectivamente.

### Asignación de valores booleanos a variables

In [21]:
a = True
print(a)

True


In [23]:
type(a)

bool

In [24]:
b = False
print(b)

False


In [25]:
type(b)

bool

### Operadores booleanos

In [35]:
# Igual a
5 == 5

True

In [36]:
# No igual a
5 != 5

False

In [37]:
# Mayor a
5 > 1

True

In [38]:
# Menor a
5 < 1

False

In [39]:
# Mayor o igual a
5 >= 1

True

In [40]:
# Menor o igual a
5 <= 5

True

# Estructura de datos

## Listas

Es una estructura nativa de Python que sirve para almacenar distintos tipos de datos, de cualquier naturaleza.

In [41]:
l = [1,2,3,4,5]
print(l)

[1, 2, 3, 4, 5]


In [42]:
type(l)

list

In [43]:
l = [1,2.3,'Hola']
print(l)

[1, 2.3, 'Hola']


## Dictionarios

Es una estructura nativa de Python que sirve para guardar datos en pares de clave: valor.

In [44]:
d = {'a':1, 'b':2, 'c':3}
print(d)

{'a': 1, 'b': 2, 'c': 3}


In [45]:
type(d)

dict

## Arreglos

Los arreglos (*arrays*) son estructuras propias del paquete **Numpy** que se construyen con datos de un sólo tipo. Son como las listas, pero mucho más eficientes.

### Creación de arreglos a partir de listas

In [47]:
import numpy as np

In [48]:
a = np.array([1,2,3,4])
print(a)

[1 2 3 4]


In [54]:
type(a)

numpy.ndarray

### Arreglos n-dimensionales

In [55]:
# Arreglo unidimensional
a = np.array([1,2,3,4])
print(a)

[1 2 3 4]


In [58]:
a.shape

(4,)

In [60]:
# Arreglo bidimensional
a = np.array([
    [1,2,3,4],
    [5,6,7,8]
])
print(a)

[[1 2 3 4]
 [5 6 7 8]]


In [61]:
a.shape

(2, 4)

In [51]:
# Operaciones con arreglos
a * 2

array([2, 4, 6, 8])

In [52]:
a * a

array([ 1,  4,  9, 16])

In [53]:
a / 4

array([0.25, 0.5 , 0.75, 1.  ])

## Series

Las series son estructuras propias del paquete **Pandas** que corresponden a arreglos unidimensionales etiquetados que pueden contener cualquier tipo de datos.

In [62]:
import pandas as pd

In [67]:
b = ['a','b','c','d']
print(b)

['a', 'b', 'c', 'd']


In [68]:
bs = pd.Series(b)
print(bs)

0    a
1    b
2    c
3    d
dtype: object


In [69]:
type(bs)

pandas.core.series.Series

In [None]:
dict = {'José':34,'María':45}
pd.Series(dict)

## Marcos de datos

Los marcos de datos (*Data frames*) son estructuras tabulares bidimensionles propias del paquete **Pandas** que pueden construirse a partir de listas, arreglos o series.

In [None]:
pd.DataFrame({'nombre':['María','José'],'edad':[34,45],'sexo':['Femenino','Masculino']})

# Descripción de variables numéricas

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns
sns.set_theme(rc={'figure.figsize':[12,8]})

## Medidas de tendencia central

In [None]:
import scipy.stats

x = scipy.stats.skewnorm.rvs(a=-10, loc=0, scale=1, size=1000)

In [None]:
sns.kdeplot(x)
plt.axvline(np.mean(x), color='red')
plt.axvline(np.median(x))
plt.show()

## Medidas de dispersión

# Descripción de variables categóricas

# Caso práctico