## Repaso

Algunas cosas que aprendimos hasta ahora.

### Clase 1: medición directa

1. Reportar un intervalo para una medición: $x \pm \Delta x$
2. Repetir la medición:
    - Si da lo mismo -> el error es la resolución instrumental.
    - Si no, es lo que aprendemos hoy.
3. Mejorar el método de medición (ejemplo, medición del diámetro)
4. Describir bien el experimento, para que se pueda reproducir

### Clase 2: medición indirecta

1. Cuentas con intervalos -> fórmula de propagación

$$\begin{align}
f(x, y, \ldots) &= \ldots \\
(\Delta f)^2 &= \left( \frac{\partial f}{\partial x} \Delta x \right)^2 + \left( \frac{\partial f}{\partial y} \Delta y \right)^2 + \ldots
\end{align} $$



# Mediciones "no repetibles"

## Primer parte

1. Experimento grupal
    - Medir dos veces el intervalo de tiempo entre dos chasquidos
2. Análisis en Python
    - Carga de mediciones
    - Visualización de mediciones
    - Resumen estadístico
    - Interpretación "física"
3. Experimento individual
    - Medir el periodo de oscilación de un péndulo en diferentes condiciones

## Segunda parte

3. Discutir los resultados
4. Probabilidad y estadística
    - Variable aleatoria y distribución de probabilidad
    - Distribución normal o gaussiana
5. Historia del péndulo y más experimentos
    - Medir con el Photogate

## 1. Experimento grupal

### Medición 1

Guiado por un cronómetro, voy a chasquear los dedos dos veces.

Ustedes van a medir el intervalo de tiempo entre los dos chasquidos.

### Preguntas 1

1. Sin decir aún su medición, ¿podrían reportar un resultado a partir de su medición?

2. ¿Qué error tiene su medición?

3. ¿Creen que su medición coincide con el de otra persona?

4. ¿Por qué no coinciden? ¿Midieron fenómenos distintos?

5. ¿Creen que las mediciones hechas presencialmente son comparables a las hechas por Zoom?

### Guardado de datos

Vamos a guardar los daots en un Excel, y exportarlo como `.csv`.

https://docs.google.com/spreadsheets/d/1KGyWdTCZwaxyK8-h-4cYUlb9-aAa6hEHsPPdE5t5Mcg

### Medición 2

Repetimos el experimento.

### Preguntas 2

1. Comparando con su medición anterior, ¿el intervalo entre chasquidos fue distinto?

2. ¿Cómo mostrarían a partir de sus mediciones si son distintos?

### Exportar datos

Como `.csv` y como `.xls`.

In [None]:
!head -n 5 mediciones.csv

In [None]:
!head -n 5 mediciones.xls

## 2. Visualización (en Python)

- Cargar datos
- Graficar
    - Gráfico de linea
    - Gráfico de puntos
    - Histograma

## Cargar datos

Vamos a sumar dos librerías: `pandas` y `seaborn`.

- Pandas permite trabajar con "tablas de datos", donde cada columna es un `array` de `numpy`.
- Seaborn permite hacer gráficos más complejos con `matplotlib` de manera simple

In [None]:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn

In [None]:
plt.rc("figure", dpi=100)

In [None]:
data = pd.read_csv("mediciones.csv")

data.head()

¿Hay algún valor o rango de valores que concentre la mayoría de las mediciones?

Es dificil de ver desde una tabla.

Una mejor forma es realizando un gráfico.

## Visualizar mediciones

Visualizar las mediciones es **fundamental** antes de hacer cualquier análisis.

Hay varios ejemplos que muestran que pasa si no, como el "cuarteto de Anscombe" o el "datasaurio".

En un experimento, le dieron un conjunto de mediciones a estudiantes para analizar.

Tenían que ver si habia una correlación entre el Indice de masa corporal y la cantidad de pasos que realizaba una persona.

Pero muchos no graficaron, y estos eran los datos:

![El gorila](https://pbs.twimg.com/media/FPDufEqXsAcEP0L?format=png&name=small)

Hay muchas formas de visualizar mediciones, pero veamos algunas típicas.

### Gráfico de puntos

Para hacer un gráfico de puntos, pueden usar la función `plt.scatter`.

Necesitan darle un valor para `x` y uno para `y`.

Para `y` vamos a usar el tiempo medido, y para `x` el número de fila.

In [None]:
plt.scatter(data.index, data.tiempo_1)
# plt.scatter(data.index, data.tiempo_2)

plt.xlabel("Número de medición")
plt.ylabel("Tiempo entre chasquidos [s]")

In [None]:
seaborn.scatterplot(x=data.index, y=data.tiempo_1, hue=data.lugar)

plt.xlabel("Número de medición")
plt.ylabel("Tiempo entre chasquidos [s]")

### Gráfico de linea

Otra opción es hacer un gráfico de linea, que une los puntos del gráfico anterior con una linea.

A veces es más cómodo para ver una tendencia en los datos. Otras veces es más confuso.

In [None]:
plt.plot(data.index, data.tiempo_1)
# plt.scatter(data.index, data.tiempo_2)

plt.xlabel("Número de medición")
plt.ylabel("Tiempo entre chasquidos [s]")

Pueden combinarlos desde la función `plt.plot`:

In [None]:
plt.plot(data.index, data.tiempo_1, linestyle="--", marker="o")

plt.xlabel("Número de medición")
plt.ylabel("Tiempo entre chasquidos [s]")

### Con barras de error

Cuando conocemos el error de cada medición, podemos hacer un gráfico con barras de error con la función `plt.errorbar`:

In [None]:
plt.errorbar(
    x=data.index,
    y=data.tiempo_1,
    yerr=0.01,  # barra de error
    linestyle="",
    marker="o",
)

### Histograma

Los gráficos anteriores nos permiten ver si hay cierta relación entre los valores de `x` e `y`.

Pero acá no esperamos ninguna tendencia: el valor de `x` es un orden arbitrario, ¿no?

Lo que nos interesa es ver que región tiene más densidad de mediciones.

Para eso podemos hacer un histograma.

Se construye dividiendo el rango de los datos en intervalos,

y contando cuantas mediciones cayeron en cada intervalo:

In [None]:
y = data.tiempo_1
plt.scatter(data.index, y)
plt.xlabel("Número de medición")
plt.ylabel("Tiempo entre chasquidos [s]")

# bins = np.linspace(y.min(), y.max(), 10)
# for b in bins:
#     plt.axhline(b, linestyle="--")

# plt.twiny()
# plt.hist(y, bins=bins, orientation="horizontal", alpha=0.5)
# plt.xlabel("Cantidad de mediciones")

El histograma en su orientación típica:

In [None]:
plt.hist(data.tiempo_1, bins=10)
# plt.hist(data.tiempo_2, bins=10, histtype="step")

plt.xlabel("Tiempo entre chasquidos [s]")
plt.ylabel("Cantidad de mediciones")

El histograma tiene dos desventajas:

1. Hay una elección arbitraria de cuantos intervalos usar.

Además, si usamos muy pocos o demasiados, no se observa bien la forma de la distribución de las mediciones.

2. No funciona muy bien con poca cantidad de datos.

Estas dos desventajas, se pueden solucionar con el histograma cumulativo.

### Histograma cumulativo

El histograma cumulativo es similar al histograma.

Pero, en lugar de contar solo las mediciones que caen en un intervalo,

se cuentan también todas las mediciones anteriores.

In [None]:
plt.hist(data.tiempo_1, bins=10)
plt.hist(data.tiempo_1, bins=10, cumulative=True, histtype="step")

plt.xlabel("Tiempo entre chasquidos [s]")



Nos permite aumentar la cantidad de `bins` todo lo que queramos:

In [None]:
bins = 30

plt.hist(data.tiempo_1, bins=bins)
plt.hist(data.tiempo_1, bins=bins, cumulative=True, histtype="step")

plt.xlabel("Tiempo entre chasquidos [s]")

Comparemos las dos tandas de mediciones:

In [None]:
plt.hist(data.tiempo_1, bins=1000, cumulative=True, histtype="step")
plt.hist(data.tiempo_2, bins=1000, cumulative=True, histtype="step")

plt.xlabel("Tiempo entre chasquidos [s]")