# Desviación Estandar <img style="float: right;" src="logo.jpeg" width="85" height="70">


## Autor

<div style="display: flex; justify-content: center;">
    <table style="width: 100%;">
        <tr>
            <td style="width: 30%;"><img src="foto.jpeg" width="250" height="100"></td>
            <td style="width: 70%;" colspan="2">
                <p style="text-align: justify;"><b>Andres Felipe Guerrero Guio</b><br>
                Universidad Nacional de Colombia, <i>Facultad de Ciencias</i>, Departamento de Física. <br>
                Observatorio Astronomico Nacional, <i>Grupo de Astrofísica Solar (GOSA), Grupo de variabilidad estelar (VarYun).</i><br>
                Soy estudiante de último semestre de física y formo parte de dos grupos de investigación en el Observatorio Astronómico Nacional. He tenido la oportunidad de utilizar modelos de machine learning para resolver sistemas físicos. Mi formación sólida en matemáticas y estadística me permite aplicar enfoques cuantitativos en mi investigación y análisis de datos. He participado en la redacción de artículos científicos y he sido monitor en diversos cursos. Soy una persona dedicada, apasionada por la investigación en astrofísica y siempre en búsqueda de nuevas formas de mejorar mis habilidades y conocimientos.</p>
            </td>
        </tr>
    </table>
</div>

## Concepto

La desviación estándar es una medida de extensión o variabilidad en la estadística descriptiva. Se utiliza para calcular la variación o dispersión en la que los puntos de datos individuales difieren de la media. Una desviación baja indica que los puntos de datos están muy cerca de la media, mientras que una desviación alta muestra que los datos están dispersos en un rango mayor de valores. La desviación estándar es una de las principales medidas estadísticas que intervienen en el cálculo de la muestra de una investigación, y también es una medida de riesgo que utilizan los analistas, los gestores de carteras y los asesores.

La Desviacion estandar (S) se calcula de la forma:

$$
S=\sqrt{\frac{\sum(X-\bar{X})^2}{N}}
$$
Donde X es Cada valor en la muestra, $\bar{X}$ representa Media de todos los datos y N es Número de datos.

La desviación estándar también puede servir como una medida de incertidumbre. En física, por ejemplo, la desviación estándar de un conjunto de mediciones puede indicar la precisión de los resultados obtenidos

## Ejemplo

supongamos un conjunto de N = 10 datos aleatorios entre 0 y 1

In [5]:
import random as rd

N = 10
datos = [rd.randint(0,10) for i in range(N) ]
datos

[0, 4, 6, 7, 3, 4, 7, 9, 6, 6]

Ahora queremos calcular su media $\bar{X}$, esta esta dada por la ecuación: 

$$
\bar{x}=\frac{\sum x_i}{N},
$$
es decir, debemos sumar los datos y dividirlos ente N

In [10]:
suma = 0
for i in datos:
    suma +=i
media = suma/N
media

5.2

De esta forma ya tenemos todo lo que se requiere para calcular la desviacion estandar S de los datos, esto es:

In [20]:
suma_desv = 0
for i in datos:
    suma_desv += (i-media)**2
S = (suma_desv/N)**(1/2)

La desviacion estandar de los datos es:

In [22]:
S

2.4000000000000004

Si el conjunto de datos que estamos estudiando corresponde a alguna medida en física, el valor sería reportado de la siguiente forma:

In [29]:
print(r"medida = ({} +-{}) Unidades".format(media,round(S,1)))

medida = (5.2 +-2.4) Unidades


Donde la $\bar{X}$ es el valor numérico obtenido y S es la incertidumbre asociada a la medida. La incertidumbre representa la incerteza o error en la medición y se expresa generalmente en el mismo sistema de unidades que el valor medido. Como podemos ver, la desviacion estandar es alta comparada con la media de los datos, esto nos indica que los datos son muy dispersos.

## Librerias

En el ejemplo anterior, intentamos reducir la dependencia de librerías; sin embargo, estas pueden simplificar nuestra vida enormemente. Específicamente, con la librería NumPy, el código se reduce a unas pocas líneas. Por ejemplo, podemos calcular la media de la siguiente forma:

In [30]:
import numpy as np
media_np = np.mean(datos)
media_np

5.2

Observamos que obtenemos el mismo resultado que el cálculo anterior sin necesidad de utilizar bucles. Además, con la librería NumPy, podemos calcular directamente la desviación estándar sin tener que calcular previamente la media de los datos

In [32]:
S_np = np.std(datos)
S_np

2.4

Como podemos ver, el resultado es el mismo y utilizamos unicamente una linea de codigo.

## Bibliografia
<ol>
    <p>Questiopro (vista <b>2023</b>) <i>Desviación estándar: Qué es, usos y cómo obtenerla.</i> Disponible en <a href="https://www.questionpro.com/blog/es/desviacion-estandar/">https://www.questionpro.com/blog/es/desviacion-estandar/</a></p>
    <p>Wikipedia (vista <b>2023</b>) <i>Desviación típica.</i> Disponible en <a href="https://es.wikipedia.org/wiki/Desviaci%C3%B3n_t%C3%ADpica">https://es.wikipedia.org/wiki/Desviaci%C3%B3n_t%C3%ADpica</a></p>
    <p>Khan academic (vista <b>2023</b>) <i>Calcular la desviación estándar paso a paso.</i> Disponible en <a href="https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step">https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step</a></p>
</ol>