# Calidad de sueño y estilo de vida

En este conjunto de datos sacado de [Kaggle](https://www.kaggle.com/datasets/uom190346a/sleep-health-and-lifestyle-dataset) cuenta con datos de la calidad de sueño de distintas personas, las columnas que se encuentran son las siguientes:

- Person ID: Un identificador para cada individuo
- Gener: El género de la persona (Hombre / Mujer)
- Age: La edad de las personas en años
- Occupation: - La ocupación o profesión de la persona
- Sleep Duration (hours) - El número de horas que la persona duerme por día
- Quality Sleep (scale: 1-10) - Una calificación subjetiva de la calidad del sueño
- Physical Activity Level (minutes/day) - El número de minutos que la persona hace actividad física diariamente
- Stress Level (scale: 1-10) - Una calificacoón subjetiva del nivel de estres experimentado por la persona
- BMI Category - La categoría de Índice de Masa Corporal
- Blood Pressure (systolic/diastolic) - La presión arterial de la persona, indicado como presión sistólica sobre presión diastólica
- Heart Rate (bpm) - La frecuencia cardíaca en reposo en latidos por minuto
- Dialy Steps - El número de pasos que la persona hace al día
- Sleep Disorder - La presencia o ausensica de transtornos del sueño en la persona.

## Preguntas que buscamos responder con este conjunto

Las preguntas que buscaremos responder con este conjunto de datos son las siguientes:

- ¿Quiénes tienen peor calidad del sueño, hombres o mujeres?

- ¿Existe una relación entre la calidad del sueño de las personas y su profesión?

- ¿La actividad física afecta al sueño?

- ¿Qué profesión presenta la peor calidad de sueño?

- ¿Cuál profesión tienen a las personas con el mayor nivel de estrés y el mayor índice de masa corporal?

- ¿En qué rango de edades se encuentran la mayor cantidad de trastornos del sueño?

- La cantidad de pasos al día, ¿afecta la calidad del sueño? ¿al índice de masa corporal?

Con estas preguntas comenzaremos a hacer nuestro análisis buscando extraer la mayor cantidad de información que se pueda del conjunto, es importante señalar que en este proyecto solamente haremos análisis de datos utilizando la librería **Pandas**.



In [None]:
import pandas as pd

In [None]:
# Cargamos el conjunto de datos
data = pd.read_csv(
      '/content/sample_data/sleep health.csv',
      index_col="Person ID"
    )
data.head()

Unnamed: 0_level_0,Gender,Age,Occupation,Sleep Duration,Quality of Sleep,Physical Activity Level,Stress Level,BMI Category,Blood Pressure,Heart Rate,Daily Steps,Sleep Disorder
Person ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1
1,Male,27,Software Engineer,6.1,6,42,6,Overweight,126/83,77,4200,
2,Male,28,Doctor,6.2,6,60,8,Normal,125/80,75,10000,
3,Male,28,Doctor,6.2,6,60,8,Normal,125/80,75,10000,
4,Male,28,Sales Representative,5.9,4,30,8,Obese,140/90,85,3000,Sleep Apnea
5,Male,28,Sales Representative,5.9,4,30,8,Obese,140/90,85,3000,Sleep Apnea


In [None]:
# Información general del conjunto
data.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 374 entries, 1 to 374
Data columns (total 12 columns):
 #   Column                   Non-Null Count  Dtype  
---  ------                   --------------  -----  
 0   Gender                   374 non-null    object 
 1   Age                      374 non-null    int64  
 2   Occupation               374 non-null    object 
 3   Sleep Duration           374 non-null    float64
 4   Quality of Sleep         374 non-null    int64  
 5   Physical Activity Level  374 non-null    int64  
 6   Stress Level             374 non-null    int64  
 7   BMI Category             374 non-null    object 
 8   Blood Pressure           374 non-null    object 
 9   Heart Rate               374 non-null    int64  
 10  Daily Steps              374 non-null    int64  
 11  Sleep Disorder           374 non-null    object 
dtypes: float64(1), int64(6), object(5)
memory usage: 38.0+ KB


In [None]:
# Descripción general de las variables numericas del conjunto
data.describe()

Unnamed: 0,Age,Sleep Duration,Quality of Sleep,Physical Activity Level,Stress Level,Heart Rate,Daily Steps
count,374.0,374.0,374.0,374.0,374.0,374.0,374.0
mean,42.184492,7.132086,7.312834,59.171123,5.385027,70.165775,6816.84492
std,8.673133,0.795657,1.196956,20.830804,1.774526,4.135676,1617.915679
min,27.0,5.8,4.0,30.0,3.0,65.0,3000.0
25%,35.25,6.4,6.0,45.0,4.0,68.0,5600.0
50%,43.0,7.2,7.0,60.0,5.0,70.0,7000.0
75%,50.0,7.8,8.0,75.0,7.0,72.0,8000.0
max,59.0,8.5,9.0,90.0,8.0,86.0,10000.0


In [None]:
data.corr().columns

  data.corr().columns


Index(['Age', 'Sleep Duration', 'Quality of Sleep', 'Physical Activity Level',
       'Stress Level', 'Heart Rate', 'Daily Steps'],
      dtype='object')

### Análisis de las edades

In [None]:
# Cantidad de hombres y mujeres en el conjunto
data['Gender'].value_counts()

Male      189
Female    185
Name: Gender, dtype: int64

In [None]:
# Promedio de la edad
data['Age'].mean()

42.18449197860963

In [None]:
# Desviación estándar del conjunto
data['Age'].std()

8.673133465547243

In [None]:
# Valor mínimo de las edades
data['Age'].min()

27

In [None]:
# Valor máximo de las edades
data['Age'].max()

59

In [None]:
# Creamos una columna nueva para ordenar por adulto y adulto viejo
data.loc[data['Age']<=40, 'Age_group'] = 'Adult'
data.loc[data['Age']>=41, 'Age_group'] = 'Older Adult'

In [None]:
# Cantidad de adultos y adultos viejos del conjunto
data['Age_group'].value_counts()

Older Adult    209
Adult          165
Name: Age_group, dtype: int64

In [None]:
# Promedio y desviación estándar de las edades divididas entre hombres y mujeres
data.groupby('Gender')['Age'].agg(['mean', 'std'])

Unnamed: 0_level_0,mean,std
Gender,Unnamed: 1_level_1,Unnamed: 2_level_1
Female,47.405405,8.093407
Male,37.074074,5.662006


## Análisis de las ocupaciones

In [None]:
# Cantidad de hombres y mujeres
data.groupby(['Occupation'])['Gender'].value_counts()

Occupation            Gender
Accountant            Female    36
                      Male       1
Doctor                Male      69
                      Female     2
Engineer              Female    32
                      Male      31
Lawyer                Male      45
                      Female     2
Manager               Female     1
Nurse                 Female    73
Sales Representative  Male       2
Salesperson           Male      32
Scientist             Female     4
Software Engineer     Male       4
Teacher               Female    35
                      Male       5
Name: Gender, dtype: int64

In [None]:
# Duración mínima y máxima del sueño de las personas
print(data['Sleep Duration'].min())
print(data['Sleep Duration'].max())

5.8
8.5


In [None]:
# Duración del sueño entre hombres y mujeres
data.groupby(['Gender'])['Sleep Duration'].mean()

Gender
Female    7.229730
Male      7.036508
Name: Sleep Duration, dtype: float64

In [None]:
data.groupby('Gender')['Quality of Sleep'].mean()

Gender
Female    7.664865
Male      6.968254
Name: Quality of Sleep, dtype: float64

In [None]:
# Promedio de la calidad y duración del sueño
occ_qua=data.groupby('Occupation')[['Quality of Sleep', 'Sleep Duration']].mean()
occ_qua.sort_values(by='Quality of Sleep')

Unnamed: 0_level_0,Quality of Sleep,Sleep Duration
Occupation,Unnamed: 1_level_1,Unnamed: 2_level_1
Sales Representative,4.0,5.9
Scientist,5.0,6.0
Salesperson,6.0,6.403125
Software Engineer,6.5,6.75
Doctor,6.647887,6.970423
Teacher,6.975,6.69
Manager,7.0,6.9
Nurse,7.369863,7.063014
Accountant,7.891892,7.113514
Lawyer,7.893617,7.410638


In [None]:
occ_bmi = data.groupby('Occupation')['BMI Category'].value_counts()

occ_bmi.sort_values()

Occupation            BMI Category 
Lawyer                Normal Weight     1
Software Engineer     Overweight        1
                      Obese             1
Manager               Overweight        1
Teacher               Obese             1
Doctor                Normal Weight     2
Lawyer                Obese             2
                      Overweight        2
Software Engineer     Normal Weight     2
Sales Representative  Obese             2
Engineer              Overweight        3
                      Normal Weight     4
Doctor                Obese             4
Scientist             Overweight        4
Accountant            Normal Weight     5
                      Overweight        6
Teacher               Normal            6
Nurse                 Normal Weight     7
Accountant            Normal           26
Salesperson           Overweight       32
Teacher               Overweight       33
Lawyer                Normal           42
Engineer              Normal           5

In [None]:
occ_steps = data.groupby(['Occupation'])['Daily Steps', 'Physical Activity Level', 'Sleep Duration', 'Quality of Sleep'].mean()
occ_steps.sort_values(by='Daily Steps')

  occ_steps = data.groupby(['Occupation'])['Daily Steps', 'Physical Activity Level', 'Sleep Duration', 'Quality of Sleep'].mean()


Unnamed: 0_level_0,Daily Steps,Physical Activity Level,Sleep Duration,Quality of Sleep
Occupation,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
Sales Representative,3000.0,30.0,5.9,4.0
Scientist,5350.0,41.0,6.0,5.0
Manager,5500.0,55.0,6.9,7.0
Software Engineer,5800.0,48.0,6.75,6.5
Teacher,5957.5,45.625,6.69,6.975
Engineer,5980.952381,51.857143,7.987302,8.412698
Salesperson,6000.0,45.0,6.403125,6.0
Doctor,6808.450704,55.352113,6.970423,6.647887
Accountant,6881.081081,58.108108,7.113514,7.891892
Lawyer,7661.702128,70.425532,7.410638,7.893617


# Reporte

# Introducción

En este proyecto tomamos el conjunto de datos [Sleep Health and Lifestyle Dataset | Kaggle](https://www.kaggle.com/datasets/uom190346a/sleep-health-and-lifestyle-dataset) en donde se encuentran los datos de distintas personas como su profesión, su actividad física y la calidad de sueño. Tomaremos este conjunto de datos para conocer que cosas son las que afectan al sueño como por ejemplo la cantidad de actividad física, la profesión y la presión a la que cada uno de ellos se somete.

Las preguntas que buscaremos responder con los datos de este conjunto son las siguientes:

- ¿Quiénes tienen peor calidad del sueño, hombres o mujeres?

- ¿Existe una relación entre la calidad del sueño de las personas y su profesión?

- ¿La actividad física afecta al sueño?

- ¿Qué profesión presenta la peor calidad de sueño?

- ¿Cuál profesión tienen a las personas con el mayor nivel de estrés y el mayor índice de masa corporal?

- ¿En qué rango de edades se encuentran la mayor cantidad de trastornos del sueño?

- La cantidad de pasos al día, ¿afecta la calidad del sueño? ¿al índice de masa corporal?

Estas preguntas nos servirán como punto de partida en nuestro análisis buscando extraer la mayor cantidad de información que se pueda del conjunto, es importante señalar que para el análisis de este conjunto de datos solamente haremos uso de la librería **Pandas** por lo que en este análisis no encontraremos gráficos.

## Análisis del conjunto

### Análisis General

Sabemos que en el conjunto de datos contamos con *374* filas y *13* columnas de datos, de las cuales sabemos que en general los datos se dividen de la siguiente forma:

|Género|Cantidad|
|---|---|
|Hombres|189|
|Mujeres|185|

Esto nos da un vistazo general del conjunto y podemos decir que el conjunto se encuentran en proporción, respecto a la cantidad de hombre y mujeres.

## Clasificación dada por edad

En el conjunto podemos encontrar las edades de las personas, con respecto a las edades podemos encontrar lo siguiente:

- La edad más baja es de *27* años

- La edad más alta es de *59* años

Lo que podemos decir que el conjunto de datos toma en cuenta a personas que ya se encuentran en la edad laboral iniciando en el trabajo o con pocos años en el mismo, o de personas cercanas a jubilarse.

La edad promedio del conjunto de datos es de *42* años y la desviación estándar es de *8.67*, lo que quiere decir que en este conjunto podemos encontrar datos muy dispersos lo que puede deberse a los pocos datos recabados.  

Para apoyarnos en este análisis se agregó una nueva columna al conjunto de datos a la que se le llamó `Age_group` en la cuál se clasifico la edad de las personas de la siguiente manera:  

- Edad menor o igual a 40: `Adulto`

- Edad mayor a 40: `Adulto viejo`  

Tomando en cuenta este ordenamiento de los datos tenemos lo siguiente:

|Clasificación|Cantidad|
|---|---|
|Adulo Viejo|209|
|Adulto|165|


Finalmente el promedio de edades por cada género queda de la siguiente forma:  

|Gender|mean|std|
|---|---|---|
|Female|47\.40|8\.10|
|Male|37\.07|5\.66|

Podemos ver que existe una diferencia de `10` años en el promedio de edades de ambos géneros, y también notamos un diferencia grande en la desviación estándar, siendo ésta de `3` años.


## Ocupaciones

|Ocupación |Género|Cantidad|
|---|---|---|
|Accountant|Female|36|
||Male|1|
|Doctor|Male|69|
||Female|2|
|Engineer|Female|32|
||Male|31|
|Lawyer|Male|45|
|| Female|2|
|Manager|Female|1|
|Nurse|Female|73|
|Sales Representative|Male|2|
|Salesperson|Male|32|
|Scientist|Female|4|
|Software Engineer|Male|4|
|Teacher|Female|35|
||Male|5|

En esta gráfica notamos la siguiente:
- Las ocupaciones en donde hay más presencia de mujeres son:
	- Contador
	- Ingeniería
	- Gerente
	- Enfermería
	- Ciencia
	- Maestro
- Las ocupaciones en donde los hombres tienen más presencia:
	- Doctor
	- Representante de ventas
	- Ventas
	- Abogado
	- Ingeniero de Software

Es importante mencionar que solamente en *Ingeniería* la diferencia es de solamente una persona.

### Calidad del Sueño

El promedio de la duración del sueño entre hombres y mujeres es la siguiente:

|Genero|Promedio del sueño|Calidad del sueño|
|---|---|---|
|Female|7.23|7.66|
|Male|7.04|6.97|

Podemos ver que en general, las mujeres tienen un mejor sueño que los hombres no solamente en cantidad sino que en calidad, para profundizar más, obtendremos los mismos datos pero ahora en cada una de las profesiones del conjunto.

|Occupation|Quality of Sleep|Sleep Duration|
|---|---|---|
|Sales Representative|4\.0|5\.9|
|Scientist|5\.0|6\.0|
|Salesperson|6\.0|6\.40|
|Software Engineer|6\.5|6\.75|
|Doctor|6\.65|6\.97|
|Teacher|6\.975|6\.69|
|Manager|7\.0|6\.9|
|Nurse|7\.37|7\.06|
|Accountant|7\.89|7\.11|
|Lawyer|7\.89|7\.41|
|Engineer|8\.41|7\.99|


En estas tablas podemos ver que las peores ocupaciones que tienen la peor calidad y cantidad de sueño son:
- Representante de Ventas
- Científico
- Ventas

Y aquellas que tienen mejor calidad y tiempo de sueño son:
- Ingeniero
- Abogado
- Contador

En las profesiones donde peor calidad y cantidad de sueño hay se encuentran más hombres que mujeres.

### Problemas de salud

Finalmente buscaremos que tan buena salud tienen cada una de las personas en las distintas profesiones, con este dato podremos sacar nuestras conclusiones y podremos responder las preguntas que nos hicimos en un inicio al comenzar con nuestro análisis.

| Occupation           | BMI Category    | Count |
|----------------------|-----------------|-------|
| Lawyer               | Normal Weight   | 1     |
| Software Engineer    | Overweight      | 1     |
|                      | Obese           | 1     |
| Manager              | Overweight      | 1     |
| Teacher              | Obese           | 1     |
| Doctor               | Normal Weight   | 2     |
| Lawyer               | Obese           | 2     |
|                      | Overweight      | 2     |
| Software Engineer    | Normal Weight   | 2     |
| Sales Representative | Obese           | 2     |
| Engineer             | Overweight      | 3     |
|                      | Normal Weight   | 4     |
| Doctor               | Obese           | 4     |
| Scientist            | Overweight      | 4     |
| Accountant           | Normal Weight   | 5     |
|                      | Overweight      | 6     |
| Teacher              | Normal          | 6     |
| Nurse                | Normal Weight   | 7     |
| Accountant           | Normal          | 26    |
| Salesperson          | Overweight      | 32    |
| Teacher              | Overweight      | 33    |
| Lawyer               | Normal          | 42    |
| Engineer             | Normal          | 56    |
| Doctor               | Normal          | 65    |
| Nurse                | Overweight      | 66    |

Otro punto importante a tener en cuenta es saber si la cantidad de pasos al día afecta a la salud y a la calidad del sueño, para conocer esto tendremos el promedio de los pasos diarios, el nivel de actividad física, duración del sueño y la calidad del sueño en cada una de las profesiones.

|Occupation|Daily Steps|Physical Activity Level|Sleep Duration|Quality of Sleep|
|---|---|---|---|---|
|Sales Representative|3000\.0|30\.0|5\.9|4\.0|
|Scientist|5350\.0|41\.0|6\.0|5\.0|
|Manager|5500\.0|55\.0|6\.9|7\.0|
|Software Engineer|5800\.0|48\.0|6\.75|6\.5|
|Teacher|5957\.5|45\.62|6\.69|6\.97|
|Engineer|5980\.95|51\.86|7\.99|8\.41|
|Salesperson|6000\.0|45\.0|6\.40|6\.0|
|Doctor|6808\.45|55\.35|6\.97|6\.65|
|Accountant|6881\.08|58\.11|7\.11|7\.89|
|Lawyer|7661\.70|70\.42|7\.41|7\.89|
|Nurse|8057\.53|78\.59|7\.06|7\.37|

<div style="page-break-after: always; visibility: hidden">
\pagebreak
</div>

# Conclusiones

Este conjunto de datos nos sirve para darnos un vistazo general de cada una de las profesiones y como éstas afecta a la salud de las personas. Digo general porque un problema de este conjunto es la cantidad de datos que tiene, ya que al contar solamente con *307* filas son muy pocas para todo el margen de edad que se tomó. Eso lo podemos notar al obtener el promedio de las edades y la desviación estándar por lo que, al terminar con nuestro análisis, podemos decir que hacen falta más datos o en su caso reducir el margen de edades de los encuestados.

Pasando al sueño de cada una de las personas tenemos lo siguiente:

Las mujeres en términos generales tienen una mejor calidad y cantidad de sueño respecto a los hombres ya que, las mujeres pueden tener un mejor control de estrés o porque las mujeres a las que se les hizo la encuesta parecen tener profesiones en las que se habla con menos personas que las profesiones de los hombres.

Esto lo podemos acompañar si tomamos solamente las primeras cinco profesiones que presentan la mejor calidad y cantidad de sueño:

- Ingeniería
- Abogado
- Contador
- Enfermería
- Gerente

De estas profesiones en tres se encuentran más mujeres (Contador, Enfermería y Gerente) en una hay más hombres (Abogado) y en Ingeniería se encuentra la diferencia de una persona entre ambos.

Muchas de estas profesiones también se repiten cuando revisamos la cantidad de pasos al día, podemos ver que las cinco profesiones donde más pasos al día se dan son:

- Enfermería
- Abogado
- Contador
- Doctor
- Vendedor

En la mayoría de estas personas podemos ver que caminar forma una parte fundamental de ellas por lo que no es de extrañar que éstas presenten un promedio alto de pasos al día y esto también se ve en la salud del sueño, ya que si vemos la tabla de los pasos al día podemos ver que en ella existe una relación que entre más pasos se den mejor va a ser el sueño.

Aunque esta misma relación no se nota cuando hablamos del índice de masa corporal, porque de la lista anterior podemos ver que en las siguientes se encuentran muchas personas con sobrepeso:

- Enfermería
- Vendedor

Finalmente, las preguntas hechas alrededor de la edad de los encuestados no se respondieron ya que se encontró que el rango de edades es muy alto y se cuenta con muy pocos datos por lo que las respuestas que se puedan encontrar en este ámbito no pueden llegar a ser relevantes con la realidad.