![insomnia](insomnia.jpg)


Su cliente, SleepInc, ha compartido datos de sueño anónimos de su nueva aplicación de seguimiento del sueño SleepScope. Como su consultor de ciencia de datos, su misión es analizar los datos de la encuesta de estilo de vida con Python para descubrir relaciones entre ejercicio, género, ocupación y calidad del sueño. Vea si puede identificar patrones que conduzcan a información sobre la calidad del sueño.

## 💾 Los datos: sleep_health_data.csv

leepInc le ha proporcionado un conjunto de datos anónimos de métricas de sueño y estilo de vida de 374 personas. Este conjunto de datos contiene valores promedio para cada persona calculados durante los últimos seis meses. Los datos se guardan como `sleep_health_data.csv`.

El conjunto de datos incluye 13 columnas que cubren la duración del sueño, la calidad, los trastornos, el ejercicio, el estrés, la dieta, la demografía y otros factores.

| Columnas | Descripción |
|---------|----------------------------------------|  
| `Person ID` | Un identificador para cada individuo. |
| `Gender` | El género de la persona (Hombre/Mujer). |  
| `Age` | La edad de la persona en años. |
| `Occupation` | La ocupación o profesión de la persona.|
| `Sleep Duration (hours)` | El número medio de horas que duerme una persona al día. |
| `Quality of Sleep (scale: 1-10)` | Una calificación subjetiva de la calidad del sueño, que va del 1 al 10. |
| `Physical Activity Level (minutes/day)` | Número promedio de minutos que una persona realiza actividad física diariamente. |  
| `Stress Level (scale: 1-10)` | Una calificación subjetiva del nivel de estrés experimentado por la persona, que va del 1 al 10.|
| `BMI Category` | La categoría de IMC de la persona (por ejemplo, bajo peso, normal, sobrepeso) |
| `Blood Pressure (systolic/diastolic)` | La medición promedio de la presión arterial de la persona, indicada como presión sistólica sobre presión diastólica. |
| `Heart Rate (bpm)` | La frecuencia cardíaca promedio en reposo de una persona en latidos por minuto. |
| `Daily Steps` | El número promedio de pasos que da una persona por día. |
| `Sleep Disorder` | La presencia o ausencia de un trastorno del sueño en la persona (Ninguno, Insomnio, Apnea del sueño). |

In [62]:
# Start coding here
# Use as many cells as you need
import pandas as pd
import numpy as np

Cómo abordar el proyecto
1. Encuentre la ocupación con la menor duración del sueño.
2. Encuentre la ocupación con la menor calidad de sueño.
3. Encuentre qué proporción de usuarios de aplicaciones en cada categoría de IMC han sido diagnosticados con insomnio.

Pasos para completar

1. Encuentre la ocupación con la menor duración del sueño.
Deberá agrupar las ocupaciones y calcular la media antes de encontrar la media más baja.
2. Encuentre la ocupación con la menor calidad de sueño.
Deberá agrupar las ocupaciones y calcular la media antes de encontrar la media más baja.
3. Encuentre qué proporción de usuarios de aplicaciones en cada categoría de IMC han sido diagnosticados con insomnio.

In [63]:
df = pd.read_csv('sleep_health_data.csv')
df

Unnamed: 0,Person ID,Gender,Age,Occupation,Sleep Duration,Quality of Sleep,Physical Activity Level,Stress Level,BMI Category,Blood Pressure,Heart Rate,Daily Steps,Sleep Disorder
0,1,Male,27,Software Engineer,6.1,6,42,6,Overweight,126/83,77,4200,
1,2,Male,28,Doctor,6.2,6,60,8,Normal,125/80,75,10000,
2,3,Male,28,Doctor,6.2,6,60,8,Normal,125/80,75,10000,
3,4,Male,28,Sales Representative,5.9,4,30,8,Obese,140/90,85,3000,Sleep Apnea
4,5,Male,28,Sales Representative,5.9,4,30,8,Obese,140/90,85,3000,Sleep Apnea
...,...,...,...,...,...,...,...,...,...,...,...,...,...
369,370,Female,59,Nurse,8.1,9,75,3,Overweight,140/95,68,7000,Sleep Apnea
370,371,Female,59,Nurse,8.0,9,75,3,Overweight,140/95,68,7000,Sleep Apnea
371,372,Female,59,Nurse,8.1,9,75,3,Overweight,140/95,68,7000,Sleep Apnea
372,373,Female,59,Nurse,8.1,9,75,3,Overweight,140/95,68,7000,Sleep Apnea


In [11]:
df.head()

Unnamed: 0,Person ID,Gender,Age,Occupation,Sleep Duration,Quality of Sleep,Physical Activity Level,Stress Level,BMI Category,Blood Pressure,Heart Rate,Daily Steps,Sleep Disorder
0,1,Male,27,Software Engineer,6.1,6,42,6,Overweight,126/83,77,4200,
1,2,Male,28,Doctor,6.2,6,60,8,Normal,125/80,75,10000,
2,3,Male,28,Doctor,6.2,6,60,8,Normal,125/80,75,10000,
3,4,Male,28,Sales Representative,5.9,4,30,8,Obese,140/90,85,3000,Sleep Apnea
4,5,Male,28,Sales Representative,5.9,4,30,8,Obese,140/90,85,3000,Sleep Apnea


In [12]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 374 entries, 0 to 373
Data columns (total 13 columns):
 #   Column                   Non-Null Count  Dtype  
---  ------                   --------------  -----  
 0   Person ID                374 non-null    int64  
 1   Gender                   374 non-null    object 
 2   Age                      374 non-null    int64  
 3   Occupation               374 non-null    object 
 4   Sleep Duration           374 non-null    float64
 5   Quality of Sleep         374 non-null    int64  
 6   Physical Activity Level  374 non-null    int64  
 7   Stress Level             374 non-null    int64  
 8   BMI Category             374 non-null    object 
 9   Blood Pressure           374 non-null    object 
 10  Heart Rate               374 non-null    int64  
 11  Daily Steps              374 non-null    int64  
 12  Sleep Disorder           155 non-null    object 
dtypes: float64(1), int64(7), object(5)
memory usage: 38.1+ KB


### Paso #1

#### Ocupación con la menor duracion de sueño.

In [26]:
mean_sleep_duration_by_occupation = df.groupby('Occupation')['Sleep Duration'].mean().sort_values()

In [27]:
mean_sleep_duration_by_occupation

Occupation
Sales Representative    5.900000
Scientist               6.000000
Salesperson             6.403125
Teacher                 6.690000
Software Engineer       6.750000
Manager                 6.900000
Doctor                  6.970423
Nurse                   7.063014
Accountant              7.113514
Lawyer                  7.410638
Engineer                7.987302
Name: Sleep Duration, dtype: float64

In [50]:
#print(type(mean_sleep_duration_by_occupation))
min_sleep_occupation = mean_sleep_duration_by_occupation.index[0]
lowest_sleep_duration = mean_sleep_duration_by_occupation[0]

  lowest_sleep_duration = mean_sleep_duration_by_occupation[0]


In [61]:
print(f"Lowest sleep duration occupation is: {min_sleep_occupation} ({lowest_sleep_duration:.2f} hours)")

Lowest sleep duration occupation is: Sales Representative (5.90 hours)


### Paso #2

#### Ocupación con la menor calidad de sueño.

In [64]:
# agrupamos por ocupacion para encontrar la media por calidad
media_por_calidad = df.groupby('Occupation')['Quality of Sleep'].mean()

In [65]:
menor_calidad_sueno = media_por_calidad.min()
ocupacion_menor_calidad = media_por_calidad.idxmin()

In [69]:
print('La ocupacion con menor calidad del sueño es {} con una duracion de {}'.format(ocupacion_menor_calidad,menor_calidad_sueno))

La ocupacion con menor calidad del sueño es Sales Representative con una duracion de 4.0


### Paso #3

#### Proporción de usuarios de aplicaciones en cada categoría de IMC han sido diagnosticados con insomnio.

In [73]:
bmi_counts = df['BMI Category'].value_counts()
bmi_counts

BMI Category
Normal        216
Overweight    148
Obese          10
Name: count, dtype: int64

In [75]:
insomnia_counts = df[df['Sleep Disorder'] == 'Insomnia']['BMI Category'].value_counts()
insomnia_counts

BMI Category
Overweight    64
Normal         9
Obese          4
Name: count, dtype: int64

In [76]:

# Calculate the proportion of users with insomnia in each BMI category
insomnia_proportions = (insomnia_counts / bmi_counts) * 100

print("Proportion of users with insomnia in each BMI category:")
print(insomnia_proportions)


Proportion of users with insomnia in each BMI category:
BMI Category
Normal         4.166667
Obese         40.000000
Overweight    43.243243
Name: count, dtype: float64
