### **1.Consumo di alcol per paese** 
Esegui un’**analisi esplorativa** focalizzata sul **consumo di alcol**.  
Analizza i seguenti aspetti:
* Visualizza i primi 10 paesi ordinati per total_litres_of_pure_alcohol (dal più alto)

* Calcola la media del consumo di birra, vino, e distillati

* Crea una nuova colonna alcohol_index che sia: `(beer_servings + wine_servings + spirit_servings) / 3`

* Trova il paese con il valore massimo di alcohol_index

* Filtra solo i paesi che consumano più di 100 birre all’anno

Crea un bar chart dei 10 paesi con più consumo totale (total_litres_of_pure_alcohol)

Crea un line plot con wine_servings ordinato per paese (usa sort_values)

In [None]:
import pandas as pd

df = pd.read_csv("https://raw.githubusercontent.com/fivethirtyeight/data/master/alcohol-consumption/drinks.csv")
print(df)

In [None]:
dieci_maggiori = df.sort_values("total_litres_of_pure_alcohol", ascending = False, inplace = False).head(10)
print(dieci_maggiori)

In [None]:
media_birra = df["beer_servings"].mean(axis=0)
media_vino = df["wine_servings"].mean(axis=0)
media_distillati = df["spirit_servings"].mean(axis=0)
print(media_birra, media_vino, media_distillati)

# oppure
df_means = df[["beer_servings", "wine_servings", "spirit_servings"]].mean(axis=0)
print(df_means)

In [None]:
df["alcohol_index"] = (df.beer_servings + df.wine_servings + df.spirit_servings) / 3
print(df.alcohol_index)

In [None]:
print(df.country[df['alcohol_index'].idxmax()])

# oppure
print(df.sort_values('alcohol_index', ascending = False).head(1).country)

# oppure
print(df[df['alcohol_index'] == df['alcohol_index'].max()].country)

In [None]:
df[df['beer_servings'] > 100]

In [None]:
import matplotlib.pyplot as plt

plt.bar(dieci_maggiori['country'], dieci_maggiori['total_litres_of_pure_alcohol'])
plt.xticks(rotation = 45, ha = 'right')
plt.show()

In [None]:
import numpy as np
ticks = np.array(df['country'].head(10), dtype = str)

df.sort_values('country')
df.head(10).plot(kind = 'line', y = 'wine_servings', x = 'country')
plt.xticks(rotation=45, ticks = range(10), labels = ticks)
plt.show()

### **2.Analisi offerte di lavoro** 

Esegui un’**analisi esplorativa** focalizzata sui **lavori nel campo dei dati in ciascun paese**.  
Analizza i seguenti aspetti per ogni paese:

* Lo **stipendio medio annuale** (`salary_year_avg`)
* Il **numero totale di offerte di lavoro** (job count)
* L’intervallo degli stipendi: **valore minimo e massimo** (`min` / `max`)

Rappresenta graficamente lo stipendio medio (`salary_year_avg`) per `job_title_short` usando un grafico a barre orizzontali. Ordina i dati dallo stipendio più alto al più basso. Includi un titolo e le etichette per gli assi x e y.

In [None]:
%pip install datasets

In [None]:
import pandas as pd
from datasets import load_dataset

dataset = load_dataset('lukebarousse/data_jobs')
df = dataset['train'].to_pandas()

df['job_posted_date'] = pd.to_datetime(df['job_posted_date'])
print(df)

In [None]:
stipendio_medio_annuale = df.groupby('job_country')['salary_year_avg'].mean()
print(stipendio_medio_annuale)

In [None]:
numero_offerte = df['job_country'].value_counts()
print(numero_offerte)

# oppure
numero_offerte = df.groupby('job_country').size()

In [None]:
intervalli_stipendi = df.groupby('job_country')['salary_year_avg'].agg(['min', 'max'])
print(intervalli_stipendi)

In [None]:
import matplotlib.pyplot as plt

media_stipendi_lavori = df.groupby('job_title_short')['salary_year_avg'].mean().sort_values(ascending=False)
media_stipendi_lavori.plot(kind='barh', color='blue')
plt.xlabel('Stipendio medio annuo')
plt.ylabel('Titolo di lavoro')
plt.title('Stipendi medi')
plt.show()