#Life Expectancy in Tunisia

Tunisia, like the developing countries, will experience an aging population and this
phenomenon inherited as a result of its rapid demographic transition, will continue to
increase over the coming years. The evolution of mortality, especially at older ages, will help
greatly, hence the importance of knowing the latest developments and future. It appears as
imperative to focus on the recent and future evolution of life years gained through increased
longevity.

In Tunisia, life expectancy has increased in recent decades and the country ranks
consistently among the first countries in the Arab world but is still far in the world (82th).
Prospective analyzes of mortality lead to anticipate future changes in death rates at different
ages. They propose a stochastic model building prospective tables, model Lee-Carter, where
future mortality drift is anticipated based on past observations.http://www.itceq.tn/wp-content/uploads/files/notes2017/esperance-de-vie-en-2039.pdf

![](https://encrypted-tbn0.gstatic.com/images?q=tbn%3AANd9GcQyl5XBR58FLffy-wfiDwW9LK4IZ-L_SKbsog&usqp=CAU)msn.com

In [None]:
# This Python 3 environment comes with many helpful analytics libraries installed
# It is defined by the kaggle/python Docker image: https://github.com/kaggle/docker-python
# For example, here's several helpful packages to load

import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
import matplotlib.pyplot as plt #visualization
import seaborn as sns
%matplotlib inline
import plotly.express as px
import plotly.graph_objects as go
import plotly.offline as py
import plotly.express as px

# Input data files are available in the read-only "../input/" directory
# For example, running this (by clicking run or pressing Shift+Enter) will list all files under the input directory

import os
for dirname, _, filenames in os.walk('/kaggle/input'):
    for filename in filenames:
        print(os.path.join(dirname, filename))

# You can write up to 5GB to the current directory (/kaggle/working/) that gets preserved as output when you create a version using "Save & Run All" 
# You can also write temporary files to /kaggle/temp/, but they won't be saved outside of the current session

En Tunisie, la vaccination occupe une place importante dans le système de santé et est
gratuite. Le programme national a été lancé depuis 1979. En plus du programme élargi de
vaccination établi par l’OMS (couvrant la poliomyélite – la rougeole – la diphtérie – la
coqueluche – le tétanos, la tuberculose et l’hépatite B), la Tunisie a introduit le vaccin de
l’hépatite A, celui contre l’Haemophilusinfluenzae de type B (Hib) et récemment le vaccin
anti-pneumococciques (2019). Le vaccin anti-rotavirus et l’anti HPV (papillomavirus
humain) ne sont pas encore introduits.

Le vaccin BCG protège surtout l'enfant 'contre les formes graves et.- souvent
mortelles de la maladie. Jusqu'à t'âge de 15 ans le taux de protection est d’environ 85 %
contre tes méningites et 75 % contre ta tuberculose miliaire_ Le taux de protection chez
l’adulte descend à moins de 50%.
Les contre-indications à la vaccination par le B.C.G. sont : les déficits immunitaires
congénitaux ou acquis touchant à l’immunité cellulaire
Les effets secondaires du BCG peuvent être associés à une mauvaise technique
d'administration et surtout à une dilution insuffisante. Ils sont habituellement localisés
(BCGites), bénins et ne nécessite pas de traitement:
•Apparition d'un érythème, d'une papule ou d'une ulcération au point de ponction avec
cicatrice dans les suites
•Ulcération cutanée persistante
•Adénite inflammatoire (inflammation du ganglion axillaire du côté du bras vacciné) parfois
importante ou suppurée. Formation de cicatrices chéloïdes inesthétiques
•C'est lorsqu'il préexiste un déficit immunitaire que s'observe la complication la plus grave du
BCG : l'infection disséminée par le BCG, qui est enregistrée chez trois vaccinés pour un
million et fatale chez 0,02 vacciné pour un million en raison de déficits immunitaires.http://www.fmt.rnu.tn 

In [None]:
df = pd.read_csv('../input/esperance-de-vie-et-immunisation-chez-les-enfants/myData.csv', encoding='ISO-8859-2')
df.head()

#EsperanceDeVie = espérance de vie (en année). Years of life.

#L’immunisation contre la coqueluche, la diphtérie et le tétanos en TUNISIE : elle s'étend de 1983 à 2016.  DCT = Diphtheria, Coqueluche (Pertussis, aka whooping cough) and Tetanus.

In [None]:
cnt_srs = df['EsperanceDeVie'].value_counts().head()
trace = go.Bar(
    y=cnt_srs.index[::-1],
    x=cnt_srs.values[::-1],
    orientation = 'h',
    marker=dict(
        color=cnt_srs.values[::-1],
        colorscale = 'Blues',
        reversescale = True
    ),
)

layout = dict(
    title='Life Expectancy Distribution',
    )
data = [trace]
fig = go.Figure(data=data, layout=layout)
py.iplot(fig, filename="EsperanceDeVie")

La vaccination constitue avec l’hygiène et la nutrition, l’élément majeur de la santé publique.
De nombreux vaccins vont être mis au point dans les années à venir. Ceci a deux
conséquences essentielles : les combinaisons ou associations de vaccins deviennent une
nécessité d’une part, et les calendriers de vaccinations sont souvent modifiés d’autre part. La
gestion des vaccinations, l’évaluation des programmes sur le plan opérationnel et par la
mesure de la couverture vaccinale, et sur le plan épidémiologique par la surveillance des
maladies évitables par vaccination doivent également être considérées comme des priorités. http://www.fmt.rnu.tn 

In [None]:
#Codes from Mario Filho
from category_encoders import OneHotEncoder
from sklearn.linear_model import LinearRegression, Ridge
from sklearn.preprocessing import StandardScaler, MinMaxScaler, MaxAbsScaler

cols_selected = ['EsperanceDeVie']
ohe = OneHotEncoder(cols=cols_selected, use_cat_names=True)
df_t = ohe.fit_transform(df[cols_selected+['Date']])

#scaler = MaxAbsScaler()
X = df_t.iloc[:,:-1]
y = df_t.iloc[:, -1].fillna(df_t.iloc[:, -1].mean()) / df_t.iloc[:, -1].max()

mdl = Ridge(alpha=0.1)
mdl.fit(X,y)

pd.Series(mdl.coef_, index=X.columns).sort_values().head(10).plot.barh()

In [None]:
#Codes from Mario Filho
from category_encoders import OneHotEncoder
from sklearn.linear_model import LinearRegression, Ridge
from sklearn.preprocessing import StandardScaler, MinMaxScaler, MaxAbsScaler

cols_selected = ['IMM.dct']
ohe = OneHotEncoder(cols=cols_selected, use_cat_names=True)
df_t = ohe.fit_transform(df[cols_selected+['Date']])

#scaler = MaxAbsScaler()
X = df_t.iloc[:,:-1]
y = df_t.iloc[:, -1].fillna(df_t.iloc[:, -1].mean()) / df_t.iloc[:, -1].max()

mdl = Ridge(alpha=0.1)
mdl.fit(X,y)

pd.Series(mdl.coef_, index=X.columns).sort_values().head(10).plot.barh()

In [None]:
ax = df.groupby('EsperanceDeVie')['Date'].mean().plot(kind='barh', figsize=(12,8),
                                                           title='Mean Life Expectancy')
plt.xlabel('Mean Life Expectancy')
plt.ylabel('Date')
plt.show()

In [None]:
ax = df.groupby('EsperanceDeVie')['IMM.rougeole', 'IMM.dct'].sum().plot(kind='bar', rot=45, figsize=(12,6), logy=True,
                                                                 title='Life Expectancy and Immunisation Coverage')
plt.xlabel('Life Expectancy')
plt.ylabel('log')

plt.show()

In [None]:
ax = df.groupby('EsperanceDeVie')['IMM.rougeole', 'IMM.dct'].sum().plot(kind='barh', figsize=(14,8),
                                                                 title='Life Expectancy and Immunisation Coverage', logx=True, linewidth=3)
plt.xlabel('Log')
plt.ylabel('Life Expectancy')
plt.show()

In [None]:
fig=sns.lmplot(x='Date', y="EsperanceDeVie",data=df)

In [None]:
import matplotlib.ticker as ticker
ax = sns.distplot(df['EsperanceDeVie'])
plt.xticks(rotation=45)
ax.xaxis.set_major_locator(ticker.MultipleLocator(2))
figsize=(10, 4)

In [None]:
from scipy.stats import norm, skew #for some statistics
import seaborn as sb
from scipy import stats #qqplot
#Lets check the ditribution of the target variable (Placement?)
from matplotlib import rcParams
# figure size in inches
rcParams['figure.figsize'] = 4,2

sb.distplot(df['EsperanceDeVie'], fit=norm)

#Get the QQ-plot
fig = plt.figure()
res = stats.probplot(df['EsperanceDeVie'], plot=plt)
plt.show()

In [None]:
plt.style.use('fivethirtyeight')
df.plot(subplots=True, figsize=(4, 4), sharex=False, sharey=False)
plt.show()

In [None]:
fig, ax = plt.subplots(1,3, figsize = (20,6), sharex=True)
sns.countplot(x='EsperanceDeVie',data=df, palette="copper", ax=ax[0])
sns.countplot(x='EsperanceDeVie',hue='IMM.rougeole', palette="ocean", data=df,ax=ax[1])
sns.countplot(x='EsperanceDeVie',hue='IMM.dct', palette="flag", data=df,ax=ax[2])
ax[0].title.set_text('Life Expectancy')
ax[1].title.set_text('Life Expectancy and Rougeole')
ax[2].title.set_text('Life Expectancy and DCT')
plt.xticks(rotation=45)
plt.show()

In [None]:
ls ../input/hackathon/task_1-google_search_txt_files_v2/TN/

In [None]:
Tunisia = '../input/hackathon/task_1-google_search_txt_files_v2/TN/Tunisia-en-result-114-original.txt'

In [None]:
text = open(Tunisia, 'r',encoding='utf-8',
                 errors='ignore').read()

In [None]:
print(text[:2000])

In [None]:
df1 = pd.read_csv('../input/hackathon/task_2-Tuberculosis_infection_estimates_for_2018.csv', encoding='utf8')
df1.head()

In [None]:
tunisie = df1[(df1['country']=='Tunisia')].reset_index(drop=True)
tunisie.head()

In [None]:
#word cloud
from wordcloud import WordCloud, ImageColorGenerator
text = " ".join(str(each) for each in tunisie.country)
# Create and generate a word cloud image:
wordcloud = WordCloud(max_words=200,colormap='Set3', background_color="black").generate(text)
plt.figure(figsize=(10,6))
plt.figure(figsize=(15,10))
# Display the generated image:
plt.imshow(wordcloud, interpolation='Bilinear')
plt.axis("off")
plt.figure(1,figsize=(12, 12))
plt.show()

Das War's, Kaggle Notebook Runner: Marília Prata  @mpwolke