# **Recherche de Dataviz pour Dashboard Streamlit**

In [1]:
import pandas as pd

dataviz = pd.read_csv("../data/datasets/brut/table_fictive_dataviz_jp.csv")

In [2]:
dataviz.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 100 entries, 0 to 99
Data columns (total 14 columns):
 #   Column              Non-Null Count  Dtype 
---  ------              --------------  ----- 
 0   id_offre            100 non-null    object
 1   titre_poste         100 non-null    object
 2   entreprise          100 non-null    object
 3   lieu                100 non-null    object
 4   salaire             100 non-null    object
 5   type_contrat        100 non-null    object
 6   date_publication    100 non-null    object
 7   description         100 non-null    object
 8   lien_offre          100 non-null    object
 9   télétravail         100 non-null    object
 10  expérience_requise  100 non-null    object
 11  compétences         100 non-null    object
 12  secteur_activité    100 non-null    object
 13  source              100 non-null    object
dtypes: object(14)
memory usage: 11.1+ KB


## **Import des Bibliothèques nécessaires**

In [26]:
import plotly.express as px
import altair as alt
import pydeck as pdk
from bokeh.plotting import figure, output_file, show
from bokeh.models import ColumnDataSource, HoverTool
import streamlit as st
import matplotlib.pyplot as plt
import seaborn as sns
import nbformat

## **Bibliothèque Plotly**

### Graphiques en barres

In [29]:
fig_plotly_bar = px.bar(
    dataviz, 
    x="secteur_activité", 
    title="Nombre d'offres par secteur", 
    color="secteur_activité", 
    color_discrete_sequence=px.colors.sequential.Blues
)
fig_plotly_bar

ValueError: Mime type rendering requires nbformat>=4.2.0 but it is not installed

In [30]:
# Courbe d'évolution des offres (par date de publication)
dataviz["date_publication"] = pd.to_datetime(dataviz["date_publication"])
dataviz_groupes = dataviz.groupby("date_publication").size().reset_index(name="Nombre d'offres")
fig_plotly_line = px.line(dataviz_groupes, x="date_publication", y="Nombre d'offres", title="Évolution des offres d'emploi")
fig_plotly_line.show()

ValueError: Mime type rendering requires nbformat>=4.2.0 but it is not installed

In [22]:
# Données fictives
data = pd.DataFrame({
    "Type de Contrat": ["CDI", "CDD", "Freelance", "Stage", "Alternance"],
    "Nombre d'offres": [40, 25, 15, 10, 10]
})

# Création du pie chart
fig = px.pie(data, names="Type de Contrat", values="Nombre d'offres", title="Répartition des offres par type de contrat", color_discrete_sequence=px.colors.sequential.Blues)


fig


ValueError: Mime type rendering requires nbformat>=4.2.0 but it is not installed

## **Bibliothèque Altaïr**

In [32]:
# Histogramme du nombre d'offres par secteur d'activité
fig_altair_hist = alt.Chart(dataviz).mark_bar().encode(
    x=alt.X("secteur_activité", sort="-y", title="Secteur d'activité"),
    y=alt.Y("count()", title="Nombre d'offres"),
    color=alt.Color("secteur_activité", scale=alt.Scale(scheme="blues"))
).properties(
    title="Répartition des offres par secteur d'activité",
    width=600,
    height=400
)
fig_altair_hist

In [33]:
# Graphique en points (scatter) : Expérience requise vs Salaire
fig_altair_scatter = alt.Chart(dataviz).mark_circle(size=100).encode(
    x=alt.X("expérience_requise", title="Expérience requise", sort=["Junior", "Confirmé", "Senior"]),
    y=alt.Y("salaire", title="Fourchette de salaire"),
    color=alt.Color("expérience_requise", scale=alt.Scale(scheme="set2")),
    tooltip=["titre_poste", "entreprise", "lieu", "salaire"]
).properties(
    title="Relation entre l'expérience requise et le salaire",
    width=700,
    height=400
)
fig_altair_scatter

In [34]:
# Évolution temporelle des offres d'emploi par type de contrat
dataviz["date_publication"] = pd.to_datetime(dataviz["date_publication"])  # Conversion en datetime

fig_altair_line = alt.Chart(dataviz).mark_line(point=True).encode(
    x=alt.X("date_publication:T", title="Date de publication"),
    y=alt.Y("count()", title="Nombre d'offres"),
    color=alt.Color("type_contrat", scale=alt.Scale(scheme="category20")),
    tooltip=["date_publication", "type_contrat", "count()"]
).properties(
    title="Évolution du nombre d'offres par type de contrat",
    width=700,
    height=400
)
fig_altair_line

## **Bibliothèque Pydeck**

- Avoir les latitudes, longitudes

## **Bibliothèque Bokeh**

In [43]:
from bokeh.plotting import figure
from bokeh.models import ColumnDataSource, HoverTool

# Graphique interactif des compétences les plus demandées
comp_counts = dataviz["compétences"].str.split(", ").explode().value_counts()
source = ColumnDataSource(data=dict(competences=comp_counts.index, counts=comp_counts.values))

fig_bokeh_bar = figure(x_range=comp_counts.index.tolist(), height=400, title="Compétences les plus demandées",
                       toolbar_location=None, tools="")
fig_bokeh_bar.vbar(x="competences", top="counts", width=0.9, source=source)
fig_bokeh_bar.xgrid.grid_line_color = None
fig_bokeh_bar.add_tools(HoverTool(tooltips=[("Compétence", "@competences"), ("Nombre d'offres", "@counts")]))

In [44]:
# Pour importer les visuels dans VSCODE
from bokeh.io import output_notebook, show
output_notebook()
show(fig_bokeh_bar)

In [46]:
# Scatter plot interactif : Salaire vs Expérience requise
salaire_numerique = dataviz["salaire"].str.extract("(\d+)").astype(float).fillna(0)
experience_mapping = {"Junior": 1, "Confirmé": 2, "Senior": 3}
dataviz["experience_numeric"] = dataviz["expérience_requise"].map(experience_mapping)

fig_bokeh_scatter = figure(title="Salaire vs Expérience requise", x_axis_label="Expérience requise", y_axis_label="Salaire")
fig_bokeh_scatter.circle(dataviz["experience_numeric"], salaire_numerique)
show(fig_bokeh_scatter)


invalid escape sequence '\d'


invalid escape sequence '\d'


invalid escape sequence '\d'



In [48]:
# Évolution du nombre d'offres par date de publication
dataviz["date_publication"] = pd.to_datetime(dataviz["date_publication"])
dataviz_grouped = dataviz.groupby("date_publication").size().reset_index(name="Nombre d'offres")

fig_bokeh_line = figure(title="Évolution du nombre d'offres par date", x_axis_label="Date", y_axis_label="Nombre d'offres",
                        x_axis_type="datetime")
fig_bokeh_line.line(dataviz_grouped["date_publication"], dataviz_grouped["Nombre d'offres"], line_width=2)
show(fig_bokeh_line)


In [None]:
# Pour importer les visuels dans STREAMLIT
import streamlit as st
st.bokeh_chart(fig_bokeh_bar)
st.bokeh_chart(fig_bokeh_scatter)
st.bokeh_chart(fig_bokeh_line)

## **Bibliothèque Streamlit Elements**

In [50]:
import pandas as pd
from streamlit_elements import elements, mui, nivo

# Compter les offres par secteur
df_secteurs = dataviz["secteur_activité"].value_counts().reset_index()
df_secteurs.columns = ["secteur", "nombre"]

with elements("bar_chart"):
    nivo.Bar(
        data=df_secteurs.to_dict(orient="records"),
        keys=["nombre"],
        indexBy="secteur",
        margin={"top": 40, "right": 30, "bottom": 80, "left": 60},
        padding=0.3,
        colors={"scheme": "category10"},
        axisBottom={"tickRotation": -45},
    )





## **Bibliothèque PieCharts**