In [2]:
from stopword import stop_words
import re


def clean_text(text: str) -> str:
    """
    Clean text to prepare the matching with keyword_mapping.
        - Convert into lowercase
        - delete all punctuations (comma, dot, etc...)
        - Normalise spaces
        - Preserving commonly composed terms like "data scientist", "stagiaire informatique") 
   
    """
    if not isinstance(text, str):
        return ""

    # 1. Convert text to lowercase
    text= text.lower()
    
    # normalise spaces
    text = re.sub(r'\\n+', '\n', text)

    # 2. # Replace underscores, slashes with spaces (to separate words)
    text = re.sub(r"[-_/]", " ", text)

    # 3. # Delete all elements that is not a letter or a digit (with accents), a space, or a number
    text = re.sub(r"[^a-zàâäéèêëîïôöùûüç0-9\s]", " ", text)

    # - replace digits with an empty space
    text = re.sub(r"\d+", " ", text)

    # 4. Normalise multiple spaces
    text = re.sub(r"\s+", " ", text).strip()

    # - replacing unecessary terms like 'telma, galaxy', etc with an empty character
    text = re.sub(r"(telma|galaxy|diego|tamatave|axian|antananarivo|mahajanga|toamasina|andraharo|zone|futura|shore|andranomena|immeuble|mdg|batiment ariane|batiment|ariane|tana|antsirabe|fianarantsoa|kube|majunga|tolagnaro|er etage|mdg|mdg campus|campus)", '', text)

    # Removing french articles inside titles
    text = text.split()
    filtered_word = []
    for word in text:
        if word not in stop_words:
            word = filtered_word.append(word)
    text = ' '.join(filtered_word)

    return text

In [12]:
%run database_connection_.ipynb import df_database_connection as df


# apply the cleaning function for each column
for columns in df.select_dtypes('object').columns:
    if "profil_clean" not in columns: 
        df[columns] = df[columns].apply(clean_text)


df = df[['title_clean','mission_clean']]

df_clean_text =df

df_clean_text

!!We've got 1000 lines retrieved from the database !!


Unnamed: 0,title_clean,mission_clean
0,work force management rh,accompagner developpement recherchons aujourd hui workforce management rh charge structurer optimiser gestion effectifs role tete pont entre rh production tant work force management rh etes lien strategique entre gestion ressources humaines administration operationnelle assurez gestion fluide effectifs organisant mieux equipes booster engagement qualite missions quotidien gestion effectifs suivre plannings optimises fonction contraintes business ressources humaines suivre temps reel occupation equipes ajuster ressources consequence suivi performances reporting evaluer performance collaborateurs considerant objectifs definis fiche poste travailler etroite collaboration equipes rh operationnelles ajuster strategie analyser donnees rh absenteisme turn over charge travail proposer solutions amelioration coordination entre rh administration assurer communication fluide entre equipes rh finance operations garantir respect politiques rh procedures administratives gerer besoins contractuels administratifs lies effectifs contrats renouvellements conges etc optimisation processus rh identifier gains efficacite possibles gestion effectifs participer implementation solutions technologiques rh outils planification logiciels gestion effectifs former managers collaborateurs utilisation outils bonnes pratiques gestion personnel contribuer activement mise place systeme management qualite smq cadre certification iso vrai role jouer structuration processus rh suivi indicateurs qualite etre force proposition garant bonnes pratiques matiere audit qualite grace experience environnements certifies maitrise exigences iso
1,work force management rh,accompagner developpement recherchons aujourd hui workforce management rh charge structurer optimiser gestion effectifs role tete pont entre rh production tant work force management rh etes lien strategique entre gestion ressources humaines administration operationnelle assurez gestion fluide effectifs organisant mieux equipes booster engagement qualite missions quotidien gestion effectifs suivre plannings optimises fonction contraintes business ressources humaines suivre temps reel occupation equipes ajuster ressources consequence suivi performances reporting evaluer performance collaborateurs considerant objectifs definis fiche poste travailler etroite collaboration equipes rh operationnelles ajuster strategie analyser donnees rh absenteisme turn over charge travail proposer solutions amelioration coordination entre rh administration assurer communication fluide entre equipes rh finance operations garantir respect politiques rh procedures administratives gerer besoins contractuels administratifs lies effectifs contrats renouvellements conges etc optimisation processus rh identifier gains efficacite possibles gestion effectifs participer implementation solutions technologiques rh outils planification logiciels gestion effectifs former managers collaborateurs utilisation outils bonnes pratiques gestion personnel contribuer activement mise place systeme management qualite smq cadre certification iso vrai role jouer structuration processus rh suivi indicateurs qualite etre force proposition garant bonnes pratiques matiere audit qualite grace experience environnements certifies maitrise exigences iso
2,work force management rh,accompagner developpement recherchons aujourd hui workforce management rh charge structurer optimiser gestion effectifs role tete pont entre rh production tant work force management rh etes lien strategique entre gestion ressources humaines administration operationnelle assurez gestion fluide effectifs organisant mieux equipes booster engagement qualite missions quotidien gestion effectifs suivre plannings optimises fonction contraintes business ressources humaines suivre temps reel occupation equipes ajuster ressources consequence suivi performances reporting evaluer performance collaborateurs considerant objectifs definis fiche poste travailler etroite collaboration equipes rh operationnelles ajuster strategie analyser donnees rh absenteisme turn over charge travail proposer solutions amelioration coordination entre rh administration assurer communication fluide entre equipes rh finance operations garantir respect politiques rh procedures administratives gerer besoins contractuels administratifs lies effectifs contrats renouvellements conges etc optimisation processus rh identifier gains efficacite possibles gestion effectifs participer implementation solutions technologiques rh outils planification logiciels gestion effectifs former managers collaborateurs utilisation outils bonnes pratiques gestion personnel contribuer activement mise place systeme management qualite smq cadre certification iso vrai role jouer structuration processus rh suivi indicateurs qualite etre force proposition garant bonnes pratiques matiere audit qualite grace experience environnements certifies maitrise exigences iso
3,wordpress graphiste community manager notion ia,travailler sous wordpress faisant site dynamique leger agreable visuellement referencement seo ect savoir faire cartes visite flyers affiches gerer reseaux sociaux avoir notions community manager publication ect
4,webmaster charge marketing digital dovelec,recherchons webmaster charge marketing digital dynamique polyvalent gerer optimiser presence ligne travaillerez domaine porteur motivant energies renouvelables panneaux solaires pompes chaleur isolation gestion web cms mise jour quotidienne landing pages webflow autres cms creation publication contenus optimises seo articles pages offres analyse performance analyse mots cles positifs negatifs google ads analyse termes recherche recommandations optimisation prise decision autonome ameliorer qualite campagnes creation visuelle creation visuels attractifs via intelligence artificielle canva collaboration equipe graphistes finalisation presentiel lundi vendredi h h pause
5,webmaster designer developpeur application web,conception design concevoir architecture design application web respectant principes ux ui creer maquettes prototypes interactifs figma adobe xd sketch etc assurer coherence graphique conformite identite visuelle entreprise developpement developper application web utilisant technologies modernes html css javascript frameworks front end back end comme react angular vue js node js etc integrer fonctionnalites lien besoins utilisateurs objectifs entreprise optimiser code performances securite compatibilite multi plateforme maintenance suivi assurer mise jour maintenance application apres lancement surveiller performances resoudre eventuels bugs proposer ameliorations fonction retours utilisateurs
6,webmaster,concevoir developper administrer sites web sous wordpress effectuer mises jour regulieres cms themes extensions diagnostiquer resoudre eventuels problemes techniques
7,webmarketing manager,recuperation donnees ligne restaurants accompagnement clients creation site choix photos textes orientation textes seo proofreading redaction textes seo compte clients gestion sav niveau mail chat rdv telephoniques client entreprise creation site internet services seo destination petits commerces proximites cherchons profil nerd aime decouvrir apprendre appetence pousse webmarketing remuneration avantages salaire fixe parmi eleves marche commissions supplementaires objectif qualitatif quantitatif commerciaux uniquement augmentation salaire mois mutuelle complementaire remboursement integrale conjoint enfants retraite complementaire navette retour soir teletravail accepte partiel choisissez
8,webmarketing campaign manager,tant webmarketing campaign manager responsable gestion optimisation campagnes communication payantes google ads linkedin ads facebook ads ainsi autres plateformes publicite digitale travaillerez sein web agency captivea collaborerez directement clients externes situes france luxembourg etats unis canada singapour missions principales gestion campagnes publicitaires creer piloter optimiser campagnes google ads linkedin ads facebook ads autres campagnes payantes selon objectifs clients analyse reporting analyser performances campagnes fournir rapports reguliers proposer recommandations amelioration strategie communication elaborer mettre oeuvre strategies communication digitale adaptees besoins clients fonction marches locaux optimisation budgetaire gerer budgets publicitaires afin maximiser retour investissement chaque client veille concurrentielle technologique suivre pres tendances marche nouvelles fonctionnalites plateformes publicitaires meilleures pratiques secteur rester competitif innovant collaboration equipes clients etre contact regulier clients comprendre attentes ajuster campagnes fonction besoins specifiques
9,webmarketer seo,afin renforcer strategie referencement naturel recrutons webmarketer seo experimente si etes passionne optimisation moteurs recherche souhaitez evoluer environnement stimulant cette offre faite missions tant webmarketer seo responsable visibilite positionnement sites web entreprise moteurs recherche principales missions elaborer deployer strategies seo ameliorer classement pages web realiser audits seo techniques semantiques optimiser contenus referencement naturel mots cles balises maillage interne etc suivre evolutions algorithmes moteurs recherche google bing etc analyser performances seo proposer axes amelioration kpi google analytics google search console creer gerer strategie netlinking collaborer equipes marketing editoriales techniques mise place optimisations seo mettre place veille concurrentielle suivre tendances seo
