Skip to content

Chris-cod/Sueza_project

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

16 Commits
 
 
 
 
 
 

Repository files navigation

Sueza project

fg

But du projet (French)

1- L’objectif de ce projet est de créer une base de données numérique textuelle pour la revitalisation des langues maternelles camerounaise. Ceci dans le but de permettre aux étudiants et aux enseignants captivés par l’intelligence artificielle, l’analyse des textes et la valorisation des langues par le biais de l'IA puissent l’utiliser. Ainsi, elle pourra être utilisée dans le cadre d’une thèse de master, de l’enseignement de Natural Langage Processing dans les universités, et du développement d’applications et système de traduction sophistiqué. Ces langues en voie de disparition pourront renaître de leur centre.Ce projet open source baptisé projet Sueza est ouvert a toute personne désirant contribuer par ces connaissances en informatiques, littéraires et autres.

2- À partir du jeu de données collectées, un jeu de données contenant des connecteurs logiques pour une langue donnée va être construit. Nous allons ensuite construire le package R/python pour effectuer l'extraction des connecteurs logiques dans un texte écrit en langue camerounaise.

3- Une base de donne numérique contenant les images des plats traditionnelles camerounais devra être construit. Ensuit annoter en différentes langues afin de permettre aux personnes captive par l’apprentissage profond de l’exploiter pour créer et entraîner des modèles de détection et d'identification automatique de nos différents plats.

4- La dernière phase de projet sera de créer un système de traduction automation, de correction d'orthographe et grammaire, et de vérification de la forme de construction des phrases rédiger en nos différentes langues.

Project Goal (English)

1- The objective of this project is to create a digital textual database for the revitalization of marginalized Cameroonian languages. This is to allow students and teachers captivated by artificial intelligence, text analysis, and language enhancement through AI to use it. Thus, it can be used in the context of a master's thesis, the teaching of Natural Language Processing in universities, and the development of applications and sophisticated translation systems. These endangered languages will be reborn from their center. This project is called Project Sueza and is an open-source project. Anyone who wishes to contribute with their knowledge of computer science, literature, and other subjects is welcome.

2- From the dataset collect, a dataset containing stoping words for a given language is going to be built. we will then construct the R/python package to perform stopping word extraction in Cameroonian language writing text.

3- We need to develop a database of traditional Cameroonian dishes with annotations. The annotation will be in a variety of languages to allow deep learning enthusiasts to use it to train models that can detect and identify our different dishes.

4- To be set

Community

joins slack comunity

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published