Skip to content
@cuban-digital-language

cuban-digital-language

Como es el español digital cubano❓

1- Mineria de datos :

  • redes sociales
    • Twitter (Scrapper) ✅
    • Youtube (API) ✅
    • CubaDebate (Scrapper) ✅
    • Facebook (Scrapper) ✅
    • Instagram
    • Whatsapp
    • Telegram ✅
    • Revolico
  • Corpus de la RAE (pyrae❓)

2- Análisis de palabras ajenas a la RAE:

  • Cantidad de diminutivos
    • Como reconocer diminutivos y sus significados
      • IA❓ Se puede hacer un modelo que dadas las principales reglas generadoras de diminutivos infiera el significado?
  • Cantidad de palabras de otros ideomas (inicialmente el ingles)
    • Corpus equivalente a la RAE en ingles?
  • Cantidad de faltas de ortografía:
    • IA❓ Un modelo que se aprenda los distintos corpus y dada un error diga la palabra real?

3- Análisis de texto:

  • Aplicar un MRI (Modelo de Recuperación de Información) sobre el corpus de todos los textos recolectados (SRI🔍📰)
  • Con la información de la RAE, los diminutivos, las faltas y las palabras en ingles generar un thesaurus (SRI🔍📰)
  • Dado una consulta hacer expanción de consulta apoyado en el thesaurus y recuperar los textos más relevantes (SRI🔍📰)
  • Dado el corpus de comentarios automatizar la generación de nuevos comentarios (IA🧠💻)
  • Mezclar los comentarios generados con los recuperados y proponer al lector detectar la IA (PD 📰🧑🏿‍💻)
  • Obterner retroalimentación del juego tanto para el SRI como para la IA
  • Empleando detección de contenidos y clustering generar curpos de prueba para evaluar el SRI (IA🧠💻)

4- Artículo de Periodismo de Datos y posicionamiento del repo

  • Usar las técnicas de SEO para ganar posicionamiento del artículo y de esta organizacion y sus repos (SRI🔍📰)

Pinned Loading

  1. methodology methodology Public

    List of documents that explain each of the organization's jobs

    1

  2. Models-for-Information-Retrieval Models-for-Information-Retrieval Public

    Some models for information retrieval in Spanish text corpus of the Cuban social network

    Python

  3. nlp-probabilistic-text-generator nlp-probabilistic-text-generator Public

    🤖Machine Learning model to generate text. It uses the structure and model of the language, and probabilistic tools such as Markov's chains and hidden processes.

    Jupyter Notebook

  4. nlp-rnn-text-generator nlp-rnn-text-generator Public

    🤖 Recurrent neural network to text generate

    Jupyter Notebook

  5. corpus-cluster-by-autoencode corpus-cluster-by-autoencode Public

    Python

  6. content-detection-and-corpus-clustering content-detection-and-corpus-clustering Public

    Jupyter Notebook

Repositories

Showing 10 of 19 repositories
  • nlp-probabilistic-text-generator Public

    🤖Machine Learning model to generate text. It uses the structure and model of the language, and probabilistic tools such as Markov's chains and hidden processes.

    cuban-digital-language/nlp-probabilistic-text-generator’s past year of commit activity
    Jupyter Notebook 0 MIT 0 0 0 Updated Nov 18, 2022
  • Models-for-Information-Retrieval Public

    Some models for information retrieval in Spanish text corpus of the Cuban social network

    cuban-digital-language/Models-for-Information-Retrieval’s past year of commit activity
    Python 0 MIT 0 0 0 Updated Jul 2, 2022
  • methodology Public

    List of documents that explain each of the organization's jobs

    cuban-digital-language/methodology’s past year of commit activity
    0 MIT 1 0 0 Updated Jun 30, 2022
  • nlp-rnn-text-generator Public

    🤖 Recurrent neural network to text generate

    cuban-digital-language/nlp-rnn-text-generator’s past year of commit activity
    Jupyter Notebook 0 MIT 0 0 0 Updated Jun 28, 2022
  • cuban-digital-language/content-detection-and-corpus-clustering’s past year of commit activity
    Jupyter Notebook 0 MIT 0 0 0 Updated Jun 25, 2022
  • data-mining Public

    Json extracted data and Python script to extracte them

    cuban-digital-language/data-mining’s past year of commit activity
    Python 1 MIT 0 0 0 Updated Jun 20, 2022
  • script-to-data-analysis Public

    Union to all repos and implementations for data analysis

    cuban-digital-language/script-to-data-analysis’s past year of commit activity
    Jupyter Notebook 0 MIT 1 0 0 Updated Jun 18, 2022
  • CubaCrawler Public Forked from hiancdtrsnm/CubaCrawler

    A collection of scrapper for cuban news sites

    cuban-digital-language/CubaCrawler’s past year of commit activity
    Python 0 MIT 2 0 0 Updated Jun 18, 2022
  • tokenizer-digital-language Public

    Custom tokenizer with spacy for detecte to typical expressions of Digital Language of hispano speaking community, especially of cuban community

    cuban-digital-language/tokenizer-digital-language’s past year of commit activity
    Python 0 MIT 0 0 0 Updated Jun 16, 2022
  • cuban-digital-language/corpus-cluster-by-autoencode’s past year of commit activity
    Python 0 MIT 0 0 0 Updated Jun 14, 2022

Top languages

Loading…

Most used topics

Loading…