# Punto 3

El presente proyecto requiere de instalar las siguiente dependencia mendiante Maven, esto puede hacerse sin tener un proyecto de Maven mediante IntelliJ yendo directamente al apartado de librerías del proyecto [Control + Alt + Shift + S]

### Añadir la siguientes librerías:
```xml
org.jetbrains.kotlinx.dataframe
kennycason.kumo.core
jetbrains.kotlinx.kandy.lets.plot
```

In [1243]:
import javax.xml.crypto.Data
import java.util.*
import kotlin.collections.*
import org.jetbrains.kotlinx.dataframe.*
import org.jetbrains.kotlinx.dataframe.api.*
import org.jetbrains.kotlinx.dataframe.io.*
import com.kennycason.kumo.*
import com.kennycason.kumo.palette.*
import com.kennycason.kumo.font.*
import com.kennycason.kumo.nlp.FrequencyAnalyzer
import org.jetbrains.kotlinx.kandy.letsplot.*
import java.util.Locale
import kotlin.random.Random // Para Random.nextInt()

// Dataframe
import org.jetbrains.kotlinx.dataframe.DataFrame
import org.jetbrains.kotlinx.dataframe.api.* // API principal de DataFrame (incluye get, filter, map, etc.)
import org.jetbrains.kotlinx.dataframe.io.* // Para readCSV, etc.
import org.jetbrains.kotlinx.dataframe.columns.* // Para DataColumn, ValueColumn si necesitas tipos explícitos

// Para renderizar HTML
import org.jetbrains.kotlinx.jupyter.api.HTML

// Para Kumo (nubes de palabras)
import com.kennycason.kumo.WordCloud
import com.kennycason.kumo.WordFrequency
import com.kennycason.kumo.CollisionMode
import com.kennycason.kumo.bg.CircleBackground
import com.kennycason.kumo.font.scale.SqrtFontScalar
import com.kennycason.kumo.palette.ColorPalette
import java.awt.Color
import java.awt.Dimension
import java.io.ByteArrayOutputStream
import java.util.Base64
// Ya que usas Maven en IntelliJ o en tu kernel de Jupyter:


In [1201]:
var df_terms = DataFrame.readCSV("./terms.csv") // Cambia la ruta al archivo CSV
val df_resources = DataFrame.readCSV("../../resources/collection.csv") // Cambia la ruta al archivo CSV

# Logica para algoritmo Z

In [1202]:
/**
 * Computes the Z-array for a given string s.
 * Z[i] = length of the longest substring starting at i
 * which is also a prefix of s.
 */
fun calculateZ(s: String): IntArray {
    val n = s.length
    val z = IntArray(n)
    var l = 0
    var r = 0

    for (i in 1 until n) {
        if (i > r) {
            // Case 1: i is outside the current Z-box
            l = i
            r = i
            while (r < n && s[r] == s[r - l]) {
                r++
            }
            z[i] = r - l
            r--
        } else {
            // Case 2: i is inside the current Z-box
            val k = i - l
            if (z[k] < r - i + 1) {
                // Case 2a: z[k] does not stretch outside the box
                z[i] = z[k]
            } else {
                // Case 2b: z[k] might stretch outside, so we compare manually
                l = i
                while (r < n && s[r] == s[r - l]) {
                    r++
                }
                z[i] = r - l
                r--
            }
        }
    }
    return z
}

/**
 * Finds all occurrences of `pattern` in `text` using the Z-algorithm.
 * Returns a list of starting indices in `text`.
 */
fun zAlgorithm(pattern: String, text: String): kotlin.collections.List<Int> {
    // Combine pattern, a delimiter not in pattern/text, and text
    val combined = pattern + "$" + text
    val z = calculateZ(combined)
    val m = pattern.length
    val result = mutableListOf<Int>()

    for (i in z.indices) {
        if (z[i] == m) {
            // i - m - 1 compensates for pattern + delimiter
            result.add(i - m - 1)
        }
    }
    return result
}

# Lógica

algunas funciones auxiliares que vamos a usar más adelante

In [1203]:
/**
 * If any term in list of terms is a compound one, i.e, has more than one word, then Z algorithm with original abstract is used
 * If not, then, another algorithm is used -> The abstract is sorted and then the single word term is search
 * effienctly using binary search.
 * @param abstract shouldnt be sorted in this function.
 */
fun countTerms(terms: kotlin.collections.List<String>, abstract: String): Int {
    var count = 0
    for (term in terms) {
        if (term.split(" ").size >= 2) count += searchCompoundTerm(term, abstract)
        else count += countWordOccurrences(term, sortAndCleanAbstract(abstract))

    }
    return count
}

fun searchCompoundTerm(term: String, abstract: String) = zAlgorithm(
    term.lowercase(Locale.getDefault()),
    abstract.lowercase(Locale.getDefault())
).size



fun sortAndCleanAbstract(abstract: String): kotlin.collections.List<String> = abstract
    .lowercase(Locale.getDefault())
    .split("\\s+".toRegex())
    .asSequence()
    .map { it.trim().replace(Regex("""^\p{Punct}+|\p{Punct}+$"""), "") }
    .filter { it.isNotEmpty() }
    .sorted()
    .toList()

fun countWordOccurrences(word: String, sortedList: kotlin.collections.List<String>): Int {
    // Find any occurrence with binary search
    val index = Collections.binarySearch(sortedList, word)

    // Word not found
    if (index < 0) {
        return 0
    }

    // Count all occurrences (left and right of found index)
    var count = 1

    // Check left side
    var left = index - 1
    while (left >= 0 && sortedList[left] == word) {
        count++
        left--
    }

    // Check right side
    var right = index + 1
    while (right < sortedList.size && sortedList[right] == word) {
        count++
        right++
    }

    return count
}

fun countSetOfTerms(setOfTerms: kotlin.collections.List<String>, sortedList: kotlin.collections.List<String>): Int {
    var count = 0
    for (term in setOfTerms) {
        count += countWordOccurrences(term, sortedList)
    }
    return count
}

// Función para filtrar variables y sinonimos por categoría
fun filterByCategory(df: DataFrame<*>, category: String): kotlin.collections.List<kotlin.collections.List<String>> {
    var res = mutableListOf<kotlin.collections.List<String>>();
    df.filter { it.get("Categoria") == category }.rows().forEach { row ->
        val variable = row["Variable"] as String
        val synonymsStr = row["Sinonimos"] as String?

        // Create a mutable list starting with the variable
        val termList = mutableListOf(variable)

        // Add synonyms if they exist
        if (!synonymsStr.isNullOrEmpty()) {
            // Split synonyms by "|" and add them to the list
            termList.addAll(synonymsStr.split("|").map { it.trim().lowercase(Locale.getDefault()) })

        }

        // Add the complete list to our collection
        res.add(termList.toList())
    }
    return res.toList()
}


/**
 * Calculates the frequency of terms across a list of abstracts and returns sorted results
 *
 * @param termsList List of term lists (each inner list contains a term and its synonyms)
 * @param abstracts List of abstracts to search within
 * @return List of pairs containing term strings and their frequencies, sorted by frequency (descending)
 */
fun calculateTermFrequencies(
    termsList: kotlin.collections.List<kotlin.collections.List<String>>,
    abstracts: kotlin.collections.List<String>
): kotlin.collections.List<Pair<String, Int>> {
    val pairTermsFreq = mutableListOf<Pair<String, Int>>()

    termsList.forEach { terms ->
        // Calculate total count across all abstracts for this term
        val totalCount = abstracts.sumOf { abstract ->
            countTerms(terms, abstract)
        }
        // Add single entry with combined count
        pairTermsFreq.add(Pair(terms.joinToString(", "), totalCount))
    }

    // Sort by frequency (descending)
    return pairTermsFreq.sortedByDescending { it.second }
}

# Esquema de la base de datos

In [1204]:
// Imprimir el esquema de la base de datos
df_terms.schema()

Categoria: String
Variable: String
Sinonimos: String?

In [1205]:
import java.util.*

// Convert both "Variable" and "Sinonimos" columns to lowercase
df_terms = df_terms
.update { Variable }
.with { it.lowercase(Locale.getDefault()) }

.update { Sinonimos }
.with { it?.lowercase(Locale.getDefault()) }


df_terms

Categoria,Variable,Sinonimos
Habilidades,abstraction,
Habilidades,algorithm,
Habilidades,algorithmic thinking,
Habilidades,coding,
Habilidades,collaboration,
Habilidades,cooperation,
Habilidades,creativity,
Habilidades,critical thinking,
Habilidades,debug,
Habilidades,decomposition,


In [1206]:
//Imprimimos las categorías
df_terms.distinct { Categoria }

Categoria
Habilidades
Conceptos Computacionales
Actitudes
Propiedades psicométricas
Herramienta de evaluación
Diseño de investigación
Nivel de escolaridad
Medio
Estrategia
Herramienta


## Lista de listas de terminos por categorias

In [1207]:
val terms_habilidades = filterByCategory(df_terms, "Habilidades")
val terms_conceptos_comp = filterByCategory(df_terms, "Conceptos Computacionales")
val terms_actitudes= filterByCategory(df_terms, "Actitudes")
val terms_prop_psico = filterByCategory(df_terms, "Propiedades psicométricas")
val terms_herramienta_eval = filterByCategory(df_terms, "Herramienta de evaluación")
val terms_disenio_inves = filterByCategory(df_terms, "Diseño de investigación")
val terms_nivel_escol = filterByCategory(df_terms, "Nivel de escolaridad")
val terms_medio = filterByCategory(df_terms, "Medio")
val terms_estrate = filterByCategory(df_terms, "Estrategia")
val terms_herramienta = filterByCategory(df_terms, "Herramienta")


In [1208]:
terms_habilidades//.filter { it.size > 1 }.forEach { println(it) }

[[abstraction], [algorithm], [algorithmic thinking], [coding], [collaboration], [cooperation], [creativity], [critical thinking], [debug], [decomposition], [evaluation], [generalization], [logic], [logical thinking], [modularity], [patterns recognition], [problem solving], [programming]]

## Obtenemos la lista de abstracts


In [1209]:
//Obtenemos la lista de abstracts.
// Hasta la fecha (Mayo 1, tenemos aproximadamente 800 abstracts)
val list_of_abstracts: kotlin.collections.List<String> = df_resources.get { Abstract }.filter { !it.isNullOrEmpty() }.toList() as kotlin.collections.List<String>

# Frecuencia de aparición de términos en la categoría "Habilidades"

El siguiente bloque de codigo une los resultados de la columna "variable" y la columna "sinonimos" en una sola lista y la almacena en una variable (tambien una lista de listas)
 llamada "terms".

Es decir, tenemos una lista de listas con los terminos y sus respectivos sinonimos.

In [1210]:
val sortedResults = calculateTermFrequencies(terms_habilidades, list_of_abstracts)

plot {
    bars {
        x(sortedResults.map { it.first }.toList(), "Termino") {scale = categorical()}
        y(sortedResults.map { it.second }.toList(), "Frecuencia")
    }
}



# Nube de palabras para Frecuencia de aparición de términos en la categoría "Habilidades"



In [1211]:

import com.kennycason.kumo.WordCloud
import com.kennycason.kumo.WordFrequency
import com.kennycason.kumo.CollisionMode
import com.kennycason.kumo.bg.CircleBackground
import com.kennycason.kumo.font.scale.SqrtFontScalar
import com.kennycason.kumo.palette.ColorPalette
import java.awt.Color
import java.awt.Dimension
import java.io.ByteArrayOutputStream
import java.util.Base64
import org.jetbrains.kotlinx.jupyter.api.HTML

// 1. Convertir 'sortedResults' al formato de Kumo
val wordFrequenciesForKumo = sortedResults
    .filter { it.second > 0 }
    .map { WordFrequency(it.first, it.second) }

// 2. La variable 'outputToDisplayInJupyter' obtendrá su valor del resultado del if-else.
val outputToDisplayInJupyter: Any = if (wordFrequenciesForKumo.isNotEmpty()) {
    // Hay datos, procedemos a generar la nube

    // 3. Configuración de Kumo
    val imageDimensions = Dimension(700, 500)
    val kumoWordCloud = WordCloud(imageDimensions, CollisionMode.RECTANGLE)
    kumoWordCloud.setPadding(3)
    kumoWordCloud.setBackground(CircleBackground(240))
    kumoWordCloud.setBackgroundColor(Color(0xFF, 0xFF, 0xFF, 0))
    val kumoColorPalette = ColorPalette(
        Color(0x283593), Color(0x303F9F), Color(0x3F51B5),
        Color(0x5C6BC0), Color(0x7986CB), Color(0x1565C0)
    )
    kumoWordCloud.setColorPalette(kumoColorPalette)
    kumoWordCloud.setFontScalar(SqrtFontScalar(12, 70))

    println("Construyendo nube de palabras para 'Habilidades'...")
    kumoWordCloud.build(wordFrequenciesForKumo)
    println("Nube de palabras para 'Habilidades' construida.")

    val imageOutputStream = ByteArrayOutputStream()

    // 4. El bloque try-catch también es una expresión aquí.
    // Su resultado (un objeto HTML) se convertirá en el resultado del bloque 'if'.
    try {
        kumoWordCloud.writeToStreamAsPNG(imageOutputStream)
        val imageBytes = imageOutputStream.toByteArray()
        val base64EncodedImage = Base64.getEncoder().encodeToString(imageBytes)
        val htmlString = """<img src="data:image/png;base64,$base64EncodedImage" alt="Nube de Palabras para Habilidades"/>"""
        HTML(htmlString) // Esto es lo que devuelve el 'try' si tiene éxito
    } catch (e: Exception) {
        println("ERROR al generar la imagen de la nube de palabras para 'Habilidades': ${e.message}")
        HTML("<b>Error generando la nube de palabras:</b> ${e.message?.replace("<", "&lt;")?.replace(">", "&gt;")}")
    }

} else {

    println("No hay datos con frecuencia positiva para generar la nube de palabras de 'Habilidades'.")
    HTML("<i>No se encontraron datos para la nube de palabras de 'Habilidades'.</i>")
}


outputToDisplayInJupyter


Construyendo nube de palabras para 'Habilidades'...
Nube de palabras para 'Habilidades' construida.


# Funciones para CO-OCURRENCIA

# Frecuencia de aparición de términos en la categoría "Conceptos Computacionales"

In [1213]:
val sortedResult = calculateTermFrequencies(terms_conceptos_comp, list_of_abstracts)

plot {
    bars {
        x(sortedResult.map { it.first }.toList(), "Termino") {scale = categorical()}
        y(sortedResult.map { it.second }.toList(), "Frecuencia")
    }
}

# Nube de Palabras para Frecuencia de aparición de términos en la categoría "Conceptos Computacionales"


In [1215]:

val wordFrequenciesForKumoConceptos = sortedResult // Usamos la variable 'sortedResult' de esta sección
    .filter { it.second > 0 } // Solo palabras con frecuencia positiva
    .map { WordFrequency(it.first, it.second) } // it.first es el término, it.second es la frecuencia

// 2. La variable 'outputToDisplayInJupyterConceptos' obtendrá su valor del resultado del if-else.
val outputToDisplayInJupyterConceptos: Any = if (wordFrequenciesForKumoConceptos.isNotEmpty()) {
    // Hay datos, procedemos a generar la nube

    // 3. Configuración de Kumo
    val imageDimensionsConceptos = Dimension(700, 500)
    val kumoWordCloudConceptos = WordCloud(imageDimensionsConceptos, CollisionMode.RECTANGLE)
    kumoWordCloudConceptos.setPadding(3) // Espacio entre palabras


    kumoWordCloudConceptos.setBackground(CircleBackground(240))
    kumoWordCloudConceptos.setBackgroundColor(Color(0xFF, 0xFF, 0xFF, 0))


    val kumoColorPaletteConceptos = ColorPalette(
        Color(0x00695C), // Teal Darken-3
        Color(0x00796B), // Teal Darken-2
        Color(0x00897B), // Teal Darken-1
        Color(0x009688), // Teal
        Color(0x26A69A), // Teal Lighten-1
        Color(0x4DB6AC)  // Teal Lighten-2
    )
    kumoWordCloudConceptos.setColorPalette(kumoColorPaletteConceptos)


    kumoWordCloudConceptos.setFontScalar(SqrtFontScalar(12, 65))

    println("Construyendo nube de palabras para 'Conceptos Computacionales'...")
    kumoWordCloudConceptos.build(wordFrequenciesForKumoConceptos)
    println("Nube de palabras para 'Conceptos Computacionales' construida.")

    val imageOutputStreamConceptos = ByteArrayOutputStream()

    // 4. El bloque try-catch para generar y codificar la imagen
    try {
        kumoWordCloudConceptos.writeToStreamAsPNG(imageOutputStreamConceptos)
        val imageBytesConceptos = imageOutputStreamConceptos.toByteArray()
        val base64EncodedImageConceptos = Base64.getEncoder().encodeToString(imageBytesConceptos)
        val htmlStringConceptos = """<img src="data:image/png;base64,$base64EncodedImageConceptos" alt="Nube de Palabras para Conceptos Computacionales"/>"""
        HTML(htmlStringConceptos)
    } catch (e: Exception) {
        println("ERROR al generar la imagen de la nube de palabras para 'Conceptos Computacionales': ${e.message}")
        HTML("<b>Error generando la nube de palabras:</b> ${e.message?.replace("<", "&lt;")?.replace(">", "&gt;")}")
    }

} else {
    println("No hay datos con frecuencia positiva para generar la nube de palabras de 'Conceptos Computacionales'.")
    HTML("<i>No se encontraron datos para la nube de palabras de 'Conceptos Computacionales'.</i>")
}

outputToDisplayInJupyterConceptos


Construyendo nube de palabras para 'Conceptos Computacionales'...
Nube de palabras para 'Conceptos Computacionales' construida.


# Frecuencia de aparición de términos en la categoría "Actitudes"

In [1216]:
val sortedResult = calculateTermFrequencies(terms_actitudes, list_of_abstracts)
plot {
    bars {
        x(sortedResult.map { it.first }.toList(), "Termino") {scale = categorical()}
        y(sortedResult.map { it.second }.toList(), "Frecuencia")
    }
}

# Nube de Palabras para Frecuencia de aparición de términos en la categoría "Actitudes"


In [1217]:

import com.kennycason.kumo.WordCloud
import com.kennycason.kumo.WordFrequency
import com.kennycason.kumo.CollisionMode
import com.kennycason.kumo.bg.RectangleBackground
import com.kennycason.kumo.font.scale.LinearFontScalar
import com.kennycason.kumo.palette.ColorPalette
import java.awt.Color
import java.awt.Dimension
import java.io.ByteArrayOutputStream
import java.util.Base64
import org.jetbrains.kotlinx.jupyter.api.HTML


val wordFrequenciesForKumoActitudes = sortedResult
    .filter { it.second > 0 }
    .map { WordFrequency(it.first, it.second) }

val outputToDisplayInJupyterActitudes: Any = if (wordFrequenciesForKumoActitudes.isNotEmpty()) {

    val imageDimensionsActitudes = Dimension(800, 500)
    val kumoWordCloudActitudes = WordCloud(imageDimensionsActitudes, CollisionMode.RECTANGLE)
    kumoWordCloudActitudes.setPadding(1)

    kumoWordCloudActitudes.setBackground(RectangleBackground(imageDimensionsActitudes))
    kumoWordCloudActitudes.setBackgroundColor(Color.WHITE)


    val kumoColorPaletteActitudes = ColorPalette(
        Color(0xFF6F00),
        Color(0xFF8F00),
        Color(0xFFA000),
        Color(0xFFB300),
        Color(0xFFC107),
        Color(0xFFD770)
    )
    kumoWordCloudActitudes.setColorPalette(kumoColorPaletteActitudes)


    val minFontSizeActitudes = 10
    val maxFontSizeActitudes = 75
    kumoWordCloudActitudes.setFontScalar(LinearFontScalar(minFontSizeActitudes, maxFontSizeActitudes))



    println("Construyendo nube de palabras para 'Actitudes' (intentando horizontal y completa)...")
    kumoWordCloudActitudes.build(wordFrequenciesForKumoActitudes)
    println("Nube de palabras para 'Actitudes' construida.")

    val imageOutputStreamActitudes = ByteArrayOutputStream()
    try {
        kumoWordCloudActitudes.writeToStreamAsPNG(imageOutputStreamActitudes)
        val imageBytesActitudes = imageOutputStreamActitudes.toByteArray()
        val base64EncodedImageActitudes = Base64.getEncoder().encodeToString(imageBytesActitudes)
        val htmlStringActitudes = """<img src="data:image/png;base64,$base64EncodedImageActitudes" alt="Nube de Palabras para Actitudes"/>"""
        HTML(htmlStringActitudes)
    } catch (e: Exception) {
        println("ERROR al generar la imagen de la nube de palabras para 'Actitudes': ${e.message}")
        HTML("<b>Error generando la nube de palabras:</b> ${e.message?.replace("<", "&lt;")?.replace(">", "&gt;")}")
    }

} else {
    println("No hay datos con frecuencia positiva para generar la nube de palabras de 'Actitudes'.")
    HTML("<i>No se encontraron datos para la nube de palabras de 'Actitudes'.</i>")
}

outputToDisplayInJupyterActitudes


Construyendo nube de palabras para 'Actitudes' (intentando horizontal y completa)...
Nube de palabras para 'Actitudes' construida.


# Frecuencia de aparición de términos en la categoría "Propiedades psicométricas"

In [1218]:
val sortedResult = calculateTermFrequencies(terms_prop_psico, list_of_abstracts)

plot {
    bars {
        x(sortedResult.map { it.first }.toList(), "Termino") {scale = categorical()}
        y(sortedResult.map { it.second }.toList(), "Frecuencia")
    }
}

# Nube de Palabras Frecuencia de aparición de términos en la categoría "Propiedades psicométricas"


In [1220]:

import com.kennycason.kumo.WordCloud
import com.kennycason.kumo.WordFrequency
import com.kennycason.kumo.CollisionMode
import com.kennycason.kumo.bg.RectangleBackground
import com.kennycason.kumo.font.scale.LinearFontScalar
import com.kennycason.kumo.palette.ColorPalette
import java.awt.Color
import java.awt.Dimension
import java.io.ByteArrayOutputStream
import java.util.Base64
import org.jetbrains.kotlinx.jupyter.api.HTML

val wordFrequenciesForKumoPropPsico = sortedResult
    .filter { it.second > 0 }
    .map {

        WordFrequency(it.first, it.second)
    }

println("--- Lista de WordFrequency para Kumo (Prop Psicométricas) ---")
wordFrequenciesForKumoPropPsico.forEach { println("'${it.word}' : ${it.frequency}") }
println("----------------------------------------------------------")


val outputToDisplayInJupyterPropPsico: Any = if (wordFrequenciesForKumoPropPsico.isNotEmpty()) {

    val imageDimensionsPropPsico = Dimension(1000, 750)
    val kumoWordCloudPropPsico = WordCloud(imageDimensionsPropPsico, CollisionMode.RECTANGLE)
    kumoWordCloudPropPsico.setPadding(1)

    kumoWordCloudPropPsico.setBackground(RectangleBackground(imageDimensionsPropPsico))
    kumoWordCloudPropPsico.setBackgroundColor(Color.WHITE)

    val kumoColorPalettePropPsico = ColorPalette(
        Color(0x1B5E20),
        Color(0x2E7D32),
        Color(0x388E3C),
        Color(0x43A047),
        Color(0x4CAF50),
        Color(0x66BB6A),
        Color(0x81C784)
    )
    kumoWordCloudPropPsico.setColorPalette(kumoColorPalettePropPsico)

    val minFontSize = 7
    val maxFontSize = 70
    kumoWordCloudPropPsico.setFontScalar(LinearFontScalar(minFontSize, maxFontSize))

    // NO AngleGenerator, Kumo decidirá la orientación.

    println("Construyendo nube de palabras para 'Propiedades psicométricas' (dimensiones grandes, pixel perfect)...")
    kumoWordCloudPropPsico.build(wordFrequenciesForKumoPropPsico)
    println("Nube de palabras para 'Propiedades psicométricas' construida.")


    val imageOutputStreamPropPsico = ByteArrayOutputStream()
    try {
        kumoWordCloudPropPsico.writeToStreamAsPNG(imageOutputStreamPropPsico)
        val imageBytesPropPsico = imageOutputStreamPropPsico.toByteArray()
        val base64EncodedImagePropPsico = Base64.getEncoder().encodeToString(imageBytesPropPsico)
        val htmlStringPropPsico = """<img src="data:image/png;base64,$base64EncodedImagePropPsico" alt="Nube de Palabras para Propiedades psicométricas"/>"""
        HTML(htmlStringPropPsico)
    } catch (e: Exception) {
        println("ERROR al generar la imagen de la nube de palabras para 'Propiedades psicométricas': ${e.message}")
        HTML("<b>Error generando la nube de palabras:</b> ${e.message?.replace("<", "&lt;")?.replace(">", "&gt;")}")
    }

} else {
    println("No hay datos con frecuencia positiva para generar la nube de palabras de 'Propiedades psicométricas'.")
    HTML("<i>No se encontraron datos para la nube de palabras de 'Propiedades psicométricas'.</i>")
}

outputToDisplayInJupyterPropPsico

--- Lista de WordFrequency para Kumo (Prop Psicométricas) ---
'validity' : 56
'reliability' : 37
'structural equation model, sem' : 33
'classical test theory, ctt' : 17
'item response theory, irt' : 17
'confirmatory factor analysis, cfa' : 10
'exploratory factor analysis, efa' : 3
----------------------------------------------------------
Construyendo nube de palabras para 'Propiedades psicométricas' (dimensiones grandes, pixel perfect)...
Nube de palabras para 'Propiedades psicométricas' construida.


# Frecuencia de aparición de términos en la categoría "Herramienta de evaluación"

In [1221]:
val sortedResult = calculateTermFrequencies(terms_herramienta_eval, list_of_abstracts)
plot {
    bars {
        x(sortedResult.map { it.first }.toList(), "Termino") {scale = categorical()}
        y(sortedResult.map { it.second }.toList(), "Frecuencia")
    }
}

# Nube de Palabras Frecuencia de aparición de términos en la categoría "Herramienta de evaluación"

In [1222]:

import com.kennycason.kumo.WordCloud
import com.kennycason.kumo.WordFrequency
import com.kennycason.kumo.CollisionMode
import com.kennycason.kumo.bg.RectangleBackground
import com.kennycason.kumo.font.scale.LinearFontScalar
import com.kennycason.kumo.palette.ColorPalette
import java.awt.Color
import java.awt.Dimension
import java.io.ByteArrayOutputStream
import java.util.Base64
import org.jetbrains.kotlinx.jupyter.api.HTML



val wordFrequenciesForKumoHerrEval = sortedResult
    .filter { it.second > 0 } // Solo palabras con frecuencia positiva
    .map { WordFrequency(it.first, it.second) }

val outputToDisplayInJupyterHerrEval: Any = if (wordFrequenciesForKumoHerrEval.isNotEmpty()) {


    val imageDimensionsHerrEval = Dimension(1000, 800)
    val kumoWordCloudHerrEval = WordCloud(imageDimensionsHerrEval, CollisionMode.PIXEL_PERFECT)
    kumoWordCloudHerrEval.setPadding(1)

    kumoWordCloudHerrEval.setBackground(RectangleBackground(imageDimensionsHerrEval))
    kumoWordCloudHerrEval.setBackgroundColor(Color.WHITE)


    val kumoColorPaletteHerrEval = ColorPalette(
        Color(0x0D47A1),
        Color(0x1565C0),
        Color(0x1976D2),
        Color(0x1E88E5),
        Color(0x2196F3),
        Color(0x42A5F5),
        Color(0x64B5F6),
        Color(0x90CAF9)
    )
    kumoWordCloudHerrEval.setColorPalette(kumoColorPaletteHerrEval)


    val minFontSizeHerrEval = 6  // Muy pequeño para los términos con frecuencia 1, 2, 3
    val maxFontSizeHerrEval = 55 // Para que el término con frecuencia 23 sea el más grande
    kumoWordCloudHerrEval.setFontScalar(LinearFontScalar(minFontSizeHerrEval, maxFontSizeHerrEval))



    println("Construyendo nube de palabras para 'Herramienta de evaluación'...")
    kumoWordCloudHerrEval.build(wordFrequenciesForKumoHerrEval)
    println("Nube de palabras para 'Herramienta de evaluación' construida.")

    val imageOutputStreamHerrEval = ByteArrayOutputStream()
    try {
        kumoWordCloudHerrEval.writeToStreamAsPNG(imageOutputStreamHerrEval)
        val imageBytesHerrEval = imageOutputStreamHerrEval.toByteArray()
        val base64EncodedImageHerrEval = Base64.getEncoder().encodeToString(imageBytesHerrEval)
        val htmlStringHerrEval = """<img src="data:image/png;base64,$base64EncodedImageHerrEval" alt="Nube de Palabras para Herramienta de evaluación"/>"""
        HTML(htmlStringHerrEval)
    } catch (e: Exception) {
        println("ERROR al generar la imagen de la nube de palabras para 'Herramienta de evaluación': ${e.message}")
        HTML("<b>Error generando la nube de palabras:</b> ${e.message?.replace("<", "&lt;")?.replace(">", "&gt;")}")
    }

} else {
    println("No hay datos con frecuencia positiva para generar la nube de palabras de 'Herramienta de evaluación'.")
    HTML("<i>No se encontraron datos para la nube de palabras de 'Herramienta de evaluación'.</i>")
}

outputToDisplayInJupyterHerrEval


Construyendo nube de palabras para 'Herramienta de evaluación'...
Nube de palabras para 'Herramienta de evaluación' construida.


# Frecuencia de aparición de términos en la categoría "Diseño de investigación"

In [1223]:
val sortedResult = calculateTermFrequencies(terms_disenio_inves, list_of_abstracts)
plot {
    bars {
        x(sortedResult.map { it.first }.toList(), "Termino") {scale = categorical()}
        y(sortedResult.map { it.second }.toList(), "Frecuencia")
    }
}

# Nube de Palabras para Frecuencia de aparición de términos en la categoría "Diseño de investigación"


In [1226]:

import com.kennycason.kumo.WordCloud
import com.kennycason.kumo.WordFrequency
import com.kennycason.kumo.CollisionMode
import com.kennycason.kumo.bg.RectangleBackground
import com.kennycason.kumo.font.KumoFont
import java.awt.Font
import com.kennycason.kumo.font.scale.SqrtFontScalar
import com.kennycason.kumo.palette.ColorPalette
import java.awt.Color
import java.awt.Dimension
import java.io.ByteArrayOutputStream
import java.util.Base64
import org.jetbrains.kotlinx.jupyter.api.HTML


val wordFrequenciesForKumoDisenioInv = sortedResult
    .filter { it.second > 0 }
    .map { WordFrequency(it.first, it.second) }

val outputToDisplayInJupyterDisenioInv: Any = if (wordFrequenciesForKumoDisenioInv.isNotEmpty()) {


    val imageDimensionsDisenioInv = Dimension(600, 300)
    val kumoWordCloudDisenioInv = WordCloud(imageDimensionsDisenioInv, CollisionMode.PIXEL_PERFECT)
    kumoWordCloudDisenioInv.setPadding(0) // <<--- PADDING CERO

    // 3. Fondo
    kumoWordCloudDisenioInv.setBackground(RectangleBackground(imageDimensionsDisenioInv))
    kumoWordCloudDisenioInv.setBackgroundColor(Color.WHITE)

    // 4. Paleta de Colores
    val singleOrangeColor = Color(0xF57C00)
    val kumoColorPaletteDisenioInv = ColorPalette(singleOrangeColor)
    kumoWordCloudDisenioInv.setColorPalette(kumoColorPaletteDisenioInv)

    // 5. Fuente:
    val fontFamily = "SansSerif"
    val kumoFontDisenioInv = KumoFont(Font(fontFamily, Font.BOLD, 10))
    kumoWordCloudDisenioInv.setKumoFont(kumoFontDisenioInv)


    val minFontSizeDisenioInv = 12
    val maxFontSizeDisenioInv = 55
    kumoWordCloudDisenioInv.setFontScalar(SqrtFontScalar(minFontSizeDisenioInv, maxFontSizeDisenioInv))


    println("Construyendo nube de palabras para 'Diseño de investigación' (Compacta, Horizontal, Sqrt)...")
    kumoWordCloudDisenioInv.build(wordFrequenciesForKumoDisenioInv)
    println("Nube de palabras para 'Diseño de investigación' construida.")

    val imageOutputStreamDisenioInv = ByteArrayOutputStream()
    try {
        kumoWordCloudDisenioInv.writeToStreamAsPNG(imageOutputStreamDisenioInv)
        val imageBytesDisenioInv = imageOutputStreamDisenioInv.toByteArray()
        val base64EncodedImageDisenioInv = Base64.getEncoder().encodeToString(imageBytesDisenioInv)
        val htmlStringDisenioInv = """<div style="display: flex; justify-content: center; align-items: center; padding: 5px; background-color: #f0f0f0;">
                                      <img src="data:image/png;base64,$base64EncodedImageDisenioInv" alt="Nube de Palabras para Diseño de investigación" style="max-width: 100%; height: auto; border: 1px solid #ccc;"/>
                                   </div>"""
        HTML(htmlStringDisenioInv)
    } catch (e: Exception) {
        println("ERROR al generar la imagen de la nube de palabras para 'Diseño de investigación': ${e.message}")
        HTML("<b>Error generando la nube de palabras:</b> ${e.message?.replace("<", "&lt;")?.replace(">", "&gt;")}")
    }

} else {
    println("No hay datos con frecuencia positiva para generar la nube de palabras de 'Diseño de investigación'.")
    HTML("<i>No se encontraron datos para la nube de palabras de 'Diseño de investigación'.</i>")
}

outputToDisplayInJupyterDisenioInv
// --- Fin del Código ---

Construyendo nube de palabras para 'Diseño de investigación' (Compacta, Horizontal, Sqrt)...
Nube de palabras para 'Diseño de investigación' construida.


# Frecuencia de aparición de términos en la categoría "Nivel de escolaridad"

In [1188]:
val sortedResult = calculateTermFrequencies(terms_nivel_escol, list_of_abstracts)
plot {
    bars {
        x(sortedResult.map { it.first }.toList(), "Termino")
        y(sortedResult.map { it.second }.toList(), "Frecuencia")
    }
}


# Nube de Palabras para Frecuencia de aparición de términos en la categoría "Nivel de escolaridad"


In [1189]:

import org.jetbrains.kotlinx.jupyter.api.HTML
import kotlin.random.Random


fun kotlinFreqListToJsonForWordcloud2(list: kotlin.collections.List<Pair<String, Int>>): String {
    return list.filter { it.second > 0 }
        .joinToString(prefix = "[", postfix = "]") { pair: Pair<String, Int> ->
            val word = pair.first.replace("\"", "\\\"")
            val freq = pair.second
            "[\"$word\", $freq]"
        }
}

fun generateWordCloud2JsHtmlSimplified(
    wordFrequencies: kotlin.collections.List<Pair<String, Int>>,
    canvasIdSuffix: String = "",
    width: Int = 700,
    height: Int = 450,
    backgroundColor: String = "#FFFFFF",
    fontFamily: String = "SansSerif, Arial, sans-serif",
    fontWeight: String = "bold",
    color: String = "'#F57C00'",
    gridSizeRatio: Int = 16,
    weightFactorExponent: Double = 0.8,
    weightFactorDivisor: Double = 512.0,
    allowDrawOutOfBound: Boolean = true,
    minWordSize: Int = 4
): String { // Asegurar que devuelve String

    val wordListJson: String = kotlinFreqListToJsonForWordcloud2(wordFrequencies) // Tipo explícito

    // Uso correcto de kotlin.random.Random
    val divId = "wordcloud2_canvas_${canvasIdSuffix}_${Random.nextInt(0, Int.MAX_VALUE)}"

    val wordcloud2JsCdnUrl = "https://cdnjs.cloudflare.com/ajax/libs/wordcloud2.js/1.1.1/wordcloud2.min.js"

    val optionsJs: String = """
    {
        list: $wordListJson,
        gridSize: Math.round($gridSizeRatio * $('#$divId').width() / 1024),
        weightFactor: function (size) {
          return Math.pow(size, $weightFactorExponent) * $('#$divId').width() / $weightFactorDivisor;
        },
        fontFamily: '$fontFamily',
        fontWeight: '$fontWeight',
        color: $color,
        backgroundColor: '$backgroundColor',
        rotateRatio: 0,
        shuffle: false,
        shape: 'rectangle',
        drawOutOfBound: $allowDrawOutOfBound,
        minSize: $minWordSize
    }
    """.trimIndent()

    // El string HTML largo
    val htmlContent: String = """
    <!DOCTYPE html>
    <html>
    <head>
        <meta charset="UTF-8">
        <title>Nube de Palabras con wordcloud2.js</title>
        <script type="text/javascript" src="https://cdnjs.cloudflare.com/ajax/libs/jquery/3.6.0/jquery.min.js"></script>
        <script type="text/javascript" src="$wordcloud2JsCdnUrl"></script>
        <style type="text/css">
            #$divId {
                width: ${width}px;
                height: ${height}px;
                border: 1px solid #ccc;
            }
            body { display: flex; justify-content: center; align-items: center; min-height: ${height+50}px; background-color: #f0f0f0; margin:0;}
        </style>
    </head>
    <body>
        <div id="$divId"></div>
        <script type="text/javascript">
            $(document).ready(function() {
                if (typeof WordCloud !== 'undefined') {
                    WordCloud(document.getElementById('$divId'), $optionsJs);
                } else {
                    $('#$divId').text('Error: WordCloud2.js no se cargó.');
                    console.error("WordCloud2.js no está definido.");
                }
            });
        </script>
    </body>
    </html>
    """.trimIndent()
    return htmlContent
}

In [1190]:
// ...

    val htmlContent = generateWordCloud2JsHtmlSimplified(
        wordFrequencies = sortedResult,
        canvasIdSuffix = "NivelEscol",
        width = 900,
        height = 500,
        allowDrawOutOfBound = true,
        weightFactorExponent = 0.75,
        weightFactorDivisor = 350.0,
        minWordSize = 12,
        color = "'#00695C'"
    )
    HTML(htmlContent)


# Frecuencia de aparición de términos en la categoría "Medio"

In [1228]:
val res = calculateTermFrequencies(terms_medio, list_of_abstracts)
plot {
    bars {
        x(res.map { it.first }.toList(), "Termino")
        y(res.map { it.second }.toList(), "Frecuencia")
    }
}

# Nube de Palabras para Frecuencia de aparición de términos en la categoría "Medio"

In [1229]:
// --- Inicio del Código para la Nube de Palabras de "Medio" (Ajuste Extremo) ---

// ... (Importaciones) ...
import com.kennycason.kumo.WordCloud
import com.kennycason.kumo.WordFrequency
import com.kennycason.kumo.CollisionMode
import com.kennycason.kumo.bg.RectangleBackground
// import com.kennycason.kumo.font.scale.LinearFontScalar // Comentado para probar SqrtFontScalar
import com.kennycason.kumo.font.scale.SqrtFontScalar // <--- CAMBIO A SqrtFontScalar
import com.kennycason.kumo.palette.ColorPalette
import java.awt.Color
import java.awt.Dimension
import java.io.ByteArrayOutputStream
import java.util.Base64
import org.jetbrains.kotlinx.jupyter.api.HTML

// 'res' (List<Pair<String, Int>>) está disponible desde la celda anterior
// y contiene las frecuencias para "Medio".

val wordFrequenciesForKumoMedio = res
    .filter { it.second > 0 }
    .map { WordFrequency(it.first, it.second) }

val outputToDisplayInJupyterMedio: Any = if (wordFrequenciesForKumoMedio.isNotEmpty()) {

    val imageDimensionsMedio = Dimension(1000, 750) // <<-- AUMENTAR DIMENSIONES CONSIDERABLEMENTE
    // PIXEL_PERFECT podría ayudar aquí, aunque sea más lento. Prueba RECTANGLE si PIXEL_PERFECT es demasiado lento o no mejora.
    val kumoWordCloudMedio = WordCloud(imageDimensionsMedio, CollisionMode.RECTANGLE)
    kumoWordCloudMedio.setPadding(1)

    kumoWordCloudMedio.setBackground(RectangleBackground(imageDimensionsMedio))
    kumoWordCloudMedio.setBackgroundColor(Color.WHITE)

    val kumoColorPaletteMedio = ColorPalette( // Tu paleta de grises y naranja
        Color(0x212121), Color(0x424242), Color(0x616161),
        Color(0x757575), Color(0x9E9E9E), Color(0xBDBDBD),
        Color(0xD65108), Color(0xF57C00), Color(0xFF9800)
    )
    kumoWordCloudMedio.setColorPalette(kumoColorPaletteMedio)

    // --- CAMBIO A SqrtFontScalar ---
    // Frecuencias: 526, 175, 91, ..., 1.
    // SqrtFontScalar ayudará a que las palabras de baja frecuencia no sean invisibles
    // y que la palabra de muy alta frecuencia no domine TANTO el espacio.
    val minFontSizeMedio = 8
    val maxFontSizeMedio = 80 // Un buen tamaño para la palabra más grande con SqrtFontScalar
    kumoWordCloudMedio.setFontScalar(SqrtFontScalar(minFontSizeMedio, maxFontSizeMedio))

    println("Construyendo nube de palabras para 'Medio' (SqrtFontScalar, dimensiones grandes)...")
    kumoWordCloudMedio.build(wordFrequenciesForKumoMedio)
    println("Nube de palabras para 'Medio' construida.")

    val imageOutputStreamMedio = ByteArrayOutputStream()
    try {
        kumoWordCloudMedio.writeToStreamAsPNG(imageOutputStreamMedio)
        val imageBytesMedio = imageOutputStreamMedio.toByteArray()
        val base64EncodedImageMedio = Base64.getEncoder().encodeToString(imageBytesMedio)
        val htmlStringMedio = """<img src="data:image/png;base64,$base64EncodedImageMedio" alt="Nube de Palabras para Medio"/>"""
        HTML(htmlStringMedio)
    } catch (e: Exception) {
        println("ERROR al generar la imagen de la nube de palabras para 'Medio': ${e.message}")
        HTML("<b>Error generando la nube de palabras:</b> ${e.message?.replace("<", "&lt;")?.replace(">", "&gt;")}")
    }

} else {
    println("No hay datos con frecuencia positiva para generar la nube de palabras de 'Medio'.")
    HTML("<i>No se encontraron datos para la nube de palabras de 'Medio'.</i>")
}

outputToDisplayInJupyterMedio
// --- Fin del Código para la Nube de Palabras de "Medio" ---

Construyendo nube de palabras para 'Medio' (SqrtFontScalar, dimensiones grandes)...
Nube de palabras para 'Medio' construida.


# Frecuencia de aparición de términos en la categoría "Estrategia"

In [1193]:
val res = calculateTermFrequencies(terms_estrate, list_of_abstracts)
plot {
    bars {
        x(res.map { it.first }.toList(), "Termino")
        y(res.map { it.second }.toList(), "Frecuencia")
    }
}


# Nube de Palabras para Frecuencia de aparición de términos en la categoría "Estrategia"


In [1194]:
// --- Inicio del Código para la Nube de Palabras de "Estrategia" (Horizontal y Completa) ---

// ... (Asegúrate de que las importaciones necesarias estén presentes)
import com.kennycason.kumo.WordCloud
import com.kennycason.kumo.WordFrequency
import com.kennycason.kumo.CollisionMode
import com.kennycason.kumo.bg.RectangleBackground
import com.kennycason.kumo.font.scale.LinearFontScalar // O SqrtFontScalar si prefieres
import com.kennycason.kumo.palette.ColorPalette
import java.awt.Color
import java.awt.Dimension
import java.io.ByteArrayOutputStream
import java.util.Base64
import org.jetbrains.kotlinx.jupyter.api.HTML

// 'res' (List<Pair<String, Int>>) está disponible desde la celda anterior
// y contiene las frecuencias para "Estrategia".

val wordFrequenciesForKumoEstrate = res // <<--- Usamos 'res' como variable de entrada
    .filter { it.second > 0 }
    .map { WordFrequency(it.first, it.second) }

val outputToDisplayInJupyterEstrate: Any = if (wordFrequenciesForKumoEstrate.isNotEmpty()) {

    // Hay varios términos, algunos son frases.
    val imageDimensionsEstrate = Dimension(900, 700) // Dimensiones generosas
    // PIXEL_PERFECT puede ayudar a encajar mejor, pero RECTANGLE es más rápido.
    val kumoWordCloudEstrate = WordCloud(imageDimensionsEstrate, CollisionMode.PIXEL_PERFECT)
    kumoWordCloudEstrate.setPadding(1)

    kumoWordCloudEstrate.setBackground(RectangleBackground(imageDimensionsEstrate))
    kumoWordCloudEstrate.setBackgroundColor(Color.WHITE)

    // Paleta de colores (ejemplo con tonos azules y verdes)
    val kumoColorPaletteEstrate = ColorPalette(
        Color(0x0277BD), // Light Blue Darken-3
        Color(0x0288D1), // Light Blue Darken-2
        Color(0x039BE5), // Light Blue Darken-1
        Color(0x03A9F4), // Light Blue
        Color(0x29B6F6), // Light Blue Lighten-1
        Color(0x00695C), // Teal Darken-3
        Color(0x00796B), // Teal Darken-2
        Color(0x26A69A)  // Teal Lighten-1
    )
    kumoWordCloudEstrate.setColorPalette(kumoColorPaletteEstrate)

    // Frecuencias: Max ~30, luego 21, 15, 10, 8, 5, 4, 4, 3, 3, 2, 1, 1.
    val minFontSizeEstrate = 7   // Para los términos con frecuencia 1
    val maxFontSizeEstrate = 65  // Para "collaborative learning" (frec 30)
    // LinearFontScalar para buena proporcionalidad.
    kumoWordCloudEstrate.setFontScalar(LinearFontScalar(minFontSizeEstrate, maxFontSizeEstrate))

    // Kumo intentará horizontalmente primero.

    println("Construyendo nube de palabras para 'Estrategia' (intentando horizontal y completa)...")
    kumoWordCloudEstrate.build(wordFrequenciesForKumoEstrate)
    println("Nube de palabras para 'Estrategia' construida.")

    val imageOutputStreamEstrate = ByteArrayOutputStream()
    try {
        kumoWordCloudEstrate.writeToStreamAsPNG(imageOutputStreamEstrate)
        val imageBytesEstrate = imageOutputStreamEstrate.toByteArray()
        val base64EncodedImageEstrate = Base64.getEncoder().encodeToString(imageBytesEstrate)
        val htmlStringEstrate = """<img src="data:image/png;base64,$base64EncodedImageEstrate" alt="Nube de Palabras para Estrategia"/>"""
        HTML(htmlStringEstrate)
    } catch (e: Exception) {
        println("ERROR al generar la imagen de la nube de palabras para 'Estrategia': ${e.message}")
        HTML("<b>Error generando la nube de palabras:</b> ${e.message?.replace("<", "&lt;")?.replace(">", "&gt;")}")
    }

} else {
    println("No hay datos con frecuencia positiva para generar la nube de palabras de 'Estrategia'.")
    HTML("<i>No se encontraron datos para la nube de palabras de 'Estrategia'.</i>")
}

outputToDisplayInJupyterEstrate
// --- Fin del Código para la Nube de Palabras de "Estrategia" ---

Construyendo nube de palabras para 'Estrategia' (intentando horizontal y completa)...
Nube de palabras para 'Estrategia' construida.


# Frecuencia de aparición de términos en la categoría "Herramienta"

In [1195]:
val res = calculateTermFrequencies(terms_herramienta, list_of_abstracts)
plot {
    bars {
        x(res.map { it.first }.toList(), "Termino")
        y(res.map { it.second }.toList(), "Frecuencia")
    }
}

# Nube de Palabras para Frecuencia de aparición de términos en la categoría "Herramienta"


In [1196]:
// --- Inicio del Código para la Nube de Palabras de "Herramienta" (Horizontal y Completa) ---

// ... (Asegúrate de que las importaciones necesarias estén presentes)
import com.kennycason.kumo.WordCloud
import com.kennycason.kumo.WordFrequency
import com.kennycason.kumo.CollisionMode
import com.kennycason.kumo.bg.RectangleBackground
import com.kennycason.kumo.font.scale.LinearFontScalar
import com.kennycason.kumo.palette.ColorPalette
import java.awt.Color
import java.awt.Dimension
import java.io.ByteArrayOutputStream
import java.util.Base64
import org.jetbrains.kotlinx.jupyter.api.HTML

// 'res' (List<Pair<String, Int>>) está disponible desde la celda anterior
// y contiene las frecuencias para "Herramienta".

val wordFrequenciesForKumoHerramienta = res // <<--- Usamos 'res' como variable de entrada
    .filter { it.second > 0 }
    .map { WordFrequency(it.first, it.second) }

val outputToDisplayInJupyterHerramienta: Any = if (wordFrequenciesForKumoHerramienta.isNotEmpty()) {

    // Ajustes para esta categoría:
    // Pocos términos, uno dominante. Dimensiones pueden ser más modestas.
    val imageDimensionsHerramienta = Dimension(600, 400) // Más pequeñas, ya que hay pocos términos
    val kumoWordCloudHerramienta = WordCloud(imageDimensionsHerramienta, CollisionMode.PIXEL_PERFECT)
    // Un poco de padding

    kumoWordCloudHerramienta.setBackground(RectangleBackground(imageDimensionsHerramienta))
    kumoWordCloudHerramienta.setBackgroundColor(Color.WHITE)

    // Paleta de colores (ejemplo con tonos metálicos/grises azulados)
    val kumoColorPaletteHerramienta = ColorPalette(
        Color(0x37474F), // Blue Grey Darken-3 (para el más grande "scratch")
        Color(0x546E7A), // Blue Grey Darken-1
        Color(0x78909C), // Blue Grey Lighten-1
        Color(0x90A4AE), // Blue Grey Lighten-2
        Color(0xB0BEC5)  // Blue Grey Lighten-3 (para el más pequeño "code.org")
    )
    kumoWordCloudHerramienta.setColorPalette(kumoColorPaletteHerramienta)

    // Frecuencias: ~68, ~15, ~6, ~4, ~3. "scratch" domina.
    val minFontSizeHerramienta = 10  // Para que "code.org" (frec 3) sea legible
    val maxFontSizeHerramienta = 70 // Para que "scratch" (frec 68) sea grande
    kumoWordCloudHerramienta.setFontScalar(LinearFontScalar(minFontSizeHerramienta, maxFontSizeHerramienta))

    // Kumo intentará horizontalmente primero.

    println("Construyendo nube de palabras para 'Herramienta' (intentando horizontal y completa)...")
    kumoWordCloudHerramienta.build(wordFrequenciesForKumoHerramienta)
    println("Nube de palabras para 'Herramienta' construida.")

    val imageOutputStreamHerramienta = ByteArrayOutputStream()
    try {
        kumoWordCloudHerramienta.writeToStreamAsPNG(imageOutputStreamHerramienta)
        val imageBytesHerramienta = imageOutputStreamHerramienta.toByteArray()
        val base64EncodedImageHerramienta = Base64.getEncoder().encodeToString(imageBytesHerramienta)
        val htmlStringHerramienta = """<img src="data:image/png;base64,$base64EncodedImageHerramienta" alt="Nube de Palabras para Herramienta"/>"""
        HTML(htmlStringHerramienta)
    } catch (e: Exception) {
        println("ERROR al generar la imagen de la nube de palabras para 'Herramienta': ${e.message}")
        HTML("<b>Error generando la nube de palabras:</b> ${e.message?.replace("<", "&lt;")?.replace(">", "&gt;")}")
    }

} else {
    println("No hay datos con frecuencia positiva para generar la nube de palabras de 'Herramienta'.")
    HTML("<i>No se encontraron datos para la nube de palabras de 'Herramienta'.</i>")
}

outputToDisplayInJupyterHerramienta
// --- Fin del Código para la Nube de Palabras de "Herramienta" ---

Construyendo nube de palabras para 'Herramienta' (intentando horizontal y completa)...
Nube de palabras para 'Herramienta' construida.


# Funciones para Coocurrence

java.lang.IllegalArgumentException: Column not found: 'abstract'