# Clase 1: Fundamentos de Python 🐍 - Herramientas para Lingüistica Computacional

## ¿Qué Haremos Hoy?
1.  **Variables:** Las "cajas" para guardar información.
2.  **Tipos de Datos:** ¿Qué guardamos en esas cajas? (Texto, números, etc.).
3.  **Operadores:** Cómo hacer cosas con nuestros datos.
4.  **Condicionales:** Cómo hacer que nuestro programa tome decisiones.

## 1. Variables: Nuestras "Cajas" con Nombre

Una variable es simplemente un contenedor donde guardamos un dato para usarlo más tarde. Le damos un nombre para poder referirnos a ella.

**Reglas para los nombres:**
* No pueden empezar con un número.
* No pueden tener espacios (usa `_` en su lugar, como `mi_variable`).
* No uses palabras que Python ya reserva para sí mismo (como `print`, `if`, etc.).

In [1]:
# Creamos nuestra primera variable.
# La variable se llama 'saludo' y contiene el texto "Hola, mundo del PLN!"
saludo = "Hola, mundo del PLN!"

# Usamos la función print() para mostrar lo que hay dentro de nuestra variable.
print(saludo)

Hola, mundo del PLN!


In [None]:
saludo_uno = "Hola"

In [None]:
print(saludo_uno)

Hola


## 2. Tipos de Datos: ¿Qué hay dentro de las cajas?

No todos los datos son iguales. Python distingue principalmente entre:

* **String (`str`):** Texto, siempre entre comillas (`" "`). ¡El tipo de dato más importante para nosotros en PLN!
* **Integer (`int`):** Números enteros (ej: `10`, `-5`).
* **Float (`float`):** Números con decimales (ej: `3.14`).
* **Boolean (`bool`):** Representa la verdad. Solo puede ser `True` o `False`.

Para saber qué tipo de dato tiene una variable, usamos la función `type()`.

In [2]:
# Variable de tipo String
oracion = "El análisis de texto es fascinante."

# Variable de tipo Integer
cantidad_de_palabras = 6

# Variable de tipo Boolean
es_interesante = True

# Usemos type() para verificar
print(type(oracion))
print(type(cantidad_de_palabras))
print(type(es_interesante))

<class 'str'>
<class 'int'>
<class 'bool'>


> **Nota importante:** ¿Por qué nos importa el tipo de dato? Porque define qué operaciones podemos hacer. Por ejemplo, podemos `sumar` dos números, pero no podemos `dividir` un texto. `type()` es nuestro mejor amigo para no cometer errores.

## 3. Operadores: Haciendo Cosas con los Datos

Podemos combinar y comparar nuestras variables usando operadores.

* **Operador `+` con texto:** Une (concatena) dos strings.
* **Operadores de comparación (`==`, `!=`):** Preguntan si dos valores son iguales o diferentes. ¡Siempre devuelven un Booleano (`True` o `False`)!

In [None]:
palabra1 = "procesamiento"
palabra2 = "lenguaje"

# Unimos las palabras con un espacio en medio
frase_completa = palabra1 + " de " + palabra2
print(frase_completa)

procesamiento de lenguaje


In [None]:
print(palabra1, 'de', palabra2)

procesamiento de lenguaje


In [None]:
palabra3 = "Procesamiento"

In [None]:
palabra1 == palabra3

False

In [None]:
# Comparemos dos números
numero_a = 10
numero_b = 20
print("¿Son iguales numero_a y numero_b?")
print(numero_a == numero_b) # Esto imprimirá False

¿Son iguales numero_a y numero_b?
False


## 4. Condicionales: Tomando Decisiones

Los condicionales `if`, `elif` y `else` permiten que nuestro programa ejecute cierto código solo si se cumple una condición.

La **indentación** (el espacio al principio de la línea) es MUY importante. Le dice a Python qué código pertenece al `if`.

In [None]:
# Pedimos al usuario que escriba una palabra
palabra_usuario = input("Escribí una palabra clave (ej: Python): ")

# El programa decide qué hacer basándose en la palabra
if palabra_usuario == "Python":
    print("¡Genial! Ese es el lenguaje que estamos aprendiendo.")
else:
    print("Esa es una palabra interesante, ¡pero no es Python!")

In [None]:
variable_tmp = float(input('Ingresá un numero del 1 al 10: '))

Ingresá un numero del 1 al 10: 2


In [None]:
type(variable_tmp)

float

## Ejercicio Práctico 1: Analizador Simple de Frases

> Añadir blockquote



¡Es hora de poner a prueba lo que aprendimos! Vamos a crear un programa que analice una frase que ingrese el usuario y nos diga algunas cosas sobre ella.

**Consigna:**

1.  Pedí al usuario que ingrese una frase usando `input()`.
2.  Verifica si la palabra "Python" está en la frase.
3.  Verifica si la frase es corta (menos de 20 caracteres) o larga.
4.  Imprimí un mensaje diferente para cada caso.

In [None]:
# 1. Pedí al usuario que ingrese una frase
frase_usuario = input("Por favor, ingresa una frase: ")

# Medí la longitud de la frase
longitud_frase = len(frase_usuario)

print(f"La frase tiene {longitud_frase} caracteres.")

In [None]:
# 2. Revisá las condiciones con if/elif/else
# ¡Tu código va acá!

In [None]:
# Pista: Podes usar el operador 'in' para ver si un texto está dentro de otro.
# Ejemplo: if "palabra" in mi_frase:

if "Python" in frase_usuario:
    print("¡Excelente! Tu frase menciona nuestro lenguaje de programación favorito.")
elif longitud_frase < 20:
    print("Es una frase corta, ¡directa al punto!")
else:
    print("Una frase interesante y de buena longitud.")

## 5. Estructuras de Datos: Organizando nuestra Información

En PLN, necesitamos manejar colecciones de datos. Python nos ofrece varias formas de hacerlo:

* **Listas (`list`):** Colecciones ordenadas y modificables de elementos.
* **Tuplas (`tuple`):** Colecciones ordenadas pero INMODIFICABLES de elementos.
* **Diccionarios (`dict`):** Colecciones de pares clave-valor (como un diccionario real).

In [7]:
# Listas (pueden modificarse)
palabras = ['hola', 'mundo', 'nlp', 'python']
print("Lista original:", palabras)

Lista original: ['hola', 'mundo', 'nlp', 'python']


In [8]:
# Agregar elemento
palabras.append('texto')
print("Después de append:", palabras)

Después de append: ['hola', 'mundo', 'nlp', 'python', 'texto']


In [9]:
# Remover elemento
palabras.remove('mundo')
print("Después de remove:", palabras)

Después de remove: ['hola', 'nlp', 'python', 'texto']


In [10]:
# Acceder por índice
print("Primera palabra:", palabras[0])
print("Última palabra:", palabras[-1])

Primera palabra: hola
Última palabra: texto


In [11]:
# Tuplas (NO pueden modificarse)
coordenadas = (4, 5)
colores = ('rojo', 'verde', 'azul')

print("Tupla de coordenadas:", coordenadas)
print("Segundo color:", colores[1])

Tupla de coordenadas: (4, 5)
Segundo color: verde


In [13]:
# Esto causaría un error:
colores[1] = 'amarillo'  # Descomenta para ver el error

TypeError: 'tuple' object does not support item assignment

In [14]:
# Diccionarios (clave-valor)
frecuencia_palabras = {'python': 15,
                       'nlp': 23,
                       'texto': 42}
print("Diccionario original:", frecuencia_palabras)

Diccionario original: {'python': 15, 'nlp': 23, 'texto': 42}


In [15]:
# Agregar nueva entrada
frecuencia_palabras['datos'] = 18
print("Después de agregar 'datos':", frecuencia_palabras)

Después de agregar 'datos': {'python': 15, 'nlp': 23, 'texto': 42, 'datos': 18}


In [16]:
# Acceder a valores
print("Frecuencia de 'nlp':", frecuencia_palabras.get('nlp', 0))
print("Frecuencia de palabra inexistente:", frecuencia_palabras.get('inexistente', 0))

Frecuencia de 'nlp': 23
Frecuencia de palabra inexistente: 0


In [17]:
# Condicionales con estructuras de datos
texto = "Python es excelente para NLP"
palabras_texto = texto.split()

In [None]:
palabras_texto

['Python', 'es', 'excelente', 'para', 'NLP']

In [None]:
if len(palabras_texto) > 3:
    print("El texto tiene más de 3 palabras")
    if "NLP" in palabras_texto:
        print("Y además menciona NLP!")
elif "Python" in palabras_texto:
    print("El texto menciona Python")
else:
    print("Texto corto sin palabras clave reconocidas")

El texto tiene más de 3 palabras
Y además menciona NLP!


In [None]:
# Bucles para procesar listas
texto = "Python es un lenguaje de programación ampliamente utilizado en PLN"

print("Palabras largas en el texto:")
for palabra in texto.split():
    if len(palabra) > 5:  # Palabras de más de 5 letras
        print(f"- {palabra} ({len(palabra)} letras)")

Palabras largas en el texto:
- Python (6 letras)
- lenguaje (8 letras)
- programación (12 letras)
- ampliamente (11 letras)
- utilizado (9 letras)


##Ejercicio Practico 2

In [34]:
# Ejercicio: Contador de palabras
texto = "Python es un lenguaje de programación ampliamente utilizado en el procesamiento del lenguaje natural"

# Tu código acá:

# 1. Convertir texto a minúsculas
minusculas = texto.lower()
print("-", minusculas)
print()

# 2. Dividir en palabras
dividir = minusculas.split()
print("-",dividir)
print()

# 3. Contar frecuencia de cada palabra
frecuencia = {}
for palabra in dividir:
    if palabra in frecuencia:
        frecuencia[palabra] += 1
    else:
        frecuencia[palabra] = 1

print("-", frecuencia)

# print("¡Intenta resolver este ejercicio!")

- python es un lenguaje de programación ampliamente utilizado en el procesamiento del lenguaje natural

- ['python', 'es', 'un', 'lenguaje', 'de', 'programación', 'ampliamente', 'utilizado', 'en', 'el', 'procesamiento', 'del', 'lenguaje', 'natural']

- {'python': 1, 'es': 1, 'un': 1, 'lenguaje': 2, 'de': 1, 'programación': 1, 'ampliamente': 1, 'utilizado': 1, 'en': 1, 'el': 1, 'procesamiento': 1, 'del': 1, 'natural': 1}


---
## Glosario Rápido de la Clase 1

* **Variable**: Un nombre que usamos para guardar un valor en la memoria del programa.
* **String (`str`)**: Un tipo de dato que representa texto. Se define con comillas (`"hola"`).
* **Integer (`int`)**: Tipo de dato para números enteros, sin decimales (ej: `10`, `-3`).
* **Float (`float`)**: Tipo de dato para números con decimales (ej: `9.5`, `3.1416`).
* **Boolean (`bool`)**: Un tipo de dato que solo tiene dos valores posibles: `True` (verdadero) o `False` (falso).
* **Operador**: Un símbolo que realiza una acción, como `+` para unir texto o `==` para comparar si dos cosas son iguales.
* **Condicional (`if`, `elif`, `else`)**: Una estructura que le permite a tu programa tomar decisiones y ejecutar diferentes bloques de código según se cumpla o no una condición.
* **Indentación**: Los espacios al principio de una línea. En Python, es fundamental y define qué código pertenece a un `if`, un bucle, etc.
* **Función**: Un bloque de código con nombre que realiza una tarea específica (ej: `print()`, `len()`, `type()`).
---