# **Introducción a la lingüística computacional con Python**
### Javier Vera Zúñiga, jveraz@pucp.edu.pe

En este taller, nos dedicaremos a dar **respuestas parciales** (pero no menos interesantes) a las siguientes **preguntas** mediante **Python**:

1. ¿De qué forma podemos implementar un programa que sea capaz de transformar números enteros en palabras de una lengua peruana, por ejemplo 57 en pichqa chunka qanchis-ni-yuq?
2. ¿Cómo podemos contar la cantidad de veces que aparece una palabra en un texto? ¿Qué nos dice estos sobre la forma en que se organizan las frecuencias de palabras?

Para responder estas preguntas, necesitamos introducir elementos de programación tales como:

- la forma en que Python nombra elementos, **variables, enteros, strings**
- algunas estructuras que nos permitan guardar información, **listas**
- formas de recorrer estas estructuras, **ciclos for**
- maneras de expresar condiciones del tipo si-entonces, **if-else**

Para este taller, la **lingüística computacional** se entenderá como la disciplina que surge a partir de las interacciones, interferencias y cuestionamientos entre computación y lingüística. Un aspecto fundamental es que estos cruces no solo son importantes para los linguistas (o los informáticos), sino que para cualquier persona interesada en **procesar** información lingüística. Esto nos abre dos caminos interrelacionados. Primero, el taller mostrará elementos de programación en Python que podrían ser utilizados en problemas de lingüística computacional. Segundo (y quizás lo más importante), el taller busca abrir la mirada hacia nuevas preguntas que surjan desde las nociones básicas de programación en **Python**. 

**Contenidos!**

- **Variables:** forma de asociar etiquetas a ciertos elementos (especialmente, números, strings y listas) para operar con ellos
    - ¿qué es un número?
    - ¿qué es un string?
    - ¿qué operaciones básicas podemos hacer con números y strings?
- **Listas:** estructuras básicas para almacenar información de forma ordenada
    - relaciones entre filas de supermercado y textos
    - ¿cómo almacenamos las palabras de un texto?
    - operaciones básicas con listas (y con textos)
- **Ciclos for:** maneras de recorrer listas de forma ordenada

## ¿Dónde programamos en **Python**?
- En otro computador [colab!](https://colab.research.google.com/)
- En mi computador propio [anaconda!](https://www.anaconda.com/products/distribution)

¿Cuál opción es mejor?

## ¿Cómo aprendemos a programar en **Python**?
- PROGRAMANDO! :)
- Equivocándose
- Buscando en internet
- Viendo videos de youtube
- Teniendo un propósito definido
- Preguntando

En resumen!!! hay que tener una postura activa, que busque resolver problemas simples (que sumados resuelven problemas más complejos)

## (Jupyter) notebooks y tipos de celdas
Existen celdas de texto o markdown, como esta misma, en donde podemos escribir texto (e incluso código como texto). 

In [40]:
## y celdas de código, como esta otra. En las celdas de código el signo "#" indica un comentario. Los comentarios son algo
## MUY importante en programación: 
#### - permiten comentar qué estamos haciendo; y por sobre todo
#### - cómo lo estamos haciendo
## El ideal es que cada línea de código tenga un comentario!

## una pequeña porción de código de ejemplo: a vale 1
a = 1

In [41]:
a

1

## Variables en Python

### Asuntos básicos de variables
En la expresiones
```python
palabra = 'Lima'
```
y 

```python
numero = 57
```

el contenido _Lima_ y _57_ se asigna a nombres específicos, que llamaremos **variables.**

In [42]:
## definimos las variables en una celda de código!

## variable tipo string
palabra = 'Lima'

## variable tipo número (entero)
numero = 57

In [43]:
## vemos qué hay adentro de la variable "palabra"

palabra

'Lima'

In [44]:
## vemos qué hay adentro de la variable "numero"

numero

57

Las **variables** (ya sean números, strings o listas (como veremos)) tienen características poderosas:

* Son **variables**, es decir, pueden variar en su contenido
* El **tipo de variable** cambia el significado de las oraciones. Aquí hay un poco de magia.  
* La **asignación ocurre de derecha a izquierda:** el signo "=" **NO** indica igualdad, sino que el hecho de que se está asignando lo que está a la derecha en la variable de la izquierda

In [45]:
## ¿en qué sentido son variables? Asignemos nuevamente las variables palabra y numero

## nueva asignación de la variable tipo string
palabra = 'Santiago'

## nueva asignación de la variable tipo número (entero)
numero = 34

In [46]:
## pregunta: ¿Cuánto "valen" estas variables?

## vemos qué hay adentro de la (nueva asignación de la) variable "numero"

numero

34

In [47]:
## vemos qué hay adentro de la (nueva asignación de la) variable "palabra"

palabra

'Santiago'

¿Qué podemos **concluir**? Las variables se quedan con su **última asignación de contenido**

### Las operaciones entre variables dependen del contexto

Pensemos en dos preguntas muy simples: ¿Cómo podemos pegar (concatenar) strings? ¿Cómo sumamos números? El contenido (el **string**) 'Lima' se asigna a la variable "palabra". Ya sabemos que la variable "palabra" tiene como valor el que asignamos en su última asignación. Si tenemos dos strings, por ejemplo,

In [48]:
## asignación de un string a una variable

palabra1 = 'Lima'

## asignación de un string a una variable

palabra2 = 'Santiago'

In [49]:
palabra1, palabra2

('Lima', 'Santiago')

In [50]:
## podemos concatenarlos (pegarlos) usando

## concatenación de dos strings
'Lima' + 'Santiago'

'LimaSantiago'

In [51]:
## o bien

## concatenación de dos variables tipo string
palabra1 + palabra2

'LimaSantiago'

In [52]:
## o bien!

## asignación en la variable3 de la concatenación de dos variables tipo string
palabra3 = palabra1 + palabra2

In [63]:
palabra3

'LimaSantiago'

¿Cuál es la diferencia? ¿Qué hace el operador "+"? Si tenemos dos números, por ejemplo,

In [57]:
## asignación de un string a una variable

numero1 = 34

## asignación de un string a una variable

numero2 = 16

In [58]:
## podemos sumarlos usando

## suma de dos números
34 + 16

50

In [59]:
## podemos concatenarlos (pegarlos) usando

## concatenación de dos strings
numero1 + numero2

50

In [60]:
## o bien!

## asignación en numero3 de la suma de dos variables tipo número
numero3 = numero1 + numero2

In [61]:
numero3

50

In [62]:
## ¿Qué ocurre si "sumamos" números con strings?

numero1 + palabra1

50

¿Qué es **+** de acuerdo a los ejemplos anteriores? Una conclusión fundamental es:
    
* El operador **+** depende del contexto: números o strings!
* Solo podemos operar entre variables del mismo tipo!

### Un poco más sobre strings

### Un poco más sobre números