# **Taller de Análisis automático de textos en Humanidades**
### Javier Vera Zúñiga, jveraz@pucp.edu.pe

## Link importante para elementos básicos de Python

[Curso de Python](https://developers.google.com/edu/python/introduction)

## Primeros elementos de Python

En este primer acercamiento a **Python**, veremos los siguientes conceptos:

- ¿Qué es Python?
- ¿Dónde programar?
- Tipos de celdas en Jupyter
- Nociones básicas de variables
- Lectura de archivos

## ¿Qué es Python?

- un **lenguaje de programación** es un lenguaje artificial que se usa para dar instrucciones que controlan una máquina.
- tal como en las lenguas naturales, es posible definir elementos que se combinan (una sintaxis) y que portan un significado (una semántica).
- es relevante pensar, entonces, en qué unidades o estructuras nos ofrece **Python** y cómo se combinan. Con esto, podremos dar instrucciones precisas al computador. 
- **Python** es un lenguaje de programación de sintaxis amigable, que privilegia que los códigos o programas sean legibles.
- **Python** necesita de un espacio donde escribir los códigos, para que luego sean transformados en instrucciones para el computador. 

## ¿Dónde programar?

- [Sagemaker StudioLab](https://studiolab.sagemaker.aws): gratis + 24 horas
- [Sagemaker](https://portal.aws.amazon.com/billing/signup#/start/email): gratis + tarjeta de crédito/débito
- [Anaconda](https://www.anaconda.com/products/distribution)
- [Try jupyter](https://jupyter.org/try-jupyter/lab/): solo para probar

## Tipos de celdas

Dos tipos esenciales:

- **Código** (code)
- **Texto** (markdown)

Probemos! ¿Cuál debemos usar?

## Variables en Python

### Asuntos básicos de variables
En la expresiones
```python
palabra = 'Lima'
```
y 

```python
numero = 57
```

el contenido _Lima_ y _57_ se asigna a nombres específicos, que llamaremos **variables.**

In [45]:
## definimos las variables en una celda de código!

## variable tipo string
palabra = 'Lima'

## variable tipo número (entero)
numero = 57

In [46]:
## vemos qué hay adentro de la variable "palabra"

palabra

'Lima'

In [47]:
## vemos qué hay adentro de la variable "numero"

numero

57

Las **variables** (ya sean números, strings o listas (como veremos)) tienen características poderosas:

* Son **variables**, es decir, pueden variar en su contenido
* El **tipo de variable** cambia el significado de las oraciones. Aquí hay un poco de magia.  
* La **asignación ocurre de derecha a izquierda:** el signo "=" **NO** indica igualdad, sino que el hecho de que se está asignando lo que está a la derecha en la variable de la izquierda

y algunas **recomendaciones:**

* elijan nombres informativos, breves y que indiquen alguna información sobre el tipo de variable: NO elijan 837383838aux o variable o var
* respeten cuidadosamente los espacios, eso facilita la lectura
* usen comentarios cada vez que definan una variable: qué es, qué contiene

In [48]:
## ¿en qué sentido son variables? Asignemos nuevamente las variables palabra y numero

## nueva asignación de la variable tipo string
palabra = 'Santiago'

## nueva asignación de la variable tipo número (entero)
numero = 34

In [49]:
## pregunta: ¿Cuánto "valen" estas variables?

## vemos qué hay adentro de la (nueva asignación de la) variable "numero"

numero

34

In [50]:
## vemos qué hay adentro de la (nueva asignación de la) variable "palabra"

palabra

'Santiago'

¿Qué podemos **concluir**? Las variables se quedan con su **última asignación de contenido**

## Archivos: aspectos básicos

In [3]:
## leamos un archivo

archivo = open('datos/funes el memorioso-borges.txt', 'r', encoding='utf-8')

In [4]:
## ahora lo leemos

archivo_leido = archivo.read()

### Las operaciones entre variables dependen del contexto

Pensemos en dos preguntas muy simples: ¿Cómo podemos pegar (concatenar) strings? ¿Cómo sumamos números? El contenido (el **string**) 'Lima' se asigna a la variable "palabra". Ya sabemos que la variable "palabra" tiene como valor el que asignamos en su última asignación. Si tenemos dos strings, por ejemplo,

In [51]:
## asignación de un string a una variable

palabra1 = 'Lima'

## asignación de un string a una variable

palabra2 = 'Santiago'

In [52]:
palabra1, palabra2

('Lima', 'Santiago')

In [53]:
## podemos concatenarlos (pegarlos) usando

## concatenación de dos strings
'Lima' + 'Santiago'

'LimaSantiago'

In [54]:
## o bien

## concatenación de dos variables tipo string
palabra1 + palabra2

'LimaSantiago'

In [55]:
## o bien!

## asignación en la variable3 de la concatenación de dos variables tipo string
palabra3 = palabra1 + palabra2

In [56]:
palabra3

'LimaSantiago'

¿Cuál es la diferencia? ¿Qué hace el operador "+"? Si tenemos dos números, por ejemplo,

In [57]:
## asignación de un string a una variable

numero1 = 34

## asignación de un string a una variable

numero2 = 16

In [58]:
## podemos sumarlos usando

## suma de dos números
34 + 16

50

In [59]:
## podemos concatenarlos (pegarlos) usando

## concatenación de dos strings
numero1 + numero2

50

In [60]:
## o bien!

## asignación en numero3 de la suma de dos variables tipo número
numero3 = numero1 + numero2

In [61]:
numero3

50

In [62]:
## ¿Qué ocurre si "sumamos" números con strings?

numero1 + palabra1

TypeError: unsupported operand type(s) for +: 'int' and 'str'

¿Qué es **+** de acuerdo a los ejemplos anteriores? Una conclusión fundamental es:
    
* El operador **+** depende del contexto: números o strings!
* Solo podemos operar entre variables del mismo tipo!