<a href="https://colab.research.google.com/github/masterNLPIA2223/SeminarioComputacionProgramacion/blob/main/Python/Sesion2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Sesión 2: Un breve resumen de Python

El objetivo de este notebook es el de familiarizarnos con los conceptos más relevantes de Python. Esto puede llevar cierto tiempo y el propósito no es que aprendáis de memoria todo lo que aparezca en este notebook, sino que vayáis prácticando (a programar se aprende programando). 

## Los notebooks de Python

Los notebooks de Python pueden verse como una calculadora con una gran cantidad de funciones. Su funcionamiento es el mismo, escribes algo en ella, pulsas un botón, Python piensa unos segundos y devuelve una respuesta. 

El lugar donde escribes se llama **celda**, y se puede ejecutar la celda con el botón de ejecutar (la flecha a la izquierda de la celda). Con dicha ejecución se ejecuta el **código** escrito en la celda, es decir tu **programa**. Un programa sencillo en Python consiste en escribir únicamente un número.

In [None]:
1

1

Y la respuesta de Python es la misma que daría una calculadora. Es decir la **expresión** 1 al evaluarse se evalúa a `1`. Al contrario que una calculadora, puedes tener múltiples celdas en un notebook, y se puede ir de una a otra, reevaluarlas, editar y volver a evaluar. Podemos crear una nueva celda con el botón `+ Code` que está arriba a la izquierda y escribimos la expresión `1+1`.

Las celdas pueden consistir de múltiples líneas. Vamos a demostrarlo con un **comentario**. Los comentarios son piezas de un programa que son ignoradas por el ordenador, y que solo se incluyen para simplificar el trabajo de las personas que leen el código. En Python, la sintaxis para los comentarios comienza con el símbolo almohadilla (#). Todo lo que aparece detrás de dicho símbolo es un comentario. 

In [None]:
# Esto es un comentario
# Python ignorará esta línea, la de arriba y la de abajo
# Estas líneas solo están para la persona que lee el código
3 - 2

1

También es posible escribir celdas de texto, que no se ejecutan y permiten escribir texto formateado o enlaces entre otras funcionalidades. Para ello, hay que usar el botón `+ Text` que aparece arriba a la izquierda. Pero sigamos con algunos operadores de Python

El `*` operador se usa para multiplicar, `/` para divididir, `//` para la división truncada, `%` para el módulo, y `**` para la potencia. 

In [None]:
2*3

6

In [None]:
4/3

1.3333333333333333

In [None]:
4//3

1

In [None]:
2**3

8

In [None]:
16%12

4

En este punto posiblemente estés cansado de pulsar el botón de play para ejecutar las celdas. Para facilitar la interacción con los notebooks puedes usar los distintos atajos de teclados disponibles:
- `Alt + Enter`: evalúa la celda actual, inserta una nueva celda y cambia a ella.
- `Shift + Enter`: evalúa la celda actual y cambia a la siguiente celda.
- `Ctrl + Enter`: evalúa la celda actual y se queda en ella. 

## Textos como cadenas de caracteres

Hasta ahora hemos trabajado con números, pero en este máster nos interesa trabajar con textos. La manera más sencilla de representar texto en Python es mediante una cadena de caracteres. Las cadenas de caracteres, o **strings**, se pueden crear mediante las comillas. 

In [None]:
"¡Hola mundo!" 

'¡Hola mundo!'

In [None]:
'Hola mundo'

'Hola mundo'

¿Qué ocurre si queremos incluir en nuestro texto comillas? 

In [None]:
"En el artículo del periódico señalaban que "la policía allanó la casa de los sospechosos""

SyntaxError: ignored

Vemos que se ha producido un error de sintaxis (`SyntaxError`). Cuando se produce un error en la ejecución, Python muestra un mensaje con el objetivo de que el programador pueda solucionarlo. 

En este caso si queremos incluir comillas en nuestro texto debemos escaparlas mediante el símbolo `\`. 

In [None]:
"En el artículo del periódico señalaban que \"la policía allanó la casa de los sospechosos\""

'En el artículo del periódico señalaban que "la policía allanó la casa de los sospechosos"'

Al escapar un carácter cancelamos el significado por defecto de un carácter. Las secuencias de escape existen para incluir caracteres que por defecto no se pueden incluir en un texto. Por ejemplo, por defecto, no se puede incluir una nueva línea en un texto.

In [None]:
"una linea
otra linea"

SyntaxError: ignored

En este caso la solución es incluir la secuencia de escape `\n` que representa una nueva línea.

In [None]:
"una línea\notra línea"

'una línea\notra línea'

¿Por qué no aparece el salto de línea en lugar de la secuencia `\n`? Cuando se evalúa un string, Python muestra su representación canónica, la cual se puede incluir en otros bloques de código, pero que no es legible. Si queremos mostrar una versión del string tal y como aparecería en un fichero de texto necesitamos usar la función `print()`.

In [None]:
print("una línea\notra línea")

una línea
otra línea


Existen muchas secuencias de escape, por ejemplo el tabulador `\t`.

In [None]:
print("uno\tdos\ntres\tcuatro")

uno	dos
tres	cuatro


También es posible incluir caractéres basados en el código [Unicode](https://v4py.github.io/unicode.html) mediante `\N{...}`.

In [None]:
"\N{see-no-evil monkey}"

'🙈'

En caso de que queramos escribir un texto especialmente largo (con varios párrafos), puede ser molesto incluir `\n` cada vez que queramos incluir un salto de línea. La solución consiste en usar comillas triples.


In [None]:
"""una línea
otra línea"""

'una línea\notra línea'

In [None]:
print("""una línea
otra línea""")

una línea
otra línea


## Objetos y variables

Cuando escribimos código Python normalmente interactuamos y manipulamos varios **objetos**. Un objeto es un nombre genérico que puedes inspeccionar al ponerlo en una celda de código y evaluando dicha celda. Hasta el momento, hemos visto números, strings, y una **función** (sí, las funciones también son objetos). 

In [None]:
print

<function print>

Cuando se usa un objeto de manera repetida, es una buena idea almacenarlo en una **variable** mediante el **operador de asignación** `=`. De este modo evitamos escribir la expresión una y otra vez. El nombre de la variable es decisión del programador, aunque hay ciertas [reglas](https://docs.python.org/3/reference/lexical_analysis.html#identifiers), como que no pueden incluirse espacios en blanco (estos suelen remplazarse por guiones bajos `_`). 

In [None]:
cadena = "uno\tdos\ntres\tcuatro"
cadena

'uno\tdos\ntres\tcuatro'

Una vez asignado un objeto a una variable, este se puede usar en cualquier lugar usando la variable.

In [None]:
print(cadena)

uno	dos
tres	cuatro


Es posible que múltiples variables se refieran al mismo objeto.

In [None]:
otro_nombre = cadena
print(otro_nombre)

uno	dos
tres	cuatro


Podemos comprobar si dos variables se refieren al mismo objeto con el operador `is`. 

In [None]:
cadena is otro_nombre

True

In [None]:
cadena is print

False

In [None]:
cadena2 = "uno\tdos\ntres\tcuatro"
cadena is cadena2

False

Que dos objetos no sean el mismo no significa que no sean iguales, esto lo podemos comprobar mediante el operador `==`. 

In [None]:
cadena == cadena2

True

## Atributos: objetos en objetos (en objetos ...)

La mayoría de objetos no son islas aisladas, sino que la mayoría de objetos tienen otros objetos asociados a ellos que se llaman **atributos**, y que a su vez pueden tener atributos, etc. Para acceder a los atributos de un objeto se usa el símbolo `.`.

Veamos esto con los números complejos, que constan de parte real y parte imaginaria. La sintaxis para los números complejos en Python es la siguiente.

In [None]:
c = 1 + 2j
c

(1+2j)

En Python podemos acceder a la parte real e imaginaria de un número complejo mediante los atributos `.real` e `.imag` respectivamente.

In [None]:
c.real

1.0

In [None]:
c.imag

2.0

### Métodos

Las funciones también pueden estar asociadas a un objeto como atributos. Estas funciones proporcionan un comportamiento dinámico que depende del objeto al cual estén asociadas. Vamos a comparar la función `print()`que ya hemos visto anteriormente con el método `.conjugate()` asociado a los números complejos. 

In [None]:
print

<function print>

In [None]:
c.conjugate

<function complex.conjugate>

Al contrario de lo que ocurre con los datos habituales (números o strings), las funciones normalmente no se inspeccionan, sino que se **llaman** usando la sintaxis de llamada a función; es decir, añadiendo `()` al nombre de la función. Al llamar a una función se lanza su comportamiento y se ejecuta el código que está asociado a la misma. Por ejemplo, la función `print()` escribe objetos por pantalla. El método `conjugate()` calcula el [conjugado](https://es.wikipedia.org/wiki/N%C3%BAmero_complejo#Conjugado_de_un_n%C3%BAmero_complejo) de un número complejo. 

In [None]:
c.conjugate()

(1-2j)

Vamos a olvidarnos de los números complejos y centrarnos de nuevo en los strings. Una funcionalidad muy útil en los notebooks es el **completado tabular**. Si escribimos el nombre de una variable + `.` y pulsamos la combinación de teclas `Ctrl + Espacio`, se mostrará un menú con todos los métodos y atributos disponibles para dicho objeto. 

In [None]:
cadena.

Puedes ver que hay una gran cantidad de métodos disponibles. Muchos de ellos comienzan con el prefijo `is*`, y sirven para responder preguntas sobre el contenido de los strings. 

In [None]:
"cat".islower()

True

In [None]:
"DOC".isupper()

True

In [None]:
"Frank".istitle()

True

In [None]:
"42".isnumeric()

True

Si queremos saber más sobre un objeto, podemos escribir delante de él el símbolo de interrogación `?`. Por ejemplo, podemos mostrar qué hace el método `.islower()`.

In [None]:
?cadena.islower

Algunos de los métodos asociados a los objetos pueden requerir argumentos adicionales. Por ejemplo, si quieres reemplazar partes de un string con otro string podemos usar el método `.replace()` indicándole qué queremos reemplazar y con qué lo queremos reemplazar. 

In [None]:
"Me gustan los gatos y los perros".replace("gatos","pájaros")

'Me gustan los pájaros y los perros'

Notar que los métodos anteriores no modifican el string orignal, sino que crean uno nuevo.

In [None]:
animal = "gato"
animal.upper()

'GATO'

In [None]:
animal

'gato'

Esto se debe a que en Python los strings (y los números) son inmutables. Sin embargo, es posible crear nuevos strings y re-asignarlos a antiguas variables.

In [None]:
# Creamos un string y se lo asignamos a dos variables
nombre1 = "cadena"
nombre2 = nombre1

In [None]:
# Creamos un nuevo string que es una versión en mayúsculas del string original,
# y se lo reasignamos a nombre2
nombre2 = nombre2.upper()
nombre2

'CADENA'

In [None]:
# pero el string viejo está todavía ahí.
nombre1

'cadena'

Veremos a continuación que en Python hay objetos que pueden ser modificados.  

## Colecciones

Las colecciones o contenedores son objetos que contienen otros objetos, facilitando de este modo que se puedan manipular de manera conjunta. Hemos visto que casi todos los objetos de Python contienen otros objetos mediante sus atributos, pero dichos atributos están intimamente ligados a cada objeto. Por el contrario, las colecciones no se preocupan de su contenido, sino que se centran en organizar los elementos que contienen y dar acceso a los mismos. 

Para motivar la necesidad de las colecciones, imaginemos que queremos almacenar los tokens individuales de la frase "Vive y deja vivir". Sin las colecciones tendríamos que almacenar cada uno de los tokens en una variable.

In [None]:
cadena1 = "Vive"
cadena2 = "y"
cadena3 = "deja"
cadena4 = "vivir"

Esto puede ser muy tedioso en cuanto tenemos una gran cantidad de elementos. En lugar de eso podemos usar una lista de Python.

In [None]:
cadenas = ["Vive", "y", "deja", "vivir"]

### Elementos de una colección

Previamente ya nos hemos encontrado con un tipo de colección que son los strings. Un string puede verse como una colección de caractéres, o más concretamente una colección de strings. 

También en el ejemplo anterior hemos visto lo que eran las **listas**. Las listas pueden contener distintos tipos de objetos.

In [None]:
[1, "two", print]

[1, 'two', <function print>]

La lista vacía se crea del siguiente modo.

In [None]:
[]

[]

Muy cercanas a las listas nos encontramos las **tuplas** que se definen con la siguiente sintáxis. 

In [None]:
(1, "two", print)

(1, 'two', <function print>)

La tupla vacía se construye del siguiente modo.

In [None]:
()

()

Otro tipo de colección son los **diccionarios**. Los diccionarios no son solo almacenes de valores, sino de pares **clave-valor**. En concreto, los diccionarios mapean a cada clave un valor.

In [None]:
{"gato": "cat", "perro": "dog"}

{'gato': 'cat', 'perro': 'dog'}

Una restricción de los diccionarios es que las claves deben ser únicas. Si se proporcionan múltiples claves, sola se conservará la última.

In [None]:
{"impar": 1, "par": 2, "impar": 3, "par": 4}

{'impar': 3, 'par': 4}

En caso de necesitar múltiples valores por clave, se puede usar una colección.

In [None]:
{"par": [2,4], "impar": [1,3]}

{'par': [2, 4], 'impar': [1, 3]}

Para acceder a los valores asociados a la clave de un diccionario usamos la siguiente sintáxis. 

In [None]:
ejemplo = {"par": [2,4], "impar": [1,3]}
ejemplo["par"]

[2, 4]

El diccionario vacío se define del siguiente modo. 

In [None]:
{}

{}

Aunque no lo parezca, los diccionarios se emplean mucho en Python y proporcionan una estructura de datos muy versatil. 

Los **conjuntos** se parecen a los diccionarios en su sintáxis (también utilizan `{}`) pero en este caso solo almacenan valores. En el caso de los conjuntos no se admiten elementos repetidos, y estos se desechan. 

In [None]:
{1, 2, 3, 1, 2, 3}

{1, 2, 3}

Esto facilita la obtención de vocabularios de palabras únicas. 

In [None]:
{"el", "gato", "sentado", "en", "el", "sillón"}

{'el', 'en', 'gato', 'sentado', 'sillón'}

La construcción de un conjunto vacío no se hace mediante `{}`, ya hemos visto que está reservada esa sintáxis para construir un diccionario vacío, sino mediante `set()`.

In [None]:
set()

set()

### Algunas funciones comunes

Hay ciertas funciones comunes que sirven para cualquier tipo de colección. Por ejemplo, la función `len()` nos indica el número de elementos de una colección.

In [None]:
len([1, 2, 3])

3

In [None]:
len("Universidad de La Rioja")

23

In [None]:
len({"gato": "cat", "perro": "dog"})

2

La función `in` también está disponible para todas las colecciones y sirve para averiguar si un elemento pertenece a una lista. 

In [None]:
1 in [1, 2, 3]

True

In [None]:
"one" in [1, 2, 3]

False

In [None]:
"gato" in {"gato": "cat", "perro": "dog"}

True

In [None]:
"cat" in {"gato": "cat", "perro": "dog"}

False

Para acceder a los elementos de listas o tuplas, usamos la sintaxis `[...]`. La sintaxis *slice* sirve para referirse a subpartes de una colección.

Slice: `s[start:end]`  $\rightarrow$  elementos de `s` que empiezan en la posición `start` y terminan en la posición `end-1`.

In [None]:
s = "Universidad"

In [None]:
s[1:4]

'niv'

In [None]:
s[1:]

'niversidad'

In [None]:
s[:]

'Universidad'

In [None]:
s[4]

'e'

In [None]:
s[:-3]

'Universi'

In [None]:
s[-3:]

'dad'

Esta sintáxis se puede usar con listas y tuplas, pero no con diccionarios o conjuntos. 

In [None]:
dic = {"gato": "cat", "perro": "dog"}
dic[0]

KeyError: ignored

In [None]:
conjunto = {1, 2, 3}
conjunto[0]

TypeError: ignored

Para eliminar elementos de una colección podemos usar la función `del`. Sin embargo, esta función solo se puede utilizar en colecciones mutables (listas y diccionarios), pero no en tuplas o conjuntos que son inmutables. 

In [None]:
lista = [1, 2, 3]
del lista[0]
lista

[2, 3]

In [None]:
tupla = (1, 2, 3)
del tupla[0]
tupla

TypeError: ignored

In [None]:
conjunto = {1, 2, 3}
del conjunto[0]
conjunto

TypeError: ignored

In [None]:
dic = {"gato": "cat", "perro": "dog"}
del dic["gato"]
dic

{'perro': 'dog'}

## Importando librerías adicionales

En cualquier sesión de Python tenemos disponibles por defecto un conjunto de funciones y tipos de datos. Con dicha funcionalidad es posible programar prácticamente cualquier cosa que se nos ocurra, sin embargo si todos tendríamos que empezar desde cero nuestros programas, esto se podría volver una tarea tediosa. Es por esto que existen bloques de código que son reusables y que se pueden **importar** en Python para extender su funcionalidad. Estos bloques se conocen como librerías, paquetes o módulos. 

Importar una librería en Python es muy sencillo. Por ejemplo, la librería `nltk` que usamos en la sesión anterior se importa mediante el siguiente comando. 

In [None]:
import nltk

La anterior instrucción importa el módulo `nltk`y crea una variable `nltk` que se puede usar para acceder los objetos definidos en dicho módulo mediante la sintaxis de atributo. Por ejemplo, la función `word_tokenize()` rompe un texto en sus tokens, y la función `download()` sirve para descargar distintos paquetes de la librería nltk. 

In [None]:
nltk.download('punkt')
nltk.word_tokenize("Vive y deja vivir.")

[nltk_data] Downloading package punkt to /root/nltk_data...
[nltk_data]   Package punkt is already up-to-date!


['Vive', 'y', 'deja', 'vivir', '.']

En caso de que ya tengamos una variable con el nombre `nltk` nos puede interesar usar un alias. 

In [None]:
import nltk as lenguaje

El comando anterior importa el módulo `nltk` pero lo almacena en una variable llamada `lenguaje`. 

In [None]:
lenguaje.word_tokenize("Vive y deja vivir.")

['Vive', 'y', 'deja', 'vivir', '.']

Al importar un módulo, estamos importando todos sus objetos, pero puede que nos interese solo uno de ellos, y evitar el uso constante del nombre de la librería. Para importar únicamente una función de un módulo podemos usar la siguiente sintaxis. 

In [None]:
from nltk import word_tokenize
word_tokenize("Vive y deja vivir.")

['Vive', 'y', 'deja', 'vivir', '.']

No todos los paquetes disponibles para Python vienen instalados por defecto en nuestro entorno. Por ejemplo, si intentamos importar la librería `requests_html` que usamos en la sesión anterior obtendremos un error. 

In [None]:
import requests_html

ModuleNotFoundError: ignored

Para instalar dicha librería debemos hacerlo mediante un gestor de paquetes. En el entorno de Google Colaboratory esto se hace mediante el comando de sistema `pip`.

In [None]:
!pip install requests_html

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting requests_html
  Downloading requests_html-0.10.0-py3-none-any.whl (13 kB)
Collecting pyppeteer>=0.0.14
  Downloading pyppeteer-1.0.2-py3-none-any.whl (83 kB)
[K     |████████████████████████████████| 83 kB 1.6 MB/s 
[?25hCollecting pyquery
  Downloading pyquery-1.4.3-py3-none-any.whl (22 kB)
Collecting parse
  Downloading parse-1.19.0.tar.gz (30 kB)
Collecting w3lib
  Downloading w3lib-2.0.1-py3-none-any.whl (20 kB)
Collecting fake-useragent
  Downloading fake-useragent-0.1.11.tar.gz (13 kB)
Collecting pyee<9.0.0,>=8.1.0
  Downloading pyee-8.2.2-py2.py3-none-any.whl (12 kB)
Collecting websockets<11.0,>=10.0
  Downloading websockets-10.3-cp37-cp37m-manylinux_2_5_x86_64.manylinux1_x86_64.manylinux_2_12_x86_64.manylinux2010_x86_64.whl (112 kB)
[K     |████████████████████████████████| 112 kB 29.8 MB/s 
Collecting urllib3<2.0.0,>=1.25.8
  Downloading urllib3-1.26.12-py2.py3-none

In [None]:
import requests_html

## Flujos de control

Hasta el momento la ejecución de nuestro código ha sido siempre lineal; es decir, todas las instrucciones que escribíamos en las celdas de nuestro código se ejecutaban una única vez. Sin embargo, nos puede intersar tener comportamientos más ricos que se especifican con distintos flujos de control.


### Condicionales if-else

Los condicionales sirven para ejecutar un código u otro dependiendo de si se cumplen ciertas condiciones. Su sintaxis es la siguiente (notar que el código está indentado hacia la derecha cuando se entra en el bloque `if` y en el bloque `else`):

```
if <condicion>:
  <codigo si se cumple condición>
else:
  <condigo si no se cumple la condición>
```

Por ejemplo, el siguiente bloque de código muestra por pantalla par si el valor de `n` es un número par, e impar en caso contrario. 

In [None]:
n = 3 # Prueba a cambiar el valor asignado a n
if (n%2 == 0):
  print("par")
else:
  print("impar")

impar


El código dentro de los bloques `if` y `else` puede constar de varias líneas de código.

In [None]:
n = 8 # Prueba a cambiar el valor asignado a n
if (n%2 == 0):
  print("Entro por el if")
  print("par")
else:
  print("Entro por el else")
  print("impar")

Entro por el if
par


No siempre es necesario que haya un bloque `else`. Esto puede servir para realizar una acción cuando se cumple una condición, y continuar con la ejecución del programa; y en caso contrario, simplemente continuar con la ejecución del programa. 

In [None]:
n = 3 # Prueba a cambiar el valor asignado a n
if (n%2 == 0):
  print("Es un número par")

print("Continuo con la ejecución")

Continuo con la ejecución


### Bucles

Los bucles sirven para repetir un conjunto de operaciones un número de veces dada, por ejemplo para realizar la misma operación para todos los elementos de una colección. 

Para ello podemos usar la siguiente sintaxis:
```
for <elemento> in <coleccion>:
  ...
```

Por ejemplo, imaginad que queremos calcular la media de las longitudes de las palabras de la frase "Vive y deja vivir", para lo cual tenemos que sumar las longitudes de las palabras y dividir por el número de palabras total. 

In [None]:
frase = "Vive y deja vivir"
# Construimos una lista que esté formada por cada una de las palabras de la frase
palabrasFrase = frase.split(' ')
# Definimos una variable donde iremos sumando cada una de las longitudes de cada
# palabra. El valor inicial de esta variable será 0.
sumaLongitudes = 0
for palabra in palabrasFrase:
  # Para cada palabra de la lista, sumamos su longitud a la variable
  sumaLongitudes = sumaLongitudes + len(palabra)
# Finalmente dividimos la suma de las longitudes entre el número de palabras de 
# la frase
sumaLongitudes / len(palabrasFrase)

3.5

Veamos ahora cómo calcular la distribución de frecuencias de un texto combinando un bucle con condicionales. Nuestro objetivo va a ser dado un texto, construir un diccionario en el que las claves sean las palabras de cada texto, y el valor asociado sea el número de apariciones de esa palabra en el texto. 

In [None]:
# Nuestro texto va a ser el primer párrafo de la página de wikipedia:
# https://es.wikipedia.org/wiki/Inteligencia_artificial
texto = "La inteligencia artificial es, en ciencias de la computación, la disciplina que intenta replicar y desarrollar la inteligencia y sus procesos implícitos a través de computadoras. No existe un acuerdo sobre la definición completa de inteligencia artificial, pero se han seguido cuatro enfoques: dos centrados en los humanos (sistemas que piensan como humanos, y sistemas que actúan como humanos) y dos centrados en torno a la racionalidad (sistemas que piensan racionalmente y sistemas que actúan racionalmente). Comenzó poco después de la Segunda Guerra Mundial, y el nombre se acuñó en 1956 en la Conferencia de Dartmouth por el informático John McCarthy."
# Definimos un diccionario vacío
frecuencias = {}
# recorremos cada una de las palabras del diccionario
for palabra in texto.split(' '):
  # si la palabra no está en el diccionario, la añadimos con valor 1
  if palabra not in frecuencias:
    frecuencias[palabra] = 1
  # En caso contrario sumamos uno al valor actual de la palabra
  else:
    frecuencias[palabra] = frecuencias[palabra] + 1

# Finalmente mostramos el diccionario
frecuencias

{'La': 1,
 'inteligencia': 3,
 'artificial': 1,
 'es,': 1,
 'en': 5,
 'ciencias': 1,
 'de': 5,
 'la': 7,
 'computación,': 1,
 'disciplina': 1,
 'que': 5,
 'intenta': 1,
 'replicar': 1,
 'y': 6,
 'desarrollar': 1,
 'sus': 1,
 'procesos': 1,
 'implícitos': 1,
 'a': 2,
 'través': 1,
 'computadoras.': 1,
 'No': 1,
 'existe': 1,
 'un': 1,
 'acuerdo': 1,
 'sobre': 1,
 'definición': 1,
 'completa': 1,
 'artificial,': 1,
 'pero': 1,
 'se': 2,
 'han': 1,
 'seguido': 1,
 'cuatro': 1,
 'enfoques:': 1,
 'dos': 2,
 'centrados': 2,
 'los': 1,
 'humanos': 1,
 '(sistemas': 2,
 'piensan': 2,
 'como': 2,
 'humanos,': 1,
 'sistemas': 2,
 'actúan': 2,
 'humanos)': 1,
 'torno': 1,
 'racionalidad': 1,
 'racionalmente': 1,
 'racionalmente).': 1,
 'Comenzó': 1,
 'poco': 1,
 'después': 1,
 'Segunda': 1,
 'Guerra': 1,
 'Mundial,': 1,
 'el': 2,
 'nombre': 1,
 'acuñó': 1,
 '1956': 1,
 'Conferencia': 1,
 'Dartmouth': 1,
 'por': 1,
 'informático': 1,
 'John': 1,
 'McCarthy.': 1}

**Ejercicio**: El texto anterior tiene signos puntuación que nos interesa descartar, copia el código de la celda anterior en la celda siguiente, y modifícalo para que como primer paso se eliminen del texto los signos de puntuación (busca qué hace el método `replace()`, puedes ver su funcionamiento ejecutando el comando `?str.replace`)  y se pase el texto a minúsculas (busca qué hace el método `lower()`, puedes ver su funcionamiento ejecutando el comando `?str.lower`). 




## Definición de funciones

Ya hemos visto la gran cantidad de cosas que se puede hacer con bucles y condicionales, sin embargo si una **funcionalidad** la usamos muy frecuentemente, resulta muy pesado tener que escribir el código todas las veces. Para estas funcionalidades existen abreviaturas. Es decir, alguien (tú u otro programador) escribió un comando que hace todo lo que quieres con solo escribir una palabra. Esto se lleva a cabo mediante lo que se conoce como **funciones**. Ya hemos encontrado ejemplos de estas abreviaturas, por ejemplo las funciones `split()` o `replace()`. 

Una función es un mini-programa: recibe una entrada y produce una salida utilizando los principios que hemos visto hasta el momento. La sintaxis para definir una función es la siguiente:

```
def <nombre-funcion> (<entrada1>, <entrada2>, ..., <entradaN>):
  # Código que se ejecuta con los parámetros de entrada
  ...
  return <valor-a-devolver>
```

Por ejemplo, podemos definir una función que calcule la distribución de frecuencias de un texto

In [None]:
def frecuencia_texto(texto):
  # Definimos un diccionario vacío
  frecuencias = {}
  # recorremos cada una de las palabras del diccionario
  for palabra in texto.split(' '):
    # si la palabra no está en el diccionario, la añadimos con valor 1
    if palabra not in frecuencias:
      frecuencias[palabra] = 1
    # En caso contrario sumamos uno al valor actual de la palabra
    else:
      frecuencias[palabra] = frecuencias[palabra] + 1

  # Finalmente devolvemos el diccionario
  return frecuencias

Una vez definida esta función la podemos usar tantas veces como queramos sin tener que repetir todo el cuerpo de la función.

In [None]:
frecuencia_texto("Vive y deja vivir")

{'Vive': 1, 'y': 1, 'deja': 1, 'vivir': 1}

**Ejercicio:** Crea una nueva función con el código que implementaste anteriormente para contar la frecuencia de cada palabra eliminando primero signos de puntuación y pasando el texto a minúsculas. 