# **Prática 1 - Procesamiento del Lenguaje Natural**


# Introducción a Google Colab

El documento que está leyendo no es una página web estática, sino un entorno interactivo denominado notebook de Google Colab, que permite escribir y ejecutar código.


Los notebooks de Colab permiten combinar <strong>código ejecutable</strong> y <strong>texto enriquecido</strong> en un único documento, junto con <strong>imágenes</strong>, <strong>HTML</strong>, y mucho más. Los notebooks que cree en Colab se almacenan en su cuenta de Google Drive. Puede compartir fácilmente los notebooks de Colab con amigos o compañeros de trabajo para que realicen comentarios o los editen. Para más información, consulte la <a href="/notebooks/basic_features_overview.ipynb">Descripción general de Colab</a>. Para crear un nuevo notebook de Colab, vaya al menú "Archivo" y pulse "Nuevo cuaderno" para crear un nuevo notebook de Colab.

Los notebooks de Colab son notebooks de Jupyter que aloja Colab. Para obtener más información sobre el proyecto Jupyter, visite <a href="https://www.jupyter.org">jupyter.org</a>.

## Celdas
Un notebook está compuesto por una lista de celdas. Pueden ser de dos clases: de código o de texto. Para seleccionar una celda haz clic en ella.


### Celdas de texto
Esta es una celda de texto. Haga doble clic en ella para editarla. Use **markdown**. Si quiere aprender este markdown haga clic en la [guía de markdown de google](/notebooks/markdown_guide.ipynb).

Puede añadir cualquier tipo de ecuación matemática usando sintaxis de [LaTeX](http://www.latex-project.org/) y renderizando con [MathJax](https://www.mathjax.org). Simplemente añada un par de **\$** encerrando la ecuación. Por ejemplo  `$\sqrt{3x-1}+(1+x)^2$` se verá como 
$\sqrt{3x-1}+(1+x)^2.$


### Celdas de código
La celda que hay a continuación es de código. Observa las diferencias en apariencia. Haz clic en ella y ejécutala con una de las siguientes maneras:

* Pulsa en el icono **Play** a la izquierda de la celda
* Teclea **Cmd/Ctrl+Enter**

Hay más formas, pero con estas tenemos suficientes para continuar.


In [None]:
a = 11
print(a)

11


## Añadiendo y moviendo celdas
Puede añadir celdas pulsando los iconos **+ CODE** y **+ TEXT** que están en la barra de tareas encima del notebook.

Puede mover la celda seleccionada haciendo clic en los iconos de flechas que se muestran en la botonera que aparece al activar la celda (hacer clic sobre ella) en su parte de arriba a la derecha. 

# Python

La ejecución de una celda puede ser interrupida seleccionando en el menú **Entorno de ejecución -> Interrumpir ejecución**. Pruébalo ejecutando y abortando la siguiente celda:

In [None]:
import time
print("Sleeping")
time.sleep(30) # sleep for a while; interrupt me!
print("Done Sleeping")

Sleeping
Done Sleeping


## Acceso a la ayuda desde el tabulador

Si no recuerda el nombre de un metodo o solo recuerda el comienzo de una instrucción, simplemente espera un par de segundos y aparece la ayuda automáticamente.



# Introducción a la sintaxis de Python

Aunque la sintaxis de Python permite muchas variaciones, existe una guía de estilo que es recomendable para todo programador de Python. Cuando acabe el curso y antes de empezar a usar Python como tu lenguaje de programación es más que leerla atentamente:

[Guía de estilo de Python: PEP 8](https://www.python.org/dev/peps/pep-0008/)

Veamos lo básico para poder escribir programas simples en Python que nos permitan dominar los entornos que hemos explicado. 

## Tipos numéricos

Python dispone de los tipos numéricos y las operaciones más habituales (**ejecuta las celdas y comprueba lo que pasa**):

In [None]:
2 * 4 - (7 - 1) / 3 + 1.0

7.0

In [None]:
print(2+5)

7


Las divisiones por cero lanzan un error (ejecuta la siguientes celdas):

In [None]:
1/0

ZeroDivisionError: ignored

La división en Python es división entera o real en función del operador que se use (ejecuta la siguiente celda):

In [None]:
x = 3 / 2
print("x =",x)

y = 3 // 2
print("y =",y)

x = 1.5
y = 1


El operador potencia es ******

In [None]:
2 ** 16

65536

Tenemos números complejos

In [None]:
2+5j

(2+5j)

Podemos __convertir variables__ a `int, float, complex, str`...

In [None]:
int(1.96)

1

In [None]:
round(1.9)

2

Podemos comprobar el tipo de una variable:

In [None]:
a = 2.7
print(type(a))

<class 'float'>


## Listas y Tuplas

Otro tipo de datos muy importante que vamos a usar son las secuencias: las tuplas y las listas. Ambos son conjuntos ordenados de elementos: las tuplas se demarcan con paréntesis y las listas con corchetes.

In [None]:
mi_lista = [1, 2, 3.0, 4 + 0j, "5"]
mi_tupla = (1, 2, 3.0, 4 + 0j, "5")
print(mi_lista)
print(mi_tupla)
print(mi_lista == mi_tupla)


[1, 2, 3.0, (4+0j), '5']
(1, 2, 3.0, (4+0j), '5')
False


### Diferencias entre tuplas y listas

* Una lista puede ser alterada, no así una tupla.
* Una tupla puede ser utilizada como clave en un diccionario, una lista no.
* Una tupla consume menos memoria que una lista.

In [None]:
2 in mi_lista

True

In [None]:
2 not in mi_tupla

False

In [None]:
len(mi_lista)

5

In [None]:
len(mi_tupla)

5

In [None]:
print(mi_lista)
mi_lista.insert(3 , 3.5)
mi_lista

[1, 2, 3.0, (4+0j), '5']


[1, 2, 3.0, 3.5, (4+0j), '5']

In [None]:
mi_lista.append(6) # añade el 6 al final
print(mi_lista)

mi_lista.extend([7, 8]) # añade los elementos 7 y 8 al final
print(mi_lista)

mi_lista.insert(0, 0.0) # añade el 0.0 al principio
print(mi_lista)

[1, 2, 3.0, 3.5, (4+0j), '5', 6]
[1, 2, 3.0, 3.5, (4+0j), '5', 6, 7, 8]
[0.0, 1, 2, 3.0, 3.5, (4+0j), '5', 6, 7, 8]


In [None]:
mi_lista.remove(3.5) #elimina el 3.5
print(mi_lista)

dato = mi_lista.pop(0) #saca al primer elemento y lo devuelve
print(dato)

dato = mi_lista.pop() #si no hay índice saca el último
print(dato)
print(mi_lista)

[0.0, 1, 2, 3.0, (4+0j), '5', 6, 7, 8]
0.0
8
[1, 2, 3.0, (4+0j), '5', 6, 7]


In [None]:
# concatenar listas y tuplas
lista1=[1, 2, 3]
lista2=[4, 5, 6]
lista3=lista1+lista2
print(lista3)

tupla1=(1, 2, 3)
tupla2=(4, 5, 6)
tupla3=tupla1+tupla2
print(tupla3)


[1, 2, 3, 4, 5, 6]
(1, 2, 3, 4, 5, 6)


Podemos hacer listas de listas

In [None]:
bolas = ['roja', 'negra', 'blanca', 'azul']
chuches = ['regaliz', 'chicle', 'piruleta']
edades = [15, 18, 25, 35]

cosas = [bolas, chuches, edades]

print(cosas)

[['roja', 'negra', 'blanca', 'azul'], ['regaliz', 'chicle', 'piruleta'], [15, 18, 25, 35]]


Para buscar y ordenar también tenemos varios métodos:

In [None]:
estudiantes = ['Rosa', 'Antonio', 'Ismael', 'Anabel', 'Miguel', 'Cristina', 'Lucas', 'Miguel']

estudiantes.reverse()
print(estudiantes)

estudiantes.sort(reverse=True)
print(estudiantes)

estudiantes.sort()
print(estudiantes)

print("Miguel aparece :", estudiantes.count('Miguel'), "veces.")
print("Miguel aparece en la posición: ", estudiantes.index('Miguel')) #busca en las posiciones 0..5

['Miguel', 'Lucas', 'Cristina', 'Miguel', 'Anabel', 'Ismael', 'Antonio', 'Rosa']
['Rosa', 'Miguel', 'Miguel', 'Lucas', 'Ismael', 'Cristina', 'Antonio', 'Anabel']
['Anabel', 'Antonio', 'Cristina', 'Ismael', 'Lucas', 'Miguel', 'Miguel', 'Rosa']
Miguel aparece : 2 veces.
Miguel aparece en la posición:  5


## Introducir e imprimir datos 

En programación, a veces necesitamos que los datos nos vengan del usuario final de la aplicación y nosotros debemos tratar esos datos y orientar al usuario para que sepa qué debe escribir o qué tipo de dato escribir.

Usamos input (o raw_input) donde le podemos poner un mensaje orientativo para ayudar al usuario.

Veamos algun ejemplo:

In [None]:
edad = input("Introduce tu edad: ") 
print ("Tu edad es: " + edad)

Introduce tu edad: 20
Tu edad es: 20


In [None]:
#input devuelve un string!!
print(edad*2)
print(int(edad)*2)

6767
134


La salida podemos formatearla con un estilo muy parecido a C

In [None]:
# Esto imprime "Hola, Juan!"

nombre = "Juan"
edad = 18
nota = 7.677787

print("Hola, %s! dijiste que tenías %d años?" % (nombre, edad))
print("Has sacado un %.2f de nota final" % nota)


Hola, Juan! dijiste que tenías 18 años?
Has sacado un 7.68 de nota final


### Rangos

Los rangos son tipos especiales en Python y tienen una sintaxis que ahorra mucho código y es tremendamente intuitiva

In [None]:
# rango del 0 al 5
list(range(6))

[0, 1, 2, 3, 4, 5]

In [None]:
# igual rango pero las posiciones impares
# empieza en 0, termina en 5 y salta de dos en dos:
list(range(0, 5, 2))

[0, 2, 4]

In [None]:
# igual rango pero en sentido decreciente
# empieza en 5, termina en -1, en sentido decreciente
list(range(5, -1, -1))

[5, 4, 3, 2, 1, 0]

## Estructuras de control

En Python los bloques se delimitan usando el sangrado, utilizando siempre cuatro espacios (esto de cuatro es una norma de estilo). Cuando ponemos los dos puntos al final de la primera línea del condicional, todo lo que vaya a continuación con un nivel de sangrado superior se considera dentro del condicional. En cuanto escribimos la primera línea con un nivel de sangrado inferior, hemos cerrado el condicional. Si no seguimos esto a rajatabla, Python nos dará errores. Es una forma de forzar a que el código sea legible.

### Condicionales

Los condicionales tienen la siguiente forma:

    if <condición>:
        <haz lo que sea>
    elif <condición>:
        <haz otra cosa>
    else:
        <haz otra cosa>

#### Algunos ejemplos aclaratorios

In [None]:
x = 7
y = 2
x, y = 7, 2
if x > y:
    print("x es mayor que y")
    print("x sigue siendo mayor que y")

x es mayor que y
x sigue siendo mayor que y


In [None]:
if 1 < 0:
    print("Es falso que  1 < 0")
print("Mira como estoy fuera del IF") 

Mira como estoy fuera del IF


In [None]:
if 1 < 0:
    print("1 es menor que 0")
    print("1 sigue siendo menor que 0") # hay que sangrar correctamente

In [None]:
print("x =", x, ", y=", y)
if x > y:
    print("x es mayor que y")
else:
    print("y es menor que x")

x = 7 , y= 2
x es mayor que y


In [None]:
print("x =", x, ", y=", y)
if not x < y:
    print("x es menor que y")
elif x == y:
    print("x es igual a y")
elif x > y:
  print("x es mayor a y")
else:
    print("x no es ni menor ni igual que y")

x = 7 , y= 2
x es menor que y


### Bucles

En Python existen dos tipos de estructuras de control típicas:

1. Bucles `while`
2. Bucles `for`



#### **while**

Los bucles `while` repetirán las sentencias anidadas en él mientras se cumpla una condición:

    while <condición>:
        <cosas que hacer>
        
Como en el caso de los condicionales, los bloques se separan por indentación sin necesidad de sentencias del tipo `end`

In [None]:
i = -2
while i < 5:
    print(i)
    i += 1

-2
-1
0
1
2
3
4


Se puede interrumpir el bucle a la mitad con la sentencia break:

In [None]:
i = -2
while i < 5:
    print(i)
    i += 1
    if i==3:
        break

-2
-1
0
1
2


Un bloque *else* justo después del bucle se ejecuta si no ha sido interrumpido por nosotros:

In [None]:
i = -2
while i < 5:
    print(i)
    i += 1
    if i==3:
        break
else:
    print("El bucle ha terminado.")

-2
-1
0
1
2


In [None]:
i = -2
while i < 5:
    print(i)
    i += 1
    #if i==3:
    #    break
else:
    print("El bucle ha terminado.")

-2
-1
0
1
2
3
4
El bucle ha terminado.


#### **for**

El otro bucle en Python es el bucle `for` y funciona de manera que puede resultar chocante al principio ya que tiene multitud de formas sintácticas. La idea es recorrer un conjunto de elementos, o dicho correctamente, recorrer todos los elementos de un objeto iterable:

    for <elemento> in <objeto iterable>:
        <haz lo que sea...>

In [None]:
for i in (1,2,3,4,5):
    print(i)

1
2
3
4
5


In [None]:
l = ["Juanly", "Siro", "Carlos"]
for nombre in l:
    print(nombre)

Juanly
Siro
Carlos


In [None]:
for i in range(3):
    print(i)

0
1
2


In [None]:
for j in range(2, 5):
    print(j)

2
3
4


In [None]:
for nombre in "Juanlu", "Siro", "Carlos":
    if nombre == "Carlos":
        break
    print(nombre)
    
else:
    print("¿Carlos excluido?")

Juanlu
Siro


## Funciones


En Python, la definición de funciones se realiza mediante la instrucción *def* más un nombre de función descriptivo, para el que se aplican las mismas reglas que para el nombre de las variables, seguido de los paréntesis de apertura y cierre. La definición de la cabecera de la función termina con dos puntos (:). El algoritmo que la compone, irá indentado con 4 espacios:


In [None]:
def mi_funcion(): 
    print('2*2=4')

¿Cómo se llama a la función? como en todos los lenguajes: por su nombre

In [None]:
mi_funcion()

2*2=4


¿Se les puede poner parámetros? Pueden tener tantos parámetros como sea necesario, incluso no definirlos directamente y pasar un número intedeterminado de ellos, o "peor" aún, pasarle el número de parametros correcto pero empaquetados en una lista, o en una tupla, por ejemplo.

¿Pueden devolver valores, simples o complejos? Tampoco hay restricciones, pueden devolver lo que sea. Aquí se muestran varios ejemplos:


In [None]:
# Cómo no, la función "Hola mundo"
def funcion(): 
    return "Hola Mundo" 

#esto sería el programa principal
frase = funcion() 
print(frase)

In [None]:
# Esta función recibe dos cadenas de caracteres y las concatena
def completa_nombre(nombre, apellidos): 
    nombre_completo = nombre + ' ' + apellidos
    return nombre_completo 
 
# este es el programa principal
nombre, apellidos = "Leonardo", "Torres Quevedo"
nombre_completo = completa_nombre(nombre, apellidos)
print(nombre_completo)

## Diccionarios
En Python, un diccionario es una colección no-ordenada de valores que son accedidos a traves de una clave. Es decir, en lugar de acceder a la información mediante el índice numérico, como es el caso de las listas y tuplas, es posible acceder a los valores a través de sus claves, que pueden ser de diversos tipos.

Las claves son únicas dentro de un diccionario, es decir que no puede haber un diccionario que tenga dos veces la misma clave, si se asigna un valor a una clave ya existente, se reemplaza el valor anterior.

No hay una forma directa de acceder a una clave a través de su valor, y nada impide que un mismo valor se encuentre asignado a distintas claves. 

La informacion almacenada en los diccionarios, no tiene un orden particular. Ni por clave, ni por valor, ni tampoco por el orden en que han sido agregados al diccionario.

Cualquier variable de tipo inmutable, puede ser clave de un diccionario: cadenas, enteros, tuplas (con valores inmutables en sus miembros), etc. No hay restricciones para los valores que el diccionario puede contener, cualquier tipo puede ser el valor: listas, cadenas, tuplas, otros diccionarios, objetos...

De la misma forma que con listas, es posible definir un diccionario directamente con los miembros que va a contener, o bien inicializar el diccionario vacío y luego agregar los valores de uno en uno o de muchos en muchos.

Para definirlo junto con los miembros que va a contener, se encierra el listado de valores entre llaves, las parejas de clave y valor se separan con comas, y la clave y el valor se separan con :.

In [None]:
punto = {'x': 2, 'y': 1, 'z': 4}
punto

{'x': 2, 'y': 1, 'z': 4}

In [None]:
materias = {}
materias["lunes"] = [6103, 7540]
materias["martes"] = [6201]
materias["miercoles"] = [6103, 7540]
materias["jueves"] = []
materias["viernes"] = [6201]
materias

{'jueves': [],
 'lunes': [6103, 7540],
 'martes': [6201],
 'miercoles': [6103, 7540],
 'viernes': [6201]}

Para acceder al valor asociado a una determinada clave, se hace de la misma forma que con las listas, pero utilizando la clave elegida en lugar del índice.

In [None]:
print(materias["lunes"])

[6103, 7540]


### Recorriendo un diccionario

Existen diversas formas de recorrer un diccionario. Es posible recorrer sus claves y usar esas claves para acceder a los valores.

In [None]:
for dia in materias:
   print(dia, ":", materias[dia])

lunes : [6103, 7540]
martes : [6201]
miercoles : [6103, 7540]
jueves : []
viernes : [6201]


Es posible, también, obtener los valores como tuplas donde el primer elemento es la clave y el segundo es el valor.

In [None]:
for dia, codigos in materias.items():
   print(dia, ":", codigos)

lunes : [6103, 7540]
martes : [6201]
miercoles : [6103, 7540]
jueves : []
viernes : [6201]


## Activar Google Drive de forma local

En los ejemplos siguientes se muestra cómo activar Google Drive en tu entorno de ejecución con un código de autorización y cómo puedes escribir y leer archivos en ese entorno. Cuando se haya ejecutado, podrás ver el nuevo archivo &#40;<code>foo.txt</code>&#41; en <a href="https://drive.google.com/">https://drive.google.com/</a>.

De esta manera, solo se permite la lectura, escritura y transferencia de archivos. Para modificar de forma programática las opciones para compartir u otros metadatos, utiliza una de las opciones que se indican a continuación.

<strong>Nota:</strong> Si un usuario utiliza el botón Activar Drive en el explorador de archivos, no hará falta ningún código de autenticación en los cuadernos que no haya editado nadie más.

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


## Ficheros

El tratamiento de ficheros en Python es identico a la mayoría de lenguajes de programación. Tiene instrucciones para abrir y cerrar ficheros, para leer y escribir, distintos modos de apertura...

Para leer un fichero de texto basta con abrir y leer. Este código lo ilustra:

El módulo *os* nos permite acceder a funcionalidades dependientes del Sistema Operativo. Sobre todo, aquellas que nos refieren información sobre el entorno del mismo y nos permiten manipular la estructura de directorios (para leer y escribir archivos)

Más información: https://uniwebsidad.com/libros/python/capitulo-10/modulos-de-sistema

In [None]:
import os # no es necesario pero para no escribir los directorios cambio al destino
path = os.chdir("/content/drive/MyDrive/PLN")
os.getcwd()

### Leer datos

Para leer de un fichero se usan los métodos *read*, *readline* y *readlines*. Veamos unos ejemplos:

In [None]:
#lee el fichero entero en la variable dato
f = open("archivo.txt") #lo abre en modo lectura
dato = f.read() #lee todo!!
print(dato)
f.close()

a
a
a
a
a
a



In [None]:
#lee 2 líneas del fichero
f = open("entradas.txt")
linea1 = f.readline()
linea2 = f.readline()
print("1: ",linea1) 
print("2: ",linea2)
f.close()
# como puedes ver, se lee el retorno de carro

In [None]:
#lee todas las líneas 
f = open("archivo.txt", "r")
for linea in f.readlines():
    print(linea)
f.close()

a

a

a

a

a

a


### Escribir datos

In [None]:
#crear un fichero y escribe una línea

f = open("salidas.txt", "w") #si existía el fichero, ha borrado su contenido
f.write("Con cien cañones por banda\n")
f.close()
#abre el fichero y mira su contenido

In [None]:
#abre el fichero en modo append y escribe otra línea

f = open("salidas.txt", "a") #lo abre y se coloca al final para escribir
f.write("viento en popa a toda vela\n")
f.close()
#abre el fichero y mira su contenido

# Ejercicios

El resultado de esta primera práctica deberá entregarse en docencia virtual y tiene como límite de entrega las **23:59 horas del día 8 de febrero de 2022**. Se entregará este mismo notebook de extensión *.ipynb*. Importante: indicar los miembros que han realizado la práctica.

Realizado por: 
**Juan Bautista Muñoz Ruiz** 
jbmr0001@red.ujaen.es

## Ejercicio 1

A partir de dos listas de enteros, 'numeros1' y 'numeros2', almacenar en una lista el resultado de multiplicar cada uno de los elementos de 'numeros1' por, a su vez, cada uno de los elementos de 'numeros2'. Es decir, la lista resultante tendra len(numeros1) * len(numeros2) elementos.


In [157]:
numeros1 = [1, 7, 13, 21, 27]
numeros2 = [8, 9, 28, 41, 55, 77]

lista1 = []
for i in numeros1:
    for j in numeros2:
        lista1.append(i*j)

a = 10
print("|||LISTA FINAL DE TAMAÑO %d" % len(lista1) + "|||" )

for i in lista1:
        print(i)



|||LISTA FINAL DE TAMAÑO 30|||
8
9
28
41
55
77
56
63
196
287
385
539
104
117
364
533
715
1001
168
189
588
861
1155
1617
216
243
756
1107
1485
2079


## Ejercicio 2
Implementa una función que reciba una lista de enteros y devuelva otra lista con aquellos que son pares y >= 113

In [158]:
numeros = [5, 28, 675, 113, 45, 676, 89, 12, -213, 232, 39, 42, 877]
lista2 = []
for i in numeros:
  if i % 2 == 0:
    if i >=113:
      lista2.append(i)

print("|||LISTA FINAL DE TAMAÑO %d" % len(lista2) + "|||" )

for i in lista2:
        print(i)


|||LISTA FINAL DE TAMAÑO 2|||
676
232


## Ejercicio 3

Implementa una función que cuente el número de vocales contenidas en una cadena de texto y que devuelva el resultado en un diccionario.

In [159]:
cadena = 'En el verano de 1604 estaba terminada la Primera Parte del Quijote, que en septiembre obtuvo el Privilegio Real para su publicación y que fue vendida por su autor al librero Francisco Robles. Pocos meses después, a principios de 1605, aparecía en Madrid, en la imprenta de Juan de la Cuesta, la primera parte de la obra, El ingenioso hidalgo don Quijote de la Mancha. Era una edición pobre, con muchísimas erratas. Contiene también errores del autor: epígrafes incorrectos, cambios repentinos de escenario, pasajes que se duplican o se anulan y acontecimientos que suceden y no se refieren. Estos errores parecen indicar que Cervantes reconsideró la estructuración de la novela. La incorporación de historias intercaladas parece responder a una inseguridad narrativa  de Cervantes. Con ellas pretende diversificar la trama, convencido de que los personajes de su historia no serían capaces de mantener la atención del lector por sí mismos.'


vocalesTotales = 0
numVeces = {"a": 0,"e": 0,"i": 0,"o": 0,"u": 0}

print("Antes de ejecutar:",numVeces)

for i in cadena:
	if i.lower() in "aeiou":
		vocalesTotales=vocalesTotales+1
		if i.lower() in "a":
			numVeces['a'] = numVeces.get('a') + 1
		elif i.lower() in "e":
			numVeces['e'] = numVeces.get('e') + 1
		elif i.lower() in "i":
			numVeces['i'] = numVeces.get('i') + 1
		elif i.lower() in "o":
			numVeces['o'] = numVeces.get('o') + 1
		elif i.lower() in "u":
			numVeces['u'] = numVeces.get('u') + 1
    
print("|||Numero de vocales %d" % vocalesTotales + "|||" )
print("Después de ejecutar:",numVeces)  


Antes de ejecutar: {'a': 0, 'e': 0, 'i': 0, 'o': 0, 'u': 0}
|||Numero de vocales 332|||
Después de ejecutar: {'a': 85, 'e': 113, 'i': 55, 'o': 51, 'u': 28}


## Ejercicio 4

Para cada una de las cadenas de texto almacenadas en una lista, imprimir por pantalla el indice (primera letra de la cadena), la cadena en sí e indicar si la palabra es demasiado corta (cinco o menos caracteres) o larga (mas de cinco caracteres)


In [160]:
frase = "Programmers are, in their hearts, architects, and the first thing they want to do when they get to a site is to bulldoze the place flat and build something grand"
listado = frase.split()    # listado = ["Programmers", "are", ",",...]

for i in listado:
  print("||Cadena: %s  " %i +" ||Primera letra: %s " %i[0],end=" ")
  if len(i) <= 5:
    print("||DEMASIADO CORTA")
  else:
    print("||LARGA")


||Cadena: Programmers   ||Primera letra: P  ||LARGA
||Cadena: are,   ||Primera letra: a  ||DEMASIADO CORTA
||Cadena: in   ||Primera letra: i  ||DEMASIADO CORTA
||Cadena: their   ||Primera letra: t  ||DEMASIADO CORTA
||Cadena: hearts,   ||Primera letra: h  ||LARGA
||Cadena: architects,   ||Primera letra: a  ||LARGA
||Cadena: and   ||Primera letra: a  ||DEMASIADO CORTA
||Cadena: the   ||Primera letra: t  ||DEMASIADO CORTA
||Cadena: first   ||Primera letra: f  ||DEMASIADO CORTA
||Cadena: thing   ||Primera letra: t  ||DEMASIADO CORTA
||Cadena: they   ||Primera letra: t  ||DEMASIADO CORTA
||Cadena: want   ||Primera letra: w  ||DEMASIADO CORTA
||Cadena: to   ||Primera letra: t  ||DEMASIADO CORTA
||Cadena: do   ||Primera letra: d  ||DEMASIADO CORTA
||Cadena: when   ||Primera letra: w  ||DEMASIADO CORTA
||Cadena: they   ||Primera letra: t  ||DEMASIADO CORTA
||Cadena: get   ||Primera letra: g  ||DEMASIADO CORTA
||Cadena: to   ||Primera letra: t  ||DEMASIADO CORTA
||Cadena: a   ||Primera letra: 

## Ejercicio 5

Imprime por pantalla el numero de lineas de un fichero cuyo nombre es introducido por el teclado.



In [161]:
f = open("archivo.txt", "w") #Se crea el archivo archivo.txt 
f.write("a\n")
f.write("a\n")
f.write("a\n")
f.write("a\n")
f.write("a\n")
f.write("a\n")
f.close()

print("Introduzca fichero a buscar")#Se lee el archivo
fichero = input() #Introducir archivo.txt
print(f"Contando líneas del fichero {fichero}...")

f = open(fichero, "r")
contador=0
for linea in f.readlines():
    print(linea,end="")
    contador=contador+1
f.close()
print("El fichero tiene: %d " %contador +"líneas: ")

Introduzca fichero a buscar
archivo.txt
Contando líneas del fichero archivo.txt...
a
a
a
a
a
a
El fichero tiene: 6 líneas: 


## Ejercicio 6

Primero genera dos ficheros de texto que incluyan un valor por línea. Llama a estos ficheros *fichero1.txt* y *fichero2.txt*

Después, implementa una función que genere un archivo final llamado *fichero_suma.txt*, en el que cada línea del fichero final sea el resultado de la suma de los valores de esa línea de los dos archivos anteriores. 

In [162]:
f = open("fichero1.txt", "w") #Se crea el archivo
f.write("1\n")
f.write("2\n")
f.write("2\n")
f.write("8\n")
f.write("10\n")
f.close()

f = open("fichero2.txt", "w") #Se crea el archivo
f.write("0\n")
f.write("4\n")
f.write("1\n")
f.write("9\n")
f.write("2\n")
f.close()

f = open("fichero1.txt", "r") #Se lee el archivo
list1 = []
for linea in f.readlines():
    list1.append(linea)
f.close()

f = open("fichero2.txt", "r") #Se lee el archivo
list2 = []
for linea in f.readlines():
    list2.append(linea)
f.close()

i=0
resultados=[]
while i<len(list1): #Recorremos, sumamos y convertirmos.
  v1=int(list1[i])
  v2=int(list2[i])
  resultado=v1+v2
  resultados.append(resultado)
  i=i+1
  
f = open("fichero_suma.txt", "w") #Se crea el archivo final
for r in resultados:
  f.write(str(r)+"\n")
f.close()

f = open("fichero_suma.txt", "r") #Comprobamos el archivo final
for linea in f.readlines():
    print(linea,end="")
f.close()

1
6
3
17
12


## Ejercicio 7

Crear un fichero con el contenido que se muestra a continuación. Posteriormente, implementar una función que lea el fichero y genere un nuevo fichero con los datos de los pacientes que tengan más de 30 años que no sea diabéticos.

El fichero de entrada debe contener:

    Nombre Edad Diabetes
    Daniel 22 No
    Ana 32 Si
    Enrique 31 No
    Ismael 29 Si
    Isabel 38 No
    
El fichero de salida contendrá:

    Nombre Edad Diabetes
    Enrique 31 No
    Isabel 38 No

In [165]:
f = open("datos.txt", "w") #Se crea el archivo
f.write("Nombre Edad Diabetes \n")
f.write("Daniel 22 No\n")
f.write("Ana 32 Si\n")
f.write("Enrique 31 No\n")
f.write("Ismael 29 Si\n")
f.write("Isabel 38 No\n")
f.close()


f = open("datos.txt", "r") #Se lee el archivo
lineaArchivo = []
for linea in f.readlines():
    lineaArchivo.append(linea)
f.close()


cabecera=lineaArchivo[0].split() #Extraemos la cabecera de los datos

pacientes=[]
for i in lineaArchivo: #Se meterá cada paciente en un vector de pacientes
    listado=i.split() #Se separa cada palabra
    paciente = { #Se crea un nuevo paciente
      "%s" %cabecera[0]: "",
      "%s" %cabecera[1]: 0,
      "%s" %cabecera[2]: ""
    }
    #Asignamos los datos del paciente
    paciente["%s" %cabecera[0]]=listado[0]
    paciente["%s" %cabecera[1]]=listado[1]
    paciente["%s" %cabecera[2]]=listado[2]
    if cabecera[0]!=listado[0]: #Se ignora el paciente con los datos de la cabecera del archivo de datos (primera línea)
      pacientes.append(paciente)

pacientesFinales=[]
for i in pacientes:
  if int(i["%s" %cabecera[1]]) > 30: #Si es mayor de 30 y si no es diabético lo almacenamos 
    if i["%s" %cabecera[2]] == "No":
      pacientesFinales.append(i)


f = open("salidaClientes.txt", "w") #Se crea el archivo final
f.write(cabecera[0]+" "+cabecera[1]+" "+cabecera[2]+"\n") #Escribimos cabecera
for p in pacientesFinales:
  f.write(str(p["%s" %cabecera[0]])+" "+str(p["%s" %cabecera[1]])+" "+str(p["%s" %cabecera[2]])+"\n")
f.close()

f = open("salidaClientes.txt", "r") #Comprobamos el archivo final
for linea in f.readlines():
    print(linea,end="")
f.close()
 

Nombre Edad Diabetes
Enrique 31 No
Isabel 38 No
