## Introducción a Python

Escribir programas (o programar) es una actividad muy creativa y gratificante.
Puedes escribir programas por muchas razones, que pueden ir desde mantenerte
activo resolviendo un problema de análisis de datos complejo hasta hacerlo por
pura diversión ayudando a otros a resolver un enigma.

En nuestra vida diaria estamos rodeados de computadoras, desde equipos portátiles
(laptops) hasta teléfonos móviles (celulares). Podemos pensar en esas computadoras como nuestros “asistentes personales”, que pueden ocuparse de muchas tareas
por nosotros. El hardware en los equipos que usamos cada día está diseñado esencialmente para hacernos la misma pregunta de forma constante, “¿Qué quieres
que haga ahora?”

Nuestros equipos son rápidos y tienen grandes cantidades de memoria. Podrían
resultarnos muy útiles si tan solo supiéramos qué idioma utilizar para explicarle
a la computadora qué es lo que queremos que “haga ahora”. Si conociéramos ese
idioma, podríamos pedirle al aparato que realizase en nuestro lugar, por ejemplo,
tareas repetitivas. Precisamente el tipo de cosas que las computadoras saben hacer
mejor suelen ser el tipo de cosas que las personas encontramos pesadas y aburridas.


Por ejemplo, mira los primeros tres párrafos de cualquier capitulo de un libro y digame cuál es la palabra que más se repite, y cuántas veces se ha utilizado. Aunque seas capaz de leer
y comprender las palabras en pocos segundos, contarlas te resultará casi imposible,
porque la mente humana no fue diseñada para resolver ese tipo de problemas. Para
una computadora es justo al revés, leer y comprender texto de un trozo de papel
le sería difícil, pero contar las palabras y decirte cuántas veces se ha repetido la
más utilizada le resulta muy sencillo:




In [None]:
print("hola mundo")

hola mundo


In [None]:
hola mundo

SyntaxError: ignored

En las siguientes lineas le diremos a Python  que recuerde cierto
valor para utilizarlo más tarde. Tenemos que escoger un nombre para que ese
valor sea recordado y usaremos ese nombre simbólico para recuperar el valor más
tarde. Utilizamos el término variable para denominar las etiquetas que usamos
para referirnos a esos datos almacenados

In [None]:
x = 7
y = 2

In [None]:
print(x+y)

9


In [None]:
z = x + y

In [None]:
print(z)

9


In [None]:
zz = x*(5+y)*z-5

In [None]:
print(zz)

436


### ¿Qué es un programa? 
Podemos definir un programa, en su forma más básica, como una secuencia de
declaraciones o sentencias que han sido diseñadas para hacer algo. Incluso nuestro
sencillo script “hola.py” es un programa. Es un programa de una sola línea y no
resulta particularmente útil, pero si nos ajustamos estrictamente a la definición, se
trata de un programa en Python.
Tal vez resulte más fácil comprender qué es un programa pensando en un problema
que pudiera ser resuelto a través de un programa, y luego estudiando cómo sería
el programa que solucionaría ese problema.
Supongamos que estás haciendo una investigación de computación o informática social en mensajes de Facebook, y te interesa conocer cual es la palabra más utilizada
en un conjunto de mensajes. Podrías imprimir el flujo de mensajes de Facebook y
revisar con atención el texto, buscando la palabra más común, pero sería un proceso largo y muy propenso a errores. Sería más inteligente escribir un programa
en Python para encargarse de la tarea con rapidez y precisión, y así poder emplear
el fin de semana en hacer otras cosas más divertidas.

## Valores y tipos

Un valor es una de las cosas básicas que utiliza un programa, como una letra o un
número. Los valores que hemos visto hasta ahora han sido 1, 2, y “¡Hola, mundo!”
Esos valores pertenecen a tipos diferentes: 2 es un entero (int), y “¡Hola, mundo!”
es una cadena (string), que recibe ese nombre porque contiene una “cadena” de
letras. se pueden identificar las cadenas porque van encerradas
entre comillas.

In [None]:
x = "Hola Mundo"

y = 4

z = 3.9

In [None]:
type(x)

str

In [None]:
type(y)

int

In [None]:
type(z)

float

In [None]:
x = "2"

In [None]:
 ## Aunque es una un numero lo queremos trabajar como una cadena
type(x)

str

In [None]:
t = '5'

In [None]:
type(t)

str

### Variables
Una de las características más potentes de un lenguaje de programación es la
capacidad de manipular variables. Una variable es un nombre que se refiere a un
valor.

In [None]:
mensaje = "Estamos aprendiendo Python"
n = 2021
pi = 3.1415


Este ejemplo hace tres asignaciones. La primera asigna una cadena a una variable
nueva llamada mensaje; la segunda asigna el entero 2021 a n; la tercera asigna el
valor (aproximado) de π a pi.
Para mostrar el valor de una variable, se puede usar la sentencia print:


In [None]:
print(mensaje)
print(n)
print(pi)

Estamos aprendiendo Python
2021
3.1415


## Nombres de variables y palabras claves

Los programadores generalmente eligen nombres para sus variables que tengan
sentido y documentan para qué se usa esa variable.
Los nombres de las variables pueden ser arbitrariamente largos. Pueden contener
tanto letras como números, pero no pueden comenzar con un número. Se pueden
usar letras mayúsculas, pero es buena idea comenzar los nombres de las variables
con una letras minúscula.

In [None]:
79numero = 25

SyntaxError: ignored

In [None]:
numero@ = 25

In [None]:
class = 25

Palabras resevadas

<img src="palabras reservadas.JPG" style="width:600px; height:200px;">


### Operadores y operandos
Los operadores son símbolos especiales que representan cálculos, como la suma o
la multiplicación. Los valores a los cuales se aplican esos operadores reciben el
nombre de operandos.
Los operadores +, -, , /, y \* realizan sumas, restas, multiplicaciones, divisiones y
exponenciación (elevar un número a una potencia), como se muestra en los ejemplos
siguientes:


In [None]:
20 + 50

70

In [None]:
x = 25

In [None]:
print(x)

25


In [None]:
2*x+1

51

In [None]:

5**3

125

In [None]:
(5+9)*(15-7)


112

In [None]:
5//2

2

### Expresiones
Una expresión es una combinación de valores, variables y operadores. Un valor
por si mismo se considera una expresión, y también lo es una variable, así que
las siguientes expresiones son todas válidas (asumiendo que la variable x tenga un
valor asignado):


In [None]:
x = 2

In [None]:
z = x + 5

In [None]:
c = 1+1

In [None]:
print(x)
print(z)
print(c)

2
7
2


### Operador módulo
El operador módulo trabaja con enteros y obtiene el resto de la operación consistente en dividir el primer operando por el segundo. En Python, el operador módulo
es un signo de porcentaje (%). La sintaxis es la misma que se usa para los demás
operadores:


In [None]:
7%3

1

In [None]:
1500%58

50

## Operaciones con cadenas
El operador + funciona con las cadenas, pero no realiza una suma en el sentido
matemático. En vez de eso, realiza una concatenación, que quiere decir que une
ambas cadenas, enlazando el final de la primera con el principio de la segunda. Por
ejemplo:


In [None]:
y = 2
x = 3

In [None]:
x+y

5

In [None]:
x = "en bit se imparte el curso"
y = " ciencia de datos"

In [None]:
x + y 

'en bit se imparte el curso ciencia de datos'

In [None]:
x = " bit"

In [None]:
x*3

' bit bit bit'

## Petición de información al usuario 

A veces necesitaremos que sea el usuario quien nos proporcione el valor para una
variable, a través del teclado. Python proporciona una función interna llamada
input que recibe la entrada desde el teclado. Cuando se llama a esa función, el
programa se detiene y espera a que el usuario escriba algo. Cuando el usuario
pulsa Retorno o Intro, el programa continúa y input devuelve como una cadena
aquello que el usuario escribió.


In [None]:
x = input("Cuanto es 5+10\n")

Cuanto es 5+10



### Expresiones booleanas
Una expresión booleana es aquella que puede ser verdadera (True) o falsa (False).
Los ejemplos siguientes usan el operador ==, que compara dos operandos y devuelve
True si son iguales y False en caso contrario:

In [None]:
5 == 5

True

In [None]:
5== 9

False

In [None]:
"Bogota"== "Bogota"

True

In [None]:
"Bogota"== "Bogot"

False

True y False son valores especiales que pertenecen al tipo bool (booleano); no
son cadenas:

In [None]:
type(True)


bool

In [None]:

type(False)

bool

El operador == es uno de los operadores de comparación; los demás son:

<img src="comparativos.JPG" style="width:600px; height:200px;">

In [None]:
2!=3

True

In [None]:
3<2

False

###  Operadores lógicos
Existen tres operadores lógicos: and (y), or (o), y not (no). El significado
semántico de estas operaciones es similar a su significado en inglés. Por ejemplo,

In [None]:
x = 5

In [None]:
x>0 and x<10

True

In [None]:
x >0 or x <4

True

In [None]:
x = 11
x>0 and x<10

False

## Ejecución condicional
Para poder escribir programas útiles, casi siempre vamos a necesitar la capacidad
de comprobar condiciones y cambiar el comportamiento del programa de acuerdo a
ellas. Las sentencias condicionales nos proporcionan esa capacidad. La forma
más sencilla es la sentencia if:


In [None]:
x = -2

In [None]:
if x >0:
    print("x es positivo")

La expresión booleana después de la sentencia if recibe el nombre de condición.
La sentencia if se finaliza con un carácter de dos-puntos (:) y la(s) línea(s) que
van detrás de la sentencia if van indentadas
(es decir, llevan una tabulación o
varios espacios en blanco al principio).

### Ejecución alternativa
La segunda forma de la sentencia if es la ejecución alternativa, en la cual existen
dos posibilidades y la condición determina cual de ellas será ejecutada. La sintaxis
es similar a ésta:


In [None]:
x = 15

In [None]:
if x%2 == 0:
    print(" x es un numero par")
else :
    print("x es numero impar")


x es numero impar


### Condicionales encadenados
Algunas veces hay más de dos posibilidades, de modo que necesitamos más de dos
ramas. Una forma de expresar una operación como ésa es usar un condicional
encadenado:

In [None]:
x = 5
y = 5

In [None]:
if x < y:
    print("x es menor que y")
elif x > y:
    print("x es mayor que y")
else:
    print("x es igual a y")


x es igual a y


elif es una abreviatura para “else if”. En este caso también será ejecutada únicamente una de las ramas.
No hay un límite para el número de sentencias elif. Si hay una clausula else,
debe ir al final, pero tampoco es obligatorio que ésta exista

## Condicionales anidados
Un condicional puede también estar anidado dentro de otro. Podríamos haber
escrito el ejemplo anterior de las tres ramas de este modo:

In [None]:
x = 5
y = 7

In [None]:
if x == y:
    print(" x e y son iguales")
else:
    if x < y:
        print("x es menor que y")
    else:
        print("x es mayor que y")

x es menor que y


El condicional exterior contiene dos ramas. La primera rama ejecuta una sentencia
simple. La segunda contiene otra sentencia if, que tiene a su vez sus propias dos
ramas. Esas dos ramas son ambas sentencias simples, pero podrían haber sido
sentencias condicionales también.

# Funciones

### Llamadas a funciones
En el contexto de la programación, una función es una secuencia de sentencias que
realizan una operación y que reciben un nombre. Cuando se define una función, se
especifica el nombre y la secuencia de sentencias. Más adelante, se puede “llamar”
a la función por ese nombre. Ya hemos visto un ejemplo de una llamada a una
función:

In [None]:
type(2021)

int

El nombre de la función es type. La expresión entre paréntesis recibe el nombre
de argumento de la función. El argumento es un valor o variable que se pasa a la
función como parámetro de entrada. El resultado de la función type es el tipo del
argumento.
Es habitual decir que una función “toma” (o recibe) un argumento y “retorna” (o
devuelve) un resultado. El resultado se llama valor de retorno.

## Funciones internas
Python proporciona un número importante de funciones internas, que pueden ser
usadas sin necesidad de tener que definirlas previamente. Los creadores de Python
han escrito un conjunto de funciones para resolver problemas comunes y las han
incluido en Python para que las podamos utilizar.
Las funciones max y min nos darán respectivamente el valor mayor y menor de una
lista:


In [None]:
x = [1,2,3,4]
print(max(x))
print(min(x))

4
1


In [None]:
x = "Hola mundo"

In [None]:
max(x) 

'u'

In [None]:
min(x) 

' '

La función max nos dice cuál es el “carácter más grande” de la cadena (que resulta
ser la letra “u”), mientras que la función min nos muestra el carácter más pequeño
(que en ese caso es un espacio).

In [None]:
len(x)

10

## Funciones de conversión de tipos
Python también proporciona funciones internas que convierten valores de un tipo
a otro. La función int toma cualquier valor y lo convierte en un entero, si puede,
o se queja si no puede:


In [None]:
x = "32"
print(type(x))
x = int(x)
print(type(x))



<class 'str'>
<class 'int'>


In [None]:
print(int(5.222222222))
print(int(-2.333333333))

5
-2


float convierte enteros y cadenas en números de punto flotante:

In [None]:
y = 32
print(type(y))
y = float(y)
print(type(y))
print(y)

<class 'int'>
<class 'float'>
32.0


Finalmente, str convierte su argumento en una cadena:

In [None]:
x = 2021
print(type(x))
x = str(x)
print(x)
print(type(x))



<class 'int'>
2021
<class 'str'>


In [None]:
x

'2021'

 ## Números aleatorios
A partir de las mismas entradas, la mayoría de los programas generarán las mismas
salidas cada vez, que es lo que llamamos comportamiento determinista. El determinismo normalmente es algo bueno, ya que esperamos que la misma operación nos
proporcione siempre el mismo resultado. Para ciertas aplicaciones, sin embargo,
se desea que el resultado sea impredecible. Los juegos son el ejemplo obvio, pero
hay más.

Conseguir que un programa sea realmente no-determinista no resulta tan fácil,
pero hay modos de hacer que al menos lo parezca. Una de ellos es usar algoritmos que generen números pseudoaleatorios.


In [None]:
for i in range(10):
    print(i)

0
1
2
3
4
5
6
7
8
9


In [None]:
import random
for i in range(10):
    x = random.random()
    print(x)

0.04449913515749737
0.19629786010812145
0.6664512737768502
0.9250341557104838
0.17211206325837536
0.7883163586428852
0.4791227995967945
0.6079748046189174
0.7665087035843742
0.8190959429106207


### Añadiendo funciones nuevas
Hasta ahora, sólo hemos estado usando las funciones que vienen incorporadas en
Python, pero es posible añadir también funciones nuevas. Una definición de función especifica el nombre de una función nueva y la secuencia de sentencias que se
ejecutan cuando esa función es llamada. Una vez definida una función, se puede
reutilizar una y otra vez a lo largo de todo el programa.


In [None]:
def suma_numero (x,y,v,i):
    z = x+y+v
    return z

In [None]:
suma_numero(10,85,5,9)

100

def es una palabra clave que indica que se trata de una definición de función. El
nombre de la función es suma_numeros. Las reglas para los nombres de las
funciones son los mismos que para las variables: se pueden usar letras, números y
algunos signos de puntuación, pero el primer carácter no puede ser un número. No
se puede usar una palabra clave como nombre de una función, y se debería evitar
también tener una variable y una función con el mismo nombre.

In [None]:
def ejemplo():
    x = "Estamos aprendiendo Python"
    y = "Estamos viendo funciones"
    return x, y

In [None]:
ejemplo()

('Estamos aprendiendo Python', 'Estamos viendo funciones')

# Iteración
### Actualización de variables
Uno de los usos habituales de las sentencias de asignación consiste en realizar una
actualización sobre una variable – en la cual el valor nuevo de esa variable depende
del antiguo.


In [None]:
x = 5

In [None]:
print(x)

5


In [None]:
x = x+2

In [None]:
print(x)

7


Esto quiere decir “‘toma el valor actual de x, añádele 2, y luego actualiza x con el
nuevo valor”

### La sentencia while
Los computadores se suelen utilizar a menudo para automatizar tareas repetitivas. Repetir
tareas idénticas o muy similares sin cometer errores es algo que a las máquinas
se les da bien y en cambio a las personas no. Como las iteraciones resultan tan habituales, Python proporciona varias características en su lenguaje para hacerlas
más sencillas.
Una forma de iteración en Python es la sentencia while. He aquí un programa
sencillo que cuenta hacia atrás desde diez y luego dice  '¡Arranque!'

In [None]:
n = 10
while n >0:
    print(n)
    n = n-1
print("¡Arranque!")


10
9
8
7
6
5
4
3
2
1
¡Arranque!


### Bucles infinitos
A veces no se sabe si hay que terminar un bucle hasta que se ha recorrido la mitad
del cuerpo del mismo. En ese caso se puede crear un bucle infinito a propósito y
usar la sentencia break para salir fuera de él cuando se desee.


In [None]:
"""
n = 10
while True:
    print(n, end=' ')
    n = n - 1
print('¡Terminado!')
"""

"\nn = 10\nwhile True:\n    print(n, end=' ')\n    n = n - 1\nprint('¡Terminado!')\n"

In [None]:
while True:
    linea = input("> ")
    if linea == "fin":
        break
    print(linea)
print("Terminado")


> 

> 

> fin
Terminado


### Finalizar iteraciones con continue
Algunas veces, estando dentro de un bucle se necesita terminar con la iteración
actual y saltar a la siguiente de forma inmediata. En ese caso se puede utilizar
la sentencia continue para pasar a la siguiente iteración sin terminar la ejecución
del cuerpo del bucle para la actual.
A continuación se muestra un ejemplo de un bucle que repite lo que recibe como
entrada hasta que el usuario escribe “fin”, pero trata las líneas que empiezan por el
carácter almohadilla como líneas que no deben mostrarse en pantalla (algo parecido
a lo que hace Python con los comentarios).


In [None]:
while True:
    linea = input("> ")
    if linea[0] == "#":
        continue
    if linea == "fin":
        break
    print(linea)


> fin


### Bucles definidos usando for
A veces se desea repetir un bucle a través de un conjunto de cosas, como una
lista de palabras, las líneas de un archivo, o una lista de números. Cuando se tiene una lista de cosas para recorrer, se puede construir un bucle definido usando
una sentencia for. A la sentencia while se la llama un bucle indefinido, porque
simplemente se repite hasta que cierta condición se hace Falsa, mientras que el
bucle for se repite a través de un conjunto conocido de elementos, de modo que
ejecuta tantas iteraciones como elementos hay en el conjunto.
La sintaxis de un bucle for es similar a la del bucle while, en ella hay una sentencia
for y un cuerpo que se repite:


In [None]:
departamentos = ["Cundinamarca", "Vichada", "Boyaca", "Amazonas", "Putumayo", "Antioquia", "Arauca"]

for depto in departamentos:
    print("Departamento Colombia:", depto)
print("Terminado")

Departamento Colombia: Cundinamarca
Departamento Colombia: Vichada
Departamento Colombia: Boyaca
Departamento Colombia: Amazonas
Departamento Colombia: Putumayo
Departamento Colombia: Antioquia
Departamento Colombia: Arauca
Terminado


Por ejemplo, para contar el número de elementos en una lista, podemos escribir el
siguiente bucle for:


In [None]:
contador = 0
for valor in departamentos:
    contador = contador + 1
print("Numero de elementos", contador)
    


Numero de elementos 7


Ajustamos la variable contador a cero antes de que el bucle comience, después
escribimos un bucle for para movernos a través de la lista de números. Nuestra
variable de iteración se llama valor, y dado que no usamos valor dentro del
bucle, lo único que hace es controlar el bucle y hacer que el cuerpo del mismo sea
ejecutado una vez para cada uno de los valores de la lista.

Otro bucle similar, que calcula el total de un conjunto de números, se muestra a
continuación:


In [None]:
total = 0
for valor in [3,5,7,12,6,9,8]:
    total = total + valor
print("total", total)



total 50


# Cadenas

Una cadena es una secuencia de caracteres. Puedes acceder a los caracteres de uno
en uno con el operador corchete:


In [None]:
ciudad = "Bogota"
letra1 = ciudad[0]

In [None]:
print(letra1)

B


La segunda sentencia extrae el carácter en la posición del indice 0 de la variable
fruta y la asigna a la variable letra.
La expresión en los corchetes es llamada índice. El índice indica qué carácter de
la secuencia quieres (de ahí el nombre).

#### Hasta aqui va lo que hay en el curso
##  Obtener el tamaño de una cadena

In [None]:
ciudad_2 = "Amazonas"

In [None]:
tamano = len(ciudad_2)

In [None]:
print(tamano)

8


In [None]:
ciudad_2[tamano-1]

's'

In [None]:
ciudad_2[-1]

's'

In [None]:
ciudad_2[-2]

'a'

### Rebanado de cadenas
Un segmento de una cadena es llamado rebanado. Seleccionar un rebanado es
similar a seleccionar un carácter

In [None]:
cadena = "Procesamiento de texto"
print(cadena[0:])

Procesamiento de texto


El operador [n:m] retorna la parte de la cadena desde el “n-ésimo” carácter hasta
el “m-ésimo” carácter, incluyendo el primero pero excluyendo el último.
Si omites el primer índice (antes de los dos puntos), el rebanado comienza desde
el inicio de la cadena. Si se omite el segundo índice, el rebanado va hasta el final de
la cadena:


In [None]:
cadena[:3]

'Pro'

In [None]:
cadena[3:]

'cesamiento de texto'

In [None]:
cadena[3:3]

''

In [None]:
cadena[:]

'Procesamiento de texto'

### Los cadenas son inmutables
Puede ser tentador utilizar el operador [] en el lado izquierdo de una asignación,
con la intención de cambiar un carácter en una cadena. Por ejemplo:


In [None]:
cadena[0] = "M"

TypeError: ignored

El “objeto” en este caso es la cadena y el “ítem” es el carácter que tratamos de
asignar. Por ahora, un objeto es la misma cosa que un valor. Un ítem es uno de los valores en una secuencia.
La razón por la cual ocurre el error es que las cadenas son inmutables, lo cual
significa que no se peude modificar una cadena existente. Lo mejor que se puede
hacer es crear una nueva cadena que sea una variación de la original:


In [None]:
cadena = "Procesamiento de texto"
nueva_cadena = "M" + cadena[1:]
print(nueva_cadena)

Mrocesamiento de texto


###  Analizando cadenas

Frecuentemente, queremos examinar una cadena para encontrar una subcadena.
Por ejemplo, si se nos presentaran una serie de líneas con el siguiente formato:

From stephen.marquard@uandes.eud.co Sat Jan 5 09:14:16 2008

From jason.marquard@uct.ac.za Sat Jan 5 09:14:16 2006

y quisiéramos obtener únicamente la segunda parte de la dirección de correo (esto
es, uct.ac.za) de cada línea, podemos hacer esto utilizando el método find y una
parte de la cadena.

Primero tenemos que encontrar la posición de la arroba en la cadena. Después,
tenemos que encontrar la posición del primer espacio después de la arroba. Y
después partiremos la cadena para extraer la porción de la cadena que estamos
buscando.

In [None]:
dato = "stephen.marquard@uandes.edu.co Sat Jan 5 09:14:16 2008"
arrobapos = dato.find("@")
print(arrobapos)

16


In [None]:
espos = dato.find(" ", arrobapos)

In [None]:
print(espos)

30


In [None]:
dominio = dato[arrobapos+1:espos]

In [None]:
print(dominio)

uandes.edu.co


Utilizamos una versión del método find que nos permite especificar la posición en
la cadena desde donde queremos que find comience a buscar. Cuando recortamos
una parte de una cadena, extraemos los caracteres desde “uno después de la arroba
hasta, pero no incluyendo, el carácter de espacio”.

###  El operador de formato

El operador de formato % nos permite construir cadenas, reemplazando partes de
las cadenas con datos almacenados en variables. Cuando lo aplicamos a enteros, %
es el operador módulo. Pero cuando es aplicado a una cadena, % es el operador de
formato.
El primer operando es la cadena a formatear, la cual contiene una o más secuencias
de formato que especifican cómo el segundo operando es formateado. El resultado
es una cadena.
Por ejemplo, la secuencia de formato %d significa que el segundo operando debería
ser formateado como un numero (“d” significa “decimal”):

In [None]:
numero = 25

In [None]:
"%d"% numero

'25'

In [None]:
"tengo %d de reces en mi finca" %numero

'tengo 25 de reces en mi finca'

Si hay más de una secuencia de formato en la cadena, el segundo argumento tiene
que ser una tupla1
. Cada secuencia de formato es relacionada con un elemento de
la tupla, en orden.
El siguiente ejemplo usa %d para formatear un entero, %g para formatear un número
de punto flotante , y %s para formatear una cadena:


In [None]:
"En %d años de trabajo en New York se me han pagado %g  %s mas" %(3,5.3,"veces")

'En 3 años de trabajo en New York se me han pagado 5.3  veces mas'

### Archivos

Cuando queremos abrir o escribir un archivo (digamos, en el disco duro), primero
debemos abrir el archivo. Al abrir el archivo nos comunicamos con el sistema
operativo, el cual sabe dónde están almacenados los datos de cada archivo.
Cuando abres un archivo, le estás pidiendo al sistema operativo que encuentre
el archivo por su nombre y se asegure de que existe. En este ejemplo, abrimos
el archivo mbox.txt, el cual debería estar almacenado en el mismo directorio en
que estás localizado cuando inicias Python. 

In [None]:
manejador_archivo = open("mbox-short.txt")
print(manejador_archivo)


<_io.TextIOWrapper name='mbox-short.txt' mode='r' encoding='UTF-8'>


In [None]:
manejador_archivo = open("mbox-shortgggg.txt")
print(manejador_archivo)

FileNotFoundError: ignored

## Archivos de texto y líneas
Un archivo de texto puede ser considerado como una secuencia de líneas, así como
una cadena de Python puede ser considerada como una secuencia de caracteres.
Por ejemplo, este es un ejemplo de un archivo de texto que registra la actividad
de correos de varias personas en un equipo de desarrollo de un proyecto de código
abierto (open source):

In [None]:
man_archivo = open("mbox-short.txt")
contador = 0
for linea in man_archivo:
    contador = contador +1 
print("numero de lineas en el archivo", contador)

numero de lineas en el archivo 1910


La razón por la cual la función open no lee el archivo completo es porque el archivo
puede ser muy grande, incluso con muchos gigabytes de datos. La sentencia open
emplea la misma cantidad de tiempo sin importar el tamaño del archivo. De hecho,
es el bucle for el que hace que los datos sean leídos desde el archivo

In [None]:
manejador_archivo = open("mbox-short.txt")
lecture = manejador_archivo.read()
print(len(lecture))
print(lecture[:80])


94626
From stephen.marquard@uct.ac.za Sat Jan  5 09:14:16 2008
Return-Path: <postmaste


In [None]:
variable = "hola mundo    "
variable_2 = variable.rstrip()
variable_2

'hola mundo'

In [None]:
manejador_archivo = open("mbox-short.txt")
for linea in manejador_archivo:
    linea = linea.rstrip()
    if linea.startswith("From:"):
        print(linea)
    

From: stephen.marquard@uct.ac.za
From: louis@media.berkeley.edu
From: zqian@umich.edu
From: rjlowe@iupui.edu
From: zqian@umich.edu
From: rjlowe@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: gsilver@umich.edu
From: gsilver@umich.edu
From: zqian@umich.edu
From: gsilver@umich.edu
From: wagnermr@iupui.edu
From: zqian@umich.edu
From: antranig@caret.cam.ac.uk
From: gopal.ramasammycook@gmail.com
From: david.horwitz@uct.ac.za
From: david.horwitz@uct.ac.za
From: david.horwitz@uct.ac.za
From: david.horwitz@uct.ac.za
From: stephen.marquard@uct.ac.za
From: louis@media.berkeley.edu
From: louis@media.berkeley.edu
From: ray@media.berkeley.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu


In [None]:
var = " Estamos hoy a 28 de enero"
print(var.find("enero"))

21


## Listas
Así como una cadena, una lista es una secuencia de valores. En una cadena, los
valores son caracteres; en una lista, pueden ser cualquier tipo. Los valores en una
lista son llamados elementos o a veces ítems.

Hay varias formas de crear una nueva lista; la más simple es encerrar los elementos
en corchetes (“[" y “]”):

In [None]:
lista_1 = [1,2,3]
lista_2 = ["Jorge", "Yesid", "María"]

In [None]:
lista_3 = [1,2,3, "Jorge", "Yesid", "María"]

In [None]:
print(lista_3)

[1, 2, 3, 'Jorge', 'Yesid', 'María']


In [None]:
type(lista_3)

list

El primer ejemplo es una lista de 4 enteros. La segunda es una lista de tres cadenas.
Los elementos de una lista no tienen que ser del mismo tipo. La siguiente lista
contiene una cadena, un flotante, un entero:

In [None]:
lista_4 = [1,2,3,"Jorge", "Yesid", "María", ["colombia", 1,2,3] ]

In [None]:
type(lista_4)

list

Una lista dentro de otra lista está anidada.

### Las listas son mutables

La sintaxis para accesar elementos de una lista es la misma que para accesar
los caracteres de una cadena: el operador corchete. La expresión dentro de los
corchetes especifíca el índice. Recordemos que los índices empiezan en 0:


In [None]:
lista_4[6][2]

2

A diferencia de las cadenas, las listas son mutables porque pueden cambiar el
orden de los elementos en una lista o reasignar un elemento en una lista. Cuando
el operador corchete aparece en el lado izquierdo de una asignación, éste identifica
el elemento de la lista que será asignado.

In [None]:
numeros = [17, 123, 56]

In [None]:
numeros[1] = 99999

In [None]:
print(numeros)

[17, 99999, 56]


Puedes pensar en una lista como una relación entre índices y elementos. Esta
relación es llamada mapeo; cada índice “mapea a” uno de los elementos.

### Recorriendo una lista

La forma más común de recorrer los elementos de una lista es con un bucle for.
La sintaxis es la misma que para las cadenas:

In [None]:
#Se genera lista de paises
paises = ["Colombia", "Peru", "Venezuela", "Bolivia"]

In [None]:
for pais in paises:
    print(pais)

Colombia
Peru
Venezuela
Bolivia


Esto funciona bien si solamente necesitas leer los elementos de la lista. Pero si
quieres escribir o actualizar los elementos, necesitas los índices. Una forma común
de hacer eso es combinando las funciones range y len:


In [None]:
example = [1,2,3,4, "Colombia"]
print(len(example))

5


In [None]:
for i in range(8):
    print(i)

0
1
2
3
4
5
6
7


In [None]:
for i in range(len(paises)):
    print(i)

0
1
2
3


In [None]:
for i in range(len(paises)):
    paises[i] = paises[i]+ " Es de sur America"
print(paises)

['Colombia Es de sur America', 'Peru Es de sur America', 'Venezuela Es de sur America', 'Bolivia Es de sur America']


## Operaciones de listas

El operador + concatena listas:

In [None]:
lista_1 = [1,2,3]
lista_2 = ["Casa", "Carro"]

In [None]:
lista_3 = lista_1 + lista_2
print(lista_3)

[1, 2, 3, 'Casa', 'Carro']


De igual forma, el operador * repite una lista un determinado número de veces:


In [None]:
lista_1*3

[1, 2, 3, 1, 2, 3, 1, 2, 3]

### Rebanado de listas

In [None]:
lista_4 = ["a", "b","c", "d", "e", "f"]
lista_4[1:3]

['b', 'c']

In [None]:
lista_4[3:]

['d', 'e', 'f']

In [None]:
lista_4[-3:]


['d', 'e', 'f']

In [None]:
lista_4[:]

['a', 'b', 'c', 'd', 'e', 'f']

In [None]:
lista_4[2:2]

[]

### Métodos de listas
Python provee métodos que operan en listas. Por ejemplo, append agrega un nuevo
elemento al final de una lista:

In [None]:
lista_5 = ["a", "b", "c"]
lista_5.append("d")

In [None]:
print(lista_5)

['a', 'b', 'c', 'd']


In [None]:
lista_6 = ["a", "b", "c"]
lista_7 = [1,2]
lista_6.extend(lista_7)

In [None]:
lista_6

['a', 'b', 'c', 1, 2]

In [None]:
lista_7

[1, 2]

In [None]:
lista_8 = ["d", "e", "c", "b", "j"]
lista_8.sort(reverse = True)

In [None]:
lista_8

['j', 'e', 'd', 'c', 'b']

Hay varias formas de eliminar elementos de una lista. Si sabes el índice del elemento
que quieres, puedes usar pop:

In [None]:
lista_9 = ["a", "b", "c"]
lista_9.pop(1)
lista_9

['a', 'c']

In [None]:
lista_10 = ["a", "b", "c"]
del lista_10[1]
lista_10

['a', 'c']

In [None]:
#Si conocemos  elemento que se quiere  remover (pero no conocemos el índice), se puede usar remove
lista_11 = ["a", "b", "c", "jota"]
print(lista_11)
lista_11.remove("jota")
print(lista_11)

['a', 'b', 'c', 'jota']
['a', 'b', 'c']


In [None]:
lista_12 = ["a", "b", "c", "d", "e", "f"]
del lista_12[1:4]
print(lista_12)

['a', 'e', 'f']


## Listas y funciones

Hay un cierto número funciones internas que pueden ser utilizadas en las listas que
te permiten mirar rápidamente a través de una lista sin escribir tus propios bucles:

In [None]:
numeros =[1,2,5,6,9,3,6,5]
print(len(numeros))


8


In [None]:
print(max(numeros))


9


In [None]:
print(min(numeros))


1


In [None]:
print(sum(numeros))

37


In [None]:
print(sum(numeros)/len(numeros))

4.625


### Listas y cadenas

Una cadena es una secuencia de caracteres y una lista es una secuencia de valores,
pero una lista de caracteres no es lo mismo que una cadena. Para convertir una
cadena en una lista de caracteres, puedes usar list:


In [None]:
s = "Spam"
l = list(s)
print(l)

['S', 'p', 'a', 'm']


In [None]:
s = "Estamos aprendiendo Machine Learning"
l = s.split()
print(l)

['Estamos', 'aprendiendo', 'Machine', 'Learning']


In [None]:
s = "Estamos-aprendiendo-Machine-Learning"
l = s.split("-")
print(l)

['Estamos', 'aprendiendo', 'Machine', 'Learning']


join es el inverso de split. Este toma una lista de cadenas y concatena los
elementos. join es un método de cadenas, así que tienes que invocarlo en el
delimitador y pasar la lista como un parámetro:


In [None]:
l = ['Estamos', 'aprendiendo', 'Machine', 'Learning', "2021"]
delimitador = " "
delimitador.join(l)

'Estamos aprendiendo Machine Learning 2021'

### Diccionarios
Un diccionario es como una lista, pero más general. En una lista, los índices de
posiciones tienen que ser enteros; en un diccionario, los índices pueden ser (casi)
cualquier tipo.
Puedes pensar en un diccionario como una asociación entre un conjunto de índices
(que son llamados claves) y un conjunto de valores. Cada clave apunta a un valor.
La asociación de una clave y un valor es llamada par clave-valor o a veces elemento.
Como ejemplo, vamos a construir un diccionario que asocia palabras de Inglés a
Español, así que todas las claves y los valores son cadenas.



In [None]:
eng2sp = dict()
print(eng2sp)

{}


Las llaves, {}, representan un diccionario vacío. Para agregar elementos a un
diccionario, puedes utilizar corchetes:

In [None]:
eng2sp["one"] = "uno"

Esta línea crea un elemento asociando a la clave 'one' el valor “uno”. Si imprimimos el diccionario de nuevo, vamos a ver un par clave-valor con dos puntos entre
la clave y el valor:


In [None]:
print(eng2sp)

{'one': 'uno'}


In [None]:
eng = {"one":"uno", "two":"dos", "three": "tres"}
print(eng)

{'one': 'uno', 'two': 'dos', 'three': 'tres'}


El orden de los pares clave-elemento no es el mismo. De hecho, si tu escribes este
mismo ejemplo en tu computadora, podrías obtener un resultado diferente. En
general, el orden de los elementos en un diccionario es impredecible.
Pero ese no es un problema porque los elementos de un diccionario nunca son
indexados con índices enteros. En vez de eso, utilizas las claves para encontrar los
valores correspondientes:

In [None]:
print(eng["two"])


dos


In [None]:
print(eng.get("two"))

dos


In [None]:

len(eng)

3

El operador in funciona en diccionarios; éste te dice si algo aparece como una clave
en el diccionario (aparecer como valor no es suficiente).

In [None]:
print("one" in eng)
print("uno" in eng)


True
False


Para ver si algo aparece como valor en un diccionario, puedes usar el método
values, el cual retorna los valores como una lista, y después puedes usar el operador
in:

In [None]:
eng.values()

dict_values(['uno', 'dos', 'tres'])

In [None]:
values = list(eng.values())
print("uno" in values)

True


In [None]:
palabra = "brontosaurio"
d = dict()

In [None]:
for c in palabra:
    if c not in d:
        d[c] = 1
    else:
        d[c] = d[c]+1
print(d)

{'b': 1, 'r': 2, 'o': 3, 'n': 1, 't': 1, 's': 1, 'a': 1, 'u': 1, 'i': 1}


El conteo indica que las letras “a” y “b” aparecen solo una vez; “o” aparece
dos, y así sucesivamente.

In [None]:
cuentas = {"Jose":1, "Carmen":42, "Juan":5}

In [None]:
#cuentas.get("Jose")
print(cuentas.get("Armando"))

None


### Diccionarios y archivos
Uno de los usos más comunes de un diccionario es contar las ocurrencias de palabras
en un archivo con algún texto escrito. Vamos comenzando con un archivo de
palabras muy simple tomado del texto de Romeo y Julieta.
Para el primer conjunto de ejemplos, vamos a usar una versión más corta y más
simplificada del texto sin signos de puntuación.

In [None]:
texto = ["But soft what light through yonder window breaks\n"," It is the east and Juliet is the sun Arise fair sun\n ","and kill the envious moon\n" ,"Who is already sick and pale with grief"]

In [None]:
print(texto)

['But soft what light through yonder window breaks\n', ' It is the east and Juliet is the sun Arise fair sun\n ', 'and kill the envious moon\n', 'Who is already sick and pale with grief']


In [None]:
counts = dict()
for line in texto:
    words = line.split()
    for word in words:
        if word not in counts:
            counts[word] = 1
        else:
            counts[word] = counts[word] +1
print(counts)
    


{'But': 1, 'soft': 1, 'what': 1, 'light': 1, 'through': 1, 'yonder': 1, 'window': 1, 'breaks': 1, 'It': 1, 'is': 3, 'the': 3, 'east': 1, 'and': 3, 'Juliet': 1, 'sun': 2, 'Arise': 1, 'fair': 1, 'kill': 1, 'envious': 1, 'moon': 1, 'Who': 1, 'already': 1, 'sick': 1, 'pale': 1, 'with': 1, 'grief': 1}


Si utilizas un diccionario como una secuencia para una sentencia for, esta recorre
las claves del diccionario. Este bucle imprime cada clave y su valor correspondiente:


## Tuplas

Las tuplas en Python son un tipo o estructura de datos que permite almacenar datos de una manera muy parecida a las listas, con la salvedad de que son inmutables.


Las tuplas en Python  son muy similares a las listas, pero con dos diferencias. Son inmutables, lo que significa que no pueden ser modificadas una vez declaradas, y en vez de inicializarse con corchetes se hace con (). Dependiendo de lo que queramos hacer, las tuplas pueden ser más rápidas.

In [None]:
tupla = (1, 2, 3)
print(tupla)

(1, 2, 3)


También pueden declararse sin (), separando por , todos sus elementos.

In [None]:
tupla = 1, 2, 3
print(type(tupla)) #<class 'tuple'>
print(tupla)

<class 'tuple'>
(1, 2, 3)


## Operaciones con tuplas
Como hemos comentado, las tuplas son tipos inmutables, lo que significa que una vez asignado su valor, no puede ser modificado. Si se intenta, tendremos un TypeError.

In [None]:
tupla = (1, 2, 3)
tupla[0] = 5 # Error! TypeError

TypeError: ignored

Al igual que las listas, las tuplas también pueden ser anidadas.

In [None]:
tupla = 1, 2, ('a', 'b'), 3
print(tupla)       #(1, 2, ('a', 'b'), 3)
print(tupla[2][0]) #a

(1, 2, ('a', 'b'), 3)
a


Y también es posible convertir una lista en tupla haciendo uso de al función tuple().

In [None]:
lista = [1, 2, 3]
tupla = tuple(lista)
print(type(tupla)) #<class 'tuple'>
print(tupla)       #(1, 2, 3)

<class 'tuple'>
(1, 2, 3)


Se puede iterar una tupla de la misma forma que se hacía con las listas.

In [None]:
tupla = [1, 2, 3]
for t in tupla:
    print(t) #1, 2, 3

1
2
3


Y se puede también asignar el valor de una tupla con n elementos a n variables.

In [None]:
l = (1, 2, 3)
x, y, z = l
print(x, y, z) #1 2 3

1 2 3


Aunque tal vez no tenga mucho sentido a nivel práctico, es posible crear una tupla de un solo elemento. Para ello debes usar , antes del paréntesis, porque de lo contrario (2) sería interpretado como int.

In [None]:
tupla = (2,)
print(type(tupla)) #<class 'tuple'>

<class 'tuple'>


El método count() cuenta el número de veces que el objeto pasado como parámetro se ha encontrado en la lista.

In [None]:
l = (1, 1, 1, 3, 5)
print(l.count(1)) #3

3


El método index() busca el objeto que se le pasa como parámetro y devuelve el índice en el que se ha encontrado.

In [None]:
l = (7, 7, 7, 3, 5)
print(l.index(5)) #4

4


In [None]:
l[0]

7

In [None]:
l[0:2]

(7, 7)

In [None]:
l[3:5]

(3, 5)