# Refuerzo de temas del curso y de Python en general

El presente notebook trae consigo todos los temas que aparecen en la lista que se compartió el día 15 de Octubre, 2024. Se recomienda utilizar el índice para poder acceder más rápido a los temas. Para poder activarlo ya sea que que te encuentres en Jupyter Notebook o en JupyterLab hay que realizar el siguiente shortcut: `Ctrl + Shift + K`, sino funciona te recomiendo ir al menú *View* y seleccionar *Table of Contents*. Muchos de los temas están repetidos por lo que se intentará realizar un número considerable de ejemplos y proponer algunos ejercicios para la práctica.

## Tema extra: Python Object Orientable Programming (OOP) [Opcional]

(disclaimer) Me tomé la libertad de hablar un poco de programación orientada a objetos para este caso de Python, si quieres ahondar en el tema te recomiendo hacerlo para poder comprender mejor el funcionamiento de Python, sin embargo, si no te sientes listx te recomiendo saltarlo y revisarlo con más calma en otra ocasión.

Python es considerado un lenguaje orientado a objetos (OOP) por lo que es conveniente tener al menos una noción de este concepto para explotarlo de mayor o menor medida; mínimo para conocer la estructura y dinámica del lenguaje. Pero ¿qué significa que sea un lenguaje orientado a objetos? es más ¿qué es un objeto? Intenaré introducir estas ideas en un nivel muuuuy simple pero suficiente para entender la filosofía de Python y todos los lenguajes orientados a objetos.

Un **objeto** en su forma más simple de explicar es considerada una caja o un espacio de memoria en el que se almacena y se manipula información de cualquier tipo (hablando de tipos de datos: Int, Float, etc.); estos objetos se encuentran asociados a una **Clase** que es considerada como una "plantilla" para la creación de objetos que cuenta con un conjuto de datos llamados **atributos** y presenta una serie de comportamientos llamados **métodos** (funciones dentro de la clase). Cuando en un desarrollo se tiene la construcción de un gran número de clases que sirven para un fin en específico se pueden guardar en una **librería** la cual podemos mandar a llamar para invocar toda su información. Por lo tanto, cada vez que importamos librerías como  `numpy` en realidad estamos invocando todo un conjunto de clases y sus funcionalidades para que podamos trabajar.

A continuación te presento una breve formación de clases con sus atributos y métodos, y te muestro como crear objetos a partir de la clase creada.

In [None]:
#Es mejor definir hasta arriba todas las librerías a utilizar en el notebook para no andar buscando las celdas en donde podrían ejecutarse de no hacer esto
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

In [None]:
#En una clase podemos definir un gran número de objetos con distintos tipos
class Datos:
    #Los atributos son datos se encuentran en la clase y que se pueden mandar a llamar y/o utilizar para los métodos de la clase.
    atributo1 = 1
    atributo2 = "Hola"

In [None]:
#Al poner Datas como a continuación ya estamos generando un objeto, sin embargo carece de referencia 
Datos

In [None]:
#Por lo que no podemos acceder a su información a menos de que lo forcemos
Datos.atributo1

Hemos generado una clase con dos atributos, uno de tipo `Int` y otro de tipo `String`. Podemos generar un objeto al poner como tal `Datos` en una celda de código, sin embargo esto seriviría de poco pues no podemos manipular este objeto de ninguna forma debido a que carece de una **referencia**. Aún así podemos acceder a sus atributos pero da lo mismo, no podemos hacer mucho pues no hay algún espacio de memoria reservado para que podamos mandar a llamar esa información en cualquier otro punto del código.

Para que me entiendas esta idea te encomiendo un ejercicio: Intenta mandar a llamar `atributo1` del objeto que `Datos` que creamos arriba. Sin afán de hacerte quebrar la cabeza, esto es imposible porque no hay referencia del objeto creado. Entonces, creemos una:

In [None]:
#De esta manera referenciamos el objeto Datos asignándolo a un espacio de memoria llamado a
a = Datos

Hemos creado nuestro primer objeto y este objeto es único, tiene un lugar especial y reservado de memoria, podemos crear más objetos de la clase Datos y cada uno será único y detergente. Lo importante de haber referenciado es que ahora si podemos acceder a sus atributos:

In [None]:
#Para acceder a los atributos o métodos de una clase usamos el objeto "."
#te recomiendo usar tab para ver que atributos y métodos tiene tu objeto
a.atributo1

Como puedes ver hemos mandado a llamar el `atributo1` del objeto `a` asociado a la clase `Datos` (plantilla de objetos). Para poder ver atributos y métodos de tu objeto te recomiendo presionar tu tecla `tab`. Otro detalle que debes de saber sobre Python es que es de tipado dinámico, a diferencia de Java que es de tipado estático. Esto quiere decir que toda definición de objetos puede ir cambiando su tipo de dato al que se le asigne. Por ejemplo si en algún punto de la vida creo el **objeto** (que normalmente conocemos hasta ahora como variable) `x = 5`, más adelante el objeto `x` puede cambiar de tipo de dato, de la siguiente manera

```Python
x = 5
x = "hola"
```
Esto quizás puede no tener sentido por ahora, sin embargo se tiene el problema de que los datos se pueden ver comprometidos si no tenemos suficiente cuidado. Java por ejemplo, es un lenguage OOP pero con tipado estático, quiere decir que si si definimos una variable u objeto se debe hacer como sigue:
```Java
int y
int x = 5
```
en el primer caso, puedes definir posteriormente a `y` con cualquier entero pero exclusivamente entero. Si queremos realizar la siguiente asignación
```Java
y = "Hola"
```
Nos marcará un error de compilación. Esto particularmente lo veo bueno porque así no se ve comprometida la información de tus objetos y puedes generar un desarrollo más organizado y limpio. El tipado dinámico de Python es mayormente para que no te preocupes del tipo de datos que defines sino más bien te concentres en otras cosas más importantes de desarrollo, como lo han estado haciendo hasta ahora. No nos hemos preocupado de la definición de datos sino puramente del desarrollo de los algoritmos y métodos numéricos que hemos estado viendo a lo largo del curso. 

Personalmente no me agrada el tipado dinámico porque en algún punto de la vida comienzas a generar un código cada vez más organizado y que requiere de esos aspectos de seguridad, yo soy mayormente team Julia que es un híbrido de muchas cosas y tiene tanto tipado dinámico como estático, y haber definido datos con tipo estático me ha salvado de cometer errores cruciales en lo que ando trabajando.

Veamos a continuación algunas desventajas del tipado dinámico


In [None]:
#Esto en Java daría un error de compilación, incluso en Julia si definieramos desde el principio el tipo de dato de x
x = 5
x = "hola"
x

In [None]:
#Ua de las desventajas es que podemos cambiar los atributos de Datos de manera global, eso en mi experiencia brinda cierta inestabilidad
a.atributo2

In [None]:
#aquí hemos cambiado el tipo de dato del atributo 2 de la plantilla Datos
a.atributo2 = 2
a.atributo2

In [None]:
#El problema es que se ha cambiado de manera global y permanente, si creamos otro objeto de la plantilla Datos
#y accedemos al segundo atributo ya no será nunca más la cadena que habíamos definido.
b = Datos
b.atributo2

In [None]:
#Viendo desde la raíz el segundo atributo confirmamos que ha sido cambiado de una vez por todas.
Datos.atributo2

Para volver a la forma original de la clase (plantilla) Datos debemos regresar a ejecutar esa celda para que todo regrese a la normalidad (te recomiendo hacerlo y ejecutar la siguiente celda)

In [None]:
a = Datos
a.atributo2

Hasta ahora es probable que no notes la importancia de esto, sin embargo permíteme narrar una experiencia personal. En mi trabajo de tesis he definido algunas `struct` que son lo análogo a las `class` de Python pero en Julia (presentan algunas sutiles diferencias), en particular la siguiente:
``` Julia
mutable struct DatosCSV
    dominio::Union{StepRangeLen{Float64, Base.TwicePrecision{Float64}, Base.TwicePrecision{Float64}, Int64},Vector{Float64}}
    resultado::Vector{Any}
    ruta::String
    nombeArchivo::String
end
```
(no te espantes) Esta es una clase como la que hemos creado (`Datos`) cuyos atributos son `dominio`, `resultado`, `ruta`, y `nombreArchivo`, y cada uno de esos atributos tiene su tipo de dato, en los dos primeros casos es un arreglo/vector y en los otros dos una cadena. Esta clase me ha serivido para guardar en ella un bloque de información y pasársela a una función para que me realizara un tratamiento de datos. 

El tema es que la información de los primeros dos atributos me tardaba en compilar desde dos horas hasta doce horas dependiendo de la complejidad de lo que estuviera calculando. Por lo que siempre trataba con pinzas esas listas (listas, arreglos y vectores en Julia es lo mismo XD) para que no ocurriera una desgracia por alguna distracción. El tema es que en una ocasión en el atributo resultado solamente registré una variable que era un flotante, por ejemplo guardé un `0.2`. Al compilar un objeto de DatosCSV con dicha información pues me regresó un error de compilación porque no estaba registrando en el atributo `resultado` un vector sino un número. Esta pequeña acción me salvo de no haber cometido un error que hubiera sido costoso por el tiempo que tardó en compilar y por toda la chamba que llevaba detrás de esta compilación, por lo tanto estoy agradecido con el tipado estático XD.

Bueno hasta ahora parece que le he estado tirando tierra a Python jaja pero únicamente por el tipado dinámico, además aún le ando aprendiendo varias y variadas cosas ya que no me considero taaan pro como lo soy en Julia. Una de las cosas que me fascinan de Python y de los lenguajes OOP son los métodos, no son más que funciones que se definen dentro de las clases y a los que se pueden invocar una vez que tengamos definido el objeto. La diferencia entre métodos y funciones es que la función se define en donde sea y es independiente de cualquier objeto mientras que el método es una función asociada a un objeto. Algunos ejemplos que hemos visto son:
```Python
x = [1,2,3]
x.append(4) #Agrega el 4 a la lista
x.pop()     #Elimina el último elemento de la lista
```
Cada uno de estos métodos es una función que se define dentro de su respectiva clase. Cada clase tendrán sus métodos asociados como hemos visto por ahí el `split()`. Definamos a continuación algunos métodos:

In [None]:
#Hasta ahora la clase que creamos solo tenía atributos, no le podíamos pasar argumentos para que hiciera cosas
#Definamos la siguiente clase
class Prueba1:
    atributo1 = []
    atributo2 = 3.1416
    #El primer método que crearemos es el constructor que da la capacidad de guardar información en la instancia argumento1
    def __init__(self,argumento1):
        self.argumento1 = argumento1

In [None]:
c = Prueba1((3.4,[],{}))

In [None]:
#Podemos acceder a la información que le hemos ingresado al objeto mediante
print(c.atributo1)
print(c.atributo2)
print(c.argumento1)

La diferencia entre esta clase y la primera que creamos es que ahora le podemos pasar datos para que se guarden en nuevas instancias y que posteriormente podamos acceder a ellas. Para que esto ocurra se debe inicializar el *constructor* `__init__` para que se le puedan pasar parámetros (aunque podrías no poner paránetros). El único parámetro que si se agrega por defecto es `self` que lo que hace es aplicar información o métodos sobre el mismo objeto. En el ejemplo anterios le pasamos una tupla al objeto `Prueba1`, y se ha guardado esa tupla en la instancia `argumento1`. Esto también puede aplicar con los métodos


In [None]:
class Prueba2:
    atributo1 = {}
    atributo2 = (1,2)
    def __init__(self,arg1):
        self.argumento1 = arg1 #Nota que argumento1 es el nombre de la instancia mientras que su valor asociado es arg1
    def funcion1(self):
        #Al poner self quiere decir que no se le pasan argumentos a esta función
        print("Se ejecuta lo que sea que aquí se poonga")
    def NumsCatalan(self,N):
        #Ahora esta función admite solo 1 parámetro el cual se le puede hacer lo que sea
        C0 = 1
        for n in range(N):
            Cn = (4*n+2)/(n+2)*C0
            C0 = Cn
            print(Cn)
    def factoresPrimos(self,a,n):
        #ahora una función que tenga dos parámetros y return
        r = []
        for i in range(2,n):
            if a%i == 0:
                r.append(i)
        return r
    

In [None]:
d = Prueba2([0])

In [None]:
d.argumento1 

In [None]:
d.funcion1()

In [None]:
d.NumsCatalan(10)

In [None]:
d.factoresPrimos(30,30)

Hasta aqui dejamos esta breve introducción de OOP, la finalidad no es volverlos expertos con estos temas sino que lo conozcan y que puedan indagar por su cuenta dependiendo de su curiosidad, aún hay muuuucho que explorar por delante. Por otro lado también espero que con esto tengan una mejor idea de como se estructura Python y que sepan de donde vienen las cosas y como se definen. A lo largo de los temas que nos pidieron iré haciendo breves comentarios sobre esta sección para ir relacionando la información presentada.

# Trabajar con archivos de texto

En este apartado se van a contemplar:

* Lectura de archivo de texto
* Uso de readlines()
* Uso de split()
* Graficar archivos de texto
* Escritura de archivos de texto dada una lista y/o arreglo
* Uso de la librería pandas (extra)

La manera en la que hemos trabajado en el curso con la manipulación de archivos de texto es en su forma más básica y tiene ciertas limitaciones, además de que hay que aprender a usar un cierto número de métodos y generar estructuras de control para poder extraer de forma conveniente la información de los txt. Sin embargo la librería `pandas` se especializa en la manipulación de archivos de texto, y cuenta con una amplia gama de métodos que simplifica las tareas de manipulación. Desde luego que se pretende dar una introducción y más adelante con el tiempo quizás tengamos una continuación de este material. 

Antes de querer leer abrir, leer o manipular cualquier archivo ya sea `.txt` o `.csv` es necesario que primero vean su estructura, vean que tipo de separadores tiene, si son tabuladores, espacios, comas, #, etx. También es necesario que vean cuantas columnas tiene su archivo o si más bien se trata de una matriz. Todo eso es muy importante para que sepan que tipo estrategias van a usar para la extracción.

## Lectura de archivo de texto

Para poder disponer de la información de un archivo de texto primero y antes que nada es necesario utilizar la función `open()` y asociarla a un objeto del cual podremos realizar algunas acciones; al abrir el archivo, su información solamente queda disponible al instante por lo que se debe guardar en alguna variable, si no se guarda la información se libera y para volver a acceder a ella es necesario volver a ejecutar `open()`. Cabe mencionar que esta función puede abrir archivos `.txt`, `.csv`, `.dat`, y todas las acciones que veremos a continuación aplican igual (me parece) para todo tipo de archivo.

In [None]:
#abrimos el archivo (se los voy a pasar) y lo asignamos al objeto archivo
#Procuren ingresar el nombre del archivo así como la ruta en donde se encuentra
archivo = open("Ising 50.csv")

Veamos ahora las funciones principales para poder ver que tiene el objeto archivo. Noten que si ejecutan cualquiera de esas funciones dos veces, la segunda vez regresa "algo" vacío, ya sea una lista vacía, una cadena vacía etc. 

In [None]:
#PAra poder guardar esa información y que permanezca fija en un espacio de memoria debemos asignar a otro objeto
contenido = archivo.read()

In [None]:
#read() solamente nos muestra que contiene el archivo. Al ejecutar una vez nos mostrará el contenido y 
#al ejecutar una segunda vez nos mostrará una cadena vacía, significa que ya se ha perdido la información del objeto.

#archivo.read()

In [None]:
#Pero para que no se ejecute de nuebo archivo.read() ponemos el objeto contenido en otra celda, 
#al ejecutar N veces esta celda, su información no se perderá pues ya tiene un espacio de memoria asignado.

#Si quieres ver el contenido quita el ;
contenido;

Recuerda que si ejecutas una segunda vez cualquier método de `archivo`, la información se perderá y ha que abrir de nuevo la información. Investigando me encontré que hay otro parámetro (además del nombre del archivo) que se le pasa a la función `open()` con 5 opciones diferentes:
* ‘r’: Por defecto, para leer el fichero.
* ‘w’: Para escribir en el fichero.
* ‘x’: Para la creación, fallando si ya existe.
* ‘a’: Para añadir contenido a un fichero existente.
* ‘b’: Para abrir en modo binario.

Pero por ahora solo nos concentraremos en 'r' y a lo mucho 'w'. El archivo que estamos empleando son los datos que obtuve en una práctica sobre el modelo de Ising, donde se calcula la magnetización, la energía por sitio, la susceptibilidad magnética y la capacidad calorifica para un conjunto de temperaturas. Se realizó para redes de 50 nodos (archivo actual), 100 y 200 nodos; por red me refiero más bien a una cuadrícula. Por tanto veamos como obtener dicha información y guardarlas en listas:

## Uso de `readline()`, `readlines()`, `split()`, `map()`

In [None]:
temperatura = []
energia = []
magnetizacion = []
sus_magn = []
cap_calor = []
#Se abre el archivo y se asimila al objeto file (que es creado con esta linea)
with open("Ising 100.csv",'r') as file:
    #Para cada elemento del objeto file, donde cada elemento es una fila del archivo
    for line in file:
        t,E,M,CE,SM = map(float,line.split())
        temperatura.append(t)
        energia.append(E)
        magnetizacion.append(M)
        sus_magn.append(SM)
        cap_calor.append(CE)
        

¿Como funciona la celda anterior? Primero definimos 5 listas vacías para cada columna del archivo .csv, cada lista contendrá su información. Después aplicamos una técnica para ir extrayendo cada fila del archivo e ir guardando cada dato en cada una de las listas. Para ello utilizamos `open()` nuevamente y lo asociamos al objeto `file`. Cada elemento de este objeto será una fila que contendrá cada uno de los 5 datos por lo tanto definimos un ciclo for que itere sobre todas las filas, en este caso el índice del for es `line` (para términos prácticos).

Ahora vemos la función `map()`, esta es una función muy útil: se emplea sobre arreglos o listas y lo que hace es aplicar una función a cada uno de los elementos de la lista dada:
```Python
map(función,lista)
```
En este caso lo que se aplica es la conversión de tipo float a cada uno de los elementos de `line.split()`. Por otro lado, `split()` es un método que separa en componentes un conjunto de datos: puede ser una cadena separada por espacios, o una lista separada por tabuladores como es en nuestro caso, al separar la información de acuerdo a un marcador (espacios, tabuladores, etc) la información se guarda en una lista y cada elemento es de tipo `string`. Sin embargo nosotros requerimos trabajar con los números y aquí es donde usamos map para convertir a flotantes los elementos de esa lista.

Una vez convertidos los números a flotantes, se rescata cada uno por medio de una variable: en este caso `t` le corresponde guardar la primera entrada de la lista y así para el resto de variables. Al tener esta información ahora se puede utilizar el método `append()` para ir guardando cada iteración en cada una de las listas antes definidas.

Veamos ahora como realizar la misma tarea usando `readline()` y `readlines()`

In [None]:
I100 =  open("Ising 100.csv")
temperatura = []
energia = []
magnetizacion = []
sus_magn = []
cap_calor = []
for line in I100:
    line = line.split()
    line = [float(i) for i in line]
    temperatura.append(line[0])
    energia.append(line[1])
    magnetizacion.append(line[2])
    cap_calor.append(line[3])
    sus_magn.append(line[4])
I100.close()

Esta es otra alternativa para extraer información usando un iterador sobre el objeto que abre al archivo `I100`. Es como si cada `line` de la iteración fuera un `readline()`, recuerda que este método lo que hace es leer cada línea del archivo por cada ejecuión que realizas hasta que se termine el archivo, intenta hacer `I100.readline()` $N$ veces e irás viendo como te muesrta cada línea del archivo en cada ejecución.

Nuevamente definimos los arreglos y el ciclo for donde cada `line` actúa como un `readline()`, eso nos viene bien porque nada más faltaría realizar el `split()` y la conversión de sus elementos a `float`; nota que en este caso la conversión la hice por lista de compresión. Al final `line` termina convitiéndose en una lista de 5 flotantes a los que podemos acceder y agregar a cada una de las listas propuestas. 

En este caso y el anterior debes de saber que columna y por ende que posición del dato corresponde con cada lista, para evitar que se te mezclen la información. Veamos un último caso con `readlines()`

In [None]:
#si tu archivo lo tienes en alguna otra carpeta ajena a este notebook te recomiendo utilizar esta variable string
#anexando la ruta y agregándola a open(). En mi caso el archivo si se encuentra en mi directorio actual por lo que solo
#paso el nombre del archivo, recuerda que a la ruta al final hay que ponerle el nombre del archivo
ruta = "Ising 200.csv"
I100 = open(ruta,'r')
lineas = I100.readlines()
I100.close()

In [None]:
temperatura = []
energia = []
magnetizacion = []
sus_magn = []
cap_calor = []
for linea in lineas:
    t,E,M,CE,SM = linea.split("\t")
    temperatura.append(float(t))
    energia.append(float(E))
    magnetizacion.append(float(M))
    cap_calor.append(float(CE))
    sus_magn.append(float(SM))

En este tercer y último caso abrimos y cerramos el archivo en una misma celda de código, sin embargo para rescatar la información y poder permitir que el archivo se cierre adecuadamente usamos `readlines()` que literalmente guarda en una lista todas las líneas del archivo en formato string y con su separador, en nuestro caso nuestro archivo se separa por medio de tabuladores. El objeto `lineas` contiene toda la información del archivo en tipo `string`, usamos nuevamente un iterador y en este caso a `linea` le vamos a aplicar `split()` con la opción de tabulador `\t`. Aplicamos y cada entrada de línea la guardamos en las variables que aparecen y al final a la hora de realizar el `append()` hacemos la conversión a flotante y listo.

Cualquiera de las opciones es válida, por lo que puedes ver existen múltiples maneras de resolver un mismo problema solo es cuestión de ver cual es la más simple o cual nos gusta más. Nota que al final de los últimos dos ejemplos aplicamos `close()`, esto es para cerrar el archivo y no preocuparnos más por él.

## Graficación de archivos 

Como hemos visto, `open()` para cualquier tipo de archivos, por ahí vi que existen unos archivos con extensión `.mtx` que yo me los he encontrado en listas de adyacencia para la formación de grafos. Ya al tener tus listas listas xd pues puede proceder a graficar la información de tus archivos, tomemos las 5 listas que tomamos para graficar, las cuatro cantidades estan en función de la temperatura así hay que realizar 4 gráficas.

In [None]:
h = 0.9#parametro para jugar con el tamaño de la imagen
fig, axs = plt.subplots(nrows=2, ncols=2, figsize = (10*h,7*h))  

temperatura_critica = 1.134592657106511

axs[0,0].plot(temperatura,energia, 'r-')
axs[0,0].set_title("Energía por sitio")
axs[0,0].set_xlabel("Temperatura")
axs[0,0].set_ylabel("Energía")
axs[0,0].axvline(temperatura_critica)

axs[0,1].plot(temperatura,magnetizacion, 'g.-')
axs[0,1].set_title("Magnetización")
axs[0,1].set_xlabel("Temperatura")
axs[0,1].set_ylabel("Magnetización")
axs[0,1].axvline(temperatura_critica)

axs[1,0].plot(temperatura,sus_magn, 'b.-')
axs[1,0].set_title("Susceptibilidad magnética")
axs[1,0].set_xlabel("Temperatura")
axs[1,0].set_ylabel("Susceptibilidad magnética")
axs[1,0].axvline(temperatura_critica)

axs[1,1].plot(temperatura,cap_calor, 'y.-')
axs[1,1].set_title("Capacidad calorífica")
axs[1,1].set_xlabel("Temperatura")
axs[1,1].set_ylabel("Capacidad calorífica")
axs[1,1].axvline(temperatura_critica)

plt.tight_layout()
plt.show()

## Escritura de archivos

Así como podemos abrir un archivo y extraer su información para graficarla (por ejemplo), podemos escribir información en archivos al menos en formato `.txt` y `.csv`. Como se ha visto, es conveniente guardar la información en archivos para que en cualquier momento podamos acceder a ella. Supongamos que tenemos la solución del oscilador armónico simple (datos reales), queremos guardar esa información en un archivo y la manera es la siguiente:

In [None]:
#Como aún no hemos visto métodos de solución de EDO simplemente voy a usar la función coseno
xs = np.arange(0,10,0.1) #Esta función es equivalente a range pero esta si admite un step float
ys = np.array([np.cos(i) for i in xs])
#guardamos la información en data en forma de tuplas
data = [(x,y) for x,y in zip(xs,ys)]
plt.plot(xs,ys)

In [None]:
#Para poder usar open() con la opción write
with open('data.txt', 'w') as file:
    for item in data:
        file.write(str(item) + '\n')

In [None]:
#Abrimos el archivo para extraer de nuevo la información
ruta = "data.txt"
datos = open(ruta,'r')
lineas = datos.readlines()
I100.close()

In [None]:
xs = []
ys = []
for line in lineas:
    x, y = line[1:-2].split(', ')
    xs.append(float(x))
    ys.append(float(y))

plt.plot(xs,ys)

**Explicación:** Es conveniente armar un objeto `data` que obtenga la información de`xs` y la `ys`, para ello creamos una lista por compresión donde utilizaremos `zip()` para que extraiga elemento a elemento de`xs` y `ys` y lo guarde en tuplas. Esto es para que al momento de usar write podamos leer a `data` linea por linea e ir escribiendola en el archivo de texto. Si te das cuenta a la hora de escribir en el archivo, el método `write()` pide a fuerzas que las líneas sean convertidas a `string` y además agrega un salto de línea. Es por ello que al abrir y extraer la info de un archivo hay que hacer la separación y conversión a números.

En este caso particular hay que realizar un poco más de talacha para poder extraer la información de `data.txt` ya que las líneas se ven de la siguiente forma:
```
'(0.0, 1.0)\n'
```
para poder extraer únicamente los números debemos de hacer que split ignore los paréntesis y el salto de línea, para ello vamos a enfocarnos en un `slice` de lineas en concreto
```
x, y = line[1:-2].split(', ')
```
Como line es una cadena la primera posición (index 0) es ocupada por el paréntesis entonces vamos a considerar la información desde la posición 1 que es el primer número hasta la antepenúltima posición que se representa con el `-2`, ya que la última es el salto de línea y la penúltima es el otro paréntesis. Con este slice ya nada mas consideramos lo siguiente
```
0.0, 1.0
```
Ahora podemos aplicar `split()` definiento `', '`como parametro para que separe los valores. Lo siguiente es guardar en las listas realizando la conversión a float. Seguramente existen formas mas eficientes de realizar la escritura de archivos pero por el momento a mi se me ocurrió esta y debo decir que si se me hizo algo engorroso. La escritura de `.csv` es mucho mas conveniente y simple, pero hay que importar su librería.

In [None]:
#Escribir archivos en .csz
import csv

with open('data.csv', 'w', newline='') as file:
    writer = csv.writer(file)
    writer.writerows(data)

In [None]:
#Abrimos el archivo para extraer de nuevo la información
ruta = "data.csv"
datos = open(ruta,'r')
lineas = datos.readlines()
I100.close()

In [None]:
xs = []
ys = []
for line in lineas:
    x, y = line.split(",")
    xs.append(float(x))
    ys.append(float(y))

plt.plot(xs,ys)

En este caso vemos que hay un parámetro extra en la función `open()` que es `newline=''`, lo que hace es deshabilitar el salto de linea `\n` y sustituirlo por `''`, te recomiendo que quites esta opción y veas como se genera el archivo resultante para que notes lo que genera. Al llamar `csv` accedemos a sus funciones y métodos, en particular `writer()` y  `writerrows()` harán toda la chamba. Para extraer de nuevo este archivo solo basta con poner en el split la `','` como separador y listo.

En mi opinión es mejor trabajar con archivos `.csv` que `.txt` asi que les recomiendo que se familiaricen más con ellos.

## Uso de pandas (extra)

Se puede emplear esta librería para poder leer y escribir archivos, el elemento por defecto de esta librería son los `DataFrames` que son estructuras de dato que sirven para guardar información, algo asi como tablas.

In [None]:
ruta = 'Ising 200.csv'

#buen hábito, poner los siguientes argumentos
tabla = pd.read_csv(ruta,
                    #nrows = 10,       #Despliega el número de filas que quieras
                    #skiprows = 14,    #Ignora cierto número de filas
                    header = None,     #Ignora a la primer fila como el título de cada columna.
                    sep = '\t',        #Tipo de separador de los datos
                    #usecols = [0,1]   #Selecciona columnas que quieras que se visualicen.
                   )        

In [None]:
#Si quieres visualizar el contenido, quita el ;
tabla;

De cierta manera usar `pandas` es mucho más eficiente que las técnicas antes vistas. Además de que es muy util tener una tabla (DataFrame) con toda la información de nuestro archivo. Te recomiendo que realices `tabla.read_` y apretes `tab` para que veas todas las opciones que posee; te darás cuenta que no lee `.txt` xd pero no hay mucho problema porque realmente usar archivos `.csv` será considerablemente mejor.

La celda anterior es una sintaxis básica, y útil para cuando no sepas el contenido del archivo. Puedes usar `nrows` para saber cuantas filas desplegar y darte una idea de la estrcutura que tiene el archivo, puedes usar `skiprows` si es que las primeras filas tienen alguna leyenda informativa que suele ser común en algunos archivos. Utilizar `header` si tu archivo tiene una fila de títulos o no los tiene, y por último `sep` que te servirá para notar el tipo de separador de tu archivo.

He de decir que con el método `.read_csv` puedes leer también archivo `.txt` pero tiene algunos problemas con el parámetro `sep`. Ahora por último veamos como grabar información en archivos de texto con pandas.

In [None]:
#Usamos ahora la función seno, pa cambiarle
xs = np.arange(0,10,0.1) #Esta función es equivalente a range pero esta si admite un step float
ys = np.array([np.sin(i) for i in xs])
#guardamos la información en data en forma de tuplas
data = [(x,y) for x,y in zip(xs,ys)]

In [None]:
#Teniendo la información en data, falta convertir la información a un dataframe
data = pd.DataFrame(data)
#podemos utilizar las columnas de la tabla o del dataframe como elementos para realizar una gráfica.
plt.plot(data[0],data[1])

In [None]:
#Para grabar la información es tan simple como realizar lo siguiente
data.to_csv("seno.csv",index=False,sep = "\t")

In [None]:
ruta = 'seno.csv'

#buen hábito, poner los siguientes argumentos
tabla = pd.read_csv(ruta,
                    #nrows = 10,       #Despliega el número de filas que quieras
                    #skiprows = 14,    #Ignora cierto número de filas
                    header = None,     #Ignora a la primer fila como el título de cada columna.
                    sep = '\t',        #Tipo de separador de los datos
                    #usecols = [0,1]   #Selecciona columnas que quieras que se visualicen.
                   ) 

Para poder guardar datos en archivos `.csv` primero hay que generarlos y estructurar las filas en tuplas para poder o en todo caso definir desde el principio un `DataFrame` con la información en cada una de sus columnas. Una vez teniendo tu objeto `DataFrame` (para verificar esto aplica `type(data)`) únicamente hay que utilizar el método `to_csv()` en donde se le pasa como parámetro el nombre del archivo, `index=False` y el tipo de separador que quieras (por defecto son `','`). Realizar el `index=False` es importante porque si no te genera una primera columna con todos los ínices de cada fila y pues comúnmente no se necesita hasta que se necesita cx.

Para rescatar nuevamente la información aplicamos lo de antes y listo. Hay un método interesante que me he encontrado `to_latex()`; no se si han hecho tablas en Latex pero llega a ser tedioso, pues con este método olvidate de escribir mucho código para generar tus tablas, el método ya te lo devuelve.

In [None]:
#Si quieres ver la información quita el ;
tabla.to_latex();

# Graficación

Otro de los temas que fueron solicitados fue graficación en distintos rubros:

* Density plots
* Graficar complejos
* Graficos en 3D
* Graficas de caos y mapeo logístico

Para este apartado vamos a recrear ejercicios de la tarea 3 como lo son el de caminatas aleatorias y el mapeo logístico. Además voy a utilizar otra distribución de datos para generar otro histograma.

## Caminatas aleatorias

El concepto de este ejercicio es simple, dar un paso a la derecha o a la izquierda dada una probabilidad. En realidad este ejercicio lo tuvieron bien todos, solo quiero utilizarlo para ver las formas de creación de histogramas.

In [None]:
#Camminata aleatoria
def caminataA(N,p):
    caminata = [0]
    sum = 0
    for i in range(N):
        if np.random.rand() > p:
            sum += 1
            caminata.append(sum)
        else:
            sum -= 1
            caminata.append(sum)
    return caminata
N = 100
p = 0.5
caminata = caminataA(N,p)
plt.figure(figsize=(7,5))
plt.xlabel("Tiempo")
plt.ylabel("Caminata")
plt.title("Caminata aleatoria")
plt.plot(range(N+1),caminata,'k.')
plt.plot(range(N+1),caminata,'g-')
plt.grid(True)
plt.show()

In [None]:
counts, bins = np.histogram(caminata,bins = range(min(caminata),max(caminata)+1))

h = 0.6 #parametro para jugar con el tamaño de la imagen
fig, (ax1,ax2) = plt.subplots(nrows=1, ncols=2, figsize = (18*h,7*h)) 

ax1.hist(caminata,edgecolor='black',bins = range(min(caminata),max(caminata)+1))
ax1.set_title("Usando plt.hist")
ax1.set_xlabel("Valores")
ax1.set_ylabel("Frecuencia")

ax2.bar(bins[:-1], counts,edgecolor='black')
ax2.set_title("Usando np.histogram y plt.bar")
ax2.set_xlabel("Valores")
ax2.set_ylabel("Frecuencia")

plt.tight_layout()
plt.show()

Este histograma como ya saben es para notar la frecuencia de posiciones a las que accede la caminata, esta distribución en principio es variada porque únicamente consideramos una caminata. Aqui lo importante es que tenemos dos formas de generar estos gráficos (y muy probablemente haya más). La primer forma y más sencilla es utilizando el método `plt.hist()`, lo único que requiere esta función es tu conjunto de distribuciones, quizás un parámetro de contorno `edgecolor` para poder diferenciar las barras y los bins. A varios les mencioné que es útil considerar un rango de bins que contemple a todos los valores de la distribución, es decir:
```
bins = range(min(caminata),max(caminata)+1)
```
Esto hará que sus histogramas se vean más finos y tenga cada barra su propio espacio. La segunda forma es utilizar el método de numpy `np.histogram()` que lo que hace es dada una distribución, y una configuración de bins nos regresa dos arreglos que corresponde a los conteos o la frecuencia de cada valor y los bins. Estos valores se grafican bajo el método `plt.bar(bins[:-1], counts,edgecolor='black')` y prácticamente obtendremos el mismo resultado dadas dos variantes. Ahora hagamos un histograma de 100 caminatas aleatorias:

In [None]:
#b)100 caminatas aleatorias
caminatas = []
p = 0.5
N = 100
for i in range(100):
    caminata = caminataA(N,p)
    caminatas.append(caminata)

plt.figure(figsize=(8,8))
plt.xlabel("Tiempo")
plt.ylabel("Caminatas")
plt.title("Caminatas aleatorias")
for i in range(len(caminatas)):
    plt.plot(caminatas[i])
plt.show()

In [None]:
data = caminatas  # Tu lista de 100 listas
data = np.concatenate(caminatas)
y,x = np.histogram(data,bins=range(min(data),max(data)+1))

h = 0.6 #parametro para jugar con el tamaño de la imagen
fig, (ax1,ax2) = plt.subplots(nrows=1, ncols=2, figsize = (18*h,7*h))  

ax1.hist(data,bins=range(min(data),max(data)+1),edgecolor='black')
ax1.set_title("Usando plt.hist")
ax1.set_xlabel("Valores")
ax1.set_ylabel("Frecuencia")
ax2.bar(x[:-1], y, edgecolor='black')
ax2.set_title("Usando np.histogram y plt.bar")
ax2.set_xlabel("Valores")
ax2.set_ylabel("Frecuencia")
plt.tight_layout()
plt.show()

Lo que hacemos es crear una lista vacía y guardar cada una de las 100 caminatas en esa lista, por lo tatno tendrás una lista de 100 listas. Como tal esto no lo podemos hacer histograma porque necesitamos que una única lista sea la distribución, por ello usamos `np.concatenate()` pasándole como argumento la lista de 100 listas y con ello tenemos la distribución lista. Lo único que resta es realizar los mismos pasos que antes y graficar el histograma usando `plt.hist()` o `plt.bar()` (con los datos de `np.histogram()`).

Vamos a trabajar con otra distribución y para ello usaremos pandas.

## Histogramas usando pandas

In [None]:
ruta = "Diagonales.csv"

D = pd.read_csv(ruta,
                #nrows = 10,       #Despliega el número de filas que quieras
                #skiprows = 14,    #Ignora cierto número de filas
                header = None,     #Ignora a la primer fila como el título de cada columna.
                sep = '\t',        #Tipo de separador de los datos
                #usecols = [0,1],   #Selecciona columnas que quieras que se visualicen.    
                   ) 

In [None]:
histo = D[0].hist(bins=25, grid=True, figsize=(7,4), color='#86bf91', rwidth=0.9,edgecolor="black")
plt.title("Histograma usando pandas")

In [None]:
#plt.hist(np.concatenate([D[i] for i in range(50)]),bins=200)

In [None]:
d = D.to_numpy().flatten()
Djuntito = pd.DataFrame(d[d != None])
Djuntito.hist(bins=range(int(min(d)),int(max(d)+1)), grid=True, figsize=(7,4), color='#86bf91', rwidth=0.9,edgecolor="black")
plt.title("Histograma de todas las columnas del dataframe")

Importamos debidamente nuestros datos de `Diagonales.csv` que contiene cierta distribución. Vemos que genera una tabla de $100\times 50$, por lo que podemos realizar dos acciones. Primero que nada, pandas tiene un método que genera histogramas `hist()` y a este se le pasan ciertos valores de estética del plot que se va a generar. Sin embargo si tengo 50 columnas y realizo
```
D.hist(...)
```
Se me van a generar 50 histogramas, para cada columna. Por lo tanto puedo seleccionar una columna y realizar su respectivo histograma
```
D[0].hist(...)
```
Si requiero un histograma general de todas las columnas será preciso concatenar las columnas, para ello debemos de convertir momentáneamente nuestro `DataFrame` en un array de numpy, aplicarle el método `flatten()` que lo que hace es concatenar el array de arrays, y de esta forma ya solo tengo un array con todos los valores posibles. Este array lo convierto a un `DataFrame` de nuevo y ahora si puedo generar el histograma de la distribución completa.

## Graficas en 3D

Utilizaré el ejemplo de las caminatas 2D y 3D

In [None]:
#c)Caminatas aleatorias en 2D y 3D
def caminataND(N :int,p :float,dim :int):
    X = []
    for i in range(dim):
        X.append(caminataA(N,p))
    
    return X
X=caminataND(500,.5,2)
Y=caminataND(500,.5,3)

In [None]:
#Para una caminata
from mpl_toolkits.mplot3d import Axes3D

X=caminataND(500,.5,2)
Y=caminataND(500,.5,3)

h = 0.6 #parametro para jugar con el tamaño de la imagen
fig = plt.figure(figsize = (18*h,7*h)) 

ax1 = fig.add_subplot(121)  # 1 fila, 2 columnas, 1er subplot
ax1.plot(X[0],X[1],'.:')
ax1.plot(X[0][0],X[1][0],'r.')

ax2 = fig.add_subplot(122, projection='3d')  # 1 fila, 2 columnas, 2do subplot
ax2.plot(Y[0],Y[1],Y[2],'.:')
ax2.plot(Y[0][0],Y[1][0],Y[2][2],'r.')

ax1.grid()

# Mostrar la figura con ambos subplots
plt.tight_layout()  # Ajusta el espacio entre subplots
plt.show()

In [None]:
caminatas2D = []
caminatas3D = []
p = 0.5
N = 100
for i in range(1,100):
    caminata = caminataND(N,p,2)
    caminatas2D.append(caminata)

for i in range(1,100):
    caminata = caminataND(N,p,3)
    caminatas3D.append(caminata)

h = 0.7
fig = plt.figure(figsize = (15*h,7*h)) 
ax1 = fig.add_subplot(121)

for i in range(len(caminatas2D)):
    ax1.plot(caminatas2D[i][0],caminatas2D[i][1])
ax1.set_title("Caminata aleatoria 2D")

ax2 = fig.add_subplot(122, projection='3d')

for i in range(len(caminatas3D)):
    ax2.plot(caminatas3D[i][0],caminatas3D[i][1],caminatas3D[i][2])
ax2.set_title("Caminata aleatoria 3D")
plt.tight_layout()  # Ajusta el espacio entre subplots
plt.show()

Para entender la formación de estas gráficas primero entendamos la generalización de las caminatas aleatorias; únicamente es aplicar una caminata 1D a cada eje, para ello definimos una lista vacía y la dimensión, iteramos en un `for` y en el caso de que se tengan caminatas de 2dim pues tendremos una lista con dos caminatas 1D por ejemplo. Con esto tenemos para graficar las caminatas.

Para el caso de los gráficos en 3D se debe de importar `Axes3D` y solo por esta ocasión al objeto `fig` se le debe de aplicar el método `add_subplots()` y para el caso de los graficos 3d hay que agregar el parámetros `projection='3d'`.
