<h1 style="color:#872325">File I/O y Módulos</h1>

En esta sección veremos como trabajar y manipular archivos desde python. Python viene incluido con una serie de librerías y funciones predefinidas que nos permiten trabajar con archivos. De esta manera, al correr un proceso, podemos guardar su resultado a un archivo o, en su defecto, leer el contenido del archivo a fin de trabajar con sus valores.

### `open`

La función `open` nos permite abrir un archivo encontrado desde nuestra computadora. Con un archivo abierto, podemos escribir, leer, o añadir. 

**Es importante tener en cuenta en donde estamos trabajando y en donde se encuentra el archivo que queremos leer.**

Actualmente me encuentro en el directorio

In [1]:
pwd

'C:\\Users\\PatricioGarcia\\OneDrive - Adenza\\Documentos\\My Documents\\Analysic\\Python 2023-06-12\\intro_python'

El archivo que deseamos leer se llama `texto.txt`, el cual no se encuentra dentro de la carpeta actual

In [2]:
ls

 Volume in drive C has no label.
 Volume Serial Number is AAF5-5553

 Directory of C:\Users\PatricioGarcia\OneDrive - Adenza\Documentos\My Documents\Analysic\Python 2023-06-12\intro_python

06/29/2023  05:31 PM    <DIR>          .
06/29/2023  05:31 PM    <DIR>          ..
06/28/2023  03:37 PM    <DIR>          .ipynb_checkpoints
06/28/2023  03:40 PM    <DIR>          files
06/19/2023  06:56 PM            97,735 lec01.ipynb
06/20/2023  05:46 PM           158,510 lec02.ipynb
06/22/2023  06:21 PM            40,697 lec03.ipynb
06/28/2023  12:13 PM            45,080 lec04.ipynb
06/29/2023  05:30 PM            68,822 lec05.ipynb
06/29/2023  05:31 PM            13,422 lec06.ipynb
               6 File(s)        424,266 bytes
               4 Dir(s)  540,851,429,376 bytes free


Sabiendo la ruta al archivo a leer, existen dos maneras de acceder directamente al archivo sin necesidad de modificar el directorio en donde estamos trabajando.

En este ejemplo, el archivo a leer se encuentra dentro de  
`C:\Users\PatricioGarcia\OneDrive - Adenza\Documentos\My Documents\Analysic\Python 2023-06-12\intro_python\files\lec06`

**Referencia Absoluta**  
La primera manera es llegar al archivo desedo considerando toda la ruta hasta el archivo a leer  
`C:\Users\PatricioGarcia\OneDrive - Adenza\Documentos\My Documents\Analysic\Python 2023-06-12\intro_python\files\lec06`

**Referencia Relativa**  
La segunda manera es especificando, relativo a nuestro directorio, hacía donde nos vamos a mover. Abajo se muestra el diagrama del proyecto.
```
.
├── README.md
├── files
│   ├── lec01
│   │   ├── hello.py
│   │   ├── hw_script.png
│   │   └── hw_terminal.png
│   ├── lec02
│   │   ├── prg01.png
│   │   └── prg02.png
│   ├── lec06
│   │   ├── mun_cdmx.csv
│   │   └── texto.txt
│   └── misc
│       └── logo.gif
└── notas
    ├── lec01.ipynb
    ├── lec02.ipynb
    ├── lec03.ipynb
    ├── lec04.ipynb
    ├── lec05.ipynb
    ├── lec06.ipynb
    └── lec07.ipynb
```


 Nos encontramos actualmente dentro la carpeta `notas`. Si quisieramos llegar a la carpeta `lec06` dentro de `files`, tendríamos que *retroceder* una carpeta para luego acceder a `files`.
 
 Retrocedemos una carpeta de manera *relativa* por medio de `..`. En otras palabras, si quisieramos acceder al archivo `texto.txt` de manera relativa, la ruta sería  
`../files/lec06/texto.txt`

### ...de regreso a `open` (leyendo archivos)

Abrimos y leemos un archivo en Python con la función `open` cuyo primer argumento es la ruta del archivo a a acceder.

```python
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
```

In [3]:
ruta_archivo = "files/lec06/texto.txt"

f = open(ruta_archivo)
f

<_io.TextIOWrapper name='files/lec06/texto.txt' mode='r' encoding='cp1252'>

In [4]:
type(f)

_io.TextIOWrapper

El resultado de abrir un archivo es un `file object` sobre el cual podemos manipular antes de visualizar el contenido del archivo. Dependiendo del *modo* seleccionado para trabajar con el archivo, `f` toma diferentes propiedades. Por *default* el modo es *r* (read), sin embargo, existen diferentes modos de trabajo. Enunciaremos los más comunes abajo.

* `r`: leer (default)
* `w`: escribir
* `a`: escribir. Agrega información al final del archivo si este ya existe
* `b`: binario. Para trabajar con archivos binarios, e.g., excel

In [5]:
# Leemos los contenidos del archivo
f.read()

'Esto es un archivo de texto'

Para evitar posibles conflictos en el archivo, es importante cerrarlo una vez que se haya terminado de utilizar

In [None]:
f.close()

Una vez abierto un archivo es imprescindible cerrarlo. Para tener un poco más de legibilidad y no olvidar cerrar el archivo, se puede hacer uso del *keyword* `with` que abre un archivo dentro de un bloque de texto para posteiormente cerrarlo.

El keywork `with` toma un objeto (en nuestro caso un lector de archivos) que incluya dos métodos: `.open` y `.close`. Python se encarga de abrir y cerrar el archivo.


```python
with open(filename, mode) as f:
    <manipulación del archivo>
```

In [11]:
with open(ruta_archivo, "r") as f:
    max_line = 3
    contador = 0
    
    # Por confirmar método adecuado para archivos grandes
    for line in f:
        contador += 1
        print(line)
        if contador == 3:
            break

Este es un archivo de texto

Este es un archivo de texto

Este es un archivo de texto



Si tratamos de volver a leer el archivo, el siguiente error nos aparece:
```python
>>> f.read()
ValueError                                Traceback (most recent call last)
<ipython-input-24-873bb1270d85> in <module>()
      1 # Si tratamos y
----> 2 f.read()

ValueError: I/O operation on closed file.
```
El cuál anuncia que el archivo ha sido cerrado

### Escribiendo Archivos
El modo `"w"` dentro de `open` nos permite crear nuevos archivos. La sintáxis sería la siguiente
```python
open(filename, "w")
```

In [12]:
with open("nuevo_archivo.txt", "w") as my_file:
    for i in range(10):
        my_file.write(str(i) + "\n")

**Notas**  
* El código anterior escribió un caracter después de otro.
* Fue necesario convertir nuestro `int` a un `str` para poder escribir su valor

## Módulos

Un modulo  es un archivo escrito en python con funciones, clases, etc. Python contiene una librería *estándard* que contiene diferentes funciones o clases. Para hace uso de estas librerías, es necesario importarlas.

**Dos maneras de importar librerias en Python**
```python
import libreria
from libreria import modulo
```

In [13]:
import pandas

La primera manera de cargar una libreria es importar el nombre de la libreria. Para poder acceder a un elemento de la libería de esta manera es necesario acceder a este como `libreria.elemento`

In [14]:
DataFrame

NameError: name 'DataFrame' is not defined

In [15]:
pandas.DataFrame

pandas.core.frame.DataFrame

Para poder ver los elementos que dependen de una libreria (o cualquier función) usamos la función `dir`.

In [16]:
dir(pandas)

['ArrowDtype',
 'BooleanDtype',
 'Categorical',
 'CategoricalDtype',
 'CategoricalIndex',
 'DataFrame',
 'DateOffset',
 'DatetimeIndex',
 'DatetimeTZDtype',
 'ExcelFile',
 'ExcelWriter',
 'Flags',
 'Float32Dtype',
 'Float64Dtype',
 'Float64Index',
 'Grouper',
 'HDFStore',
 'Index',
 'IndexSlice',
 'Int16Dtype',
 'Int32Dtype',
 'Int64Dtype',
 'Int64Index',
 'Int8Dtype',
 'Interval',
 'IntervalDtype',
 'IntervalIndex',
 'MultiIndex',
 'NA',
 'NaT',
 'NamedAgg',
 'Period',
 'PeriodDtype',
 'PeriodIndex',
 'RangeIndex',
 'Series',
 'SparseDtype',
 'StringDtype',
 'Timedelta',
 'TimedeltaIndex',
 'Timestamp',
 'UInt16Dtype',
 'UInt32Dtype',
 'UInt64Dtype',
 'UInt64Index',
 'UInt8Dtype',
 '__all__',
 '__builtins__',
 '__cached__',
 '__deprecated_num_index_names',
 '__dir__',
 '__doc__',
 '__docformat__',
 '__file__',
 '__getattr__',
 '__git_version__',
 '__loader__',
 '__name__',
 '__package__',
 '__path__',
 '__spec__',
 '__version__',
 '_config',
 '_is_numpy_dev',
 '_libs',
 '_testing',
 '

In [18]:
import math

dir(math)

['__doc__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 'acos',
 'acosh',
 'asin',
 'asinh',
 'atan',
 'atan2',
 'atanh',
 'ceil',
 'comb',
 'copysign',
 'cos',
 'cosh',
 'degrees',
 'dist',
 'e',
 'erf',
 'erfc',
 'exp',
 'expm1',
 'fabs',
 'factorial',
 'floor',
 'fmod',
 'frexp',
 'fsum',
 'gamma',
 'gcd',
 'hypot',
 'inf',
 'isclose',
 'isfinite',
 'isinf',
 'isnan',
 'isqrt',
 'lcm',
 'ldexp',
 'lgamma',
 'log',
 'log10',
 'log1p',
 'log2',
 'modf',
 'nan',
 'nextafter',
 'perm',
 'pi',
 'pow',
 'prod',
 'radians',
 'remainder',
 'sin',
 'sinh',
 'sqrt',
 'tan',
 'tanh',
 'tau',
 'trunc',
 'ulp']

Si deseamos solo un objecto de un módulo, podemos importar el objecto sin importar toda la librería usando 
```python
from modulo import objecto
```

In [19]:
math.log10(5)

0.6989700043360189

In [20]:
from math import log10

In [21]:
log10(5)

0.6989700043360189

## Datetime 

In [None]:
from datetime import datetime

Dando formato a las fechas. Documentación en:

https://docs.python.org/3/library/datetime.html?highlight=datetime#strftime-and-strptime-behavior

<h3 style="color:crimson"> Ejercicio </h3>

1. Crea la función `timestep(init_date, n)` tal que, dada una fecha inicial y $n$ días de duración, calcule la fecha hábil final corriendo la fecha un día después al final de $n$ días si  cae en una fecha inhábil o en fin de semana. Para lograr esto, lee el archivo `../files/lec07/holidays.txt`

Considera cualquier fecha entre 1/1/10 y 12/25/50.

```python
>>> timestep(datetime(2009, 12, 31), 1)
datetime.datetime(2010, 1, 4, 0, 0)

>>> timestep(datetime(2009, 12, 31), 2)
datetime.datetime(2010, 1, 4, 0, 0)

>>> timestep(datetime(2017, 12, 26), 4)
datetime.datetime(2018, 1, 2, 0, 0)

>>> timestep(datetime(2018, 2, 19), 2)
datetime.datetime(2018, 2, 21, 0, 0)
```

2. Usando el archivo `6m_rates.csv`, crear el diccionario `tasas` donde las llaves sean las fechas (`datetime.datetime`) y los valores (`float`) las tasas a esa fecha.
```python
>>>tasas[datetime(2017, 2, 1)]
2.58
>>>tasas[datetime(2013, 4, 1)]
1.9
```

3. Crear una función `tasa_compuesta` que, para una tasa nominal fija compuesta $n$ veces en un año, calcule el valor del nominal para cada periodo $k = 0,\ldots, n$. 
```python
def tasa_compuesta(inicio_periodo, nominal, tasa_nominal, n_periodos, path="."):
    pass
```
La función debe regresar un archivo `.csv` de nombre `cap_n.csv`; donde `n` es el número de veces de capitalización en un año.

## OS

In [None]:
import os

## Collections ## 

In [None]:
import collections