# 9. Archivos

## 9.1 ¿Qué es un archivo?

Un archivo es un contenedor de información. En un archivo la información se almacena como un conjunto de bytes consecutivos. En el interior del archivo, la información se organiza acorde a un formato concreto (texto, binario, executable, etc.).

Los archivos se representan como series de unos (1) y ceros (0) para ser procesador por el sistema (computador).

Un archivo se organiza en tres partes:

1. Encabezado - tiene la metadata del contenido del archivo (nombre, tamaño, tipo, etc).
2. Datos - contenido del archivo
3. Fin del archivo - EOF (End-Of-File).

## 9.2 Operaciones básicas sobre un archivo

Ejemplo 9.2.1: Obtener la ruta actual del archivo en edición.

In [2]:
import pathlib

resultado = pathlib.Path().resolve()

resultado

WindowsPath('G:/Dropbox/Pro/Talleres/PandasTallerManipulacionDatos/Taller001-Python-Intro')

Ejemplo 9.2.2: Obtener el nombre del archivo actual.

In [3]:
%%javascript
IPython.notebook.kernel.execute(`notebookname = '${window.document.getElementById("notebook_name").innerHTML}'`)

<IPython.core.display.Javascript object>

In [4]:
notebookname

'T001-09-Archivos'

In [5]:
nombre_archivo = notebookname + '.ipynb'

nombre_archivo

'T001-09-Archivos.ipynb'

Ejemplo 9.2.3: Preguntar si un archivo existe.

In [6]:
dir(resultado)

['__bytes__',
 '__class__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__enter__',
 '__eq__',
 '__exit__',
 '__format__',
 '__fspath__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rtruediv__',
 '__setattr__',
 '__sizeof__',
 '__slots__',
 '__str__',
 '__subclasshook__',
 '__truediv__',
 '_accessor',
 '_cached_cparts',
 '_closed',
 '_cparts',
 '_drv',
 '_flavour',
 '_format_parsed_parts',
 '_from_parsed_parts',
 '_from_parts',
 '_hash',
 '_init',
 '_make_child',
 '_make_child_relpath',
 '_opener',
 '_parse_args',
 '_parts',
 '_pparts',
 '_raise_closed',
 '_raw_open',
 '_root',
 '_str',
 'absolute',
 'anchor',
 'as_posix',
 'as_uri',
 'chmod',
 'cwd',
 'drive',
 'exists',
 'expanduser',
 'glob',
 'group',
 'home',
 'is_absolute',
 'is_block_device',
 'is_char_device',
 'is_dir',
 'is_fifo',
 'is_file',
 'is_mount',
 'is_reserved',
 '

In [7]:
resultado.absolute

<bound method Path.absolute of WindowsPath('G:/Dropbox/Pro/Talleres/PandasTallerManipulacionDatos/Taller001-Python-Intro')>

In [8]:
resultado.absolute()

WindowsPath('G:/Dropbox/Pro/Talleres/PandasTallerManipulacionDatos/Taller001-Python-Intro')

In [9]:
resultado = str(resultado)

'G:\\Dropbox\\Pro\\Talleres\\PandasTallerManipulacionDatos\\Taller001-Python-Intro'

In [10]:
resultado = str(resultado)

resultado

'G:\\Dropbox\\Pro\\Talleres\\PandasTallerManipulacionDatos\\Taller001-Python-Intro'

In [11]:
nombre_archivo

'T001-09-Archivos.ipynb'

In [12]:
import os

In [13]:
ruta_absoluta = os.path.join(resultado, nombre_archivo)

ruta_absoluta

'G:\\Dropbox\\Pro\\Talleres\\PandasTallerManipulacionDatos\\Taller001-Python-Intro\\T001-09-Archivos.ipynb'

In [14]:
os.path.exists(ruta_absoluta)

True

In [15]:
ruta_absoluta_no_existente = os.path.join(resultado, 'taller01_archivos.ipynb')

ruta_absoluta_no_existente

'G:\\Dropbox\\Pro\\Talleres\\PandasTallerManipulacionDatos\\Taller001-Python-Intro\\taller01_archivos.ipynb'

In [16]:
os.path.exists(ruta_absoluta_no_existente)

False

**Ejemplo 9.2.4**:

Leer el contenido de un archivo.

In [17]:
ruta_absoluta

'G:\\Dropbox\\Pro\\Talleres\\PandasTallerManipulacionDatos\\Taller001-Python-Intro\\T001-09-Archivos.ipynb'

In [None]:
def leer_contenido_archivo(ruta_archivo):
    if os.path.exists(ruta_archivo):
        if os.path.isfile(ruta_archivo):
            with open(ruta_archivo, 'rt', encoding='utf-8') as f:
                for l in f.readline():
                    print(l)
        else:
            print('ERROR: La ruta indicada no corresponde a un archivo.')
    else:
        print('ERROR: El archivo no existe.')