# 9. Archivos

## 9.1 ¿Qué es un archivo?

Un archivo es un contenedor de información. En un archivo la información se almacena como un conjunto de bytes consecutivos. En el interior del archivo, la información se organiza acorde a un formato concreto (texto, binario, executable, etc.).

Los archivos se representan como series de unos (1) y ceros (0) para ser procesador por el sistema (computador).

Un archivo se organiza en tres partes:

1. Encabezado - tiene la metadata del contenido del archivo (nombre, tamaño, tipo, etc).
2. Datos - contenido del archivo
3. Fin del archivo - EOF (End-Of-File).

## 9.2 Operaciones básicas sobre un archivo

Ejemplo 9.2.1: Obtener la ruta actual del archivo en edición.

In [2]:
import pathlib

resultado = pathlib.Path().resolve()

resultado

WindowsPath('G:/Dropbox/Pro/Talleres/PandasTallerManipulacionDatos/Taller001-Python-Intro')

Ejemplo 9.2.2: Obtener el nombre del archivo actual.

In [3]:
%%javascript
IPython.notebook.kernel.execute(`notebookname = '${window.document.getElementById("notebook_name").innerHTML}'`)

<IPython.core.display.Javascript object>

In [4]:
notebookname

'T001-09-Archivos'

In [5]:
nombre_archivo = notebookname + '.ipynb'

nombre_archivo

'T001-09-Archivos.ipynb'

Ejemplo 9.2.3: Preguntar si un archivo existe.

In [6]:
dir(resultado)

['__bytes__',
 '__class__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__enter__',
 '__eq__',
 '__exit__',
 '__format__',
 '__fspath__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rtruediv__',
 '__setattr__',
 '__sizeof__',
 '__slots__',
 '__str__',
 '__subclasshook__',
 '__truediv__',
 '_accessor',
 '_cached_cparts',
 '_closed',
 '_cparts',
 '_drv',
 '_flavour',
 '_format_parsed_parts',
 '_from_parsed_parts',
 '_from_parts',
 '_hash',
 '_init',
 '_make_child',
 '_make_child_relpath',
 '_opener',
 '_parse_args',
 '_parts',
 '_pparts',
 '_raise_closed',
 '_raw_open',
 '_root',
 '_str',
 'absolute',
 'anchor',
 'as_posix',
 'as_uri',
 'chmod',
 'cwd',
 'drive',
 'exists',
 'expanduser',
 'glob',
 'group',
 'home',
 'is_absolute',
 'is_block_device',
 'is_char_device',
 'is_dir',
 'is_fifo',
 'is_file',
 'is_mount',
 'is_reserved',
 '

In [7]:
resultado.absolute

<bound method Path.absolute of WindowsPath('G:/Dropbox/Pro/Talleres/PandasTallerManipulacionDatos/Taller001-Python-Intro')>

In [8]:
resultado.absolute()

WindowsPath('G:/Dropbox/Pro/Talleres/PandasTallerManipulacionDatos/Taller001-Python-Intro')

In [9]:
resultado = str(resultado)

'G:\\Dropbox\\Pro\\Talleres\\PandasTallerManipulacionDatos\\Taller001-Python-Intro'

In [10]:
resultado = str(resultado)

resultado

'G:\\Dropbox\\Pro\\Talleres\\PandasTallerManipulacionDatos\\Taller001-Python-Intro'

In [11]:
nombre_archivo

'T001-09-Archivos.ipynb'

In [12]:
import os

In [13]:
ruta_absoluta = os.path.join(resultado, nombre_archivo)

ruta_absoluta

'G:\\Dropbox\\Pro\\Talleres\\PandasTallerManipulacionDatos\\Taller001-Python-Intro\\T001-09-Archivos.ipynb'

In [14]:
os.path.exists(ruta_absoluta)

True

In [15]:
ruta_absoluta_no_existente = os.path.join(resultado, 'taller01_archivos.ipynb')

ruta_absoluta_no_existente

'G:\\Dropbox\\Pro\\Talleres\\PandasTallerManipulacionDatos\\Taller001-Python-Intro\\taller01_archivos.ipynb'

In [16]:
os.path.exists(ruta_absoluta_no_existente)

False

**Ejemplo 9.2.4**:

Leer el contenido de un archivo.

In [17]:
ruta_absoluta

'G:\\Dropbox\\Pro\\Talleres\\PandasTallerManipulacionDatos\\Taller001-Python-Intro\\T001-09-Archivos.ipynb'

In [23]:
def leer_contenido_archivo(ruta_archivo):
    """
    Lee el contenido de un archivo especificado en un ruta.
    
    :param ruta_archivo:string: Ruta del archivo a leer.
    :return NoneType.
    """
    if os.path.exists(ruta_archivo):
        if os.path.isfile(ruta_archivo):
            with open(ruta_archivo, 'rt', encoding='utf-8') as f:
                for l in f.readlines():
                    print(l)
        else:
            print('ERROR: La ruta indicada no corresponde a un archivo.')
    else:
        print('ERROR: El archivo no existe.')

In [19]:
help(leer_contenido_archivo)

Help on function leer_contenido_archivo in module __main__:

leer_contenido_archivo(ruta_archivo)
    Lee el contenido de un archivo especificado en un ruta.
    
    :param ruta_archivo:string: Ruta del archivo a leer.
    :return NoneType.



In [20]:
leer_contenido_archivo(ruta_absoluta_no_existente)

ERROR: El archivo no existe.


In [21]:
leer_contenido_archivo(resultado)

ERROR: La ruta indicada no corresponde a un archivo.


In [24]:
leer_contenido_archivo(ruta_absoluta)

{

 "cells": [

  {

   "cell_type": "markdown",

   "metadata": {},

   "source": [

    "# 9. Archivos"

   ]

  },

  {

   "cell_type": "markdown",

   "metadata": {},

   "source": [

    "## 9.1 ¿Qué es un archivo?\n",

    "\n",

    "Un archivo es un contenedor de información. En un archivo la información se almacena como un conjunto de bytes consecutivos. En el interior del archivo, la información se organiza acorde a un formato concreto (texto, binario, executable, etc.).\n",

    "\n",

    "Los archivos se representan como series de unos (1) y ceros (0) para ser procesador por el sistema (computador)."

   ]

  },

  {

   "cell_type": "markdown",

   "metadata": {},

   "source": [

    "Un archivo se organiza en tres partes:\n",

    "\n",

    "1. Encabezado - tiene la metadata del contenido del archivo (nombre, tamaño, tipo, etc).\n",

    "2. Datos - contenido del archivo\n",

    "3. Fin del archivo - EOF (End-Of-File)."

   ]

  },

  {

   "cell_type": "markdown",



**Ejemplo 9.2.5**

Acceder al contenido de un archivo de texto plano ya existente.

In [25]:
ruta_archivo_paises = 'T001-09-paises.txt'

In [26]:
ruta_archivo_paises

'T001-09-paises.txt'

In [27]:
os.path.exists(ruta_archivo_paises)

True

In [28]:
os.path.isdir(ruta_archivo_paises)

False

In [29]:
os.path.isfile(ruta_archivo_paises)

True

In [32]:
with open(ruta_archivo_paises, 'rt', encoding='utf-8') as f:
    for l in f.readlines():
        print(l, end='')

Colombia
Bolivia
Perú
Argentina
Ecuador
Venezuela
Paraguay
Uruguay
Chile
Brasil

## 9.3 Proceso de escritura de archivos

**Ejemplo 9.3.1**

Solicitar al usuario el ingreso de diez números y guardarlos en una lista. Después de capturados esos valores procederemos a guardar ese contenido en un archivo de texto plano.

In [33]:
numeros = []

for i in range(10):
    while True:
        try:
            numero = float(input('Digite un número: '))
            break
        except:
            print()
            print('MENSAJE: Debe digitar un valor que corresponda con un número.')
            print()
    
    print()
    
    numeros.append(numero)

print()

ruta_archivo_numeros = 'T001-09-numeros.txt'

with open(ruta_archivo_numeros, 'wt', encoding='utf-8') as f:
    for n in numeros:
        f.write(f'{n}\n')


Digite un número: 2

Digite un número: 7

Digite un número: 5

Digite un número: 11

Digite un número: 3

Digite un número: 19

Digite un número: 23

Digite un número: 29

Digite un número: 31

Digite un número: 43




In [35]:
with open(ruta_archivo_numeros, 'rt', encoding='utf-8') as f:
    for l in f.readlines():
        print(l, end='')

2.0
7.0
5.0
11.0
3.0
19.0
23.0
29.0
31.0
43.0


In [37]:
with open(ruta_archivo_numeros, 'rt', encoding='utf-8') as f:
    linea = f.readline()
    print(linea, end='')

2.0


In [43]:
with open(ruta_archivo_numeros, 'rt', encoding='utf-8') as f:
    linea = f.readline()
    print(linea, end='')
    
    print()
    
    linea = f.readline()
    print(linea, end='')
    
    
    print()
    
    linea = f.readline()
    print(linea, end='')
    
    print()
    
    linea = f.readline()
    print(linea, end='')
    
    print()
    
    linea = f.readline()
    print(linea, end='')
    
    print()
    
    linea = f.readline()
    print(linea, end='')
    
    print()
    
    linea = f.readline()
    print(linea, end='')
    
    print()
    
    linea = f.readline()
    print(linea, end='')
    
    print()
    
    linea = f.readline()
    print(linea, end='')
    
    print()
    
    linea = f.readline()
    print(linea, end='')
    
    print()
    
    linea = f.readline()
    print(linea, end='')
    
    print()
    
    linea = f.readline()
    print(linea, end='')
    
    print()
    
    linea = f.readline()
    print(linea, end='')
    
    print()
    
    linea = f.readline()
    print(linea, end='')
    
    print()
    
    linea = f.readline()
    print(linea, end='')

2.0

7.0

5.0

11.0

3.0

19.0

23.0

29.0

31.0

43.0







In [44]:
len(linea)

0

**Ejemplo 9.3.2**

Sumar el contenido del archivo que contiene número (`T001-09-numeros.txt`).

In [45]:
def leer_contenido_archivo(ruta_archivo):
    """
    Lee el contenido de un archivo.
    
    :param ruta_archivo:str: Ruta absoluta o relativa del archivo a leer.
    :return list: Contenido del archivo.
    """
    contenido = []
    
    with open(ruta_archivo, 'rt', encoding='utf-8') as f:
        for l in f.readlines():
            contenido.append(l.strip())
    
    return contenido

In [46]:
help(leer_contenido_archivo)

Help on function leer_contenido_archivo in module __main__:

leer_contenido_archivo(ruta_archivo)
    Lee el contenido de un archivo.
    
    :param ruta_archivo:str: Ruta absoluta o relativa del archivo a leer.
    :return list: Contenido del archivo.



In [47]:
ruta_archivo_numeros

'T001-09-numeros.txt'

In [48]:
resultado = leer_contenido_archivo(ruta_archivo_numeros)

In [49]:
resultado

['2.0', '7.0', '5.0', '11.0', '3.0', '19.0', '23.0', '29.0', '31.0', '43.0']

In [50]:
help(sum)

Help on built-in function sum in module builtins:

sum(iterable, /, start=0)
    Return the sum of a 'start' value (default: 0) plus an iterable of numbers
    
    When the iterable is empty, return the start value.
    This function is intended specifically for use with numeric values and may
    reject non-numeric types.



In [51]:
# suma_numeros = sum(resultado) # TypeError

TypeError: unsupported operand type(s) for +: 'int' and 'str'

In [52]:
type(resultado[0])

str

In [53]:
type(resultado[-1])

str

In [54]:
suma_numeros = sum(float(e) for e in resultado)

In [56]:
suma_numeros

173.0

In [57]:
type(suma_numeros)

float

**Ejemplo 9.3.3**

Solicitar al usuario que digite nombres de países de cualquier parte del mundo.

El programa termina cuando el usuario haya escrito la palabra `FIN`.

Después de esa tarea crearemos un archivo para guardar todos los países que el usuario digitó.

In [58]:
paises = []

pais = ''

while pais != 'FIN':
    while True:
        pais = input('Digite el nombre de un país (FIN para terminar): ')
        
        pais = pais.strip()
        
        if len(pais):
            break
        else:
            print()
            print('MENSAJE: Debe escribir una cadena que no contenga sólo espacios.')
            print()
    
    if pais != 'FIN':
        paises.append(pais)
    
    print()

Digite el nombre de un país (FIN para terminar): Colombia

Digite el nombre de un país (FIN para terminar):             

MENSAJE: Debe escribir una cadena que no contenga sólo espacios.

Digite el nombre de un país (FIN para terminar): Perú

Digite el nombre de un país (FIN para terminar): Alemania

Digite el nombre de un país (FIN para terminar): Rusia

Digite el nombre de un país (FIN para terminar): Estados Unidos

Digite el nombre de un país (FIN para terminar): Argentina

Digite el nombre de un país (FIN para terminar): Chile

Digite el nombre de un país (FIN para terminar): Egipto

Digite el nombre de un país (FIN para terminar): China

Digite el nombre de un país (FIN para terminar): Japón

Digite el nombre de un país (FIN para terminar): México

Digite el nombre de un país (FIN para terminar): FIN



In [59]:
paises

['Colombia',
 'Perú',
 'Alemania',
 'Rusia',
 'Estados Unidos',
 'Argentina',
 'Chile',
 'Egipto',
 'China',
 'Japón',
 'México']

In [60]:
len(paises)

11

In [62]:
archivo_paises = 'T001-09-paises.txt'

with open(archivo_paises, 'wt', encoding='utf-8') as f:
    for p in paises:
        f.write(f'{p}\n')