<img src="img/1.jpeg" width="200px">

## Data Types

![logo](img/2.jpeg)

*Nombre:* Edgar Garces <br>
*Fecha:* 18/01/2026

### 1 Acceso a ficheros<br>
#### 1.1 Ficheros<br>
• File es un tipo de objeto predefinido en Python (built-in).<br>
• Permite acceder a ficheros desde programas Python.<br>
• Los ficheros son de un tipo especial:<br>
– Son built-in, pero no son ni números, ni secuencias, ni mappings. Tampoco responden a
operadores en expresiones.<br>
• La función open permite crear objetos de tipo fichero.<br>
Formato general para abrir un fichero:<br>
afile = open(filename, mode)<br>
• mode es opcional. Por defecto, los ficheros se abren en modo lectura.<br>
• Los datos leidos de un fichero siempre se obtienen en formato string. Lo mismo ocurre con
escritura.<br>
• Los ficheros se deben cerrar invocando close (liberación de recursos).<br>

In [1]:
# Lectura desde fichero usando método 'read'. Devuelve todo el contenido del fichero.
mi_fichero = open('res/multiple_lines.txt')
print(mi_fichero.read())
mi_fichero.close()

Este fichero
contiene tres
lineas de texto.



In [2]:
# Lectura linea a linea a través del bucle 'for'.
mi_fichero = open('res/multiple_lines.txt')
for linea in mi_fichero:
    print(f"{linea}")
mi_fichero.close()

Este fichero

contiene tres

lineas de texto.



In [3]:
# leer de un archivo a una lista.
mi_fichero = open('res/multiple_lines.txt')
lineas = mi_fichero.readlines()
mi_fichero.close()

print(lineas)

['Este fichero\n', 'contiene tres\n', 'lineas de texto.\n']


• Resolución de paths independiente de plataforma

In [4]:
import os
ruta = os.path.join("res", "multiple_lines.txt")
print(ruta)

res/multiple_lines.txt


res\multiple_lines.txt

In [5]:
dataset_file_path = ["res","multiple_lines.txt"]
ruta = os.path.join(*dataset_file_path)
print(ruta)

res/multiple_lines.txt


• close autómatico con sentencia with. Esta es la forma habitual de leer de fichero en Python,
context manager

In [6]:
with open(ruta) as mi_fichero:
    for linea in mi_fichero:
        print(linea, end= '')

Este fichero
contiene tres
lineas de texto.


• Se puede abrir varios ficheros en un mismo with.

In [7]:
#abrir varios ficheros en el mismo with
ruta1 = os.path.join("res", "one_line.txt")
ruta2 = os.path.join("res", "multiple_lines.txt")
with open(ruta1) as fichero1, open(ruta2) as fichero2:
    print(fichero1.readlines())
    print(fichero2.readlines())

['Hola mundo desde un fichero.']
['Este fichero\n', 'contiene tres\n', 'lineas de texto.\n']


#### 1.2 Modos de acceso<br>
• Al crear un objeto de tipo File se puede espeficiar el modo de acceso (lectura/escritura).<br>
| Modo de Acceso | Descripción |
|---------------|-------------|
| r  | Solo lectura |
| w  | Solo escritura (borra el archivo si ya existe) |
| x  | Solo escritura (falla si el archivo ya existe) |
| a  | Crea fichero (si existe lo abre y añade al final) |
| r+ | Lectura y escritura |
| b  | Se puede añadir a otros modos para acceso binario |
| t  | Acceso para archivos de texto (por defecto) |

### 1.3 Acceso para escritura

In [8]:
def crear_lista(tamanyo):
    lista = []
    for i in range(tamanyo):
        lista.append(str(i) + '\n')
    return lista

ruta = os.path.join("res", "a_dummy.txt")
with open(ruta, 'wt') as fichero:
    fichero.write('Cabecera del ciclo del for en el ejemplo\n')
    lista = crear_lista(10)
    fichero.writelines(lista)
    print("archivo creado")


archivo creado


### Buffering<br>
• Por defecto, el texto que transfieres desde tu programa a un fichero no se guarda en disco
inmediatamente. Se almacena en un buffer.<br>
• Acciones como cerrar un fichero o invocar el método flush fuerzan que se transfiera el contenido del buffer a disco<br>

In [9]:
ruta = os.path.join("res", "FicheroParaEscritura.txt")
fichero_write = open(ruta, 'w')
fichero_write.write('foter')

fichero_read = open(ruta, "r")
print(fichero_read.readlines())

fichero_write.flush()
print(fichero_read.readlines())

fichero_write.close()
fichero_read.close()

[]
['foter']


### 1.4 Archivos CSV<br>
• Python permite leer datos de ficheros CSV y también escribir ficheros en este formato.<br>
• Popular formato en ciencia de datos.<br>

In [11]:
# tabla_operaciones.csv contiene valores separados por comas
import csv
ruta = os.path.join("res", "tabla_operaciones.csv")

with open(ruta) as fichero:
    data_reader = csv.reader(fichero, delimiter=',')
    for linea in data_reader:
        print(linea[0] + ' ---- ' + linea[1])

Operacion ---- Descripcion
a + b ---- suma a y b
a - b ---- resta a menos b
a / b ---- a dividido
a // b ---- a dividido entre b (quitando decimales)
a % b ---- devuelve el resto de la división a/b (modulus)
a * b ---- a multiplicado por b
a ** b ---- a elevado a b


Operacion ---- Descripcion<br>
a + b ---- suma a y b<br>
a - b ---- resta a menos b<br>
a / b ---- a dividido<br>
a // b ---- a dividido entre b (quitando decimales)<br>
a % b ---- devuelve el resto de la divisiÃ³n a/b (modulus)<br>
a * b ---- a multiplicado por b<br>
a ** b ---- a elevado a b<br>

In [13]:
ruta = os.path.join("res", "tabla_operaciones.csv")
f = open(ruta)
data_reader = csv.reader(f, delimiter = ',')

ruta_o = os.path.join("res", "4_tabla_operaciones.csv")
with open(ruta_o, 'w') as f2:
    csv_writer = csv.writer(f2, delimiter = '|')
    for line in data_reader:
        print(line)
        csv_writer.writerow(line)

f.close()

['Operacion', 'Descripcion']
['a + b', 'suma a y b']
['a - b', 'resta a menos b']
['a / b', 'a dividido']
['a // b', 'a dividido entre b (quitando decimales)']
['a % b', 'devuelve el resto de la división a/b (modulus)']
['a * b', 'a multiplicado por b']
['a ** b', 'a elevado a b']


['Operacion', 'Descripcion']<br>
['a + b', 'suma a y b']<br>
['a - b', 'resta a menos b']<br>
['a / b', 'a dividido']<br>
['a // b', 'a dividido entre b (quitando decimales)']<br>
['a % b', 'devuelve el resto de la divisiÃ³n a/b (modulus)']<br>
['a * b', 'a multiplicado por b']<br>
['a ** b', 'a elevado a b']<br>

### 2 Docstrings<br>
• Python permite adjuntar documentación a los objetos e inspeccionarla a través de la línea de
comandos o durante la ejecución del programa.<br>
• Los docstrings se almacenan en el atributo __doc__ de cada objeto.<br>
• El valor de dicho atributo se puede mostrar por medio de la función help.<br>

In [14]:
help(open)

Help on function open in module io:

open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
    Open file and return a stream.  Raise OSError upon failure.
    
    file is either a text or byte string giving the name (and the path
    if the file isn't in the current working directory) of the file to
    be opened or an integer file descriptor of the file to be
    wrapped. (If a file descriptor is given, it is closed when the
    returned I/O object is closed, unless closefd is set to False.)
    
    mode is an optional string that specifies the mode in which the file
    is opened. It defaults to 'r' which means open for reading in text
    mode.  Other common values are 'w' for writing (truncating the file if
    it already exists), 'x' for creating and writing to a new file, and
    'a' for appending (which on some Unix systems, means that all writes
    append to the end of the file regardless of the current seek position).
    In

• No es necesario editar este atributo directamente.<br>
• Para asociar un docstring a un objeto basta con escribir el texto (entre triples comillas) al
principio de los modulos, funciones o clases, antes del codigo ejecutable<br>

In [15]:
def funcion_de_prueba():
    """Esta es la documentación de la función de prueba"""
    pass

help(funcion_de_prueba)

Help on function funcion_de_prueba in module __main__:

funcion_de_prueba()
    Esta es la documentación de la función de prueba



• Accediendo al atributo __doc__ sólo se obtiene el docstring.

In [16]:
print(funcion_de_prueba.__doc__)

Esta es la documentación de la función de prueba


Como se puede observar, help añade información adicional. Por ejemplo, para entidades más
grandes, help muestra el docstring dividido en secciones.

In [17]:
import sys
help(sys)

Help on built-in module sys:

NAME
    sys

MODULE REFERENCE
    https://docs.python.org/3.11/library/sys.html
    
    The following documentation is automatically generated from the Python
    source files.  It may be incomplete, incorrect or include features that
    are considered implementation detail and may vary between Python
    implementations.  When in doubt, consult the module reference at the
    location listed above.

DESCRIPTION
    This module provides access to some objects used or maintained by the
    interpreter and to functions that interact strongly with the interpreter.
    
    Dynamic objects:
    
    argv -- command line arguments; argv[0] is the script pathname if known
    path -- module search path; path[0] is the script directory, else ''
    modules -- dictionary of loaded modules
    
    displayhook -- called to show results in an interactive session
    excepthook -- called to handle any uncaught exception other than SystemExit
      To customize pri

Los docstrings que ocupan más de una línea suelen tener estas partes:<br>
• Resumen en la primera línea.<br>
• Línea en blanco.<br>
• Descripción detallada.<br>
• Otra línea en blanco antes del código.

In [18]:
def funcion_de_prueba2():
    """Esta es la línea para el resumen.
    Este es el párrafo donde se puede escribir una descripción más
    detallada de la función. Observa que el resumen y la descripción
    detallada van separados por una línea en blanco. También hay
    otra línea en blanco antes de empezar el código.
    """
    pass

help(funcion_de_prueba2)

Help on function funcion_de_prueba2 in module __main__:

funcion_de_prueba2()
    Esta es la línea para el resumen.
    Este es el párrafo donde se puede escribir una descripción más
    detallada de la función. Observa que el resumen y la descripción
    detallada van separados por una línea en blanco. También hay
    otra línea en blanco antes de empezar el código.



Algunos comentarios adicionales:<br>
• Comentarios con ‘#’ suelen asociarse a expresiones sencillas, instrucciones individuales o
pequeños bloques de código.<br>
• Los docstrings son más apropiados para construcciones de más alto nivel: funciones, clases y
módulos.<br>

#### 2.1 Sphinx<br>
• Herramienta de documentación.<br>
• Especialmente útil para sistemas grandes.<br>
• Da soporte a una gran variedad de formatos de salida: HTML, LaTeX, ePub, …<br>
Web de Sphinx.<br>
Proyectos que usan Sphinx.<br>
#### 2.2 Estilo<br>
• Es importante que los docstrings sean consistentes.<br>
• El equipo de desarrollo debe acordar un formato y seguirlo rigurosamente.<br>
Google Python Style Guide Google define la siguiente guía de estilo.<br>
Contiene reglas para los docstrings de:<br>
• Módulos.<br>
• Métodos y funciones.<br>
• Clases.<br>
#### 2.3 Ejercicios<br>
1. Escribe una función que reciba una ruta de un fichero de texto y una cadena de caracteres a
buscar y determine si la cadena aparece en el fichero.<br>
2. Escribe una función que reciba una lista, una ruta destino y un número n. La función debe
crear un fichero en la ruta especificada. El contenido del fichero serán los primeros n elementos
de la lista. La función debe controlar de manera apropiada los posibles valores de n que estén
fuera de rango.<br>
3. Escribe una función que reciba una ruta de un fichero de texto devuelva un diccionario con la
frecuencia de aparición de cada palabra. Ejemplo: un fichero que contenga la frase ‘es mejor
que venga que que no venga’ devolverá el siguiente diccionario: {‘es’ : 1, ‘mejor’ : 1, ‘que’ :
3, ‘venga’ : 2, ‘no’ : 1}. Para dividir un string en palabras puedes hacer uso del método split.<br>

In [29]:
#1

ruta = os.path.join("res", "multiple_lines.txt")

fichero_read = open(ruta, "r")
print(fichero_read.readlines())

string_buscar = "lineas de texto."

with open(ruta, 'r', encoding='utf-8') as fichero:
    contenido = fichero.read()

if string_buscar in contenido:
    print("Sí existe")
else:
    print("No existe")


['Este fichero\n', 'contiene tres\n', 'lineas de texto.\n']
Sí existe


In [38]:
#2

letras = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
num = 3

ruta = os.path.join("res", "archivo.txt")

def crear_fichero(num):
    resultado = letras[:num]
    
    with open(ruta, "w", encoding="utf-8") as fichero:
        for letra in resultado:
            fichero.write(letra + "\n")

crear_fichero(num)
print("Se creó fichero en res")


Se creó fichero en res


In [41]:
#3

ruta_fichero = os.path.join("res", "archivo.txt")

def frecuencia_palabras(ruta_fichero):
    frecuencias = {}

    with open(ruta_fichero, "r", encoding="utf-8") as fichero:
        texto = fichero.read()

    palabras = texto.split()

    for palabra in palabras:
        if palabra in frecuencias:
            frecuencias[palabra] += 1
        else:
            frecuencias[palabra] = 1

    return frecuencias

resultado = frecuencia_palabras(ruta_fichero)
print(resultado)

{'a': 1, 'b': 1, 'c': 1}
