<a href="https://colab.research.google.com/github/mrodriguezh23/Proteccion-De-Datos/blob/main/1_3Importaci%C3%B3n_de_datos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Miriam Rodríguez Hernández


Protección de datos


Importación de datos

# **Usar context manager para abrir un archivo**

In [None]:
with open('fear.txt') as fh:
    for line in fh:
        print(line.strip())

La función opne() es capaz de crear un objeto de archivo cuando se llama por context manager. La diferencia que lo hace ser más seguro es que el fh.close() será llamado automáticamente, incluso cuando haya errores.

# **Leer y escribir en un archivo**

In [None]:
with open('fear.txt') as f:
    lines = [line.rstrip() for line in f]

with open('fear_copy.txt', 'w') as fw:
    fw.write('\n'.join(lines))

Primero abrimos el archivo de texto fear.txt y recolectamos su contenido en una lista línea por línea con iteración. Usando el método rstrip() para eliminar espacios en blanco. En la segunda parte creamos un nuevo archivo y escribimos todas las líneas del archivo original.

# **Verificar la existencia de archivos y directorios**


In [None]:
from pathlib import Path

p = Path('fear.txt')
path = p.parent.absolute()

print(p.is_file()) # True
print(path) # /Users/fab/srv/lpp3e/ch08/files
print(path.is_dir()) # True

q = Path('/Users/fab/srv/lpp3e/ch08/files')
print(q.is_dir()) # True

False
/content
True
False


Creamos el objeto Path con el nombre del archivo de texto que queremos verificar. Usamos el método parent() para extraer la carpeta en la cual el archivo está guardado, y después llamamos el método absolute() para extraer la información. Se verifica si el 'fear.txt' es un archivo y la carpeta o directorio en la cual está guardada.

# **Archivos y directorios temporales**

Si los tests afectan el disco, se puede utilizar archivos y directorios temporales para verificar si la lógica es correcta y si al final del test no hay residuos.

In [None]:
from tempfile import NamedTemporaryFile, TemporaryDirectory

with TemporaryDirectory(dir='.') as td:
    print('Temp directory:', td)
    with NamedTemporaryFile(dir=td) as t:
        name = t.name
        print(name)

# **Comprimir un archivo**


Crear un archivo .zip

In [None]:
from zipfile import ZipFile

with ZipFile('example.zip', 'w') as zp:
    zp.write('content1.txt')
    zp.write('content2.txt')
    zp.write('subfolder/content3.txt')
    zp.write('subfolder/content4.txt')

with ZipFile('example.zip') as zp:
    zp.extract('content1.txt', 'extract_zip')
    zp.extract('subfolder/content3.txt', 'extract_zip')

Importamos ZipFile y dentro de un context manager escribimos cuatro archivos. Después abrimos los archivos comprimidos y solo extraemos algunos archivos con el directorio extarct_zip.

# Comunicación entre sistemas (STREAM) usando memoria


In [None]:
import io

with io.StringIO() as stream:
    stream.write('Learning Python Programming.\n')
    print('Become a Python ninja!', file=stream)
    contents = stream.getvalue()
    print(contents)

Learning Python Programming.
Become a Python ninja!



Se importa el módulo io de la librería estándar para usar el método StringIO.write() que es un context manager. Cuando llamamos a getvalue() obtenemos el contenido para después imprimirlo.


# Solicitudes HTTP

In [None]:
import requests

urls = {
    "get": "https://httpbin.org/get?t=learn+python+programming",
    "headers": "https://httpbin.org/headers",
    "ip": "https://httpbin.org/ip",
    "user-agent": "https://httpbin.org/user-agent",
    "UUID": "https://httpbin.org/uuid",
    "JSON": "https://httpbin.org/json",
}

def get_content(title, url):
    resp = requests.get(url)
    print(f"Response for {title}")
    print(resp.json())

for title, url in urls.items():
    get_content(title, url)
    print("-" * 40)

Response for get
{'args': {'t': 'learn python programming'}, 'headers': {'Accept': '*/*', 'Accept-Encoding': 'gzip, deflate', 'Host': 'httpbin.org', 'User-Agent': 'python-requests/2.31.0', 'X-Amzn-Trace-Id': 'Root=1-65077204-4ab227e536a3427f2777b0aa'}, 'origin': '34.73.113.197', 'url': 'https://httpbin.org/get?t=learn+python+programming'}
----------------------------------------
Response for headers
{'headers': {'Accept': '*/*', 'Accept-Encoding': 'gzip, deflate', 'Host': 'httpbin.org', 'User-Agent': 'python-requests/2.31.0', 'X-Amzn-Trace-Id': 'Root=1-65077204-0af5a4581aba1c3218f000ea'}}
----------------------------------------
Response for ip
{'origin': '34.73.113.197'}
----------------------------------------
Response for user-agent
{'user-agent': 'python-requests/2.31.0'}
----------------------------------------
Response for UUID
{'uuid': '08ee0434-232b-4c04-992d-694998949a8b'}
----------------------------------------
Response for JSON
{'slideshow': {'author': 'Yours Truly', 'date'

Declaramos un diccionario de URLs de donde queremos solicitar. Creamos el método get_content() para encapsular el código. Usamos una solicitud tipo get usando requests.get() e imprimimos el título y la versión descodificada de JSON del cuerpo de la solicitud. Al final usamos un ciclo para iterar cada URL y ver los resultados en la consola.

# Deserialización de datos con pickle


In [None]:
import pickle
from dataclasses import dataclass

@dataclass
class Person: #creación de clase Person
    first_name: str  #Tres atributos de Person
    last_name: str
    id: int

    def greet(self): #este método imprime un mensaje
        print(f'Hi, I am {self.first_name} {self.last_name}'
              f' and my ID is {self.id}')

#creación de objetos
people = [
    Person('Obi-Wan', 'Kenobi', 123),
    Person('Anakin', 'Skywalker', 456),
]

#guardamos los datos en formato binario
with open('data.pickle', 'wb') as stream:
    pickle.dump(people, stream)

# leemos el archivo
with open('data.pickle', 'rb') as stream:
    peeps = pickle.load(stream)

#llamamos al método para asegurarnos que se convirtieron correctamente
for person in peeps:
    person.greet()

Hi, I am Obi-Wan Kenobi and my ID is 123
Hi, I am Anakin Skywalker and my ID is 456


Se crea la clase Person con tres atributos: first_name, last_name, y id. El método greet() es para imprimir un mensaje con los datos.

Se crea la lista con los objetos y los guardamos en un archivo con pickle.dump() donde el contenido se convierte de bytes a objetos. Con pickle.load() leemos el archivo para imprimirlo con el método greet() y verificar que se haya convertido correctamente.

# Guardar datos con **shelve**

Un shelf es objeto dictioanry-like persistente. Los valores que se guarden en un shelf se puede usar pickle.



In [None]:
import shelve

class Person:
    def __init__(self, name, id):
        self.name = name
        self.id = id

with shelve.open('shelf1.shelve') as db:
    db['obi1'] = Person('Obi-Wan', 123)
    db['ani'] = Person('Anakin', 456)
    db['a_list'] = [2, 3, 5]
    db['delete_me'] = 'we will have to delete this one...'
    print(list(db.keys())) # 'ani', 'delete_me', 'a_list', 'obi1']

    del db['delete_me'] # gone!
    print(list(db.keys())) # ['ani', 'a_list', 'obi1']
    print('delete_me' in db) # False
    print('ani' in db) # True

['a_list', 'ani', 'delete_me', 'obi1']
['a_list', 'ani', 'obi1']
False
True


Creamos la clase Person.

Abrimos un archivo shelve como un manager.

Se usa syntax de diccionario para guardar cuatro objetos: dos personas, una lista y una cadena de caracteres.

Si imrpimimos las keys, obtenemos la lista de las cuatro keys que se usaron.

Después de imprimir, se elimina el delete_me.

Imprimir las keys otra vez muestra que la eliminación fue un éxito.

# Guardar datos en una base de datos

En este código se interactúa con una base de datos usando una ORM (SQLAlchemy).

Definiremos dos modelos (Person y Adress), cada uno mapeará a una tabla.

In [None]:
#importación de funciones
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy import (
 Column, Integer, String, ForeignKey, create_engine)
from sqlalchemy.orm import relationship

#creación del motor que le dirá a SQLAlchemy sobre el tipo de base de datos
#y cómo conectarlo
engine = create_engine('sqlite:///:memory:')
Base = declarative_base()

#definimios Person que mapea a una tabla llamada person
class Person(Base):
    __tablename__ = 'person'

    #atributos de la tabla person
    id = Column(Integer, primary_key=True)
    name = Column(String)
    age = Column(Integer)

    #declaramos la relación con el modelo Adress
    addresses = relationship(
        'Address',
        back_populates='person',
        order_by='Address.email',
        cascade='all, delete-orphan' #afecta cómo se crea y elimina
    )

    #este método provee la representación string de un objeto
    def __repr__(self):
        return f'{self.name}(id={self.id})'

#declaración del modelo Adress
class Address(Base):
    __tablename__ = 'address'

    #atributos
    id = Column(Integer, primary_key=True)
    email = Column(String)

    #crean la relación entre Person y Adress
    person_id = Column(ForeignKey('person.id')) #referencia a la persona a la que pertenece
    person = relationship('Person', back_populates='addresses')

    #mismo método que se usó en Person
    def __str__(self):
        return self.email
    __repr__ = __str__ #las dos opciones llaman al método

#le decimos al motor que cree las tablas en
#la base de datos de acuerdo a los modelos
Base.metadata.create_all(engine)