# TP1- Revision sobre los SGBD relacionales

Para revisar algunos conceptos de los SGBD relacionales (en particular el modelo relacional y el lenguaje SQL), vamos a crear una pequeña Base de Datos relacional desde un programa en Python y a partir de datos que se encuentran en varios archivos textos.

La base de datos que queremos construir está representada por el modelo Entidad-Asociación siguiente:

<img src="modeloEA-1.png">

## 1. Transformación del Modelo Entidad-Asociación hacia Modelo Relacional

Proponer un modelo relacional que corresponde al modelo Entidad-Asociación.

medios_prensas(pk_nombre, dueno, numero_followers)

noticias(id_noticia, titulo, texto, #pk_nombre, fecha)

## 2. Crear la estructura de la base de datos desde un programa Python

### 2.1 Conectarse a MySQL desde Python

In [1]:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
from __future__ import print_function
import mysql.connector
from mysql.connector import errorcode

conexion = mysql.connector.connect(user='root', password='root',host='localhost')
if(conexion):
    print("conectado")
else:
    print("No conectado")
cursor = conexion.cursor()

conectado


### 2.2 Crear las tablas

In [2]:
TABLES = {}
DB_NAME = "medios_de_prensa"
TABLES['medios_prensas'] = (
    "CREATE TABLE `medios_prensas` ("
    "  `nombre` VARCHAR(255) NOT NULL,"
    "  `dueno` VARCHAR(255)  NOT NULL,"
    "  `numero_followers` INT NOT NULL,"
    "  PRIMARY KEY (`nombre`)"
    ") ENGINE=InnoDB")
TABLES['noticias'] = (
    "CREATE TABLE `noticias` ("
    "  `id_noticia` INT NOT NULL AUTO_INCREMENt,"
    "  `titulo` VARCHAR(255) NOT NULL,"
    "  `texto` TEXT NOT NULL,"
    "  `ref_prensa` VARCHAR(255) NOT NULL,"
    "  `fecha` VARCHAR(255) NOT NULL,"
    "   PRIMARY KEY (`id_noticia`)"
    ") ENGINE=InnoDB")

def create_database(cursor):
    try:
        cursor.execute(
            "CREATE DATABASE {} DEFAULT CHARACTER SET 'utf8'".format(DB_NAME))
    except mysql.connector.Error as err:
        print("No se pudo conectar la base de datos: {}".format(err))
        exit(1)

try:
    conexion.database = DB_NAME  
except mysql.connector.Error as err:
    if err.errno == errorcode.ER_BAD_DB_ERROR:
        create_database(cursor)
        conexion.database = DB_NAME
    else:
        print(err)

try:
    cursor.execute(TABLES['medios_prensas'])
    cursor.execute(TABLES['noticias'])
except mysql.connector.Error as err:
    if err.errno == errorcode.ER_TABLE_EXISTS_ERROR:
        print("Las tablas ya han sido creadas")
    else:
        print(err.msg)
else:
    print("Tablas creadas con exito")       


Las tablas ya han sido creadas


# 3. Insertar los datos en la base de datos

## 3.1 Leer los archivos textos

In [None]:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import csv

with open('medios.csv') as csvarchivo:
    entrada = csv.DictReader(csvarchivo)
    for elementos in entrada:
        print(elementos['CódigoMedio'], " \t " ,elementos['PropiedadLegal'], " \t ",elementos['FollowersFinAño'])

## 3.2 Leer los archivos textos y insertar los datos

In [None]:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
with open('medios.csv') as csvarchivo:
    entrada = csv.DictReader(csvarchivo)
    for reg in entrada:
        nombre=reg['CódigoMedio']
        dueno=reg['PropiedadLegal']
        numero_followers=reg['FollowersFinAño']
        cursor.execute("INSERT INTO medios_prensas (nombre, dueno, numero_followers) VALUES (%s, %s, %s)",(nombre,dueno,numero_followers))
    conexion.commit()

archivo = open("noticias.txt")
"""
datos = []
for linea in archivo.readlines(): 
    datos.append(linea) 
for i in range (0,int((len(datos)/5))):
    fecha = datos[5*i]
    ref_prensa = datos[5*i+1]
    titulo = datos [5*i+2]
    texto = datos [5*i+3]
    cursor.execute("INSERT INTO noticias (titulo, fecha, ref_prensa, texto) VALUES (%s, %s, %s, %s)",(titulo, fecha, ref_prensa, texto))
conexion.commit()
archivo.close() 




# 4. Consultar la base de datos

Listar los medios de prensa en Chile ordenado según su número de followers en Twitter.

In [None]:

consulta = ("SELECT nombre, numero_followers FROM medios_prensas ORDER BY numero_followers DESC")
cursor.execute(consulta)

for (dato) in cursor:
  print(dato)


In [16]:
consulta = ("SELECT COUNT(*) FROM (SELECT COUNT(dueno)FROM medios_prensas GROUP BY dueno) AS num")
cursor.execute(consulta)

for (nombre) in cursor:
  print(nombre)

(158,)


Contar cuantes medios de prensa posee cada dueño.

In [12]:
consulta = ("SELECT COUNT(nombre) AS valor, dueno FROM medios_prensas GROUP BY dueno")
cursor.execute(consulta)

for (nombre) in cursor:
  print(nombre)

(1, 'Aconcagua News')
(1, 'Agencia Uno')
(1, 'Albavisión (MX)')
(1, 'Araucanía Noticias')
(1, 'AraucaníaTV')
(1, 'Benjamín González')
(1, 'Betazeta Networks S.A.')
(2, 'Bethia')
(1, 'BIO-BIO comunicaciones')
(1, 'Biobio Comunicaciones')
(1, 'BS Comunicaciones')
(1, 'Carta Abierta')
(1, 'Cauquenes NET')
(1, "Centro Cultural de Comunicación y Educación Radiofónica ''Chasqui''")
(1, 'CEPT Comunicaciones')
(1, 'Chañarcillo')
(1, 'Chillan Activo')
(1, 'Chillan Noticias')
(1, 'Chiloe Al día')
(1, 'Clave9')
(1, 'Colectivo de Comunicacion Mapuche Mapuexpress')
(1, 'Compañía Chilena de Comunicaciones')
(1, 'Compañía de Radio y TV Nuevo Mundo S.A')
(1, 'Comunicaciones C Y V S A ')
(1, 'Comunidad Sitio Cero')
(1, 'Consorcio Periodístico El Epicentro S.A')
(1, 'Consorcio Periodístico El Norte SpA')
(1, 'CoolTV')
(1, 'Diario El Sur S.A')
(1, 'Diario El Sur S.A.')
(1, 'Diario ELDIA')
(1, 'Diario en Acción')
(1, 'Diario Naciemiento')
(1, 'Dichato al Dia')
(1, 'Ediciones Giro País SpA')
(1, 'Ediciones

Mostrar los últimos 10 títulos de noticias del medio "La Tercera"

In [10]:
consulta = ("SELECT titulo FROM noticias WHERE ref_prensa LIKE'La Tercera' LIMIT 10 ")
cursor.execute(consulta)

for (nombre) in cursor:
  print(nombre)

Mostrar los nombre de medios y los títulos en los cuales aparacen la palabra "Valdivia".

In [None]:
consulta = ("SELECT titulo, ref_prensa FROM noticias WHERE titulo LIKE '%Valdivia%' OR texto LIKE '%Valdivia%'")
cursor.execute(consulta)

for (nombre) in cursor:
  print(nombre)


Por cada medio, mostrar el número de títulos en los cuales aparecen la palabra "Puerto Montt".

In [8]:
consulta = ("SELECT ref_prensa, COUNT(titulo) FROM noticias WHERE titulo LIKE '%Puerto Montt%' GROUP BY ref_prensa")
cursor.execute(consulta)

for (nombre) in cursor:
  print(nombre)

('24HorasTVN\n', 4)
('adnradiochile\n', 8)
('biobio\n', 40)
('CNNChile\n', 2)
('TerraChile\n', 2)
('thecliniccl\n', 2)
