# 4.3 - Postgres

![postgres](images/postgres.png)


$$$$


PostgreSQL, o simplemente Postgres, es un sistema de código abierto de administración de bases de datos del tipo relacional, aunque también es posible ejecutar consultas que sean no relaciones. En este sistema, las consultas relacionales se basan en SQL, mientras que las no relacionales hacen uso de JSON.

Como decíamos, se trata de un sistema de código abierto y además gratuito, y su desarrollo es llevado adelante por una gran comunidad de colaboradores de todo el mundo que día a día ponen su granito de arena para hacer de este sistema una de las opciones más sólidas a nivel de bases de datos.

Dos detalles a destacar de PostgreSQL es que posee data types (tipos de datos) avanzados y permite ejecutar optimizaciones de rendimiento avanzadas, que son características que por lo general solo se ven en sistemas de bases de datos comerciales, como por ejemplo SQL Server de Microsoft u Oracle de la compañía homónima.


### Características
Siendo uno de los sistemas de bases de datos más avanzados y usados del mundo, es obvio que PostgreSQL debe tener algunas características bastante llamativas, así que vamos a echarle un vistazo a algunas de ellas.

+ **Es de código abierto:** una de las principales razones por la cual PostgreSQL se ha vuelto tan popular es que se trata de un sistema de código abierto. Esto ha permitido que una gran comunidad de desarrolladores crezca para respaldarlo y continuar mejorándolo. Gracias a todo el apoyo con el que cuenta ha logrado transformarse en uno de los mejores gestores de bases de datos a nivel mundial.
+ **Es gratuito:** como cabe esperarse se trata de un sistema totalmente gratis, no tenemos que pagar nada por utilizarlo. Cualquier persona es libre de descargar PostgreSQL desde su sitio web oficial y darle uso sin ningún costo.
+ **Es multiplataforma:** una característica genial que de hecho es común en muchos grandes proyectos de código abierto es el hecho de que se trata de software multiplataforma, es decir, es un software que puede correr bajo distintos entornos y sistemas operativos, y es compatible con muchos de los servidores web más populares como Apache, Nginx y LiteSpeed por mencionar algunos.
+ **Es fácil de usar:** la facilidad de uso de PostgreSQL es sin dudas otra de las principales características de este sistema. Su administración se vuelve muy sencilla por medio de paneles con PgAdmin, que básicamente viene a ser un phpMyAdmin orientado para PostgreSQL. La posibilidad de realizar diversos procedimientos en forma sencilla hacen que PgAdmin sea ampliamente utilizado, aunque también permite realizar tareas más complejos, así que tanto novatos como usuarios expertos hacen uso de él.
+ **Puede manejar un gran volumen de datos:** una característica extremadamente importante de PostgreSQL es su gran capacidad para el manejo de grandes volúmenes de datos, algo en lo que otros sistemas como MySQL aún no hacen tan bien. Las bases de datos de gran tamaño pueden hacer pleno uso del MVCC de PostgreSQL, resultando en un gran rendimiento. MVCC es un método de control que nos permite realizar tareas de escritura y lectura simultáneamente.
+ **Soporte total de ACID:** otro punto muy importante que no se debe dejar de lado es el cumplimiento de ACID. ¿Qué es ACID? Estas siglas en inglés refieren a: atomicity, consistency, isolation y durability, que si lo traducimos al español básicamente hablan de la atomicidad, consistencia, aislamiento y durabilidad de las transacciones que se realizan en una base de datos. ¿Y por qué es tan importante? Porque tener soporte completo de ACID da la seguridad de que, si se produce una falla durante una transacción, los datos no se perderán ni terminarán donde no deban.


### DBeaver

![dbeaver](images/dbeaver.png)

DBeaver es una aplicación de software cliente de SQL y una herramienta de administración de bases de datos. Para las bases de datos relacionales, utiliza la interfaz de programación de aplicaciones (API) JDBC para interactuar con las bases de datos a través de un controlador JDBC. Para otras bases de datos (NoSQL) utiliza controladores de bases de datos propietarios. Proporciona un editor que soporta el autocompletado de código y el resaltado de sintaxis. Proporciona una arquitectura de plugins (basada en la arquitectura de plugins de Eclipse) que permite a los usuarios modificar gran parte del comportamiento de la aplicación para proporcionar funcionalidad o características específicas de la base de datos que son independientes de la base de datos. Esta es una aplicación de escritorio escrita en Java y basada en la plataforma Eclipse.

La community edition (CE) de DBeaver es un software libre y de código abierto que se distribuye bajo la Apache License. Una edición empresarial de código cerrado de DBeaver se distribuye bajo una licencia comercial.

Es el Workbench de Postgres.

### Cargando datos

In [1]:
import pandas as pd

from sqlalchemy import create_engine, Column, Float, Integer, JSON, DateTime, Text
from sqlalchemy.orm import sessionmaker  # establece la sesion de conexion
from sqlalchemy.ext.declarative import declarative_base  # para heredar clase tabla
from sqlalchemy import DDL

In [2]:
# string de conexion = lenguaje+driver://usuario:password@servidor:puerto/database

str_conn='mysql+pymysql://root:password@localhost:3306/Apps'

motor=create_engine(str_conn)

In [3]:
data=pd.read_sql('select * from Ratings', motor)[['id', 'prime_genre', 'rating_count_tot', 'user_rating_ver']]

data.columns=['id', 'prime_genre', 'total_rating', 'avg_rating']

data.head()

Unnamed: 0,id,prime_genre,total_rating,avg_rating
0,281656475,Games,21292,4.5
1,281796108,Productivity,161065,3.5
2,281940292,Weather,188583,4.5
3,282614216,Shopping,262241,4.5
4,282935706,Reference,985920,5.0


**crear base de datos**
```
sudo -u usuario createdb nombre_db
````

Si `ZSH` no reconoce psql:

``` 
export PATH=/Library/PostgreSQL/13/bin:$PATH
```


In [4]:
!pip install psycopg2-binary



In [5]:
str_conn='postgresql+psycopg2://postgres:password@localhost:5432/prueba'

In [6]:
class Conector:
    
    def __init__(self, str_conn):
        
        print('Conectando....')
        
        self.motor=create_engine(str_conn)
        self.sesion=sessionmaker(bind=self.motor)()

In [7]:
Base=declarative_base()

class Tabla(Base):
    __tablename__='articles'
    __table_args__={'schema': 'prueba'}
    
    _id=Column(Integer(), primary_key=True)   # autoincrement=True pone solo el id
    prime_genre=Column(Text())
    total_rating=Column(Text())
    avg_rating=Column(Text())

In [8]:
dir(Base)

['__abstract__',
 '__class__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 '_sa_registry',
 'metadata',
 'registry']

In [9]:
class Prueba:
    
    def __init__(self, str_conn):
        '''metodo constructor que inicializa la conexion y crea base de datos si no existe'''
        
        conn=Conector(str_conn)
        
        self.motor=conn.motor
        self.sesion=conn.sesion
        
        self.motor.execute(DDL('create schema if not exists prueba'))
        
    
    def crea_tablas(self):  # metodo para crear una tabla, segun la clase Tabla definida arriba
        
        try:
            print('Creando tabla....')
            Tabla.__table__.create(self.motor)
        except:
            print('La tabla ya existe.')
            
    
    
    def borra_tablas(self): # metodo para borrar una tabla, segun la clase Tabla definida arriba
        
        try:
            print('Borrando tabla....')
            Tabla.__table__.drop(self.motor)
        except:
            print('La tabla no existe.')
            
        return 'hola que tal, hola que pasa que tal'
            
    
    def rellena_tablas(self, datos):   # metodo para rellenar una tabla, segun la clase Tabla definida arriba a traves del df
        
        for e in datos.itertuples():
            
            item=Tabla(_id=e[0],
                       prime_genre=e[1],
                       total_rating=e[2],
                       avg_rating=e[3])
            
            self.sesion.add(item)
            
        self.sesion.commit()
        
        print('Comiteado.')
        
    
    def show_df(self):  # metodo para seleccionar todo y mostrar un dataframe
        
        data=self.motor.execute('select * from prueba.articles').fetchall()
        
        columns=self.motor.execute("select * from prueba.information_schema.columns where table_name='articles'").fetchall()
        print(columns)
        return pd.DataFrame(data, columns=[e[3] for e in columns])  # e[3] porque el resto es metadata

In [10]:
help(Prueba)

Help on class Prueba in module __main__:

class Prueba(builtins.object)
 |  Prueba(str_conn)
 |  
 |  Methods defined here:
 |  
 |  __init__(self, str_conn)
 |      metodo constructor que inicializa la conexion y crea base de datos si no existe
 |  
 |  borra_tablas(self)
 |  
 |  crea_tablas(self)
 |  
 |  rellena_tablas(self, datos)
 |  
 |  show_df(self)
 |  
 |  ----------------------------------------------------------------------
 |  Data descriptors defined here:
 |  
 |  __dict__
 |      dictionary for instance variables (if defined)
 |  
 |  __weakref__
 |      list of weak references to the object (if defined)



In [11]:
prueba=Prueba(str_conn)

Conectando....


In [12]:
prueba.borra_tablas()

Borrando tabla....
La tabla no existe.


'hola que tal, hola que pasa que tal'

In [13]:
prueba.crea_tablas()

Creando tabla....


In [14]:
prueba.rellena_tablas(data)

Comiteado.


In [15]:
prueba.show_df().head()

[('prueba', 'prueba', 'articles', '_id', 1, "nextval('prueba.articles__id_seq'::regclass)", 'NO', 'integer', None, None, 32, 2, 0, None, None, None, None, None, None, None, None, None, None, None, None, 'prueba', 'pg_catalog', 'int4', None, None, None, None, '1', 'NO', 'NO', None, None, None, None, None, 'NO', 'NEVER', None, 'YES'), ('prueba', 'prueba', 'articles', 'prime_genre', 2, None, 'YES', 'text', None, 1073741824, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, 'prueba', 'pg_catalog', 'text', None, None, None, None, '2', 'NO', 'NO', None, None, None, None, None, 'NO', 'NEVER', None, 'YES'), ('prueba', 'prueba', 'articles', 'total_rating', 3, None, 'YES', 'text', None, 1073741824, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, 'prueba', 'pg_catalog', 'text', None, None, None, None, '3', 'NO', 'NO', None, None, None, None, None, 'NO', 'NEVER', None, 'YES'), ('prueba', 'prueba', 'articles', 'avg_ra

Unnamed: 0,_id,prime_genre,total_rating,avg_rating
0,0,281656475,Games,21292
1,1,281796108,Productivity,161065
2,2,281940292,Weather,188583
3,3,282614216,Shopping,262241
4,4,282935706,Reference,985920


In [16]:
print(prueba.borra_tablas())

Borrando tabla....
hola que tal, hola que pasa que tal
