# Instalación del AWS SDK para Python

Primero que nada, instalamos boto3, el SDK para Python de AWS

In [None]:
import os

os.system(f"pip install boto3")

# Conectamos con dynamo

Luego conectamos con la instancia de dynamo que querramos usar

In [None]:
from __future__ import print_function # Python 2/3 compatibility
import boto3, pprint

# create the resource we need to connect.
dynamodb = boto3.resource('dynamodb', region_name='sa-east-1', aws_access_key_id="AKIATAJ3CFT4XC5PHUPK", aws_secret_access_key= "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")

# Tablas

Verificamos si existen tablas actualmente

In [None]:
response = dynamodb.meta.client.list_tables()

pprint.pprint(response)

# Creación de Tablas

Creamos una tabla con un GSI

In [None]:
tableName="ObrasPublicasLlena"

table = dynamodb.create_table(
    TableName=tableName, 
    BillingMode="PROVISIONED",
    KeySchema=[
        {'AttributeName': 'id', 'KeyType': 'HASH'} # Partition key
    ],
    GlobalSecondaryIndexes=[
        {
            'IndexName':"jurisdiccion",
            'KeySchema':[
                {'AttributeName': 'jurisdiccion', 'KeyType': 'HASH'},  # Partition key
                {'AttributeName': 'monto_contrato', 'KeyType': 'RANGE'}  # Sort key
            ],
            'Projection':{
                "ProjectionType": "ALL" #KEYS_ONLY, INCLUDE, ALL
            },
            'ProvisionedThroughput':{'ReadCapacityUnits': 5, 'WriteCapacityUnits': 5}
        }
    ],
    AttributeDefinitions=[
        {'AttributeName': 'id', 'AttributeType': 'N'},
        {'AttributeName': 'jurisdiccion', 'AttributeType': 'S'},
        {'AttributeName': 'monto_contrato', 'AttributeType': 'N'}
    ],
    ProvisionedThroughput={'ReadCapacityUnits': 5, 'WriteCapacityUnits': 5})

table.meta.client.get_waiter('table_exists').wait(TableName=tableName)
print('Table created, please continue to insert data.')

# Inserción

Obtenemos datos desde la API de gobierno abierto de bahia blanca

In [None]:
import requests, json
from decimal import Decimal

# https://datos.bahia.gob.ar/dataset/obras
url = requests.get("https://gobiernoabierto.bahia.gob.ar/WS/4022")
data = json.loads(url.text, parse_float=Decimal)
pprint.pprint(len(data))

Intentamos agregamos los datos obtenidos

In [None]:
import time
start_time = time.time()

for obra in data:
    try:
        if obra['jurisdiccion']:
            table.put_item(Item=obra)
        else:
            obra['jurisdiccion']='Ninguna'
            table.put_item(Item=obra)
    except Exception:
        print("error")
        pprint.pprint(obra)

print("--- %s segundos ---" % (time.time() - start_time))

Una solución diferente es eliminar el valor, lo que implica que no se puede encontrar por este índice y tampoco ocupa lugar

In [None]:
start_time = time.time()
with table.batch_writer() as writer:
    for obra in data:
        try:
            if obra['jurisdiccion']:
                writer.put_item(Item=obra)
            else:
                del obra['jurisdiccion']
                writer.put_item(Item=obra)
        except Exception:
            print("error")
            pprint.pprint(obra)

print("--- %s segundos ---" % (time.time() - start_time))

# Obtenemos un elemento

Utilizando la clave primaria, obtenemos un item

In [None]:
response = table.get_item(Key={'id': 198})
pprint.pprint(response['Item'])

# Consulta

Realizamos una query para traer todas las obras de una jurisdicción en particular

In [None]:
from boto3.dynamodb.conditions import Key

response = table.query(
    IndexName="jurisdiccion",
    KeyConditionExpression=Key('jurisdiccion').eq("Centro")
)
pprint.pprint(response['Count'])
#pprint.pprint(response['Items'])

Realizamos una query para traer todas las obras de una jurisdicción en particular cuyo monto sea mayor a 10M

In [None]:
from boto3.dynamodb.conditions import Key, Attr

response = table.query(
    IndexName="jurisdiccion",
    KeyConditionExpression=Key('jurisdiccion').eq("Centro") & Key('monto_contrato').gt(10000000)
)
pprint.pprint(response['Count'])
#pprint.pprint(response['Items'])

Obtemenos las etapas disponibles

In [None]:
from boto3.dynamodb.conditions import Key, Attr

response = table.query(
    IndexName="jurisdiccion",
    KeyConditionExpression=Key('jurisdiccion').eq("Centro"),
    ProjectionExpression='etapa'
)
pprint.pprint(response['Count'])
uniqueNames = set(map(lambda obra:obra['etapa'], response['Items']))
pprint.pprint(uniqueNames)


Realizamos una query para traer todas las obras de una jurisdicción en particular cuyo monto sea mayor a 10M y en ejecución

In [None]:
from boto3.dynamodb.conditions import Key, Attr

response = table.query(
    IndexName="jurisdiccion",
    KeyConditionExpression=Key('jurisdiccion').eq("Centro") & Key('monto_contrato').gt(10000000),
    FilterExpression=Attr('etapa').eq('En ejecucion')
)
pprint.pprint(response['Count'])
#pprint.pprint(response['Items'])


# Scan

Realizamos un scan para obtener todos los elementos de la tabla

In [None]:
response = table.scan()
print("Items Returned: {}".format(len(response['Items'])))
print("Items Returned: {}".format(response['Count']))
#pprint.pprint(response)

In [None]:
table = dynamodb.Table('Tweets')      
count=0
response = table.scan()
print("Items Returned: {}".format(len(response['Items'])))
count+=len(response['Items'])
while 'LastEvaluatedKey' in response:
    response = table.scan(ExclusiveStartKey=response['LastEvaluatedKey'])
    print("Items Returned: {}".format(len(response['Items'])))
    count+=len(response['Items'])

print(count)

# Borramos la tabla

Finalmente, eliminamos la tabla

In [None]:
table.delete()

print(f"Deleting {table.name}...")
table.wait_until_not_exists()

print('Table deleted.')
