### NoSQL

Os bancos de dados NoSQL, são bancos distribuídos e não-relacionais, que foram projetados para atender os requerimentos do Big Data, a grande maioria dos bancos de dados NoSQL nasceram na era do big data, eles oferecem uma arquitetura muito mais escalável e eficiente que os bancos relacionais e facilitam consultas no-sql de dados semi-estruturados ou não-estruturados.

Com esse conceito o NoSQL surgiu como um paradigma não tradicional para lidar com grandes volumes de dados e para resolver os desafios colocados pela chegada de implementações de Big Data.

Os bancos de dados NoSQL oferecem 4 categorias principais de bancos de dados:

- Graph databases (Neo4j, FlockDB, GraphDB, ArangoDB)
- Document databases (MongoDB, CouchDB, RavenDB, Terrastore)
- Key-values stores (Oracle NoSQL DB, MemcacheDB, Redis, AWS DynamoDB)
- Column family store (HBase, Cassandra*, Hypertable, Accumulo)



In [1]:
!pip install pymongo

Collecting pymongo
  Downloading pymongo-4.2.0-cp39-cp39-win_amd64.whl (374 kB)
Installing collected packages: pymongo
Successfully installed pymongo-4.2.0


In [1]:
# Importando o MongoClient para conectar nossa aplicação ao MongoDB
from pymongo import MongoClient

In [2]:
# Estabelecendo a conexão ao Banco de dados
conn = MongoClient('localhost', 27017)

In [6]:
# Verificando o tipo de arquivo
type(conn)        # Tipo: Conexão
type(db)          # Tipo: Database
type(collection)  # Tipo: Coleção

pymongo.collection.Collection

In [4]:
# Uma única instância do MongoDB pode suportar diversos bancos de dados.
# Vamos criar o banco de dados cadastrodb
db = conn.cadastrodb

In [5]:
# Uma coleção é um grupo de documentos armazenados no MongoDB
# (relativamente parecido com o conceito de tabelas em bancos relacionais)
collection = db.cadastrodb

Uma nota importante sobre coleções (e bancos de dados) em MongoDB é que eles são criados posteriormente - nenhum dos comandos acima executou efetivamente qualquer operação no servidor MongoDB. Coleções e bancos de dados são criados quando o primeiro documento é inserido.

In [8]:
import datetime

Dados no MongoDB são representados (e armazenados) usando documentos JSON (Java Script Object Notation). Com o PyMongo usamos dicionários para representar documentos.

In [18]:
# Criando documento dicionário de dados
post1 = {'codigo': 'ID-9987725',
        'prod_name': 'Geladeira',
        'marcas': ['brastemp', 'consul', 'eletrolux'],
        'date-cadastro': datetime.datetime.utcnow()}

In [12]:
type(post1)

dict

In [13]:
collection = db.posts

In [14]:
# Inserindo os dados
post_id = collection.insert_one(post1)

In [15]:
post_id.inserted_id

ObjectId('63173ba6f3a48a688e58affa')

In [16]:
# Quando um documento é inserido uma chave especial, '_id', é adicionada
# automaticamente se o documento ainda não contém uma chave '_id'.
post_id

<pymongo.results.InsertOneResult at 0x21190405d60>

In [19]:
# Criando outro documento dicionário de dados
post2 = {'codigo': 'ID-2209876',
        'prod_name': 'Televisor',
        'marcas': ['samsung', 'panasonic', 'lg'],
        'date-cadastro': datetime.datetime.utcnow()}

In [20]:
collection = db.posts

In [21]:
post_id = collection.insert_one(post2).inserted_id

In [22]:
post_id

ObjectId('63173cf2f3a48a688e58affb')

In [23]:
collection.find_one({'prod_name': 'Televisor'})

{'_id': ObjectId('63173cf2f3a48a688e58affb'),
 'codigo': 'ID-2209876',
 'prod_name': 'Televisor',
 'marcas': ['samsung', 'panasonic', 'lg'],
 'date-cadastro': datetime.datetime(2022, 9, 6, 12, 27, 40, 811000)}

In [24]:
# A função find() retorna um cursor e podemos então navegar pelos dados
for post in collection.find():
    print(post)

{'_id': ObjectId('63173ba6f3a48a688e58affa'), 'codigo': 'ID-9987725', 'prod_name': 'Geladeira', 'marcas': ['brastemp', 'consul', 'eletrolux'], 'date-cadastro': datetime.datetime(2022, 9, 6, 12, 21, 56, 51000)}
{'_id': ObjectId('63173cf2f3a48a688e58affb'), 'codigo': 'ID-2209876', 'prod_name': 'Televisor', 'marcas': ['samsung', 'panasonic', 'lg'], 'date-cadastro': datetime.datetime(2022, 9, 6, 12, 27, 40, 811000)}


In [25]:
# Verificando o nome do banco de dados
db.name

'cadastrodb'

In [28]:
# Listando as coleções disponíveis
db.list_collection_names()

['posts']

### Retornando dados no MongoDB com o PyMongo

In [30]:
# Importamos o módulo PyMongo
import pymongo

In [31]:
# Criando a conexão com o MongoDB (neste caso, conexão padrão)
client_con = pymongo.MongoClient()

In [33]:
# Listando os bancos de dados disponíveis
client_con.list_database_names()

['admin', 'cadastrodb', 'config', 'local']

In [34]:
# Definindo o objeto db
db = client_con.cadastrodb

In [35]:
# Listando as coleções disponíveis
db.list_collection_names()

['posts']

In [36]:
# Criando uma coleção
db.create_collection('mycollection')

Collection(Database(MongoClient(host=['localhost:27017'], document_class=dict, tz_aware=False, connect=True), 'cadastrodb'), 'mycollection')

In [37]:
# Listando as coleções disponíveis 
db.list_collection_names()

['mycollection', 'posts']

In [38]:
# Inserindo um documento na coleção criada
db.mycollection.insert_one({
    'titulo': 'MongoDB com Python',
    'descricao': 'MongoDB é um Banco de Dados NoSQL',
    'by': 'Data Science Academy',
    'url': 'https://www.datascienceacademy.com.br',
    'tags': ['mongodb', 'database', 'NoSQL'],
    'likes': 100
})

<pymongo.results.InsertOneResult at 0x21190d72520>

In [39]:
# Retornando o documento criado
db.mycollection.find_one()

{'_id': ObjectId('63174425f3a48a688e58affd'),
 'titulo': 'MongoDB com Python',
 'descricao': 'MongoDB é um Banco de Dados NoSQL',
 'by': 'Data Science Academy',
 'url': 'https://www.datascienceacademy.com.br',
 'tags': ['mongodb', 'database', 'NoSQL'],
 'likes': 100}

In [40]:
# Preparando um documento
doc1 = {'Nome':'Donald', 'sobrenome': 'Trump', 'twitter': '@POTUS'}

In [41]:
# Inserindo um documento
db.mycollection.insert_one(doc1)

<pymongo.results.InsertOneResult at 0x21190168be0>

In [42]:
# Preparando outro documento
doc2 = {'Site':'http://www.datascienceacademy.com.br',
        'facebook':'facebook.com/dsacademybr'}

In [43]:
# Inserindo novo documento
db.mycollection.insert_one(doc2)

<pymongo.results.InsertOneResult at 0x211915cb9a0>

In [44]:
# Retornando os documentos na coleção
for rec in db.mycollection.find():
    print(rec)

{'_id': ObjectId('63174425f3a48a688e58affd'), 'titulo': 'MongoDB com Python', 'descricao': 'MongoDB é um Banco de Dados NoSQL', 'by': 'Data Science Academy', 'url': 'https://www.datascienceacademy.com.br', 'tags': ['mongodb', 'database', 'NoSQL'], 'likes': 100}
{'_id': ObjectId('631744c7f3a48a688e58affe'), 'Nome': 'Donald', 'sobrenome': 'Trump', 'twitter': '@POTUS'}
{'_id': ObjectId('631745acf3a48a688e58afff'), 'Site': 'http://www.datascienceacademy.com.br', 'facebook': 'facebook.com/dsacademybr'}


In [45]:
# Conectando a uma coleção
col = db['mycollection']

In [46]:
type(col)

pymongo.collection.Collection

In [58]:
# Contando os documentos em uma coleção
col.estimated_document_count()

3

In [59]:
# Encontrando um único documento
redoc = col.find_one()

In [60]:
redoc

{'_id': ObjectId('63174425f3a48a688e58affd'),
 'titulo': 'MongoDB com Python',
 'descricao': 'MongoDB é um Banco de Dados NoSQL',
 'by': 'Data Science Academy',
 'url': 'https://www.datascienceacademy.com.br',
 'tags': ['mongodb', 'database', 'NoSQL'],
 'likes': 100}