## Gravando dados no MongoDB com PyMongo

In [2]:
# instalando pacote pymongo
# ! será executado no sistema operacional não no jupyter notebook
!pip install pymongo

Collecting pymongo
  Downloading https://files.pythonhosted.org/packages/5b/df/d0f82279467c72dd0c8cd1908e04a7fb56145a5d222704722e2593af79f1/pymongo-3.10.1-cp37-cp37m-win_amd64.whl (354kB)
Installing collected packages: pymongo
Successfully installed pymongo-3.10.1


In [4]:
# importando o MongoCliente para conectar nossa aplicação ao MongoDB
from pymongo import MongoClient

## Caso o PyMongo não esteja instalado, abra um prompt de comando e execute: pip install pymongo

In [5]:
# estabelecendo conexão com MongoDB
conn = MongoClient('localhost', 27017)

In [6]:
# qual tipo do objeto
# pymongo é uma conexão do mongoDB
type(conn)

pymongo.mongo_client.MongoClient

In [9]:
# Uma única instância do MongoDB pode suportar diversos bancos de dados
# Vamos criar o banco de dados cadastrodb
db = conn.cadastrodb

In [10]:
# tipo do objeto db
print(type(db))

<class 'pymongo.database.Database'>


In [11]:
# uma coleção é um grupo de documentos armazenados no MongoDB
# (relativamente parecido com o conceito de tabelas em bancos relacionais)
# cadastrodb é o nome da coluna no mongoDB
collections = db.cadastrodb

In [12]:
# tipo objeto collections
print(type(collections))

<class 'pymongo.collection.Collection'>


## <h5><font color='red'>Uma nota importante sobre collections(em bancos de dados) no MongoDB é que eles são criados posteriormente - nenhum dos comandos acima executou efetivamente qualquer operação no servidor MongoDB. Coleção e bancos de dados são criadas quando o primeiro documento é inserido.</font></h5>

In [13]:
# importando pacote datetime
import datetime

## <h5>Dados no MongoDB são representados (e armazenados) usando documentos JSON(Java Script Object Notation). Com O PyMongo usamos dicionários para representar documentos</h5> 

In [14]:
# criando um dicionário
# utcnow() pega uma data disponível agora no sistema operacional
post1 = {'codigo': 'ID-9987725',
        'prod_name': 'Geladeira',
        'marcas': ['Brastemp', 'Consul', 'Eletrolux'],
        'data_cadastro': datetime.datetime.utcnow()}

In [15]:
# tipo do objeto post1
print(type(post1))

<class 'dict'>


In [16]:
# criando uma instância da postagem
collections = db.posts

In [17]:
# inserindo documento
# post_id vai receber uma chave especial do documento inserido
post_id = collections.insert_one(post1)

In [18]:
# mostrando o id do documento inserido
post_id.inserted_id

ObjectId('5e722a20d25248562cd91425')

In [19]:
# quando um documento é inserido uma chave especial '_id', é adicionada
# automaticamente se o documento ainda não contém uma chave '_id'
post_id

<pymongo.results.InsertOneResult at 0x285b6cd7f08>

In [20]:
# inserindo o segundo registro 
# podemos considerar um conjunto de dados semi-estruturado
# a instrutura é estruturada por se tratar de um dicionário
# porém os valores são diferentes por conter uma lista como valor
post2 = {'codigo': 'ID-2209876',
        'prod_name': 'Televisor',
        'Marcas': ['Samsung', 'Panasonic', 'Lg'],
        'data_cadastro': datetime.datetime.utcnow()}

In [21]:
# criando instância de postagem
collections = db.posts

In [22]:
# inserindo documento
post_2 = collections.insert_one(post2).inserted_id

In [25]:
# id do post_2
post_2

<pymongo.results.InsertOneResult at 0x285b9e221c8>

In [27]:
# utilizando find
# retorna um cursor que aponta para os ids das collections
collections.find({'prod_name': 'Televisor'})

<pymongo.cursor.Cursor at 0x285bae2c648>

In [28]:
# através do collections.find(), retorno um cursor
# imprimo na tela
# temo s_id: objectId('5e722a20d25248562cd9142') que é a chave depois os valores
for post in collections.find():
    print(post)

{'_id': ObjectId('5e722a20d25248562cd91425'), 'codigo': 'ID-9987725', 'prod_name': 'Geladeira', 'marcas': ['Brastemp', 'Consul', 'Eletrolux'], 'data_cadastro': datetime.datetime(2020, 3, 18, 13, 50, 44, 819000)}
{'_id': ObjectId('5e722c06d25248562cd91426'), 'codigo': 'ID-2209876', 'prod_name': 'Televisor', 'Marcas': ['Samsung', 'Panasonic', 'Lg'], 'data_cadastro': datetime.datetime(2020, 3, 18, 14, 9, 42, 189000)}


In [29]:
# verificando o nome do banco de dados
db.name

'cadastrodb'

In [31]:
# listando as coleções disponiveis
# coleções são as tabelas
db.list_collection_names()

['posts']

##  <h5>O que muitas empresas fazem por ai você faz uma aplicação qualquer, para acessar uma página web, está aplicação gera um arquivo JSON, o JSON é enviado para o MongoDB e gravado no Banco de Dados.<br>Voçê ainda nestas condições não está armazenado dados estruturados ainda estamos fazendo um DataLake, armazenando dados semi-estruturados, não-estruturados
</h5> 

## Fim