Índices no Mongo

Projeto para documentar a apresentação sobre índices no Mongo na Liven.

Introdução

SGBD

SGBD (Sistema Gerenciador de Banco de Dados), é um software que gerencia um ou mais bancos de dados. Ele é responsável por abstrair do cliente as responsabilidades como acesso, persistência, manipulação e organização dos dados. Todo SGBD possui uma interface para facilitar a manipulação e gerenciamento dos dados.

MongoDB + Atlas

Diferentemente dos SGBDs relacionais (MySQL, Postgres, etc), o Mongo é um banco não relacional orientado a documentos. Traçando um paralelo didático superficial, cada tabela no relacional seria uma coleção no Mongo e cada linha, um documento.

O Mongo possui um DBaaS (Database as a Service) denominado Atlas. Com ele, podemos construir desde clusters compartilhados gratuítos até clusters dedicados pagos.

O que são índices?

Índices são estruturas auxiliares associados a uma tabela (no contexto de SGBDs relacionais), ou coleção (no contexto do MongoDB). Essa estrutura, via de regra, permite uma localização mais rápida de um registro quando efetuada uma consulta.

A analogia clássica são índices de livros. Se você deseja ler apenas um capítulo específico, basta consultar no índice remissivo e pular diretamente para a página em questão; não precisa ler o livro inteiro para encontrar o trecho desejado.

Esse link apresenta informações mais detalhadas, explicando um pouco algumas estruturas de índices, como Árvore-B, Bitmap, Hashing, entre outros.

Tradeoffs

Apesar de poder otimizar bastante as consultas na base de dados, é preciso cautela e uma análise prévia antes de criar índices para todas as propriedades, a fim de garantir que sejam aplicados da melhor maneira.

Prós

Otimização de consultas em muitos casos
Acesso a dados ordenados rapidamente
Facilidade em garantir unicidade de valores

Contras

Piora a performance de escrita dos dados
Aumenta o consumo de espaço de armazenamento
Aumenta a necessidade de manutenção na base
Se aplicado erroneamente, pode diminuir a performance das consultas

Essa resposta no Stackoverflow apresenta mais detalhes sobre cada pró e contra e informações mais detalhadas para discernir corretamente os cenários para uso de índices.

Mão na massa

Base de testes

Foi criada uma base de dados didática com duas coleções: usuários e pedidos. A coleção de usuários possui 1M de documentos, já a de pedidos possui 500k de documentos referenciando três usuários randômicos.

Você pode replicar essa base, confira como na Seção Reproduzindo a base de dados.

Consultando usuário pelo nome

Rodar uma consulta pelo nome do usuário - mostrar explain no compass
Adicionar índice no nome do usuário
Rodar consulta novamente pelo nome do usuário - mostrar explain no compass

Consultando pedido pelo range de data

Rodar uma consulta por um range de data - mostrar explain no compass
Adicionar índice na data de compra do pedido
Rodar consulta novamente por um range de data - mostrar explain no compass

Consultando pedido pelo ID do usuário e método de pagamento (composto)

Rodar uma consulta por um ID do usuário e método de pagamento - mostrar explain no compass
Adicionar índice no ID do usuário e método de pagamento (composto)
Rodar consulta novamente por um ID do usuário e método de pagamento - mostrar explain no compass

BONUS 1: Text search

Quero filtrar usuários que contenham um termo tanto no nome quanto no email. Forma mais simples de fazer isso seria colocando um $or. Forma mais elegante seria usando text search.

Criar índice de fulltext
Filtrar por "limoni"
Explain da consulta

BONUS 2: Configurando índices direto no mongoose

Índice no nome do usuário
Índice na data do pedido
Índice composto - ID do usuário + método de pagamento

Reproduzindo a base de dados

Para reproduzir a base de dados, primeiramente crie um cluster no MongoDB Atlas (pode optar por executar localmente se preferir) e obtenha a string de conexão.

Com o acesso ao banco, crie um arquivo .env na raiz do projeto com o mesmo conteúdo do .env.example, colocando a string de conexão obtida.

Execute os comandos:

npm install
npm run setup:create-users para criar 1M de usuários na base;
setup:create-orders para criar 500k de pedidos para 3 usuários randomicos na base
(opcional) Instale e configure a conexão utilizando o Compass
(opcional) Altere os dados dos registros como preferir para fazer os seus testes

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
database		database
img		img
setup		setup
.env.example		.env.example
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
env.js		env.js
index.js		index.js
package-lock.json		package-lock.json
package.json		package.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Índices no Mongo

Introdução

SGBD

MongoDB + Atlas

O que são índices?

Tradeoffs

Prós

Contras

Mão na massa

Base de testes

Consultando usuário pelo nome

Consultando pedido pelo range de data

Consultando pedido pelo ID do usuário e método de pagamento (composto)

BONUS 1: Text search

BONUS 2: Configurando índices direto no mongoose

Reproduzindo a base de dados

Referências

About

Releases

Packages

Languages

License

gabriellimoni/mongo-indexes

Folders and files

Latest commit

History

Repository files navigation

Índices no Mongo

Introdução

SGBD

MongoDB + Atlas

O que são índices?

Tradeoffs

Prós

Contras

Mão na massa

Base de testes

Consultando usuário pelo nome

Consultando pedido pelo range de data

Consultando pedido pelo ID do usuário e método de pagamento (composto)

BONUS 1: Text search

BONUS 2: Configurando índices direto no mongoose

Reproduzindo a base de dados

Referências

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages