# jsonpath_ng lib

A biblioteca **`jsonpath_ng`** em Python √© uma implementa√ß√£o robusta e poderosa da linguagem **JSONPath**. Como vimos antes, JSONPath √© uma linguagem de consulta para JSON, similar ao XPath para XML, permitindo que voc√™ selecione e extraia partes espec√≠ficas de um documento JSON de forma declarativa.

`jsonpath_ng` se destaca por ser uma implementa√ß√£o flex√≠vel e rica em recursos, que se esfor√ßa para ser compat√≠vel com a especifica√ß√£o JSONPath, mas com algumas nuances e extens√µes que a tornam muito √∫til em ambientes Python.

## Como `jsonpath_ng` Funciona?

O processo geral de uso de `jsonpath_ng` envolve duas etapas principais:

1.  **Parsing da Express√£o JSONPath:** Primeiro, voc√™ "compila" sua string de express√£o JSONPath em um objeto de express√£o `jsonpath_ng`. Isso permite que a biblioteca entenda a estrutura da sua consulta.
2.  **Busca no Documento JSON:** Em seguida, voc√™ usa o objeto de express√£o compilada para buscar (ou "encontrar") os valores correspondentes dentro de um documento JSON (geralmente um dicion√°rio ou lista Python).

A biblioteca retorna os resultados como uma lista de objetos `Match`, onde cada `Match` cont√©m o valor encontrado e informa√ß√µes sobre seu caminho no documento original.


In [1]:
%pip install jsonpath-ng

Note: you may need to restart the kernel to use updated packages.


## Classes e M√©todos Principais

Vamos mergulhar nas principais classes, m√©todos e propriedades com exemplos pr√°ticos.

Primeiro, preparemos o documento JSON de exemplo que usamos anteriormente:


In [2]:
import json
import time
from jsonpath_ng import jsonpath, parse
from jsonpath_ng.ext import parse as ext_parse
from jsonpath_ng.jsonpath import Index, Fields, Child, Where, Union  # Descendant
from jsonpath_ng.lexer import JsonPathLexer
from data import json_data  # data.py

In [3]:
def run_jsonpath_query(query: str):
    """
    Executes a JSONPath query using jsonpath-ng and prints the results.
    """
    print(f"\n--- JSONPath Query: '{query}' ---")
    try:
        jsonpath_expr = parse(query)
        matches = jsonpath_expr.find(json_data)
        if matches:
            print(f"  Resultados ({len(matches)}):")
            for i, match in enumerate(matches):
                # O objeto 'match' tem propriedades 'value' e 'path'
                print(
                    f"    Match {i+1}: Valor = {match.value}, Caminho = {match.path}")
        else:
            print("  Nenhum resultado encontrado.")
    except Exception as e:
        print(f"  Erro ao executar query: {e}")


def separador(titulo):
    """Fun√ß√£o auxiliar para separar se√ß√µes"""
    print(f"\n{'='*80}")
    print(f" {titulo}")
    print(f"{'='*80}")


def exemplo(descricao, codigo, resultado):
    """Fun√ß√£o auxiliar para mostrar exemplos"""
    print(f"\nüìå {descricao}")
    print(f"C√≥digo: {codigo}")
    print(f"Resultado: {resultado}")
    
def tr_dict(obj):
    out=''
    for i in obj:
        out+=f'\n  - {i}: {obj[i]}'
    return out
    

### 1. Fun√ß√µes de Parsing e Busca

  - **`jsonpath_ng.parse(jsonpath_string)`**:

      - **O que faz:** Recebe uma string que representa uma express√£o JSONPath e a compila em um objeto de express√£o. Este √© o ponto de partida para qualquer consulta.
      - **Retorna:** Uma inst√¢ncia de `jsonpath_ng.JsonPath` (ou uma de suas subclasses, como `Child`, `Slice`, `Filter`, etc.).

  - **`jsonpath_expr.find(data)`**:

      - **O que faz:** √â um m√©todo do objeto de express√£o JSONPath compilado. Ele executa a consulta JSONPath no `data` (seu documento JSON, que deve ser um dicion√°rio ou lista Python) e retorna todos os `Match`es encontrados.
      - **`data`**: O objeto Python (geralmente um `dict` ou `list`) no qual a pesquisa ser√° realizada.
      - **Retorna:** Uma lista de objetos `jsonpath_ng.jsonpath.Match`.


In [4]:
# Exemplo 1: Selecionando um valor simples
run_jsonpath_query('$.livraria.titulo')

# Exemplo 2: Selecionando todos os t√≠tulos de livros
run_jsonpath_query('$.livraria.livros[*].titulo')

# Exemplo 3: Selecionando o primeiro autor do segundo livro
run_jsonpath_query('$.livraria.livros[1].autores[0]')


--- JSONPath Query: '$.livraria.titulo' ---
  Resultados (1):
    Match 1: Valor = Cat√°logo de Livros T√©cnicos, Caminho = titulo

--- JSONPath Query: '$.livraria.livros[*].titulo' ---
  Resultados (4):
    Match 1: Valor = Aprendendo JSONPath, Caminho = titulo
    Match 2: Valor = Dominando JMESPath, Caminho = titulo
    Match 3: Valor = Introdu√ß√£o ao Web Scraping, Caminho = titulo
    Match 4: Valor = Python para Iniciantes, Caminho = titulo

--- JSONPath Query: '$.livraria.livros[1].autores[0]' ---
  Resultados (1):
    Match 1: Valor = Charlie, Caminho = [0]


### 2. O Objeto `Match`

Quando `find()` retorna resultados, eles v√™m na forma de uma lista de objetos `Match`. Um objeto `Match` tem duas propriedades principais:

  - **`match.value`**: O valor real encontrado no documento JSON.
  - **`match.path`**: O objeto de caminho (uma inst√¢ncia de `jsonpath_ng.jsonpath.JsonPath`) que levou a este valor. Pode ser √∫til para entender de onde o valor veio. Para obter o caminho como string, voc√™ pode usar `str(match.path)`.

**Exemplos:** (Os exemplos acima j√° demonstram o uso de `match.value` e `match.path`)


### 3. Sintaxe e Recursos JSONPath Comuns em `jsonpath_ng`

`jsonpath_ng` suporta a maioria dos elementos da sintaxe JSONPath.

  - **`$`**: O elemento raiz do objeto JSON.
  - **`.`**: Operador de ponto, usado para acessar membros de objeto. Ex: `$.livraria.titulo`
  - **`[]`**: Operador de subscri√ß√£o para arrays ou para chaves de objeto com caracteres especiais.
      - **`[index]`**: Acessa um elemento de array pelo √≠ndice. Ex: `$.livraria.livros[0]`
      - **`[start:end:step]`**: Fatiamento de array (slicing). Ex: `$.livraria.livros[0:2]`
      - **`['key-with-hyphen']`**: Acessa uma chave de objeto com caracteres especiais. Ex: `$.configuracoes['chave-com-traco']`
      - **`[index1, index2]`**: Sele√ß√£o de m√∫ltiplos √≠ndices de array. Ex: `$.livraria.livros[0,2].titulo`
  - **`*`**: Wildcard para todos os membros de objeto ou todos os elementos de array. Ex: `$.livraria.livros[*].titulo`
  - **`..`**: Operador de descend√™ncia recursiva. Busca o nome em qualquer n√≠vel abaixo do atual. (Cuidado com o desempenho em documentos grandes). Ex: `$.livraria..titulo` (encontraria todos os campos `titulo` em qualquer profundidade).
  - **`?()`**: Express√£o de filtro. Permite filtrar elementos de um array ou membros de objeto baseados em uma condi√ß√£o.
      - **`@`**: Representa o elemento atual no filtro.
      - **Operadores de compara√ß√£o:** `==`, `!=`, `<`, `<=`, `>`, `>=`.
      - **Operadores l√≥gicos:** `&&` (AND), `||` (OR).
      - **Express√µes regulares:** Alguns parsers suportam `~= /regex/`. `jsonpath-ng` usa `@.field =~ "regex"`.


In [5]:
# Selecionando chaves com caracteres especiais
run_jsonpath_query('$.configuracoes["chave-com-traco"]')

# Fatiamento de array (slicing): os dois primeiros livros
run_jsonpath_query('$.livraria.livros[0:2].titulo')

# Sele√ß√£o de m√∫ltiplos √≠ndices: primeiro e terceiro livro
run_jsonpath_query('$.livraria.livros[0,2].titulo')

# Descend√™ncia recursiva: todos os t√≠tulos em qualquer n√≠vel
# Este pode ser pesado para documentos muito grandes!
run_jsonpath_query('$.livraria..titulo')

# Filtro de livros dispon√≠veis (conforme a corre√ß√£o anterior)
run_jsonpath_query('$.livraria.livros[?(@.disponivel == true)].titulo')

# Filtro complexo: livros com pre√ßo > 25 E da Editora Inova√ß√£o
run_jsonpath_query(
    '$.livraria.livros[?(@.preco > 25 && @.editora.nome == "Editora Inova√ß√£o")].titulo')

# Filtrando usu√°rios administradores e pegando seus √∫ltimos acessos
run_jsonpath_query('$.usuarios[?(@.isAdmin == true)].ultimosAcessos')

# Filtrando livros que contenham 'Programa√ß√£o' na lista de tags
# jsonpath-ng n√£o tem uma fun√ß√£o 'contains' nativa para arrays como JMESPath.
# Para este caso, voc√™ precisaria de uma express√£o mais complexa ou p√≥s-processamento.
# Exemplo aproximado que busca por um item espec√≠fico, mas n√£o √© um 'contains' gen√©rico:
run_jsonpath_query('$.livraria.livros[?("Programa√ß√£o" in @.tags)].titulo')
# Nota: A sintaxe '"Programa√ß√£o" in @.tags' funciona para testar se um elemento est√° em uma lista.

# Filtrando usando regex (se o nome da editora contiver "Inova√ß√£o")
# A sintaxe de regex em jsonpath-ng √© `@.field =~ "regex"`.
run_jsonpath_query('$.livraria.livros[?(@.editora.nome =~ "Inova√ß√£o")].titulo')


--- JSONPath Query: '$.configuracoes["chave-com-traco"]' ---
  Nenhum resultado encontrado.

--- JSONPath Query: '$.livraria.livros[0:2].titulo' ---
  Resultados (2):
    Match 1: Valor = Aprendendo JSONPath, Caminho = titulo
    Match 2: Valor = Dominando JMESPath, Caminho = titulo

--- JSONPath Query: '$.livraria.livros[0,2].titulo' ---
  Erro ao executar query: Parse error at 1:19 near token , (,)

--- JSONPath Query: '$.livraria..titulo' ---
  Resultados (5):
    Match 1: Valor = Cat√°logo de Livros T√©cnicos, Caminho = titulo
    Match 2: Valor = Aprendendo JSONPath, Caminho = titulo
    Match 3: Valor = Dominando JMESPath, Caminho = titulo
    Match 4: Valor = Introdu√ß√£o ao Web Scraping, Caminho = titulo
    Match 5: Valor = Python para Iniciantes, Caminho = titulo

--- JSONPath Query: '$.livraria.livros[?(@.disponivel == true)].titulo' ---
  Erro ao executar query: Error on line 1, col 18: Unexpected character: ? 

--- JSONPath Query: '$.livraria.livros[?(@.preco > 25 && @.ed

### 4. Express√µes Compostas (`|`)

Voc√™ pode combinar m√∫ltiplas express√µes JSONPath usando o operador de uni√£o (`|`). Isso retorna os resultados de todas as express√µes combinadas.


In [6]:
# T√≠tulos de livros OU nomes de usu√°rios
run_jsonpath_query('$.livraria.livros[*].titulo | $.usuarios[*].nome')


--- JSONPath Query: '$.livraria.livros[*].titulo | $.usuarios[*].nome' ---
  Resultados (8):
    Match 1: Valor = Ana, Caminho = nome
    Match 2: Valor = Bruno, Caminho = nome
    Match 3: Valor = Ana, Caminho = nome
    Match 4: Valor = Bruno, Caminho = nome
    Match 5: Valor = Ana, Caminho = nome
    Match 6: Valor = Bruno, Caminho = nome
    Match 7: Valor = Ana, Caminho = nome
    Match 8: Valor = Bruno, Caminho = nome


### 5. `JsonPath` Objects (Propriedades da Express√£o Compilada)

Quando voc√™ compila uma express√£o com `parse()`, o objeto retornado (uma inst√¢ncia de `JsonPath` ou suas subclasses) tem algumas propriedades e m√©todos:

  - **`expr.find(data)`**: O m√©todo principal de busca, j√° discutido.
  - **`expr.map(data_or_list_of_data)`**: Aplica a express√£o a cada item de uma lista de dados.
  - **`expr.update(data, value)`**: Atualiza o valor dos elementos encontrados.
  - **`expr.values(data)`**: Retorna apenas os valores encontrados, sem os objetos `Match`.
  - **`str(expr)`**: Retorna a string da express√£o original.


In [7]:
print("--- expr.find(data) ---")

# Parse the JSONPath expression
titulo_path_expr = parse('$.livraria.titulo')

# Execute the find method
matches = titulo_path_expr.find(json_data)

if matches:
    # Access the value from the Match object
    titulo_valor = matches[0].value
    print(f"Valor do t√≠tulo da livraria: '{titulo_valor}'")
else:
    print("Nenhum t√≠tulo encontrado.")

--- expr.find(data) ---
Valor do t√≠tulo da livraria: 'Cat√°logo de Livros T√©cnicos'


In [8]:
# Example with multiple results
livro_titulos_expr = parse('$.livraria.livros[*].titulo')
livro_titulo_matches = livro_titulos_expr.find(json_data)

print("\nT√≠tulos de todos os livros:")
for match in livro_titulo_matches:
    print(f"- {match.value}")


T√≠tulos de todos os livros:
- Aprendendo JSONPath
- Dominando JMESPath
- Introdu√ß√£o ao Web Scraping
- Python para Iniciantes


# 1. CLASSE JSONPath - M√©todos e Atributos B√°sicos

In [9]:
# parse() - Criar parser JSONPath
jsonpath_expr = parse('$.livraria.titulo')
match = jsonpath_expr.find(json_data)
exemplo(
    "parse() - Criar parser JSONPath",
    "parse('$.livraria.titulo').find(json_data)",
    [m.value for m in match]
)


üìå parse() - Criar parser JSONPath
C√≥digo: parse('$.livraria.titulo').find(json_data)
Resultado: ['Cat√°logo de Livros T√©cnicos']


In [10]:
# find() - Encontrar todas as ocorr√™ncias
matches = parse('$.livraria.livros[*].titulo').find(json_data)
exemplo(
    "find() - Encontrar todas as ocorr√™ncias",
    "parse('$.livraria.livros[*].titulo').find(json_data)",
    [m.value for m in matches]
)


üìå find() - Encontrar todas as ocorr√™ncias
C√≥digo: parse('$.livraria.livros[*].titulo').find(json_data)
Resultado: ['Aprendendo JSONPath', 'Dominando JMESPath', 'Introdu√ß√£o ao Web Scraping', 'Python para Iniciantes']


In [11]:
# update() - Atualizar valores
data_copy = json.loads(json.dumps(json_data))  # Deep copy
parse('$.livraria.autorPrincipal').update(data_copy, 'Prof. Novo')
exemplo(
    "update() - Atualizar valores",
    "parse('$.livraria.autorPrincipal').update(data_copy, 'Prof. Novo')",
    data_copy['livraria']['autorPrincipal']
)


üìå update() - Atualizar valores
C√≥digo: parse('$.livraria.autorPrincipal').update(data_copy, 'Prof. Novo')
Resultado: Prof. Novo


In [12]:
# filter() - Filtrar matches
all_precos = parse('$.livraria.livros[*].preco').find(json_data)
filtered_precos = [m for m in all_precos if m.value > 25]
exemplo(
    "filter() - Filtrar matches (pre√ßos > 25)",
    "[m for m in parse('$.livraria.livros[*].preco').find(json_data) if m.value > 25]",
    [m.value for m in filtered_precos]
)



üìå filter() - Filtrar matches (pre√ßos > 25)
C√≥digo: [m for m in parse('$.livraria.livros[*].preco').find(json_data) if m.value > 25]
Resultado: [25.5, 30.0, 35.0]


In [13]:
# find_first() - Encontrar primeira ocorr√™ncia
# Em vez de find_first() (que n√£o existe)
def safe_find_first(expression, data):
    matches = parse(expression).find(data)
    return matches[0] if matches else None

match = safe_find_first('$.livraria.livros[*].preco',json_data)
exemplo(
    "find_first/safe_find_first - Encontrar primeira ocorr√™ncia",
    "function",
    tr_dict({
        'value': match.value,
        'path': match.path,
        'full_path': match.full_path,
        'context': match.context,
        'type.context': type(match.context),
    }) if match else None
)


üìå find_first/safe_find_first - Encontrar primeira ocorr√™ncia
C√≥digo: function
Resultado: 
  - value: 25.5
  - path: preco
  - full_path: livraria.livros.[0].preco
  - context: DatumInContext(value={'titulo': 'Aprendendo JSONPath', 'autores': ['Alice', 'Bob'], 'ano': 2020, 'preco': 25.5, 'disponivel': True, 'editora': {'nome': 'Editora Inova√ß√£o', 'cidade': 'S√£o Paulo'}}, path=Index(index=0), context=DatumInContext(value=[{'titulo': 'Aprendendo JSONPath', 'autores': ['Alice', 'Bob'], 'ano': 2020, 'preco': 25.5, 'disponivel': True, 'editora': {'nome': 'Editora Inova√ß√£o', 'cidade': 'S√£o Paulo'}}, {'titulo': 'Dominando JMESPath', 'autores': ['Charlie'], 'ano': 2021, 'preco': 30.0, 'disponivel': False, 'editora': {'nome': 'Editora Global', 'cidade': 'Rio de Janeiro'}}, {'titulo': 'Introdu√ß√£o ao Web Scraping', 'autores': ['David', 'Eve', 'Frank'], 'ano': 2019, 'preco': 20.0, 'disponivel': True, 'editora': {'nome': 'Editora Inova√ß√£o', 'cidade': 'S√£o Paulo'}}, {'titulo': 'Pytho

In [14]:
# update_first() - Atualizar primeira ocorr√™ncia
data_copy2 = json.loads(json.dumps(json_data))
def safe_update_first(expression, data, new_value):
    """
    Simula update_first() que n√£o existe na jsonpath-ng padr√£o
    Atualiza apenas o primeiro match encontrado
    Retorna True se atualizou, False se n√£o encontrou matches
    """
    matches = parse(expression).find(data)
    if matches:
        # Pega o primeiro match
        first_match = matches[0]
        # Atualiza usando o caminho completo do primeiro match
        first_match.full_path.update(data, new_value)
        return True
    return False

safe_update_first('$.livraria.livros[*].preco',data_copy2, 99.99)
exemplo(
    "update_first() - Atualizar primeira ocorr√™ncia",
    "function",
    data_copy2['livraria']['livros'][0]['preco']
)


üìå update_first() - Atualizar primeira ocorr√™ncia
C√≥digo: function
Resultado: 99.99


# 3. OPERADORES E SINTAXES ESPECIAIS


In [15]:
# 3.1 Root ($) - Raiz do documento
root_matches = parse('$').find(json_data)
exemplo(
    "Root ($) - Raiz do documento",
    "parse('$').find(json_data)",
    f"Tipo: {type(root_matches[0].value)}, Chaves: {list(root_matches[0].value.keys())}"
)



üìå Root ($) - Raiz do documento
C√≥digo: parse('$').find(json_data)
Resultado: Tipo: <class 'dict'>, Chaves: ['livraria', 'usuarios', 'configuracoes']


In [16]:
# 3.2 Current (@) - Contexto atual (usado em filtros)
# Nota: @ √© usado em express√µes de filtro
current_example = ext_parse('$.livraria.livros[?(@.preco > 25)]')
exemplo(
    "Current (@) - Em filtros (extens√£o)",
    "Usado em express√µes como: $.livraria.livros[?(@.preco > 25)]",
    "Express√£o criada (precisa de ext_parse para funcionar)"
)


üìå Current (@) - Em filtros (extens√£o)
C√≥digo: Usado em express√µes como: $.livraria.livros[?(@.preco > 25)]
Resultado: Express√£o criada (precisa de ext_parse para funcionar)


In [17]:
# 3.3 Wildcard (*) - Todos os elementos
wildcard_matches = parse('$.livraria.livros[*].titulo').find(json_data)
exemplo(
    "Wildcard (*) - Todos os elementos",
    "parse('$.livraria.livros[*].titulo').find(json_data)",
    [m.value for m in wildcard_matches]
)


üìå Wildcard (*) - Todos os elementos
C√≥digo: parse('$.livraria.livros[*].titulo').find(json_data)
Resultado: ['Aprendendo JSONPath', 'Dominando JMESPath', 'Introdu√ß√£o ao Web Scraping', 'Python para Iniciantes']


In [18]:
# 3.4 Recursive Descent (..) - Busca recursiva
recursive_matches = parse('$..titulo').find(json_data)
exemplo(
    "Recursive Descent (..) - Busca recursiva",
    "parse('$..titulo').find(json_data)",
    [m.value for m in recursive_matches]
)


üìå Recursive Descent (..) - Busca recursiva
C√≥digo: parse('$..titulo').find(json_data)
Resultado: ['Cat√°logo de Livros T√©cnicos', 'Aprendendo JSONPath', 'Dominando JMESPath', 'Introdu√ß√£o ao Web Scraping', 'Python para Iniciantes']


In [19]:
# 3.5 Array Slice ([start:end]) - Fatias de array
slice_matches = parse('$.livraria.livros[1:3]').find(json_data)
exemplo(
    "Array Slice ([1:3]) - Fatias de array",
    "parse('$.livraria.livros[1:3]').find(json_data)",
    [m.value['titulo'] for m in slice_matches]
)


üìå Array Slice ([1:3]) - Fatias de array
C√≥digo: parse('$.livraria.livros[1:3]').find(json_data)
Resultado: ['Dominando JMESPath', 'Introdu√ß√£o ao Web Scraping']


In [20]:
# 3.6 Array Index ([n]) - √çndice espec√≠fico
index_match = parse('$.livraria.livros[2].titulo').find(json_data)
exemplo(
    "Array Index ([2]) - √çndice espec√≠fico",
    "parse('$.livraria.livros[2].titulo').find(json_data)",
    [m.value for m in index_match]
)


üìå Array Index ([2]) - √çndice espec√≠fico
C√≥digo: parse('$.livraria.livros[2].titulo').find(json_data)
Resultado: ['Introdu√ß√£o ao Web Scraping']


In [21]:
# 3.7 Multiple Array Indices ([1,3]) - M√∫ltiplos √≠ndices
# multi_index = ext_parse('$.livraria.livros[0,2]').find(json_data)
multi_index = parse('$.livraria.livros[0]').find(json_data)
multi_index.extend(parse('$.livraria.livros[2]').find(json_data))
exemplo(
    "Multiple Array Indices ([0,2]) - M√∫ltiplos √≠ndices",
    "parse('$.livraria.livros[0,2]').find(json_data)",
    [m.value['titulo'] for m in multi_index]
)


üìå Multiple Array Indices ([0,2]) - M√∫ltiplos √≠ndices
C√≥digo: parse('$.livraria.livros[0,2]').find(json_data)
Resultado: ['Aprendendo JSONPath', 'Introdu√ß√£o ao Web Scraping']


In [22]:
# 3.8 Last Array Index ([-1]) - √öltimo elemento
last_match = parse('$.livraria.livros[-1].titulo').find(json_data)
exemplo(
    "Last Array Index ([-1]) - √öltimo elemento",
    "parse('$.livraria.livros[-1].titulo').find(json_data)",
    [m.value for m in last_match]
)


üìå Last Array Index ([-1]) - √öltimo elemento
C√≥digo: parse('$.livraria.livros[-1].titulo').find(json_data)
Resultado: ['Python para Iniciantes']


# 4. EXTENS√ïES (jsonpath_ng.ext)


In [23]:
# 4.1 Filtros com express√µes
try:
    filter_expr = ext_parse('$.livraria.livros[?(@.preco > 25)]')
    filter_matches = filter_expr.find(json_data)
    exemplo(
        "Filtros com express√µes [?(@.preco > 25)]",
        "ext_parse('$.livraria.livros[?(@.preco > 25)]').find(json_data)",
        [m.value['titulo'] for m in filter_matches]
    )
except:
    exemplo(
        "Filtros com express√µes",
        "ext_parse('$.livraria.livros[?(@.preco > 25)]')",
        "Requer jsonpath-ng-ext para funcionar completamente"
    )



üìå Filtros com express√µes [?(@.preco > 25)]
C√≥digo: ext_parse('$.livraria.livros[?(@.preco > 25)]').find(json_data)
Resultado: ['Dominando JMESPath', 'Python para Iniciantes']


In [24]:
# 4.2 Filtros com operadores de compara√ß√£o
try:
    bool_filter = ext_parse('$.livraria.livros[?(@.disponivel == true)]')
    bool_matches = bool_filter.find(json_data)
    exemplo(
        "Filtros booleanos [?(@.disponivel == true)]",
        "ext_parse('$.livraria.livros[?(@.disponivel == true)]').find(json_data)",
        [m.value['titulo'] for m in bool_matches]
    )
except:
    exemplo(
        "Filtros booleanos",
        "ext_parse('$.livraria.livros[?(@.disponivel == true)]')",
        "Funcionalidade de extens√£o"
    )



üìå Filtros booleanos [?(@.disponivel == true)]
C√≥digo: ext_parse('$.livraria.livros[?(@.disponivel == true)]').find(json_data)
Resultado: ['Aprendendo JSONPath', 'Introdu√ß√£o ao Web Scraping', 'Python para Iniciantes']


In [25]:
# 4.3 Operadores l√≥gicos (and, or)
try:
    logic_filter = ext_parse(
        '$.livraria.livros[?(@.preco > 20 & @.disponivel == true)]')
    logic_matches = logic_filter.find(json_data)
    exemplo(
        "Operadores l√≥gicos [?(@.preco > 20 & @.disponivel == true)]",
        "ext_parse('$.livraria.livros[?(@.preco > 20 & @.disponivel == true)]')",
        [m.value['titulo']
            for m in logic_matches] if logic_matches else "Sem matches"
    )
except:
    exemplo(
        "Operadores l√≥gicos",
        "Exemplo: $.livraria.livros[?(@.preco > 20 & @.disponivel == true)]",
        "Funcionalidade de extens√£o"
    )



üìå Operadores l√≥gicos [?(@.preco > 20 & @.disponivel == true)]
C√≥digo: ext_parse('$.livraria.livros[?(@.preco > 20 & @.disponivel == true)]')
Resultado: ['Aprendendo JSONPath', 'Python para Iniciantes']


# 5. CLASSES INTERNAS E SUBCLASSES


In [26]:
# 5.1 Fields - Acesso a campos
fields_expr = Fields('titulo')
exemplo(
    "Fields('titulo') - Classe para campos",
    "Fields('titulo')",
    f"Tipo: {type(fields_expr)}"
)



üìå Fields('titulo') - Classe para campos
C√≥digo: Fields('titulo')
Resultado: Tipo: <class 'jsonpath_ng.jsonpath.Fields'>


In [27]:
# 5.2 Index - Acesso por √≠ndice
index_expr = Index(0)
exemplo(
    "Index(0) - Classe para √≠ndices",
    "Index(0)",
    f"Tipo: {type(index_expr)}"
)



üìå Index(0) - Classe para √≠ndices
C√≥digo: Index(0)
Resultado: Tipo: <class 'jsonpath_ng.jsonpath.Index'>


In [28]:
# 5.3 Child - Relacionamento pai-filho
try:
    child_expr = Child(Fields('livraria'), Fields('titulo'))
    child_result = child_expr.find(json_data)
    exemplo(
        "Child(Fields('livraria'), Fields('titulo')) - Relacionamento pai-filho",
        "Child(Fields('livraria'), Fields('titulo')).find(json_data)",
        [m.value for m in child_result]
    )
except Exception as e:
    exemplo(
        "Child - Relacionamento pai-filho",
        "Child(Fields('livraria'), Fields('titulo'))",
        f"Erro: {str(e)}"
    )



üìå Child(Fields('livraria'), Fields('titulo')) - Relacionamento pai-filho
C√≥digo: Child(Fields('livraria'), Fields('titulo')).find(json_data)
Resultado: ['Cat√°logo de Livros T√©cnicos']


In [29]:
# 5.4 Descendant - Busca descendente
try:
    desc_expr = Descendant(Fields('livraria'), Fields('titulo'))
    desc_result = desc_expr.find(json_data)
    exemplo(
        "Descendant - Busca descendente",
        "Descendant(Fields('livraria'), Fields('titulo')).find(json_data)",
        [m.value for m in desc_result]
    )
except Exception as e:
    exemplo(
        "Descendant - Busca descendente",
        "Descendant(Fields('livraria'), Fields('titulo'))",
        f"Classe interna para busca descendente"
    )



üìå Descendant - Busca descendente
C√≥digo: Descendant(Fields('livraria'), Fields('titulo'))
Resultado: Classe interna para busca descendente


# 6. CASOS ESPECIAIS E CARACTERES ESPECIAIS


In [30]:
# 6.1 Chaves com caracteres especiais
special_key = parse("$.configuracoes['chave~com/traco']").find(json_data)
exemplo(
    "Chaves com caracteres especiais",
    "parse(\"$.configuracoes['chave~com/traco']\").find(json_data)",
    [m.value for m in special_key]
)



üìå Chaves com caracteres especiais
C√≥digo: parse("$.configuracoes['chave~com/traco']").find(json_data)
Resultado: ['valor']


In [31]:
# 6.2 Escape de caracteres
try:
    # Para chaves que podem ter pontos ou outros caracteres especiais
    escaped_example = parse('$.configuracoes.tema').find(json_data)
    exemplo(
        "Chaves normais (sem escape necess√°rio)",
        "parse('$.configuracoes.tema').find(json_data)",
        [m.value for m in escaped_example]
    )
except Exception as e:
    exemplo(
        "Escape de caracteres",
        "parse('$.configuracoes.tema')",
        f"Erro: {str(e)}"
    )



üìå Chaves normais (sem escape necess√°rio)
C√≥digo: parse('$.configuracoes.tema').find(json_data)
Resultado: ['escuro']


# 7. M√âTODOS UTILIT√ÅRIOS E AN√ÅLISE


In [32]:
# 7.1 str() - Representa√ß√£o string
expr = parse('$.livraria.livros[*].titulo')
exemplo(
    "str(expression) - Representa√ß√£o string",
    "str(parse('$.livraria.livros[*].titulo'))",
    str(expr)
)



üìå str(expression) - Representa√ß√£o string
C√≥digo: str(parse('$.livraria.livros[*].titulo'))
Resultado: $.livraria.livros.[*].titulo


In [33]:
# 7.2 repr() - Representa√ß√£o t√©cnica
exemplo(
    "repr(expression) - Representa√ß√£o t√©cnica",
    "repr(parse('$.livraria.livros[*].titulo'))",
    repr(expr)
)


üìå repr(expression) - Representa√ß√£o t√©cnica
C√≥digo: repr(parse('$.livraria.livros[*].titulo'))
Resultado: Child(Child(Child(Child(Root(), Fields('livraria')), Fields('livros')), Slice(start=None,end=None,step=None)), Fields('titulo'))


In [34]:
# 7.3 An√°lise de caminho complexo
complex_path = parse('$..editora.nome')
complex_matches = complex_path.find(json_data)
exemplo(
    "An√°lise de caminho complexo ($..editora.nome)",
    "parse('$..editora.nome').find(json_data)",
    [m.value for m in complex_matches]
)


üìå An√°lise de caminho complexo ($..editora.nome)
C√≥digo: parse('$..editora.nome').find(json_data)
Resultado: ['Editora Inova√ß√£o', 'Editora Global', 'Editora Inova√ß√£o']


# 8. COMBINA√á√ïES E PADR√ïES AVAN√áADOS


In [35]:
# 8.1 Uni√£o de caminhos (usando |)
try:
    union_expr = parse('$.livraria.titulo | $.livraria.autorPrincipal')
    union_matches = union_expr.find(json_data)
    exemplo(
        "Uni√£o de caminhos (titulo | autorPrincipal)",
        "parse('$.livraria.titulo | $.livraria.autorPrincipal').find(json_data)",
        [m.value for m in union_matches]
    )
except:
    # Alternativa manual
    titulo_matches = parse('$.livraria.titulo').find(json_data)
    autor_matches = parse('$.livraria.autorPrincipal').find(json_data)
    exemplo(
        "Uni√£o manual de caminhos",
        "Combina√ß√£o de duas consultas separadas",
        [m.value for m in titulo_matches + autor_matches]
    )



üìå Uni√£o de caminhos (titulo | autorPrincipal)
C√≥digo: parse('$.livraria.titulo | $.livraria.autorPrincipal').find(json_data)
Resultado: ['Dr. Tech']


In [36]:
# 8.2 Aninhamento profundo
deep_matches = parse('$.livraria.livros[*].editora.cidade').find(json_data)
exemplo(
    "Aninhamento profundo (livros -> editora -> cidade)",
    "parse('$.livraria.livros[*].editora.cidade').find(json_data)",
    [m.value for m in deep_matches]
)


üìå Aninhamento profundo (livros -> editora -> cidade)
C√≥digo: parse('$.livraria.livros[*].editora.cidade').find(json_data)
Resultado: ['S√£o Paulo', 'Rio de Janeiro', 'S√£o Paulo']


In [37]:
# 8.3 Arrays dentro de objetos
autores_matches = parse('$.livraria.livros[*].autores[*]').find(json_data)
exemplo(
    "Arrays dentro de objetos (todos os autores)",
    "parse('$.livraria.livros[*].autores[*]').find(json_data)",
    [m.value for m in autores_matches]
)


üìå Arrays dentro de objetos (todos os autores)
C√≥digo: parse('$.livraria.livros[*].autores[*]').find(json_data)
Resultado: ['Alice', 'Bob', 'Charlie', 'David', 'Eve', 'Frank', 'Grace']


# 9. TRATAMENTO DE ERROS E CASOS EXTREMOS


In [38]:
# 9.1 Caminho inexistente
inexistente = parse('$.caminho.inexistente').find(json_data)
exemplo(
    "Caminho inexistente",
    "parse('$.caminho.inexistente').find(json_data)",
    f"Resultado: {len(inexistente)} matches encontrados"
)


üìå Caminho inexistente
C√≥digo: parse('$.caminho.inexistente').find(json_data)
Resultado: Resultado: 0 matches encontrados


In [39]:
# 9.2 √çndice fora do range
try:
    fora_range = parse('$.livraria.livros[10]').find(json_data)
    exemplo(
        "√çndice fora do range [10]",
        "parse('$.livraria.livros[10]').find(json_data)",
        f"Resultado: {len(fora_range)} matches encontrados"
    )
except Exception as e:
    exemplo(
        "√çndice fora do range",
        "parse('$.livraria.livros[10]')",
        f"Tratamento silencioso: retorna lista vazia"
    )


üìå √çndice fora do range [10]
C√≥digo: parse('$.livraria.livros[10]').find(json_data)
Resultado: Resultado: 0 matches encontrados


# PERFORMANCE E OTIMIZA√á√ÉO


In [40]:
# Reutiliza√ß√£o de express√µes
expr_reutilizavel = parse('$.livraria.livros[*].preco')
resultado1 = expr_reutilizavel.find(json_data)
resultado2 = expr_reutilizavel.find(json_data)  # Reutiliza√ß√£o
exemplo(
    "Reutiliza√ß√£o de express√µes",
    "expr = parse('$.livraria.livros[*].preco'); expr.find(data)",
    f"Mesma express√£o usada {2} vezes"
)


üìå Reutiliza√ß√£o de express√µes
C√≥digo: expr = parse('$.livraria.livros[*].preco'); expr.find(data)
Resultado: Mesma express√£o usada 2 vezes


In [41]:
# find_first() vs find() para um resultado
start = time.time()
primeiro = safe_find_first('$.livraria.livros[*].titulo',json_data)
tempo_first = time.time() - start

start = time.time()
todos = parse('$.livraria.livros[*].titulo').find(json_data)
tempo_all = time.time() - start

exemplo(
    "find_first() vs find() - Performance",
    "Compara√ß√£o de tempos de execu√ß√£o",
    f"find_first(): {tempo_first:.6f}s, find(): {tempo_all:.6f}s"
)


üìå find_first() vs find() - Performance
C√≥digo: Compara√ß√£o de tempos de execu√ß√£o
Resultado: find_first(): 0.018604s, find(): 0.018632s


# RESUMO FINAL

- PRINCIPAIS M√âTODOS DA CLASSE JSONPath:
   - `parse(expression)`         - Criar parser JSONPath
   - `find(data)`                - Encontrar todas as ocorr√™ncias
   - `find_first(data)`          - Encontrar primeira ocorr√™ncia
   - `update(data, value)`       - Atualizar todos os valores
   - `update_first(data, value)` - Atualizar primeiro valor

- ATRIBUTOS DE DatumInContext (resultado das buscas):
   - `.value`      - Valor encontrado
   - `.path`       - Caminho JSONPath
   - `.full_path`  - Caminho completo
   - `.context`    - Contexto do match

- OPERADORES JSONPATH:
   - `$`           - Raiz do documento
   - `@`           - Contexto atual (em filtros)
   - `*`           - Wildcard (todos os elementos)
   - `..`          - Busca recursiva (descendant)
   - `[n]`         - √çndice espec√≠fico
   - `[start:end]` - Slice de array
   - `[a,b,c]`     - M√∫ltiplos √≠ndices
   - `['key']`     - Chave com caracteres especiais

- EXTENS√ïES (jsonpath_ng.ext):
   - `[?(@.prop > value)]`    - Filtros com compara√ß√£o
   - `[?(@.prop == value)]`   - Filtros de igualdade
   - `[?(@.a > 1 & @.b < 5)]` - Operadores l√≥gicos

- CLASSES INTERNAS:
   - `Fields()`     - Acesso a campos
   - `Index()`      - Acesso por √≠ndice
   - `Child()`      - Relacionamento pai-filho
   - `Descendant()` - Busca descendente
   - `Union()`      - Uni√£o de express√µes

- DICAS DE PERFORMANCE:
   - Reutilize express√µes compiladas
   - Use find_first() quando precisar apenas do primeiro resultado
   - Prefira caminhos espec√≠ficos a buscas recursivas quando poss√≠vel

## Exce√ß√µes Comuns

  - **`jsonpath_ng.exceptions.JsonPathLexerError`**: Ocorre quando a express√£o JSONPath cont√©m caracteres inesperados ou est√° malformada sintaticamente (erros de tokeniza√ß√£o).
  - **`jsonpath_ng.exceptions.JsonPathParserError`**: Ocorre quando a express√£o JSONPath √© sintaticamente v√°lida, mas semanticamente incorreta ou segue uma estrutura que o parser n√£o entende.
