# XPath e XQuery

# XPath

![XPath1](referencia-xpath1.png)
![XPath2](referencia-xpath2.png)

# XQuery
```xquery
FOR <variable bindings to individual nodes (elements)>
  LET <variable bindings to collections of nodes (elements)>
  WHERE <qualifier conditions>
  RETURN <query result specification>
```

# Exercício sobre publicações

Considere a representação gráfica a seguir de um esquema XML referente a publicação de artigos em conferências e revistas científicas (*journals*). O elemento `<publications>` define um título `<title>` geral, um conjunto de categorias `<categories>` (em que as publicações estão categorizadas) e as  publicações -- elementos `<publication>`. Diversos elementos, como o `<title>`, são definidos como `multiLangType`, que indica que além da string de conteúdo, têm um atributo `@lang` que define em que língua o conteúdo está.

O conjunto de categorias define a chave que será usada para classificar as categorias `@catkey` e um título descritivo do conjunto de categorias `<title>`. Cada categoria `<category>` dentro do conjunto define uma chave de identificação `@key` e rótulo. Há um tipo de categoria especial year que será usada para agrupar publicações por ano.
    
Cada publicação `<publication>` define títul `title>`, um conjunto de autores `<author>`, mês `<month>` e ano `<year>` em que foi publicada e chaves `@key`, que associam a publicação a categorias. Uma publicação terá um elemento `<event>` se foi publicada em um evento (e.g., conferência ou workshop); para cada evento é definido o link `@href` para a sua página, onde ele aconteceu (`@location`) e qual os dias de início `@begin` e fim `@end`. Se, por outro lado, a publicação for em uma revista científica, um elemento `<journal>` indicará o link `@href` da revista, o volume `@vol` e número `@n` em que o artigo foi publicado. Quando as publicações estão disponíveis online, um ou mais links para os respectivos arquivos são providos pelo elemento `<online>` através do atributo `@href`.

Responda as seguintes questões fazendo acesso ao arquivo XML disponível em: http://www.ic.unicamp.br/~santanch/publications/publications.xml

Cujo esquema está disponível em: http://www.ic.unicamp.br/~santanch/publications/publications.xsd

A seguir é apresentado um diagramas do esquema do arquivo:
![XQueryS2](publications-schema2.png)

Você deve testar as queries em: http://try.zorba.io/

Para todas as queries a seguir considere a sentença que associa o arquivo XML à variável `$publicadoc`:

```xquery
let $publicadoc := doc('http://www.ic.unicamp.br/~santanch/publications/publications.xml')
```

## Questão 1
Analise a query a seguir e descreva o que ela faz:
```xquery
return count($publicadoc//publication[year>2010])
```

**Resposta:** 

## Questão 2
**a)** Analise a query a seguir e descreva o que ela faz:
```xml
for $c in ($publicadoc//categories/category)
where $c/label[@lang='en-US'] = 'e-Science Domain'
return $c
```

**Resposta:** 

**b)** Transforme a query da letra (a) em uma única sentença em XPath sem o `for` (dentro de um `return` do XQuery).

**Resposta:**
```xquery

```

## JOIN em XQuery

Em XQuery é possível associar duas variáveis a dois caminhos que são percorridos em paralelo. No exemplo a seguir, a variável `$c` é associada ao caminho `$publicadoc//categories/category` e a variável `$p` ao caminho `$publicadoc//publication`. Quando o campo `key` de `$p` é associado ao atributo `@key` de `$c`, é realizado um JOIN ao modo SQL.

A consulta a seguir retorna as publicações associadas à categoria cujo `<label>` em inglês é '`e-Science Domain`'. 

```xml
for $c in ($publicadoc//categories/category),
    $p in ($publicadoc//publication)
where $c/label[@lang='en-US'] = 'e-Science Domain' and
      $p/key = $c/@key
return $p
```

Considere um segundo arquivo XML contendo dados de autores de livros:
```xml
<authors>
    <author name="Hugo Alves" country="Brazil"/>
    <author name="André Santanchè" country="Italy"/>
    ...
</authors>
```

O arquivo está disponível em: http://www.ic.unicamp.br/~santanch/publications/authors.xml

# Questão 3

*a)* Liste todos os autores que não são do Brasil:

**Resposta:**
```xquery

```

*b)* Liste todos os artigos publicados por pelo menos um autor que não é do Brasil.

**Resposta:**
```xml

```

# Questão 4

Analise a query a seguir e descreva o que ela faz.

A sequência `&#10;` é para pular uma linha. Execute o codigo a seguir.

```xml
let $publicadoc := doc('http://www.ic.unicamp.br/~santanch/publications/publications.xml')
for $c in ($publicadoc//categories[@catkey = 'subject']/category)
return {<group>&#10;
         <category>{data($c/label[@lang='en-US'])}</category>&#10;
         {for $p in ($publicadoc//publication)
          where $p/key = $c/@key
          return <ptitle>{data($p/title)}</ptitle>, '&#10;'}
        </group>, '&#10;&#10;'}
```

**Resposta:**