-------------------
# <center>TP1 NoSQL</center>
------------------

## Recherche textuelle/patterns

##### 1. Tous les films qui ont le mot **stardust** dans leur nom :      
```sql
SELECT *
FROM movies
WHERE title LIKE '%stardust%' ;
```
=> Aucun film ne contient 'stardust'. Mais la même requête avec 'Stardust' retourne deux films. 

Il nous faut donc utiliser une [REGEX](https://docs.postgresql.fr/9.1/functions-matching.html) ou bien utiliser l'opérateur `ILIKE` :

```sql
SELECT *
FROM movies
WHERE title ILIKE '%stardust%' ;
```
=> Retourne quelques films avec 'stardust'.

##### 2. Compter tous les films dont le titre ne commence pas par le mot **the** :       
```sql
SELECT COUNT(*)
FROM movies
WHERE title NOT ILIKE 'the%' ;
```

    
##### 3. Tous les films qui ont le mot **war** dans le titre mais pas en dernière position :            
```sql
SELECT *
FROM movies
WHERE title ILIKE '%war_%' ;
```
=> Cette requête renvoie tous les films qui contiennent le mot **war** même quand celui-ci est inclus dans un mot.              
Ou sinon pour avoir le mot **war** tout seul, sans qu'il ne soit inclus dans un mot :          
```sql
SELECT *
FROM movies
WHERE title ILIKE '% war %' ;
```

## Distance Levenshtein

Voir article Wikipédia : [Distance de Levenshtein](https://fr.wikipedia.org/wiki/Distance_de_Levenshtein)                

Utilisez les fonctions du package [fuzzystrgmatch](http://docs.postgresql.fr/9.1/fuzzystrmatch.html) pour trouver :

##### 1. La distance Levenshtein entre les mots **execution** et **intention** :                
```sql
SELECT LEVENSHTEIN('execution', 'intention') ;
```
=> Renvoie **5**.

##### 2. Tous les films qui sont a une distance levenshtein inférieure a 9 de la chaine ***a hard day nght*** :              
```sql
SELECT *
FROM movies
WHERE LEVENSHTEIN(title, 'a hard day nght') < 9 ;
```
=> Renvoie deux films.

## N-gram, similarity search (%)

[Documentation extension trgm](https://docs.postgresql.fr/9.1/pgtrgm.html)

##### 1. Tous les tri-grammes du mot **Avatar** :            
```sql
SELECT show_trgm('Avatar') ;
```

    
##### 2. La similarité entre **VOTKA** et **VODKA** :             
```sql
SELECT similarity('VOTKA', 'VODKA') ;
```
=> Donne une similarité de 33 % (c'est peu mais on raisonne sur les trigrammes).

    
##### 3. Tous les films dnt le titre est similaire a plus de 0,1% du titre **Avatar** :               
```sql
SELECT *
FROM movies
WHERE similarity(title, 'Avatar') > 0.001 ;
```
=> Retourne 517 films. *Avec 0,1 on obtient 12 films*.