# Consulta centrada no termo: resolvendo a discordância de signals

Como vimos no notebook anterior, a consulta centrada no termo, apesar de resolver o problema do elefante albino, ainda sofre do problema de discordância de signals. Vimos também que, para resolver o problema de discordância de signals, não basta dar boost no campo. É necessário manipular as frequências dos termos.

Assim, neste notebook vamos ver como podemos manipular as frequências utilizando alguns métodos:
* Elasticsearch: <i>custom all fields</i> e <i>cross_fields</i>
* Solr: <i>copyField</i>


No Elasticsearch, o <i>custom all fields</i> combina os campos especificados em tempo de indexação (é o copyField do Solr). Já o <i>cross_field</i> trabalha em tempo de query e combina o conteúdo dos campos indicados com o objetivo de manipular as frequências. 

O <i>copyField</i> do Solr combina o conteúdo de campos indicados em tempo de indexação.

In [31]:
!pip install ipynb



You should consider upgrading via the 'python -m pip install --upgrade pip' command.


## Inicialização

In [32]:
from ipynb.fs.full.functions import reindex_solr, search_solr, explain_solr
from ipynb.fs.full.functions import reindex_elastic, search_elastic, explain_elastic
from ipynb.fs.full.functions import extract, SOLR_ADDR, headers

## 1. Combinando os campos cast.name e directors.name

Percebemos no notebook anterior que separar o elenco e os diretores em campos diferentes geram resultados que não correspondem à expectativa do usuário (discordância de signals). Ao combinar esses dois campos, geramos um campo mais genérico que estará mais próximo ao que o usuário espera ao realizar a pesquisa. 

### Atualização Elastisearch

In [34]:
#Cria o campo people e adiciona o copy_to em cast e directors
analysisSettings = {
   "analyzer" : {
      "default" : {
        "type" : "portuguese"
      },
      "portuguese_bigrams": {
          "type": "custom",
          "tokenizer": "standard",
          "filter": [
            "lowercase",
            "portuguese_stop",
            "portuguese_keywords",
            "portuguese_stemmer",
            "bigram_filter"
          ]
      }
    },
  "filter": {
    "bigram_filter": {
        "type": "shingle",
        "max_shingle_size":2,
        "min_shingle_size":2,
        "output_unigrams":"false"
    },
    "portuguese_stop": {
      "type":       "stop",
      "stopwords":  "_portuguese_" 
    },
    "portuguese_keywords": {
      "type":       "keyword_marker",
      "keywords":   ["exemplo"] 
    },
    "portuguese_stemmer": {
      "type":       "stemmer",
      "language":   "light_portuguese"
    }
  }
}
mappingSettings = {
    'properties': { 
        'people': {
            'properties': {
                  'name': {
                      'type': 'text',
                      'analyzer': 'portuguese',
                      'fields': {
                         "bigramed": {
                            "type": "text",
                            "analyzer": "portuguese_bigrams"
                        }     
                      }
                   }
           }
        },
        "cast": {
            'properties': {
                  'name': {
                      'type': 'text',
                      'analyzer': 'portuguese',
                      'copy_to': 'people.name',
                      'fields': {
                         "bigramed": {
                            "type": "text",
                            "analyzer": "portuguese_bigrams"
                        }     
                      }
                   }
           }
        },
        "directors": {
            'properties': {
                'name': {
                    'type': 'text',
                    'analyzer': 'portuguese',
                    'copy_to': 'people.name',
                    'fields': {
                        "bigramed": {
                            "type": "text",
                            "analyzer": "portuguese_bigrams"
                        }     
                    }
                }
           }
        }            
    }
}

In [35]:
movieDict = extract()
reindex_elastic(analysisSettings, mappingSettings, movieDict=movieDict)

elastic building... 200
elastic indexing...
elastic indexing done. 200
Elastic done! (took 129 seconds)



### Atualização Solr

In [10]:
import requests
#Cria novo campo e define os copy fields
url = 'http://' + SOLR_ADDR + '/solr/tmdb/schema'
data = '"add-field":{\
         "name":"people.name",\
         "type":"text_pt",\
         "stored":true,\
         "multiValued":true}'
httpResp = requests.post(url, data=data,headers=headers)

if httpResp.status_code == 400:
    data = '"replace-field":{\
         "name":"people.name",\
         "type":"text_pt",\
         "stored":true,\
         "multiValued":true}'
    httpResp = requests.post(url, data=data,headers=headers)
    
print('Campo criado! status code:', httpResp.status_code)


Campo criado! status code: 200


In [11]:
#Cria regra copy-field para os novos campos criados
data = '"add-copy-field":{\
         "source":"cast.name",\
         "dest":[ "people.name"]}'
httpResp = requests.post(url, data=data,headers=headers)
print('Copy field de cast.name para people.name criado: status code:',httpResp.status_code)
print(httpResp.text)

#Cria regra copy-field para os novos campos criados
data = '"add-copy-field":{\
         "source":"directors.name",\
         "dest":[ "people.name"]}'
httpResp = requests.post(url, data=data,headers=headers)
print('Copy field de directors.name para people.name criado: status code:',httpResp.status_code)
print(httpResp.text)

Copy field para people.name criado: status code: 200
{
  "responseHeader":{
    "status":0,
    "QTime":438}}

Copy field para people.name criado: status code: 200
{
  "responseHeader":{
    "status":0,
    "QTime":917}}



In [15]:
reindex_solr(movieDict)

solr building... 200
solr indexing...
solr indexing done. 200 {
  "responseHeader":{
    "rf":1,
    "status":0,
    "QTime":15367}}



### Pesquisa
Agora vamos buscar pelos dois atores do Star Trek - William Shatner e Patrick Stewart.

In [37]:
usersSearch = 'patrick stewart william shatner'
query = {
    'query': {
        'match': { 
            'people.name': usersSearch 
         }
    },
}

df = search_elastic(usersSearch, query)
df_resumido = df[['Relevance Score', 'Movie Title']]
df_resumido.head(15)

Elasticsearch results


Unnamed: 0,Relevance Score,Movie Title
0,15.423882,Jornada nas Estrelas: Generations
1,12.446302,Jornada nas Estrelas V: A Última Fronteira
2,10.205641,Selvagem
3,10.066978,Bill & Ted - Dois Loucos no Tempo
4,9.501642,Osmose Jones
5,9.276566,Showtime
6,9.132347,Jornada nas Estrelas II: A Ira de Khan
7,9.061906,Jornada nas Estrelas: O Filme
8,8.714335,Fanboys
9,8.632275,A Garota da Casa ao Lado


In [36]:
df = search_solr(usersSearch, qf='title overview people.name')
df_resumido = df[['Relevance Score', 'Movie Title']]
df_resumido.head(15)

Solr results


Unnamed: 0,Relevance Score,Movie Title
0,9.023155,Jornada nas Estrelas: Generations
1,6.447208,Jornada nas Estrelas V: A Última Fronteira
2,6.231855,Selvagem
3,6.150387,Jornada nas Estrelas: O Filme
4,6.14484,Bill & Ted - Dois Loucos no Tempo
5,5.829172,X-Men: O Confronto Final
6,5.507841,Osmose Jones
7,5.486414,Máquina Quase Mortífera
8,5.396521,Showtime
9,5.342532,Jornada nas Estrelas II: A Ira de Khan


O resultado ficou interessante. Mas até que ponto podemos agrupar? Vejamos uma busca por um campo que agrupa todos os campos pesquisáveis. Vamos chamá-lo de all.

### Criação do campo all no Elasticsearch

In [38]:
#Cria o campo people e adiciona o copy_to em cast e directors
analysisSettings = {
   "analyzer" : {
      "default" : {
        "type" : "portuguese"
      },
      "portuguese_bigrams": {
          "type": "custom",
          "tokenizer": "standard",
          "filter": [
            "lowercase",
            "portuguese_stop",
            "portuguese_keywords",
            "portuguese_stemmer",
            "bigram_filter"
          ]
      }
    },
  "filter": {
    "bigram_filter": {
        "type": "shingle",
        "max_shingle_size":2,
        "min_shingle_size":2,
        "output_unigrams":"false"
    },
    "portuguese_stop": {
      "type":       "stop",
      "stopwords":  "_portuguese_" 
    },
    "portuguese_keywords": {
      "type":       "keyword_marker",
      "keywords":   ["exemplo"] 
    },
    "portuguese_stemmer": {
      "type":       "stemmer",
      "language":   "light_portuguese"
    }
  }
}
mappingSettings = {
    'properties': { 
        'all': {
            'type': 'text',
            'analyzer': 'portuguese'
        },
        'title': {
            'type': 'text',
            'analyzer': 'portuguese',
            'copy_to': 'all'
        },
        'overview': {
            'type': 'text',
            'analyzer': 'portuguese',
            'copy_to': 'all'
        }, 
        "cast": {
            'properties': {
                  'name': {
                      'type': 'text',
                      'analyzer': 'portuguese',
                      'copy_to': 'all',
                      'fields': {
                         "bigramed": {
                            "type": "text",
                            "analyzer": "portuguese_bigrams"
                        }     
                      }
                   }
           }
        },
        "directors": {
            'properties': {
                'name': {
                    'type': 'text',
                    'analyzer': 'portuguese',
                    'copy_to': 'all',
                    'fields': {
                        "bigramed": {
                            "type": "text",
                            "analyzer": "portuguese_bigrams"
                        }     
                    }
                }
           }
        }            
    }
}

In [39]:
movieDict = extract()
reindex_elastic(analysisSettings, mappingSettings, movieDict=movieDict)

elastic building... 200
elastic indexing...
elastic indexing done. 200
Elastic done! (took 127 seconds)



### Criação do campo all no Solr

In [21]:
data = '"add-field":{\
         "name":"all",\
         "type":"text_pt",\
         "stored":true,\
         "multiValued":true}'
httpResp = requests.post(url, data=data,headers=headers)

if httpResp.status_code == 400:
    data = '"replace-field":{\
         "name":"all",\
         "type":"text_pt",\
         "stored":true,\
         "multiValued":true}'
    httpResp = requests.post(url, data=data,headers=headers)
    
print('Campo criado! status code:', httpResp.status_code)
print(httpResp.text)

#Cria regra copy-field para o novo campo criado: all
data = '"add-copy-field":{\
         "source":"title",\
         "dest":[ "all"]}'
httpResp = requests.post(url, data=data,headers=headers)
print('Copy field para title>all criado: status code:',httpResp.status_code)
print(httpResp.text)

data = '"add-copy-field":{\
         "source":"overview",\
         "dest":[ "all"]}'
httpResp = requests.post(url, data=data,headers=headers)
print('Copy field para overview>all criado: status code:',httpResp.status_code)
print(httpResp.text)

data = '"add-copy-field":{\
         "source":"cast.name",\
         "dest":[ "all"]}'
httpResp = requests.post(url, data=data,headers=headers)
print('Copy field para cast.name>all criado: status code:',httpResp.status_code)
print(httpResp.text)

data = '"add-copy-field":{\
         "source":"directors.name",\
         "dest":[ "all"]}'
httpResp = requests.post(url, data=data,headers=headers)
print('Copy field para directors.name>all criado: status code:',httpResp.status_code)
print(httpResp.text)

Campo criado! status code: 200
{
  "responseHeader":{
    "status":0,
    "QTime":555}}

Copy field para title>all criado: status code: 200
{
  "responseHeader":{
    "status":0,
    "QTime":1273}}

Copy field para overview>all criado: status code: 200
{
  "responseHeader":{
    "status":0,
    "QTime":656}}

Copy field para cast.name>all criado: status code: 200
{
  "responseHeader":{
    "status":0,
    "QTime":1180}}

Copy field para directors.name>all criado: status code: 200
{
  "responseHeader":{
    "status":0,
    "QTime":564}}



In [22]:
reindex_solr(movieDict)

solr building... 200
solr indexing...
solr indexing done. 200 {
  "responseHeader":{
    "rf":1,
    "status":0,
    "QTime":13931}}



In [23]:
usersSearch = 'jornada nas estrelas patrick stewart william shatner'
query = {
    'query': {
        'match': { 
            'all': usersSearch 
         }
    },
}

df = search_elastic(usersSearch, query)
df_resumido = df[['Relevance Score', 'Movie Title']]
df_resumido.head(15)

Elasticsearch results


Unnamed: 0,Relevance Score,Movie Title
0,25.583641,Jornada nas Estrelas: Generations
1,21.06946,Jornada nas Estrelas V: A Última Fronteira
2,20.250086,Jornada nas Estrelas: O Filme
3,16.6666,Jornada nas Estrelas VI: A Terra Desconhecida
4,16.132074,Jornada nas Estrelas II: A Ira de Khan
5,16.132074,Jornada nas Estrelas IV: A Volta para Casa
6,15.433888,Jornada nas Estrelas: Nêmesis
7,15.159684,Jornada nas Estrelas III: A procura de Spock
8,14.876781,Jornada nas Estrelas: Insurreição
9,14.640514,Jornada nas Estrelas: Primeiro Contato


In [24]:
df = search_solr(usersSearch, qf='all')
df_resumido = df[['Relevance Score', 'Movie Title']]
df_resumido.head(15)

Solr results


Unnamed: 0,Relevance Score,Movie Title
0,14.874978,Jornada nas Estrelas: Generations
1,11.723151,Jornada nas Estrelas V: A Última Fronteira
2,11.497293,Jornada nas Estrelas: O Filme
3,10.064531,Jornada nas Estrelas II: A Ira de Khan
4,10.064531,Jornada nas Estrelas VI: A Terra Desconhecida
5,9.847783,Jornada nas Estrelas IV: A Volta para Casa
6,9.640173,Jornada nas Estrelas III: A procura de Spock
7,9.175156,Jornada nas Estrelas: Insurreição
8,9.152418,Jornada nas Estrelas: Nêmesis
9,8.941699,Jornada nas Estrelas: Primeiro Contato


### Mas...

In [25]:
usersSearch = 'patrick stewart'
query = {
    'query': {
        'match': { 
            'all': usersSearch 
         }
    },
}

df = search_elastic(usersSearch, query)
df_resumido = df[['Relevance Score', 'Movie Title']]
df_resumido.head(15)

Elasticsearch results


Unnamed: 0,Relevance Score,Movie Title
0,7.593667,Um Corpo Que Cai
1,7.306704,As Panteras
2,6.897527,Bambi 2
3,6.669725,Family Guy Presents: It's a Trap!
4,6.558484,O Banquete
5,6.370599,Jornada nas Estrelas: Generations
6,6.370599,Zapped
7,6.301543,X-Men: O Confronto Final
8,6.251211,Gnomeu e Julieta
9,6.174532,O Menino Que Queria Ser Rei


In [26]:
df.head(15)

Unnamed: 0,Num,Relevance Score,Movie Title,Overview,Cast,Director
0,1,7.593667,Um Corpo Que Cai,"Em São Francisco, um detetive aposentado (James Stewart) que sofre de um terrível medo de alturas é encarregado de vigiar uma mulher (Kim Novak) com possíveis tendências suicidas, até que algo estranho acontece nesta missão.","[James Stewart, Kim Novak, Barbara Bel Geddes, Tom Helmore, Henry Jones, Raymond Bailey, Ellen Corby, Konstantin Shayne, Lee Patrick, Bess Flowers, Alfred Hitchcock]",[Alfred Hitchcock]
1,2,7.306704,As Panteras,"Elizabeth Banks dirige a nova geração de Panteras – Kristen Stewart, Naomi Scott e Ella Balinska – a serviço do misterioso Charles Townsend. As Panteras sempre proveram segurança e suas habilidades de investigação para clientes particulares, e agora a agência Townsend tem atuação internacional: as mais espertas, destemidas e altamente treinadas agentes em todo o globo formam múltiplos times de Panteras guiados por múltiplos Bosleys e estão prontas para atuar nos trabalhos mais difíceis ao redor do mundo. Quando um jovem engenheiro de sistemas soa o alarme a respeito de uma perigosa tecnologia; as Panteras são chamadas à ação, e colocam suas vidas em risco para nos proteger a todos.","[Kristen Stewart, Naomi Scott, Ella Balinska, Elizabeth Banks, Patrick Stewart, Djimon Hounsou, Sam Claflin, Jonathan Tucker, Nat Faxon, Chris Pang, Luis Gerardo Méndez, Noah Centineo, Marie-Lou Sellem, David Schütter, Hannah Hoekstra, Murali Perumal, Michael Strahan, Neil Malik Abdullah, Nick Dong-Sik, Dennenesch Zoudé, Robert Clotworthy, Jaclyn Smith, Danica Patrick, Ronda Rousey, Laverne Cox, Hailee Steinfeld, Chloe Kim, Lili Reinhart, Aly Raisman, Radhesh Aria]",[Elizabeth Banks]
2,3,6.897527,Bambi 2,"A história de Bambi crescendo sob os cuidados de seu pai, o Grande Príncipe da Floresta.","[Patrick Stewart, Alexander Gould, Keith Ferguson, Brendon Baerg, Nicky Jones, Andrea Bowen, Anthony Ghannam, Makenna Cowgill, Emma Rose Lima, Ariel Winter, Brian Pimental, Carolyn Hennesy, Cree Summer]",[Brian Pimental]
3,4,6.669725,Family Guy Presents: It's a Trap!,,"[Seth MacFarlane, Alex Borstein, Seth Green, Mila Kunis, Carrie Fisher, H. Jon Benjamin, Mike Henry, Patrick Warburton, Dee Bradley Baker, Adam West, John G. Brennan, Mark Hentemann, Patrick Stewart, Colin Ford, Mary Hart, Anne Hathaway, Steve Callaghan, Bruce McGill, Michael Dorn, Yara Shahidi, John Viener, Max Burkholder, Alec Sulkin, Chris Cox, Chris Edgerly, Chris Sheridan, Danny Smith, Ralph Garman, Robin Walsh, Ted Knight, Conway Twitty, Rush Limbaugh]",[Peter Shin]
4,5,6.558484,O Banquete,"A vida amorosa de um homem vista através dos olhos do melhor amigo dele: Winston, um cãozinho que adora comer. A cada mordida das refeições que dono e bichinho de estimação compartilham, cresce uma bela história de amor entre o homem e uma mulher.","[Tommy Snider, Katie Lowes, Ben Bledsoe, Stephen Apostolina, Kirk Baily, David Cowgill, Terri Douglas, Jackie Gonneau, Brandon Scott, Adam Shapiro, Mark Allan Stewart]",[Patrick Osborne]
5,6,6.370599,Jornada nas Estrelas: Generations,"A viagem inaugural da terceira nave Enterprise está ameaçada pelo cientista louco Soren e apenas uma pessoa pode detê-lo, mas ela está morta há 78 anos.","[Patrick Stewart, Jonathan Frakes, Brent Spiner, LeVar Burton, Michael Dorn, Gates McFadden, Marina Sirtis, William Shatner, James Doohan, Walter Koenig, Malcolm McDowell, Alan Ruck, Whoopi Goldberg, Thomas Dekker, Cameron Oppenheimer, Jenette Goldstein, Tim Russ]",[David Carson]
6,7,6.370599,Zapped,"Zoey Stevens é boa aluna e dançarina, mas está com dificuldades para se adaptar à nova vida depois do casamento de sua mãe. Um dia, descobre um aplicativo de celular que treina cães e controla os garotos da escola, menos Jackson Kale.","[Zendaya, Chanelle Peloso, Spencer Boldman, Emilia McCarthy, Adam DiMarco, William Ainscough, Aleks Paunovic, Lucia Walters, Jedidiah Goodacre, Louriza Tronco, Conner Cowie, Samuel Patrick Chu, Zachary Gibson, Christian J. Stewart, Drew Tanner]",[Peter DeLuise]
7,8,6.301543,X-Men: O Confronto Final,"É descoberta uma cura para os mutantes, que agora podem optar por manter seus poderes ou se tornarem seres humanos normais. A descoberta põe em campos opostos Magneto (Ian McKellen), que acredita que esta cura se tornará uma arma contra os mutantes, e os X-Men, liderados pelo professor Charles Xavier (Patrick Stewart).","[Hugh Jackman, Halle Berry, Ian McKellen, Patrick Stewart, Famke Janssen, Anna Paquin, Kelsey Grammer, James Marsden, Rebecca Romijn, Shawn Ashmore, Aaron Stanford, Vinnie Jones, Ellen Page, Daniel Cudmore, Ben Foster, Michael Murphy, Dania Ramirez, Shohreh Aghdashloo, Josef Sommer, Bill Duke, Eric Dane, Desiree Zurowski, Adrian Hough, Haley Ramm, Chris Claremont, Stan Lee, Cayden Boyd, Tanya Newbould, Anthony Heald, Cameron Bright, Connor Widdows, Kea Wong, Shauna Kain, Luke Pohl, Julian Richings, Lloyd Adams, Richard Yee, Via Saleaumua, Meiling Melançon, Omahyra Mota, Clayton Watmough, Ken Leung, Julian Christopher, Brad Kelly, Makenzie Vega Norfolk, Mi-Jung Lee, Benita Ha, Ron James, R. Lee Ermey, Lance Gibson, Aaron Pearl, Chelah Horsdal, John Pyper-Ferguson, Brenna O'Brien, Justin Callan, Alex Ferris, Peter Kawasaki, Ron Blecker, Emy Aneke, David Smith, Olivia Williams]",[Brett Ratner]
8,9,6.251211,Gnomeu e Julieta,"Gnomeu (James McAvoy) e Julieta (Emily Blunt) são anões de jardim cujas famílias são vizinhas e rivais. Um dia eles se apaixonam, para desgosto dos familiares. Para ficarem juntos, eles precisarão enfrentar diversos obstáculos.","[James McAvoy, Emily Blunt, Michael Caine, Maggie Smith, Julie Walters, Jim Cummings, Jason Statham, Ashley Jensen, Matt Lucas, Ozzy Osbourne, Patrick Stewart, Stephen Merchant, Dolly Parton, Hulk Hogan, Richard Wilson, Julio Bonet, Julia Braams]",[Kelly Asbury]
9,10,6.174532,O Menino Que Queria Ser Rei,"Alex (Louis Serkis) é um garoto que enfrenta problemas no colégio, por sempre defender o amigo Bedders (Dean Chaumoo) dos valentões Lance (Tom Taylor) e Kaye (Rhianna Dorris). Um dia, ao fugir da dupla, ele se esconde em um canteiro de obras abandonado. Lá encontra uma espada encravada em uma pedra, da qual retira com grande facilidade. O que Alex não sabia era que a espada era a lendária Excalibur e que, como seu novo portador, precisa agora enfrentar a meia-irmã do rei Arthur, Morgana (Rebecca Ferguson), que está prestes a retomar seu poder. Para tanto, ele conta com a ajuda do mago Merlin (Angus Imrie), transformado em uma versão bem mais jovem.","[Louis Ashbourne Serkis, Dean Chaumoo, Tom Taylor, Rhianna Dorris, Denise Gough, Angus Imrie, Patrick Stewart, Rebecca Ferguson, Genevieve O'Reilly, Noma Dumezweni, Nathan Stewart-Jarrett, Mark Bonnar, Alexandra Roach, Nick Mohammed, Adam Buxton, Claudie Blakley, Myra McFadyen, Adam Leese, Joey Ansah]",[Joe Cornish]


In [27]:
usersSearch = 'patrick stewart'
df = search_solr(usersSearch, qf='all')
df_resumido = df[['Relevance Score', 'Movie Title']]
df_resumido.head(15)

Solr results


Unnamed: 0,Relevance Score,Movie Title
0,4.135446,Um Corpo Que Cai
1,4.008708,As Panteras
2,3.894299,Bambi 2
3,3.797157,Family Guy Presents: It's a Trap!
4,3.796781,O Banquete
5,3.704028,Jornada nas Estrelas: Generations
6,3.704028,Zapped
7,3.65933,Gnomeu e Julieta
8,3.656074,X-Men: O Confronto Final
9,3.638888,O Menino Que Queria Ser Rei


In [28]:
df.head(15)

Unnamed: 0,Num,Relevance Score,Movie Title,Overview,Cast,Director
0,1,4.135446,Um Corpo Que Cai,"Em São Francisco, um detetive aposentado (James Stewart) que sofre de um terrível medo de alturas é encarregado de vigiar uma mulher (Kim Novak) com possíveis tendências suicidas, até que algo estranho acontece nesta missão.","[James Stewart, Kim Novak, Barbara Bel Geddes, Tom Helmore, Henry Jones, Raymond Bailey, Ellen Corby, Konstantin Shayne, Lee Patrick, Bess Flowers, Alfred Hitchcock]",[Alfred Hitchcock]
1,2,4.008708,As Panteras,"Elizabeth Banks dirige a nova geração de Panteras – Kristen Stewart, Naomi Scott e Ella Balinska – a serviço do misterioso Charles Townsend. As Panteras sempre proveram segurança e suas habilidades de investigação para clientes particulares, e agora a agência Townsend tem atuação internacional: as mais espertas, destemidas e altamente treinadas agentes em todo o globo formam múltiplos times de Panteras guiados por múltiplos Bosleys e estão prontas para atuar nos trabalhos mais difíceis ao redor do mundo. Quando um jovem engenheiro de sistemas soa o alarme a respeito de uma perigosa tecnologia; as Panteras são chamadas à ação, e colocam suas vidas em risco para nos proteger a todos.","[Kristen Stewart, Naomi Scott, Ella Balinska, Elizabeth Banks, Patrick Stewart, Djimon Hounsou, Sam Claflin, Jonathan Tucker, Nat Faxon, Chris Pang, Luis Gerardo Méndez, Noah Centineo, Marie-Lou Sellem, David Schütter, Hannah Hoekstra, Murali Perumal, Michael Strahan, Neil Malik Abdullah, Nick Dong-Sik, Dennenesch Zoudé, Robert Clotworthy, Jaclyn Smith, Danica Patrick, Ronda Rousey, Laverne Cox, Hailee Steinfeld, Chloe Kim, Lili Reinhart, Aly Raisman, Radhesh Aria]",[Elizabeth Banks]
2,3,3.894299,Bambi 2,"A história de Bambi crescendo sob os cuidados de seu pai, o Grande Príncipe da Floresta.","[Patrick Stewart, Alexander Gould, Keith Ferguson, Brendon Baerg, Nicky Jones, Andrea Bowen, Anthony Ghannam, Makenna Cowgill, Emma Rose Lima, Ariel Winter, Brian Pimental, Carolyn Hennesy, Cree Summer]",[Brian Pimental]
3,4,3.797157,Family Guy Presents: It's a Trap!,,"[Seth MacFarlane, Alex Borstein, Seth Green, Mila Kunis, Carrie Fisher, H. Jon Benjamin, Mike Henry, Patrick Warburton, Dee Bradley Baker, Adam West, John G. Brennan, Mark Hentemann, Patrick Stewart, Colin Ford, Mary Hart, Anne Hathaway, Steve Callaghan, Bruce McGill, Michael Dorn, Yara Shahidi, John Viener, Max Burkholder, Alec Sulkin, Chris Cox, Chris Edgerly, Chris Sheridan, Danny Smith, Ralph Garman, Robin Walsh, Ted Knight, Conway Twitty, Rush Limbaugh]",[Peter Shin]
4,5,3.796781,O Banquete,"A vida amorosa de um homem vista através dos olhos do melhor amigo dele: Winston, um cãozinho que adora comer. A cada mordida das refeições que dono e bichinho de estimação compartilham, cresce uma bela história de amor entre o homem e uma mulher.","[Tommy Snider, Katie Lowes, Ben Bledsoe, Stephen Apostolina, Kirk Baily, David Cowgill, Terri Douglas, Jackie Gonneau, Brandon Scott, Adam Shapiro, Mark Allan Stewart]",[Patrick Osborne]
5,6,3.704028,Jornada nas Estrelas: Generations,"A viagem inaugural da terceira nave Enterprise está ameaçada pelo cientista louco Soren e apenas uma pessoa pode detê-lo, mas ela está morta há 78 anos.","[Patrick Stewart, Jonathan Frakes, Brent Spiner, LeVar Burton, Michael Dorn, Gates McFadden, Marina Sirtis, William Shatner, James Doohan, Walter Koenig, Malcolm McDowell, Alan Ruck, Whoopi Goldberg, Thomas Dekker, Cameron Oppenheimer, Jenette Goldstein, Tim Russ]",[David Carson]
6,7,3.704028,Zapped,"Zoey Stevens é boa aluna e dançarina, mas está com dificuldades para se adaptar à nova vida depois do casamento de sua mãe. Um dia, descobre um aplicativo de celular que treina cães e controla os garotos da escola, menos Jackson Kale.","[Zendaya, Chanelle Peloso, Spencer Boldman, Emilia McCarthy, Adam DiMarco, William Ainscough, Aleks Paunovic, Lucia Walters, Jedidiah Goodacre, Louriza Tronco, Conner Cowie, Samuel Patrick Chu, Zachary Gibson, Christian J. Stewart, Drew Tanner]",[Peter DeLuise]
7,8,3.65933,Gnomeu e Julieta,"Gnomeu (James McAvoy) e Julieta (Emily Blunt) são anões de jardim cujas famílias são vizinhas e rivais. Um dia eles se apaixonam, para desgosto dos familiares. Para ficarem juntos, eles precisarão enfrentar diversos obstáculos.","[James McAvoy, Emily Blunt, Michael Caine, Maggie Smith, Julie Walters, Jim Cummings, Jason Statham, Ashley Jensen, Matt Lucas, Ozzy Osbourne, Patrick Stewart, Stephen Merchant, Dolly Parton, Hulk Hogan, Richard Wilson, Julio Bonet, Julia Braams]",[Kelly Asbury]
8,9,3.656074,X-Men: O Confronto Final,"É descoberta uma cura para os mutantes, que agora podem optar por manter seus poderes ou se tornarem seres humanos normais. A descoberta põe em campos opostos Magneto (Ian McKellen), que acredita que esta cura se tornará uma arma contra os mutantes, e os X-Men, liderados pelo professor Charles Xavier (Patrick Stewart).","[Hugh Jackman, Halle Berry, Ian McKellen, Patrick Stewart, Famke Janssen, Anna Paquin, Kelsey Grammer, James Marsden, Rebecca Romijn, Shawn Ashmore, Aaron Stanford, Vinnie Jones, Ellen Page, Daniel Cudmore, Ben Foster, Michael Murphy, Dania Ramirez, Shohreh Aghdashloo, Josef Sommer, Bill Duke, Eric Dane, Desiree Zurowski, Adrian Hough, Haley Ramm, Chris Claremont, Stan Lee, Cayden Boyd, Tanya Newbould, Anthony Heald, Cameron Bright, Connor Widdows, Kea Wong, Shauna Kain, Luke Pohl, Julian Richings, Lloyd Adams, Richard Yee, Via Saleaumua, Meiling Melançon, Omahyra Mota, Clayton Watmough, Ken Leung, Julian Christopher, Brad Kelly, Makenzie Vega Norfolk, Mi-Jung Lee, Benita Ha, Ron James, R. Lee Ermey, Lance Gibson, Aaron Pearl, Chelah Horsdal, John Pyper-Ferguson, Brenna O'Brien, Justin Callan, Alex Ferris, Peter Kawasaki, Ron Blecker, Emy Aneke, David Smith, Olivia Williams]",[Brett Ratner]
9,10,3.638888,O Menino Que Queria Ser Rei,"Alex (Louis Serkis) é um garoto que enfrenta problemas no colégio, por sempre defender o amigo Bedders (Dean Chaumoo) dos valentões Lance (Tom Taylor) e Kaye (Rhianna Dorris). Um dia, ao fugir da dupla, ele se esconde em um canteiro de obras abandonado. Lá encontra uma espada encravada em uma pedra, da qual retira com grande facilidade. O que Alex não sabia era que a espada era a lendária Excalibur e que, como seu novo portador, precisa agora enfrentar a meia-irmã do rei Arthur, Morgana (Rebecca Ferguson), que está prestes a retomar seu poder. Para tanto, ele conta com a ajuda do mago Merlin (Angus Imrie), transformado em uma versão bem mais jovem.","[Louis Ashbourne Serkis, Dean Chaumoo, Tom Taylor, Rhianna Dorris, Denise Gough, Angus Imrie, Patrick Stewart, Rebecca Ferguson, Genevieve O'Reilly, Noma Dumezweni, Nathan Stewart-Jarrett, Mark Bonnar, Alexandra Roach, Nick Mohammed, Adam Buxton, Claudie Blakley, Myra McFadyen, Adam Leese, Joey Ansah]",[Joe Cornish]


O signal gerado a partir de um campo genérico que concentra todos os demais é vago e não há mapeamento para informações significativas que os usuários reconheceriam. O signal criado para as pessoas do filme (cast.name + directors.name) é provavelmente mais próximo do critério significativo do usuário: mede pontuações de relevância para pessoas associadas a um filme. <b>Os campos que aspiram todo o texto tendem a ser muito gerais e geralmente devem ser evitados.</b>

### Utilizando cross fields para juntar os campos

In [40]:
usersSearch = 'jornada nas estrelas patrick stewart william shatner'
query = {
    'query': {
        'multi_match': { 
            'query': usersSearch ,
            'fields': ['title', 'overview', 'cast.name', 'directors.name'] ,
            'type': 'cross_fields' 
         }
    },
}

df = search_elastic(usersSearch, query)
df_resumido = df[['Relevance Score', 'Movie Title']]
df_resumido.head(15)

Elasticsearch results


Unnamed: 0,Relevance Score,Movie Title
0,23.136162,Jornada nas Estrelas: Generations
1,16.903622,Jornada nas Estrelas V: A Última Fronteira
2,16.687708,Jornada nas Estrelas: O Filme
3,14.979364,Jornada nas Estrelas II: A Ira de Khan
4,14.11171,Jornada nas Estrelas: Insurreição
5,14.040442,Jornada nas Estrelas IV: A Volta para Casa
6,13.921703,Jornada nas Estrelas VI: A Terra Desconhecida
7,13.921703,Jornada nas Estrelas III: A procura de Spock
8,13.818055,Jornada nas Estrelas: Nêmesis
9,13.122634,Jornada nas Estrelas: Primeiro Contato


O cross_fields combina os campos em tempo de query, mas há falhas nesse cálculo pois o cross_fields pega a frequência máxima do termo nos campos ao invés de uma soma.