# Pesquisas centradas no campo

Neste notebook, vamos realizar pesquisas centradas no campo no Elasticsearch. 

Vamos ver v√°rias abordagens de pesquisa centrada no campo e demonstrar seus problemas.

As diversas possibilidades de pesquisa no Elasticsearch podem ser encontradas em: 

https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl.html


Pr√©-requisitos:
    - Ter executado o notebook Parte II/Indexa√ß√£o dos dados: 
        No fim deste notebook, realiza-se a indexa√ß√£o dos dados do TMDB com um novo pipeline de an√°lise baseado no portugu√™s
        

# Inicializa√ß√£o

In [1]:
#PAR√ÇMETROS

#host:port
ELASTIC_ADDR='localhost:9200'

In [3]:
import json
import requests
import pandas as pd
from datetime import datetime
headers = {'content-type': 'application/json;charset=UTF-8'}

def date_diff_in_seconds(dt2, dt1):
    timedelta = dt2 - dt1
    return timedelta.days * 24 * 3600 + timedelta.seconds

# Some utilities for flattening the explain into something a bit more
# readable. Pass Explain JSON, get something readable (ironically this is what Solr's default output is :-p)
def flatten(l):
    [item for sublist in l for item in sublist]

def simplerExplain(explainJson, depth=0):
    result = " " * (depth * 2) + "%s, %s\n" % (explainJson['value'], explainJson['description'])
    #print json.dumps(explainJson, indent=True)
    if 'details' in explainJson:
        for detail in explainJson['details']:
            result += simplerExplain(detail, depth=depth+1)
    return result

In [4]:
def get_cast_list(cast, n):
    i = 0
    cast_list = []
    for e in cast:
        i += 1
        cast_list.append(e['name'])
    return cast_list

In [5]:
#Faz a pesquisa especificada no Elasticsearch e imprime os resultados
def search_elastic(usersSearch, query=None):
    if not query:
        query = {
            'query': {
                'multi_match': { 
                    'query': usersSearch, #A
                    'fields': ['title^10', 'overview'] #B
                }
            },
            'size': '30'
        }
    
    url = 'http://'+ ELASTIC_ADDR +'/tmdb/_search'
    httpResp = requests.get(url, data=json.dumps(query), headers=headers) #A
    searchHits = json.loads(httpResp.text)['hits']
    print("Elasticsearch results")
    lista_resultados = []
    for idx, hit in enumerate(searchHits['hits']):
        filme = [idx + 1, hit['_score'], hit['_source']['title'], hit['_source']['overview'], get_cast_list(hit['_source']['cast'],10), get_cast_list(hit['_source']['directors'],5)]
        lista_resultados.append(filme)
    
    pd.set_option('display.max_colwidth', -1)
    
    df = pd.DataFrame(lista_resultados,columns=['Num', 'Relevance Score', 'Movie Title', 'Overview', 'Cast', 'Director'], index=None)
    return df

In [6]:
import pickle

#Retorna um dicion√°rio do python com os dados dos filmes
def extract():
    return pickle.load(open("../Dados/movies.p","rb"))

In [7]:
#Cria um √≠ndice novo no Elastic e reindexa os dados
def reindex_elastic(analysisSettings={}, mappingSettings={}, movieDict={}):
    start = datetime.now()
    
    settings = { #A
        "settings": {
            "number_of_shards": 1, #B
            "index": {
                "analysis" : analysisSettings, #C
    }}}

    if mappingSettings:
        settings['mappings'] = mappingSettings #C

    resp = requests.delete("http://" + ELASTIC_ADDR + "/tmdb") #D
    resp = requests.put("http://" + ELASTIC_ADDR + "/tmdb", 
                        data=json.dumps(settings), headers=headers)

    print("elastic building...", resp.status_code)
    
    if resp.status_code != 200:
        print(resp.text)
    
    bulkMovies = ""
    
    for id, movie in movieDict.items(): 
        addCmd = {"index": {"_index": "tmdb", #E
                            #"_type": "movie",
                            "_id": movie['id']}}
        bulkMovies += json.dumps(addCmd) + "\n" + json.dumps(movie) + "\n"

    print("elastic indexing...")
    resp = requests.post("http://" + ELASTIC_ADDR + "/_bulk", data=bulkMovies, headers=headers)
    print("elastic indexing done.", resp.status_code)
    
    end = datetime.now()
    delta = date_diff_in_seconds(end, start)
    print('Elastic done! (took %d seconds)\n' % (delta))

# Vamos come√ßar!

Quais s√£o os crit√©rios importantes para quem est√° pesquisando filmes?

1. As informa√ß√µes <b>title</b> e <b>overview</b> s√£o importantes
2. E o elenco? <b>Atores</b>, <b>diretores</b> s√£o importantes?

## Pesquisas centradas no campo (field-centric)

Em uma primeira abordagem centrada no campo e utilizando a estrat√©gia best_fields do Elasticsearch que foca no melhor campo para responder a pergunta do usu√°rio, temos:

title ‚Äî Um score alto provavelmente equivale a um match do t√≠tulo

overview ‚Äî Um score alto provavelmente equivale uma consulta que descreve um filme

cast.name ‚Äî Um score alto provavelmente equivale a um match de um ator

directors.name ‚Äî Um score alto provavelmente equivale a um match de um diretor

A estrat√©gia best_fields √© a tamb√©m descrita por <b>"winner-takes-all search"</b>

### F√£s de Star Trek buscando por Patrick Stewart (obs: eu n√£o me incluo neste grupo)

In [8]:
from IPython.display import Image
Image(filename='img/patrick-stewart.jpg')

<IPython.core.display.Image object>

### 1. best_field nos campos title, overview, cast.name, directors.name

In [9]:
usersSearch = 'patrick stewart'
query = {
    'query': {
        'multi_match': { 
            'query': usersSearch,  #User's query
            'fields': ['title', 'overview', 'cast.name', 'directors.name'],      
            'type': 'best_fields'
         }
    },
    'size': 50,
    'explain': True
}

df = search_elastic(usersSearch, query)
df_resumido = df[['Relevance Score', 'Movie Title']]
df_resumido.head(15)

Elasticsearch results


Unnamed: 0,Relevance Score,Movie Title
0,11.073451,X-Men: O Confronto Final
1,9.486658,Logan
2,7.925139,X-Men: Dias de um Futuro Esquecido
3,7.266754,Crush √† Altura
4,7.266754,Os Escolhidos
5,7.266754,Padre
6,7.266754,Pacto Secreto
7,7.266754,Max Steel
8,7.266754,Legi√£o
9,7.180874,O Menino Que Queria Ser Rei


In [12]:
df.head(15)

Unnamed: 0,Num,Relevance Score,Movie Title,Overview,Cast,Director
0,1,11.073451,X-Men: O Confronto Final,"√â descoberta uma cura para os mutantes, que agora podem optar por manter seus poderes ou se tornarem seres humanos normais. A descoberta p√µe em campos opostos Magneto (Ian McKellen), que acredita que esta cura se tornar√° uma arma contra os mutantes, e os X-Men, liderados pelo professor Charles Xavier (Patrick Stewart).","[Hugh Jackman, Halle Berry, Ian McKellen, Patrick Stewart, Famke Janssen, Anna Paquin, Kelsey Grammer, James Marsden, Rebecca Romijn, Shawn Ashmore, Aaron Stanford, Vinnie Jones, Ellen Page, Daniel Cudmore, Ben Foster, Michael Murphy, Dania Ramirez, Shohreh Aghdashloo, Josef Sommer, Bill Duke, Eric Dane, Desiree Zurowski, Adrian Hough, Haley Ramm, Chris Claremont, Stan Lee, Cayden Boyd, Tanya Newbould, Anthony Heald, Cameron Bright, Connor Widdows, Kea Wong, Shauna Kain, Luke Pohl, Julian Richings, Lloyd Adams, Richard Yee, Via Saleaumua, Meiling Melan√ßon, Omahyra Mota, Clayton Watmough, Ken Leung, Julian Christopher, Brad Kelly, Makenzie Vega Norfolk, Mi-Jung Lee, Benita Ha, Ron James, R. Lee Ermey, Lance Gibson, Aaron Pearl, Chelah Horsdal, John Pyper-Ferguson, Brenna O'Brien, Justin Callan, Alex Ferris, Peter Kawasaki, Ron Blecker, Emy Aneke, David Smith, Olivia Williams]",[Brett Ratner]
1,2,9.486658,Logan,"Em 2029, Logan (Hugh Jackman) ganha a vida como chofer de limousine para cuidar do nonagen√°rio Charles Xavier (Patrick Stewart). Debilitado fisicamente e esgotado emocionalmente, ele √© procurado por Gabriela (Elizabeth Rodriguez), uma mexicana que precisa da ajuda do ex-X-Men para defender a pequena Laura Kinney / X-23 (Dafne Keen). Ao mesmo tempo em que se recusa a voltar √† ativa, Logan √© perseguido pelo mercen√°rio Donald Pierce (Boyd Holbrook), interessado na menina.","[Hugh Jackman, Patrick Stewart, Dafne Keen, Boyd Holbrook, Stephen Merchant, Elizabeth Rodriguez, Richard E. Grant, Eriq La Salle, Elise Neal, Quincy Fouse, Al Coronel, Frank Gallegos, Anthony Escobar, Reynaldo Gallegos, Krzysztof Soszynski, Stephen Dunlevy, Daniel Bernhardt, Ryan Sturz, Brandon Melendy, Jeremy Fitzgerald, Luke Hawx, Chris Palermo, Paul Andrew O'Connor, Clinton Roberts, Rocky Abou-Sakher, Keith Jardine, Jean Claude Leuyer, Andrew Arrabito, Jef Groff, Sebastian James, Aaron Matthews, Garrett Hammond, Matt McClain, Maureen Brennan, Jayson Genao, Hannah Westerfield, Bryant Tardy, Ashlyn Casalegno, Alison Fernandez, Parker Lovein, Jimmy Gonzales, Dave Davis, Lennie Loftin, Mark Ashworth, James Handy, Bryce Romero, Phi Vu, Chester Rushing, David Simpson, Lauren Gros, John Raymond, Vanessa Cloke, Doris Morgado, Katie Anne Mitchell, Lara Grice, James Moses Black, Ned Yousef, Michael Lehr, Baxter Humby, Bryan Sloyer, Daniel Hern√°ndez, John Bernecker, Evan Dane Taylor, Joe Williams, Toby Holguin, Robert Wu, Panuvat Anthony Nanakornpanom, Victor Winters-Junco, Eyad Elbitar, Craig Henningsen, Han Soto, Rissa Rose Kilar, Salef Celiz, Aidan Kennedy, Nayah Murphy, Chase Cubia, Emma Teo, Vincenzo Lucatorto, Noell Jellison, Haley Glass, Ella Rowbotham, Hudson Wright, Sebeon Jackson, Kelton DuMont, Damon Carney, Cynthia Woods, Mali O'Connor, David Kallaway, Robert Vargas, David Paris, Sienna Novikov, Ted Ferguson, Juan Gaspard, Julia Holt, Gonzalo Robles]",[James Mangold]
2,3,7.925139,X-Men: Dias de um Futuro Esquecido,"No futuro, os mutantes s√£o ca√ßados impiedosamente pelos Sentinelas, gigantescos rob√¥s criados por Bol√≠var Trask (Peter Dinklage). Os poucos sobreviventes precisam viver escondidos, caso contr√°rio ser√£o tamb√©m mortos. Entre eles est√£o o professor Charles Xavier (Patrick Stewart), Magneto (Ian McKellen), Tempestade (Halle Berry), Kitty Pryde (Ellen Page) e Wolverine (Hugh Jackman), que buscam um meio de evitar que os mutantes sejam aniquilados. O meio encontrado √© enviar a consci√™ncia de Wolverine em uma viagem no tempo, rumo aos anos 1970. L√° ela ocupa o corpo do Wolverine da √©poca, que procura os ainda jovens Xavier (James McAvoy) e Magneto (Michael Fassbender) para que, juntos, impe√ßam que este futuro tr√°gico para os mutantes se torne realidade.","[Hugh Jackman, James McAvoy, Michael Fassbender, Jennifer Lawrence, Halle Berry, Nicholas Hoult, Anna Paquin, Ellen Page, Peter Dinklage, Shawn Ashmore, Omar Sy, Evan Peters, Josh Helman, Daniel Cudmore, Fan Bingbing, Adan Canto, Booboo Stewart, Ian McKellen, Patrick Stewart, Famke Janssen, James Marsden, Lucas Till, Evan Jonigkeit, Mark Camacho, Alexander Felici, Jan Gerste, Massimo Cannistraro, Mike Dopud, Lee Villeneuve, Andreas Apergis, Robert Montcalm, Gregg Lowe, Jaa Smith-Johnson, Alex Ivanovici, Alain Dahan, Freddy Bessa, Patricia Tougas, Michael Lerner, Chris Claremont, Len Wein, Fran√ßois Paquette, Zabryna Guevara, Zehra Leverman, Angela Galuppo, Milo Chang Sigel, Kiana Chang Sigel, Victor Cornfoot, Brent Skagford, Kyle Gatehouse, John-sebastien Cote, St√©phane Julien, Taris Tyler, Darryl Scheelar, Thai-Hoa Le, Johnny Tran, Gregory Hlady, Dang Quoc Thinh, Vladimir Aksenov, Jimmy Chan, Julian Casey, Robert Crooks, Matt Cooke, Tim Post, Jason Deline, Karine Vanasse, Pierre LeBlanc, Jude Beny, Arthur Holden, Susanna Fournier, Andrew Peplowski, John Sanford Moore, Moe Jeudy-Lamour, Harry Standjofski, Brianna Bone, Neil Napier, Jason Koehler, Miya Shelton-Contreras, Mizinga Mwinga, Christian Jadah, Kelsey Grammer, Brendan Pedder, Bryan Singer, Morgan Lily, Sean Curley]",[Bryan Singer]
3,4,7.266754,Crush √† Altura,"Jodi √© uma adolescente que tem que lidar com as inconveni√™ncias de ser a garota mais alta da escola. Tudo muda quando ela se apaixona por um bonito (e igualmente alto) intercambista, que vai morar na casa do melhor amigo de Jodi. Como resultado, Jodi se v√™ embolada num tri√¢ngulo amoroso inesperado, que a ajuda a perceber que ela √© bem mais do que suas inseguran√ßas a faziam acreditar.","[Ava Michelle, Sabrina Carpenter, Griffin Gluck, Luke Eisner, Paris Berelc, Clara Wilsey, Anjelika Washington, Angela Kinsey, Steve Zahn, Rico Paris, Trina LaFargue, Bria Condon, Chad Michael Griffith, Andrew Brodeur, Conway Solomon, Hayden Lovell, Baylee Johnson, Amy Le, Marco Schittone, Cameron J. Wright, Milena Rivero, Sydney Thomas, Gralen Bryant Banks, Jason Rogel, Tatiana Piper, Betsy Borrego, Kelly Murtagh, Shane Guilbeau, Justin Thompson, Candi Brooks, Brian Condon]",[Nzingha Stewart]
4,5,7.266754,Os Escolhidos,"A fam√≠lia Barret leva uma vida pacata e tranquila no sub√∫rbio, mas isso come√ßa a mudar quando uma s√©rie de estranhos e misteriosos eventos passa a fazer parte de sua rotina. A fam√≠lia acaba descobrindo que existe uma terr√≠vel e mortal for√ßa atr√°s dela e precisar√° lutar por sua sobreviv√™ncia.","[Keri Russell, Josh Hamilton, Dakota Goyo, J.K. Simmons, Trevor St. John, Annie Thurman, Myndy Crist, Ron Ostrow, Josh Wingate, Kadan Rockett, L.J. Benet, Rich Hutchman, Jake Brennan, Marion Kerr, Alyvia Alyn Lind, Josh Stamberg, Tiffany Jeneen, Brian Stepanek, Judith Moreland, Adam Schneider, Jessica Borden, Kenneth Meseroll, Andy Umberger, Michael Patrick McGill, Alexandra Anthony, Scott Anthony, Tom Costello, Jaeden Bettencourt]",[Scott Stewart]
5,6,7.266754,Padre,"No mundo devastado por uma guerra entre humanos e vampiros, um padre guerreiro vive no anonimato at√© ter a sobrinha sequestrada. Ela √© levada por um grupo de vampiros assassinos para um local de confinamento, que fica nas Reservas. Contrariando as ordens da Igreja, entidade que orienta os humanos e afirma n√£o haver ataques vamp√≠ricos, o padre parte para o resgate da menina. Sua determina√ß√£o esbarra nas decis√µes da Igreja, que recruta outros padres para tentar traz√™-lo de volta, vivo ou morto.","[Paul Bettany, Karl Urban, Cam Gigandet, Maggie Q, Lily Collins, Stephen Moyer, M√§dchen Amick, Brad Dourif, Christopher Plummer, Alan Dale, Marilyn Brett, Jacob Hopkins]",[Scott Stewart]
6,7,7.266754,Pacto Secreto,"Cassidy (Briana Evigan), Ellie (Rumer Willis), Megan (Audrina Patridge), Jessica (Leah Pipes) e Claire (Jamie Chung) s√£o irm√£s de fraternidade em uma faculdade. Elas juraram manter entre elas sigilo, companheirismo e solidariedade, independente do que aconte√ßa. A lealdade entre elas √© testada quando uma brincadeira d√° errado e Megan √© brutalmente assassinada. Com medo de que seus futuros sejam destru√≠dos, elas decidem n√£o confessar o crime e esconder o cad√°ver. Um ano depois, na √©poca da formatura, as amigas decidem realizar uma festa de despedida na casa da fraternidade. No decorrer da festa as garotas recebem v√≠deos no celular, com cenas da noite do assassinato de Megan, enviadas por um remetente an√¥nimo.","[Briana Evigan, Leah Pipes, Jamie Chung, Rumer Willis, Margo Harshman, Audrina Patridge, Julian Morris, Matt O'Leary, Maxx Hennard, Matt Lanter, Carrie Fisher, Rick Applegate, Caroline D'Amore, Debra Gordon, Adam Berry, Nikki Moore, Deja Kreutzberg, Justine Wachsberger, Teri Andrzejewski, Robert Belushi, Marie Blanchard, Chris Conroy, Ken Bolden, Megan Wolfley, Zack Garrett, J. Matthew Miller, Ashtin Petrella, Melissa Lukon, Joe Forgione, Kelly Dessoye, Katie Woolridge, Jeff Krajci, Joanna Waldsmith, Natalia Dove, Justin Tully, Chaton Anderson, Nayli Russo]",[Stewart Hendler]
7,8,7.266754,Max Steel,"O jovem Max McGrath (Ben Winchell) descobre que seu corpo pode gerar uma poderosa energia, e ele deve unir-se com o √∫nico ser capaz de conter esta energia: um misterioso extraterrestre tecno-org√¢nico chamado Steel. Unidos como o super-her√≥i Max Steel, os dois amigos devem combater uma amea√ßa alien√≠gena e desvendar os segredos do seu passado.","[Ben Winchell, Josh Brener, Ana Villafa√±e, Andy Garc√≠a, Maria Bello, Billy Slaughter, Mike Doyle, Brandon Larracuente]",[Stewart Hendler]
8,9,7.266754,Legi√£o,"Deus perdeu a f√© na humanidade e enviou o anjo Michael (Paul Bettany), juntamente com uma legi√£o de anjos, para dar in√≠cio ao apocalipse. Entretanto, ao chegar Michael resolve se opor √†s ordens recebidas e proteger os humanos. O palco da batalha ser√° no interior dos Estados Unidos, onde fica uma lanchonete gerenciada por Bob Hanson (Dennis Quaid) e seu filho Jeep (Lucas Black). Juntamente com Charlie (Adrianne Palicki), uma gar√ßonete gr√°vida, e Percy Walker (Charles S. Dutton), eles precisam encontrar um meio para sobreviver aos anjos que desejam extermin√°-los a todo custo.","[Paul Bettany, Dennis Quaid, Kevin Durand, Kate Walsh, Doug Jones, Lucas Black, Tyrese Gibson, Adrianne Palicki, Charles S. Dutton, Jon Tenney, Jeanette Miller, Cameron Harlow, Josh Stamberg, Yancey Arias, Willa Holland]",[Scott Stewart]
9,10,7.180874,O Menino Que Queria Ser Rei,"Alex (Louis Serkis) √© um garoto que enfrenta problemas no col√©gio, por sempre defender o amigo Bedders (Dean Chaumoo) dos valent√µes Lance (Tom Taylor) e Kaye (Rhianna Dorris). Um dia, ao fugir da dupla, ele se esconde em um canteiro de obras abandonado. L√° encontra uma espada encravada em uma pedra, da qual retira com grande facilidade. O que Alex n√£o sabia era que a espada era a lend√°ria Excalibur e que, como seu novo portador, precisa agora enfrentar a meia-irm√£ do rei Arthur, Morgana (Rebecca Ferguson), que est√° prestes a retomar seu poder. Para tanto, ele conta com a ajuda do mago Merlin (Angus Imrie), transformado em uma vers√£o bem mais jovem.","[Louis Ashbourne Serkis, Dean Chaumoo, Tom Taylor, Rhianna Dorris, Denise Gough, Angus Imrie, Patrick Stewart, Rebecca Ferguson, Genevieve O'Reilly, Noma Dumezweni, Nathan Stewart-Jarrett, Mark Bonnar, Alexandra Roach, Nick Mohammed, Adam Buxton, Claudie Blakley, Myra McFadyen, Adam Leese, Joey Ansah]",[Joe Cornish]


O que est√° acontecendo nesses resultados? O quarto elemento do resultado n√£o tem nada a ver com Patrick Stewart!
Mas observem que a partir do quarto resultado, a engine come√ßa a priorizar os filmes com Stewart no nome do diretor. Stewart no nome do diretor √© mais raro do que Stewart em cast.name.

H√° um vi√©s no TF-IDF para termos raros, ou seja, TF-IDF retribui a raridade. Assim, as pesquisa do usu√°rio pode ser por um ator comum, mas o sistema valoriza os documentos com um diretor raro.

<b>Em outras palavras, √© prov√°vel que voc√™ obtenha resultados divergentes - geralmente na dire√ß√£o que voc√™ n√£o espera. Isso pode criar resultados de pesquisa confusos para os usu√°rios, pois as correspond√™ncias de campo obscuras t√™m preced√™ncia sobre as comuns.</b>

E se reduz√≠ssemos a prioridade do nome do diretor por meio de um pequeno boost? üëá

In [13]:
usersSearch = 'patrick stewart'
query = {
    'query': {
        'multi_match': { 
            'query': usersSearch,  #User's query
            'fields': ['title', 'overview', 'cast.name', 'directors.name^0.1'],      
            'type': 'best_fields'
         }
    },
    'size': 50,
    'explain': True
}

df = search_elastic(usersSearch, query)
df_resumido = df[['Relevance Score', 'Movie Title']]
df_resumido.head(15)

Elasticsearch results


Unnamed: 0,Relevance Score,Movie Title
0,11.073451,X-Men: O Confronto Final
1,9.486658,Logan
2,7.925139,X-Men: Dias de um Futuro Esquecido
3,7.180874,O Menino Que Queria Ser Rei
4,7.081099,As Panteras
5,6.998074,Um Corpo Que Cai
6,6.848892,O Piano
7,6.75764,Bambi 2
8,6.587884,Jornada nas Estrelas: Primeiro Contato
9,6.533178,Zapped


In [14]:
df.head(15)

Unnamed: 0,Num,Relevance Score,Movie Title,Overview,Cast,Director
0,1,11.073451,X-Men: O Confronto Final,"√â descoberta uma cura para os mutantes, que agora podem optar por manter seus poderes ou se tornarem seres humanos normais. A descoberta p√µe em campos opostos Magneto (Ian McKellen), que acredita que esta cura se tornar√° uma arma contra os mutantes, e os X-Men, liderados pelo professor Charles Xavier (Patrick Stewart).","[Hugh Jackman, Halle Berry, Ian McKellen, Patrick Stewart, Famke Janssen, Anna Paquin, Kelsey Grammer, James Marsden, Rebecca Romijn, Shawn Ashmore, Aaron Stanford, Vinnie Jones, Ellen Page, Daniel Cudmore, Ben Foster, Michael Murphy, Dania Ramirez, Shohreh Aghdashloo, Josef Sommer, Bill Duke, Eric Dane, Desiree Zurowski, Adrian Hough, Haley Ramm, Chris Claremont, Stan Lee, Cayden Boyd, Tanya Newbould, Anthony Heald, Cameron Bright, Connor Widdows, Kea Wong, Shauna Kain, Luke Pohl, Julian Richings, Lloyd Adams, Richard Yee, Via Saleaumua, Meiling Melan√ßon, Omahyra Mota, Clayton Watmough, Ken Leung, Julian Christopher, Brad Kelly, Makenzie Vega Norfolk, Mi-Jung Lee, Benita Ha, Ron James, R. Lee Ermey, Lance Gibson, Aaron Pearl, Chelah Horsdal, John Pyper-Ferguson, Brenna O'Brien, Justin Callan, Alex Ferris, Peter Kawasaki, Ron Blecker, Emy Aneke, David Smith, Olivia Williams]",[Brett Ratner]
1,2,9.486658,Logan,"Em 2029, Logan (Hugh Jackman) ganha a vida como chofer de limousine para cuidar do nonagen√°rio Charles Xavier (Patrick Stewart). Debilitado fisicamente e esgotado emocionalmente, ele √© procurado por Gabriela (Elizabeth Rodriguez), uma mexicana que precisa da ajuda do ex-X-Men para defender a pequena Laura Kinney / X-23 (Dafne Keen). Ao mesmo tempo em que se recusa a voltar √† ativa, Logan √© perseguido pelo mercen√°rio Donald Pierce (Boyd Holbrook), interessado na menina.","[Hugh Jackman, Patrick Stewart, Dafne Keen, Boyd Holbrook, Stephen Merchant, Elizabeth Rodriguez, Richard E. Grant, Eriq La Salle, Elise Neal, Quincy Fouse, Al Coronel, Frank Gallegos, Anthony Escobar, Reynaldo Gallegos, Krzysztof Soszynski, Stephen Dunlevy, Daniel Bernhardt, Ryan Sturz, Brandon Melendy, Jeremy Fitzgerald, Luke Hawx, Chris Palermo, Paul Andrew O'Connor, Clinton Roberts, Rocky Abou-Sakher, Keith Jardine, Jean Claude Leuyer, Andrew Arrabito, Jef Groff, Sebastian James, Aaron Matthews, Garrett Hammond, Matt McClain, Maureen Brennan, Jayson Genao, Hannah Westerfield, Bryant Tardy, Ashlyn Casalegno, Alison Fernandez, Parker Lovein, Jimmy Gonzales, Dave Davis, Lennie Loftin, Mark Ashworth, James Handy, Bryce Romero, Phi Vu, Chester Rushing, David Simpson, Lauren Gros, John Raymond, Vanessa Cloke, Doris Morgado, Katie Anne Mitchell, Lara Grice, James Moses Black, Ned Yousef, Michael Lehr, Baxter Humby, Bryan Sloyer, Daniel Hern√°ndez, John Bernecker, Evan Dane Taylor, Joe Williams, Toby Holguin, Robert Wu, Panuvat Anthony Nanakornpanom, Victor Winters-Junco, Eyad Elbitar, Craig Henningsen, Han Soto, Rissa Rose Kilar, Salef Celiz, Aidan Kennedy, Nayah Murphy, Chase Cubia, Emma Teo, Vincenzo Lucatorto, Noell Jellison, Haley Glass, Ella Rowbotham, Hudson Wright, Sebeon Jackson, Kelton DuMont, Damon Carney, Cynthia Woods, Mali O'Connor, David Kallaway, Robert Vargas, David Paris, Sienna Novikov, Ted Ferguson, Juan Gaspard, Julia Holt, Gonzalo Robles]",[James Mangold]
2,3,7.925139,X-Men: Dias de um Futuro Esquecido,"No futuro, os mutantes s√£o ca√ßados impiedosamente pelos Sentinelas, gigantescos rob√¥s criados por Bol√≠var Trask (Peter Dinklage). Os poucos sobreviventes precisam viver escondidos, caso contr√°rio ser√£o tamb√©m mortos. Entre eles est√£o o professor Charles Xavier (Patrick Stewart), Magneto (Ian McKellen), Tempestade (Halle Berry), Kitty Pryde (Ellen Page) e Wolverine (Hugh Jackman), que buscam um meio de evitar que os mutantes sejam aniquilados. O meio encontrado √© enviar a consci√™ncia de Wolverine em uma viagem no tempo, rumo aos anos 1970. L√° ela ocupa o corpo do Wolverine da √©poca, que procura os ainda jovens Xavier (James McAvoy) e Magneto (Michael Fassbender) para que, juntos, impe√ßam que este futuro tr√°gico para os mutantes se torne realidade.","[Hugh Jackman, James McAvoy, Michael Fassbender, Jennifer Lawrence, Halle Berry, Nicholas Hoult, Anna Paquin, Ellen Page, Peter Dinklage, Shawn Ashmore, Omar Sy, Evan Peters, Josh Helman, Daniel Cudmore, Fan Bingbing, Adan Canto, Booboo Stewart, Ian McKellen, Patrick Stewart, Famke Janssen, James Marsden, Lucas Till, Evan Jonigkeit, Mark Camacho, Alexander Felici, Jan Gerste, Massimo Cannistraro, Mike Dopud, Lee Villeneuve, Andreas Apergis, Robert Montcalm, Gregg Lowe, Jaa Smith-Johnson, Alex Ivanovici, Alain Dahan, Freddy Bessa, Patricia Tougas, Michael Lerner, Chris Claremont, Len Wein, Fran√ßois Paquette, Zabryna Guevara, Zehra Leverman, Angela Galuppo, Milo Chang Sigel, Kiana Chang Sigel, Victor Cornfoot, Brent Skagford, Kyle Gatehouse, John-sebastien Cote, St√©phane Julien, Taris Tyler, Darryl Scheelar, Thai-Hoa Le, Johnny Tran, Gregory Hlady, Dang Quoc Thinh, Vladimir Aksenov, Jimmy Chan, Julian Casey, Robert Crooks, Matt Cooke, Tim Post, Jason Deline, Karine Vanasse, Pierre LeBlanc, Jude Beny, Arthur Holden, Susanna Fournier, Andrew Peplowski, John Sanford Moore, Moe Jeudy-Lamour, Harry Standjofski, Brianna Bone, Neil Napier, Jason Koehler, Miya Shelton-Contreras, Mizinga Mwinga, Christian Jadah, Kelsey Grammer, Brendan Pedder, Bryan Singer, Morgan Lily, Sean Curley]",[Bryan Singer]
3,4,7.180874,O Menino Que Queria Ser Rei,"Alex (Louis Serkis) √© um garoto que enfrenta problemas no col√©gio, por sempre defender o amigo Bedders (Dean Chaumoo) dos valent√µes Lance (Tom Taylor) e Kaye (Rhianna Dorris). Um dia, ao fugir da dupla, ele se esconde em um canteiro de obras abandonado. L√° encontra uma espada encravada em uma pedra, da qual retira com grande facilidade. O que Alex n√£o sabia era que a espada era a lend√°ria Excalibur e que, como seu novo portador, precisa agora enfrentar a meia-irm√£ do rei Arthur, Morgana (Rebecca Ferguson), que est√° prestes a retomar seu poder. Para tanto, ele conta com a ajuda do mago Merlin (Angus Imrie), transformado em uma vers√£o bem mais jovem.","[Louis Ashbourne Serkis, Dean Chaumoo, Tom Taylor, Rhianna Dorris, Denise Gough, Angus Imrie, Patrick Stewart, Rebecca Ferguson, Genevieve O'Reilly, Noma Dumezweni, Nathan Stewart-Jarrett, Mark Bonnar, Alexandra Roach, Nick Mohammed, Adam Buxton, Claudie Blakley, Myra McFadyen, Adam Leese, Joey Ansah]",[Joe Cornish]
4,5,7.081099,As Panteras,"Elizabeth Banks dirige a nova gera√ß√£o de Panteras ‚Äì Kristen Stewart, Naomi Scott e Ella Balinska ‚Äì a servi√ßo do misterioso Charles Townsend. As Panteras sempre proveram seguran√ßa e suas habilidades de investiga√ß√£o para clientes particulares, e agora a ag√™ncia Townsend tem atua√ß√£o internacional: as mais espertas, destemidas e altamente treinadas agentes em todo o globo formam m√∫ltiplos times de Panteras guiados por m√∫ltiplos Bosleys e est√£o prontas para atuar nos trabalhos mais dif√≠ceis ao redor do mundo. Quando um jovem engenheiro de sistemas soa o alarme a respeito de uma perigosa tecnologia; as Panteras s√£o chamadas √† a√ß√£o, e colocam suas vidas em risco para nos proteger a todos.","[Kristen Stewart, Naomi Scott, Ella Balinska, Elizabeth Banks, Patrick Stewart, Djimon Hounsou, Sam Claflin, Jonathan Tucker, Nat Faxon, Chris Pang, Luis Gerardo M√©ndez, Noah Centineo, Marie-Lou Sellem, David Sch√ºtter, Hannah Hoekstra, Murali Perumal, Michael Strahan, Neil Malik Abdullah, Nick Dong-Sik, Dennenesch Zoud√©, Robert Clotworthy, Jaclyn Smith, Danica Patrick, Ronda Rousey, Laverne Cox, Hailee Steinfeld, Chloe Kim, Lili Reinhart, Aly Raisman, Radhesh Aria]",[Elizabeth Banks]
5,6,6.998074,Um Corpo Que Cai,"Em S√£o Francisco, um detetive aposentado (James Stewart) que sofre de um terr√≠vel medo de alturas √© encarregado de vigiar uma mulher (Kim Novak) com poss√≠veis tend√™ncias suicidas, at√© que algo estranho acontece nesta miss√£o.","[James Stewart, Kim Novak, Barbara Bel Geddes, Tom Helmore, Henry Jones, Raymond Bailey, Ellen Corby, Konstantin Shayne, Lee Patrick, Bess Flowers, Alfred Hitchcock]",[Alfred Hitchcock]
6,7,6.848892,O Piano,"Em meados do s√©culo XIX, Ada √© uma mulher muda que tem uma filha - Flora. Para um casamento arranjado ela deixa sua terra natal, a Esc√≥cia, acompanhada de sua filha e seu amado piano. A vida nas florestas densas de uma ilha ao sul da Nova Zel√¢ndia e o relacionamento com seu marido Stewart n√£o s√£o o que ela esperava. Quando Stewart vende o piano para seu vizinho, George, Ada sofre muito. George diz que pode lhe devolver o piano se ela o ensinar a tocar. A princ√≠pio Ada ignora George, mas lentamente o relacionamento deles se transforma, levando-os a uma situa√ß√£o perigosa.","[Holly Hunter, Harvey Keitel, Sam Neill, Anna Paquin, Cliff Curtis, Kerry Walker, Tungia Baker, Ian Mune, Genevieve Lemon, Pete Smith, Te Whatanui Skipwith, Bruce Allpress, Rose McIver, Neil Gudsell, Jon Sperry, Verity George, Stephen Papps]",[Jane Campion]
7,8,6.75764,Bambi 2,"A hist√≥ria de Bambi crescendo sob os cuidados de seu pai, o Grande Pr√≠ncipe da Floresta.","[Patrick Stewart, Alexander Gould, Keith Ferguson, Brendon Baerg, Nicky Jones, Andrea Bowen, Anthony Ghannam, Makenna Cowgill, Emma Rose Lima, Ariel Winter, Brian Pimental, Carolyn Hennesy, Cree Summer]",[Brian Pimental]
8,9,6.587884,Jornada nas Estrelas: Primeiro Contato,"O capit√£o Jean-Luc e a tripula√ß√£o da Enterprise embarcam em uma nova aventura, a qual √© um confronto com os Borgs, criaturas meio org√¢nicas e meio m√°quinas que formam uma comunidade que possui um √∫nico objetivo: conquistar e assimilar todas as ra√ßas. Liderados por sua sedutora e s√°dica rainha, os Borgs seguem para a Terra com um plano demon√≠aco para alterar a hist√≥ria. O √∫ltimo encontro entre Picard e os Borgs quase o matou e agora ele quer vingan√ßa.","[Patrick Stewart, Jonathan Frakes, Brent Spiner, LeVar Burton, Michael Dorn, Gates McFadden, Marina Sirtis, James Cromwell, Alfre Woodard, Alice Krige, Neal McDonough, Dwight Schultz, Cameron Oppenheimer, Robert Picardo, Adam Scott]",[Jonathan Frakes]
9,10,6.533178,Zapped,"Zoey Stevens √© boa aluna e dan√ßarina, mas est√° com dificuldades para se adaptar √† nova vida depois do casamento de sua m√£e. Um dia, descobre um aplicativo de celular que treina c√£es e controla os garotos da escola, menos Jackson Kale.","[Zendaya, Chanelle Peloso, Spencer Boldman, Emilia McCarthy, Adam DiMarco, William Ainscough, Aleks Paunovic, Lucia Walters, Jedidiah Goodacre, Louriza Tronco, Conner Cowie, Samuel Patrick Chu, Zachary Gibson, Christian J. Stewart, Drew Tanner]",[Peter DeLuise]


Resolve em parte, mas ainda h√° problemas. Note que h√° alguns filmes sendo priorizados por causa do termo Stewart em overview.

### 2. best_field com bigramas: signals mais precisos

Podemos fornecer ao sistema signals mais precisos. Podemos observar que os nomes dos atores e diretores s√£o compostos por dois nomes. Assim, podemos usar bigramas para criar uma busca com maior precis√£o. 

Palavras em conjunto podem trazer mais contexto do que palavras em separado. Esta metodologia √© chamada de n-gramas e consiste em considerar a sequ√™ncia das palavras em uma frase. Bigramas significa que consideraremos 2 palavras em sequencia.

Vamos criar novos campos para conter os bigramas de cast.name e directors.name. Abaixo temos a defini√ß√£o do novo analisador no Elastic e os novos campos. 

In [15]:
analysisSettings = {
   "analyzer" : {
      "default" : {
        "type" : "portuguese"
      },
      "portuguese_bigrams": {
          "type": "custom",
          "tokenizer": "standard",
          "filter": [
            "lowercase",
            "portuguese_stop",
            "portuguese_keywords",
            "portuguese_stemmer",
            "bigram_filter"
          ]
      }
    },
  "filter": {
    "bigram_filter": {
        "type": "shingle",
        "max_shingle_size":2,
        "min_shingle_size":2,
        "output_unigrams":"false"
    },
    "portuguese_stop": {
      "type":       "stop",
      "stopwords":  "_portuguese_" 
    },
    "portuguese_keywords": {
      "type":       "keyword_marker",
      "keywords":   ["exemplo"] 
    },
    "portuguese_stemmer": {
      "type":       "stemmer",
      "language":   "light_portuguese"
    }
  }
}


# From listing 9
mappingSettings = {
    'properties': {
        'title': {
            'type': 'text',
            'analyzer': 'portuguese'
        },
        'overview': {
            'type': 'text',
            'analyzer': 'portuguese'
        }, 
        "cast": {
            'properties': {
                  'name': {
                      'type': 'text',
                      'analyzer': 'portuguese',
                      'fields': {
                         "bigramed": {
                            "type": "text",
                            "analyzer": "portuguese_bigrams"
                        }     
                      }
                   }
           }
        },
        "directors": {
            'properties': {
                'name': {
                    'type': 'text',
                    'analyzer': 'portuguese',
                    'fields': {
                        "bigramed": {
                            "type": "text",
                            "analyzer": "portuguese_bigrams"
                        }     
                    }
                }
           }
        }            
    }
}

Reindexa√ß√£o dos dados com as novas configura√ß√µes. <b>Leva aproximadamente 2 minutos para executar.</b>

In [16]:
movieDict = extract()
reindex_elastic(analysisSettings, mappingSettings, movieDict)

elastic building... 200
elastic indexing...
elastic indexing done. 200
Elastic done! (took 117 seconds)



Vamos analisar como fica a an√°lise do campo bigrama. üëá

In [17]:
import urllib.parse

data='{"field": "cast.name.bigramed", "text" : "'+ usersSearch + '", "explain" : true}'   
params = data.encode()

resp = requests.get('http://'+ ELASTIC_ADDR +'/tmdb/_analyze', data=params, headers=headers)

json_str= json.dumps(json.loads(resp.text), indent=2, ensure_ascii=False).encode('utf-8')
print(json_str.decode())

{
  "detail": {
    "custom_analyzer": true,
    "charfilters": [],
    "tokenizer": {
      "name": "standard",
      "tokens": [
        {
          "token": "patrick",
          "start_offset": 0,
          "end_offset": 7,
          "type": "<ALPHANUM>",
          "position": 0,
          "bytes": "[70 61 74 72 69 63 6b]",
          "positionLength": 1,
          "termFrequency": 1
        },
        {
          "token": "stewart",
          "start_offset": 8,
          "end_offset": 15,
          "type": "<ALPHANUM>",
          "position": 1,
          "bytes": "[73 74 65 77 61 72 74]",
          "positionLength": 1,
          "termFrequency": 1
        }
      ]
    },
    "tokenfilters": [
      {
        "name": "lowercase",
        "tokens": [
          {
            "token": "patrick",
            "start_offset": 0,
            "end_offset": 7,
            "type": "<ALPHANUM>",
            "position": 0,
            "bytes": "[70 61 74 72 69 63 6b]",
            "positionLeng

Agora vamos pesquisar utilizando os campos bigrama.

In [18]:
usersSearch = 'patrick stewart'
query = {
    'query': {
        'multi_match': { 
            'query': usersSearch,  #User's query
            'fields': ['title', 'overview', 'cast.name.bigramed', 'directors.name.bigramed'],      
            'type': 'best_fields'
         }
    },
    'size': 50,
    'explain': True
}

df = search_elastic(usersSearch, query)
df_resumido = df[['Relevance Score', 'Movie Title']]
df_resumido.head(15)

Elasticsearch results


Unnamed: 0,Relevance Score,Movie Title
0,11.073451,X-Men: O Confronto Final
1,9.486658,Logan
2,7.925139,X-Men: Dias de um Futuro Esquecido
3,7.080252,Bambi 2
4,6.966468,Jornada nas Estrelas: Primeiro Contato
5,6.848892,O Piano
6,6.74953,Jornada nas Estrelas: Generations
7,6.74953,Gnomeu e Julieta
8,6.64605,Excalibur
9,6.64605,Jornada nas Estrelas: N√™mesis


In [19]:
df.head(15)

Unnamed: 0,Num,Relevance Score,Movie Title,Overview,Cast,Director
0,1,11.073451,X-Men: O Confronto Final,"√â descoberta uma cura para os mutantes, que agora podem optar por manter seus poderes ou se tornarem seres humanos normais. A descoberta p√µe em campos opostos Magneto (Ian McKellen), que acredita que esta cura se tornar√° uma arma contra os mutantes, e os X-Men, liderados pelo professor Charles Xavier (Patrick Stewart).","[Hugh Jackman, Halle Berry, Ian McKellen, Patrick Stewart, Famke Janssen, Anna Paquin, Kelsey Grammer, James Marsden, Rebecca Romijn, Shawn Ashmore, Aaron Stanford, Vinnie Jones, Ellen Page, Daniel Cudmore, Ben Foster, Michael Murphy, Dania Ramirez, Shohreh Aghdashloo, Josef Sommer, Bill Duke, Eric Dane, Desiree Zurowski, Adrian Hough, Haley Ramm, Chris Claremont, Stan Lee, Cayden Boyd, Tanya Newbould, Anthony Heald, Cameron Bright, Connor Widdows, Kea Wong, Shauna Kain, Luke Pohl, Julian Richings, Lloyd Adams, Richard Yee, Via Saleaumua, Meiling Melan√ßon, Omahyra Mota, Clayton Watmough, Ken Leung, Julian Christopher, Brad Kelly, Makenzie Vega Norfolk, Mi-Jung Lee, Benita Ha, Ron James, R. Lee Ermey, Lance Gibson, Aaron Pearl, Chelah Horsdal, John Pyper-Ferguson, Brenna O'Brien, Justin Callan, Alex Ferris, Peter Kawasaki, Ron Blecker, Emy Aneke, David Smith, Olivia Williams]",[Brett Ratner]
1,2,9.486658,Logan,"Em 2029, Logan (Hugh Jackman) ganha a vida como chofer de limousine para cuidar do nonagen√°rio Charles Xavier (Patrick Stewart). Debilitado fisicamente e esgotado emocionalmente, ele √© procurado por Gabriela (Elizabeth Rodriguez), uma mexicana que precisa da ajuda do ex-X-Men para defender a pequena Laura Kinney / X-23 (Dafne Keen). Ao mesmo tempo em que se recusa a voltar √† ativa, Logan √© perseguido pelo mercen√°rio Donald Pierce (Boyd Holbrook), interessado na menina.","[Hugh Jackman, Patrick Stewart, Dafne Keen, Boyd Holbrook, Stephen Merchant, Elizabeth Rodriguez, Richard E. Grant, Eriq La Salle, Elise Neal, Quincy Fouse, Al Coronel, Frank Gallegos, Anthony Escobar, Reynaldo Gallegos, Krzysztof Soszynski, Stephen Dunlevy, Daniel Bernhardt, Ryan Sturz, Brandon Melendy, Jeremy Fitzgerald, Luke Hawx, Chris Palermo, Paul Andrew O'Connor, Clinton Roberts, Rocky Abou-Sakher, Keith Jardine, Jean Claude Leuyer, Andrew Arrabito, Jef Groff, Sebastian James, Aaron Matthews, Garrett Hammond, Matt McClain, Maureen Brennan, Jayson Genao, Hannah Westerfield, Bryant Tardy, Ashlyn Casalegno, Alison Fernandez, Parker Lovein, Jimmy Gonzales, Dave Davis, Lennie Loftin, Mark Ashworth, James Handy, Bryce Romero, Phi Vu, Chester Rushing, David Simpson, Lauren Gros, John Raymond, Vanessa Cloke, Doris Morgado, Katie Anne Mitchell, Lara Grice, James Moses Black, Ned Yousef, Michael Lehr, Baxter Humby, Bryan Sloyer, Daniel Hern√°ndez, John Bernecker, Evan Dane Taylor, Joe Williams, Toby Holguin, Robert Wu, Panuvat Anthony Nanakornpanom, Victor Winters-Junco, Eyad Elbitar, Craig Henningsen, Han Soto, Rissa Rose Kilar, Salef Celiz, Aidan Kennedy, Nayah Murphy, Chase Cubia, Emma Teo, Vincenzo Lucatorto, Noell Jellison, Haley Glass, Ella Rowbotham, Hudson Wright, Sebeon Jackson, Kelton DuMont, Damon Carney, Cynthia Woods, Mali O'Connor, David Kallaway, Robert Vargas, David Paris, Sienna Novikov, Ted Ferguson, Juan Gaspard, Julia Holt, Gonzalo Robles]",[James Mangold]
2,3,7.925139,X-Men: Dias de um Futuro Esquecido,"No futuro, os mutantes s√£o ca√ßados impiedosamente pelos Sentinelas, gigantescos rob√¥s criados por Bol√≠var Trask (Peter Dinklage). Os poucos sobreviventes precisam viver escondidos, caso contr√°rio ser√£o tamb√©m mortos. Entre eles est√£o o professor Charles Xavier (Patrick Stewart), Magneto (Ian McKellen), Tempestade (Halle Berry), Kitty Pryde (Ellen Page) e Wolverine (Hugh Jackman), que buscam um meio de evitar que os mutantes sejam aniquilados. O meio encontrado √© enviar a consci√™ncia de Wolverine em uma viagem no tempo, rumo aos anos 1970. L√° ela ocupa o corpo do Wolverine da √©poca, que procura os ainda jovens Xavier (James McAvoy) e Magneto (Michael Fassbender) para que, juntos, impe√ßam que este futuro tr√°gico para os mutantes se torne realidade.","[Hugh Jackman, James McAvoy, Michael Fassbender, Jennifer Lawrence, Halle Berry, Nicholas Hoult, Anna Paquin, Ellen Page, Peter Dinklage, Shawn Ashmore, Omar Sy, Evan Peters, Josh Helman, Daniel Cudmore, Fan Bingbing, Adan Canto, Booboo Stewart, Ian McKellen, Patrick Stewart, Famke Janssen, James Marsden, Lucas Till, Evan Jonigkeit, Mark Camacho, Alexander Felici, Jan Gerste, Massimo Cannistraro, Mike Dopud, Lee Villeneuve, Andreas Apergis, Robert Montcalm, Gregg Lowe, Jaa Smith-Johnson, Alex Ivanovici, Alain Dahan, Freddy Bessa, Patricia Tougas, Michael Lerner, Chris Claremont, Len Wein, Fran√ßois Paquette, Zabryna Guevara, Zehra Leverman, Angela Galuppo, Milo Chang Sigel, Kiana Chang Sigel, Victor Cornfoot, Brent Skagford, Kyle Gatehouse, John-sebastien Cote, St√©phane Julien, Taris Tyler, Darryl Scheelar, Thai-Hoa Le, Johnny Tran, Gregory Hlady, Dang Quoc Thinh, Vladimir Aksenov, Jimmy Chan, Julian Casey, Robert Crooks, Matt Cooke, Tim Post, Jason Deline, Karine Vanasse, Pierre LeBlanc, Jude Beny, Arthur Holden, Susanna Fournier, Andrew Peplowski, John Sanford Moore, Moe Jeudy-Lamour, Harry Standjofski, Brianna Bone, Neil Napier, Jason Koehler, Miya Shelton-Contreras, Mizinga Mwinga, Christian Jadah, Kelsey Grammer, Brendan Pedder, Bryan Singer, Morgan Lily, Sean Curley]",[Bryan Singer]
3,4,7.080252,Bambi 2,"A hist√≥ria de Bambi crescendo sob os cuidados de seu pai, o Grande Pr√≠ncipe da Floresta.","[Patrick Stewart, Alexander Gould, Keith Ferguson, Brendon Baerg, Nicky Jones, Andrea Bowen, Anthony Ghannam, Makenna Cowgill, Emma Rose Lima, Ariel Winter, Brian Pimental, Carolyn Hennesy, Cree Summer]",[Brian Pimental]
4,5,6.966468,Jornada nas Estrelas: Primeiro Contato,"O capit√£o Jean-Luc e a tripula√ß√£o da Enterprise embarcam em uma nova aventura, a qual √© um confronto com os Borgs, criaturas meio org√¢nicas e meio m√°quinas que formam uma comunidade que possui um √∫nico objetivo: conquistar e assimilar todas as ra√ßas. Liderados por sua sedutora e s√°dica rainha, os Borgs seguem para a Terra com um plano demon√≠aco para alterar a hist√≥ria. O √∫ltimo encontro entre Picard e os Borgs quase o matou e agora ele quer vingan√ßa.","[Patrick Stewart, Jonathan Frakes, Brent Spiner, LeVar Burton, Michael Dorn, Gates McFadden, Marina Sirtis, James Cromwell, Alfre Woodard, Alice Krige, Neal McDonough, Dwight Schultz, Cameron Oppenheimer, Robert Picardo, Adam Scott]",[Jonathan Frakes]
5,6,6.848892,O Piano,"Em meados do s√©culo XIX, Ada √© uma mulher muda que tem uma filha - Flora. Para um casamento arranjado ela deixa sua terra natal, a Esc√≥cia, acompanhada de sua filha e seu amado piano. A vida nas florestas densas de uma ilha ao sul da Nova Zel√¢ndia e o relacionamento com seu marido Stewart n√£o s√£o o que ela esperava. Quando Stewart vende o piano para seu vizinho, George, Ada sofre muito. George diz que pode lhe devolver o piano se ela o ensinar a tocar. A princ√≠pio Ada ignora George, mas lentamente o relacionamento deles se transforma, levando-os a uma situa√ß√£o perigosa.","[Holly Hunter, Harvey Keitel, Sam Neill, Anna Paquin, Cliff Curtis, Kerry Walker, Tungia Baker, Ian Mune, Genevieve Lemon, Pete Smith, Te Whatanui Skipwith, Bruce Allpress, Rose McIver, Neil Gudsell, Jon Sperry, Verity George, Stephen Papps]",[Jane Campion]
6,7,6.74953,Jornada nas Estrelas: Generations,"A viagem inaugural da terceira nave Enterprise est√° amea√ßada pelo cientista louco Soren e apenas uma pessoa pode det√™-lo, mas ela est√° morta h√° 78 anos.","[Patrick Stewart, Jonathan Frakes, Brent Spiner, LeVar Burton, Michael Dorn, Gates McFadden, Marina Sirtis, William Shatner, James Doohan, Walter Koenig, Malcolm McDowell, Alan Ruck, Whoopi Goldberg, Thomas Dekker, Cameron Oppenheimer, Jenette Goldstein, Tim Russ]",[David Carson]
7,8,6.74953,Gnomeu e Julieta,"Gnomeu (James McAvoy) e Julieta (Emily Blunt) s√£o an√µes de jardim cujas fam√≠lias s√£o vizinhas e rivais. Um dia eles se apaixonam, para desgosto dos familiares. Para ficarem juntos, eles precisar√£o enfrentar diversos obst√°culos.","[James McAvoy, Emily Blunt, Michael Caine, Maggie Smith, Julie Walters, Jim Cummings, Jason Statham, Ashley Jensen, Matt Lucas, Ozzy Osbourne, Patrick Stewart, Stephen Merchant, Dolly Parton, Hulk Hogan, Richard Wilson, Julio Bonet, Julia Braams]",[Kelly Asbury]
8,9,6.64605,Excalibur,"O mago Merlin (Nicol Williamson) d√° ao rei Uther Pendragon (Gabriel Byrne) a m√≠stica Excalibur, a espada do poder. Durante uma emboscada Uther √© ferido mortalmente e, pouco antes de morrer, enterra a espada em uma pedra. Fica ent√£o decidido que o cavaleiro que puder retir√°-la da pedra ser√° o novo rei, mas ningu√©m consegue. Anos depois o pa√≠s estava divido em guerra entre os senhores feudais e Arthur (Nigel Terry), um jovem escudeiro, retira facilmente a espada da pedra. Alguns nobres juram fidelidade ao novo rei e Merlin relata que Arthur √© um filho bastardo de Uther, mas alguns nobres n√£o aceitam sua autoridade.","[Nigel Terry, Helen Mirren, Nicholas Clay, Cherie Lunghi, Paul Geoffrey, Nicol Williamson, Corin Redgrave, Patrick Stewart, Keith Buckley, Clive Swift, Liam Neeson, Gabriel Byrne, Robert Addie, Katrine Boorman, Ciar√°n Hinds, Niall O'Brien, Charley Boorman, Br√≠d Brennan]",[John Boorman]
9,10,6.64605,Jornada nas Estrelas: N√™mesis,"O capit√£o Jean-Luc Picard e a tripula√ß√£o da Enterprise s√£o enviados em uma miss√£o diplom√°tica de paz rumo ao planeta Romulus. L√° eles precisam deter uma rebeli√£o liderada por Shinzou que amea√ßa destruir a Terra, bem como enfrentar um perigoso clone do pr√≥prio capit√£o Picard.","[Patrick Stewart, Jonathan Frakes, Brent Spiner, LeVar Burton, Michael Dorn, Gates McFadden, Marina Sirtis, Tom Hardy, Ron Perlman, Shannon Cochran, Dina Meyer, Kate Mulgrew, Wil Wheaton, Whoopi Goldberg, Stuart Baird, Alan Dale, Bryan Singer, David Ralphe]",[Stuart Baird]


O que aconteceu? Existem alguns intrusos, como "O Piano" e "Um corpo que cai". üòßüò≥üò≤

Vamos entender a pontua√ß√£o.

In [20]:
query['explain'] = True
httpResp = requests.get('http://'+ ELASTIC_ADDR +'/tmdb/_search', data=json.dumps(query), headers=headers)
jsonResp = json.loads(httpResp.text)
print("Explain for %s" % jsonResp['hits']['hits'][0]['_source']['title'])
print(simplerExplain(jsonResp['hits']['hits'][0]['_explanation']))
print("Explain for %s" % jsonResp['hits']['hits'][1]['_source']['title'])
print(simplerExplain(jsonResp['hits']['hits'][1]['_explanation']))
print("Explain for %s" % jsonResp['hits']['hits'][2]['_source']['title'])
print(simplerExplain(jsonResp['hits']['hits'][2]['_explanation']))
print("Explain for %s" % jsonResp['hits']['hits'][3]['_source']['title'])
print(simplerExplain(jsonResp['hits']['hits'][3]['_explanation']))
print("Explain for %s" % jsonResp['hits']['hits'][25]['_source']['title'])
print(simplerExplain(jsonResp['hits']['hits'][25]['_explanation']))

Explain for X-Men: O Confronto Final
11.073451, max of:
  11.073451, sum of:
    5.235121, weight(overview:patrick in 4265) [PerFieldSimilarity], result of:
      5.235121, score(freq=1.0), computed as boost * idf * tf from:
        2.2, boost
        4.799368, idf, computed as log(1 + (N - n + 0.5) / (n + 0.5)) from:
          56, n, number of documents containing term
          6860, N, total number of documents with field
        0.49581534, tf, computed as freq / (freq + k1 * (1 - b + b * dl / avgdl)) from:
          1.0, freq, occurrences of term within document
          1.2, k1, term saturation parameter
          0.75, b, length normalization parameter
          34.0, dl, length of field
          42.684986, avgdl, average length of field
    5.8383303, weight(overview:stewart in 4265) [PerFieldSimilarity], result of:
      5.8383303, score(freq=1.0), computed as boost * idf * tf from:
        2.2, boost
        5.3523684, idf, computed as log(1 + (N - n + 0.5) / (n + 0.5)) fro

Se voc√™ usar best_fields, √© necess√°rio fornecer sinais precisos - sinais t√£o precisos que √© improv√°vel que o termo de pesquisa corresponda a muitos documentos. Ainda existe a possibilidade de v√°rios campos corresponderem. Portanto, voc√™ precisar√° definir boosts que declaram quais campos voc√™ considera melhor.

In [21]:
usersSearch = 'patrick stewart'
query = {
    'query': {
        'multi_match': { 
            'query': usersSearch,  #User's query
            'fields': ['title', 'overview', 'cast.name.bigramed^5', 'directors.name.bigramed'],      
            'type': 'best_fields'
         }
    },
    'size': 50,
    'explain': True
}

df = search_elastic(usersSearch, query)
df_resumido = df[['Relevance Score', 'Movie Title']]
df_resumido.head(15)

Elasticsearch results


Unnamed: 0,Relevance Score,Movie Title
0,35.40126,Bambi 2
1,34.83234,Jornada nas Estrelas: Primeiro Contato
2,33.74765,Jornada nas Estrelas: Generations
3,33.74765,Gnomeu e Julieta
4,33.230247,Excalibur
5,33.230247,Jornada nas Estrelas: N√™mesis
6,31.769058,O Menino Que Queria Ser Rei
7,31.310133,Teoria da Conspira√ß√£o
8,29.59979,Sala Verde
9,29.59979,"Pagemaster, o Mestre da Fantasia"


In [22]:
df.head(15)

Unnamed: 0,Num,Relevance Score,Movie Title,Overview,Cast,Director
0,1,35.40126,Bambi 2,"A hist√≥ria de Bambi crescendo sob os cuidados de seu pai, o Grande Pr√≠ncipe da Floresta.","[Patrick Stewart, Alexander Gould, Keith Ferguson, Brendon Baerg, Nicky Jones, Andrea Bowen, Anthony Ghannam, Makenna Cowgill, Emma Rose Lima, Ariel Winter, Brian Pimental, Carolyn Hennesy, Cree Summer]",[Brian Pimental]
1,2,34.83234,Jornada nas Estrelas: Primeiro Contato,"O capit√£o Jean-Luc e a tripula√ß√£o da Enterprise embarcam em uma nova aventura, a qual √© um confronto com os Borgs, criaturas meio org√¢nicas e meio m√°quinas que formam uma comunidade que possui um √∫nico objetivo: conquistar e assimilar todas as ra√ßas. Liderados por sua sedutora e s√°dica rainha, os Borgs seguem para a Terra com um plano demon√≠aco para alterar a hist√≥ria. O √∫ltimo encontro entre Picard e os Borgs quase o matou e agora ele quer vingan√ßa.","[Patrick Stewart, Jonathan Frakes, Brent Spiner, LeVar Burton, Michael Dorn, Gates McFadden, Marina Sirtis, James Cromwell, Alfre Woodard, Alice Krige, Neal McDonough, Dwight Schultz, Cameron Oppenheimer, Robert Picardo, Adam Scott]",[Jonathan Frakes]
2,3,33.74765,Jornada nas Estrelas: Generations,"A viagem inaugural da terceira nave Enterprise est√° amea√ßada pelo cientista louco Soren e apenas uma pessoa pode det√™-lo, mas ela est√° morta h√° 78 anos.","[Patrick Stewart, Jonathan Frakes, Brent Spiner, LeVar Burton, Michael Dorn, Gates McFadden, Marina Sirtis, William Shatner, James Doohan, Walter Koenig, Malcolm McDowell, Alan Ruck, Whoopi Goldberg, Thomas Dekker, Cameron Oppenheimer, Jenette Goldstein, Tim Russ]",[David Carson]
3,4,33.74765,Gnomeu e Julieta,"Gnomeu (James McAvoy) e Julieta (Emily Blunt) s√£o an√µes de jardim cujas fam√≠lias s√£o vizinhas e rivais. Um dia eles se apaixonam, para desgosto dos familiares. Para ficarem juntos, eles precisar√£o enfrentar diversos obst√°culos.","[James McAvoy, Emily Blunt, Michael Caine, Maggie Smith, Julie Walters, Jim Cummings, Jason Statham, Ashley Jensen, Matt Lucas, Ozzy Osbourne, Patrick Stewart, Stephen Merchant, Dolly Parton, Hulk Hogan, Richard Wilson, Julio Bonet, Julia Braams]",[Kelly Asbury]
4,5,33.230247,Excalibur,"O mago Merlin (Nicol Williamson) d√° ao rei Uther Pendragon (Gabriel Byrne) a m√≠stica Excalibur, a espada do poder. Durante uma emboscada Uther √© ferido mortalmente e, pouco antes de morrer, enterra a espada em uma pedra. Fica ent√£o decidido que o cavaleiro que puder retir√°-la da pedra ser√° o novo rei, mas ningu√©m consegue. Anos depois o pa√≠s estava divido em guerra entre os senhores feudais e Arthur (Nigel Terry), um jovem escudeiro, retira facilmente a espada da pedra. Alguns nobres juram fidelidade ao novo rei e Merlin relata que Arthur √© um filho bastardo de Uther, mas alguns nobres n√£o aceitam sua autoridade.","[Nigel Terry, Helen Mirren, Nicholas Clay, Cherie Lunghi, Paul Geoffrey, Nicol Williamson, Corin Redgrave, Patrick Stewart, Keith Buckley, Clive Swift, Liam Neeson, Gabriel Byrne, Robert Addie, Katrine Boorman, Ciar√°n Hinds, Niall O'Brien, Charley Boorman, Br√≠d Brennan]",[John Boorman]
5,6,33.230247,Jornada nas Estrelas: N√™mesis,"O capit√£o Jean-Luc Picard e a tripula√ß√£o da Enterprise s√£o enviados em uma miss√£o diplom√°tica de paz rumo ao planeta Romulus. L√° eles precisam deter uma rebeli√£o liderada por Shinzou que amea√ßa destruir a Terra, bem como enfrentar um perigoso clone do pr√≥prio capit√£o Picard.","[Patrick Stewart, Jonathan Frakes, Brent Spiner, LeVar Burton, Michael Dorn, Gates McFadden, Marina Sirtis, Tom Hardy, Ron Perlman, Shannon Cochran, Dina Meyer, Kate Mulgrew, Wil Wheaton, Whoopi Goldberg, Stuart Baird, Alan Dale, Bryan Singer, David Ralphe]",[Stuart Baird]
6,7,31.769058,O Menino Que Queria Ser Rei,"Alex (Louis Serkis) √© um garoto que enfrenta problemas no col√©gio, por sempre defender o amigo Bedders (Dean Chaumoo) dos valent√µes Lance (Tom Taylor) e Kaye (Rhianna Dorris). Um dia, ao fugir da dupla, ele se esconde em um canteiro de obras abandonado. L√° encontra uma espada encravada em uma pedra, da qual retira com grande facilidade. O que Alex n√£o sabia era que a espada era a lend√°ria Excalibur e que, como seu novo portador, precisa agora enfrentar a meia-irm√£ do rei Arthur, Morgana (Rebecca Ferguson), que est√° prestes a retomar seu poder. Para tanto, ele conta com a ajuda do mago Merlin (Angus Imrie), transformado em uma vers√£o bem mais jovem.","[Louis Ashbourne Serkis, Dean Chaumoo, Tom Taylor, Rhianna Dorris, Denise Gough, Angus Imrie, Patrick Stewart, Rebecca Ferguson, Genevieve O'Reilly, Noma Dumezweni, Nathan Stewart-Jarrett, Mark Bonnar, Alexandra Roach, Nick Mohammed, Adam Buxton, Claudie Blakley, Myra McFadyen, Adam Leese, Joey Ansah]",[Joe Cornish]
7,8,31.310133,Teoria da Conspira√ß√£o,"Em Nova York, Jerry Fletcher (Mel Gibson) √© um motorista de taxi que critica o governo e fala sempre da exist√™ncia de uma conspira√ß√£o envolvendo altos escal√µes. Ele ama Alice Sutton (Julia Roberts), uma mulher que ele observa √† dist√¢ncia e que ironicamente trabalha para o governo. Por√©m, nela Jerry acredita, tanto que faz alvoro√ßo no Departamento de Justi√ßa para falar com Alice, mas ningu√©m lhe d√° aten√ß√£o sobre suas teorias, que envolvem alien√≠genas e assassinatos. No entanto, ele escreveu algo em seu jornal (com apenas 5 assinantes) que algu√©m acreditou, pois decidiram mat√°-lo de qualquer jeito.","[Mel Gibson, Julia Roberts, Patrick Stewart, Cylk Cozart, Steve Kahan, Terry Alexander, Alex McArthur, Rod McLachlan, Michael Potts, Jim Sterling, Rich Hebert, Brian J. Williams, G. A. Aguilar, Cece Neber Labao, Saxon Trainor, Sage Allen, Joanna Sanchez, Andrew Lauren, Danny Smith]",[Richard Donner]
8,9,29.59979,Sala Verde,"Ap√≥s terminarem seu show, uma banda de rock acaba testemunhando um terr√≠vel ato de viol√™ncia e um brutal assassinato. Como eles s√£o as √∫nicas testemunhas do crime, eles logos se tornam o principal alvo de uma gangue de skinheads. A banda, ent√£o, ter√° que se refugiar na ""sala verde"" se quiser sobreviver a ""queima de arquivos"" promovida pelos brutais assassinos.","[Anton Yelchin, Imogen Poots, Alia Shawkat, Joe Cole, Callum Turner, Patrick Stewart, Mark Webber, Eric Edelstein, Macon Blair, Kai Lennox, David W. Thompson, Michael Draper, Andy Copeland, Brent Werzner, Lj Klink, Kasey Brown, Taylor Tunes, Jake Love, Kyle Love, October Moore, Joseph Bert√≥t, Jacob Kasch, Samuel Summer, Mason Knight, Colton Ruscheinsky]",[Jeremy Saulnier]
9,10,29.59979,"Pagemaster, o Mestre da Fantasia","Garoto que n√£o gosta de livros, fugindo de uma tempestade, abriga-se em biblioteca. L√° encontra Pagemaster, o mestre da fantasia, que o leva por uma viagem encantada com seus amigos, Aventura, Fantasia e Terror, pelas p√°ginas dos livros.","[Macaulay Culkin, Christopher Lloyd, Patrick Stewart, Whoopi Goldberg, Canan J. Howell, Alexis Kirschner, Jessica Kirschner, Guy Mansker, Brandon S. McKay, Ed Begley Jr., Mel Harris, Frank Welker, Leonard Nimoy, George Hearn, Dorian Harewood, Ed Gilbert, Richard Erdman, Fernando Escandon, Robert Picardo, Phil Hartman, Jim Cummings, B. J. Ward]","[Joe Johnston, Pixote Hunt]"


No caso acima, todos os filmes estrelaram Patrick Stewart.

### 3. best_field com tie_breaker

√â muito comum usu√°rios submeterem consultas unindo v√°rios crit√©rios. Por exemplo, uma busca por filme e diretor ao mesmo tempo.

√â poss√≠vel selecionar qual o melhor campo, mas utilizando outros signals para contruibuir ao score final.

Para isso, podemos usar o <b>tie_breaker</b>. O par√¢metro tie_breaker possibilita utilizar scores que n√£o ganharam no resultado final.

score = S-title + tie_breaker √ó (S-overview + S-cast.name + S-directors.name)

In [23]:
usersSearch = 'jornada nas estrelas patrick stewart'
query = {
    'query': {
        'multi_match': { 
            'query': usersSearch,  #User's query
            'fields': ['title', 'overview', 'cast.name.bigramed^5', 'directors.name.bigramed'],   
            'type': 'best_fields',
            'tie_breaker': 0.4
         }
    },
    'size': 50,
    'explain': True
}

df = search_elastic(usersSearch, query)
df_resumido = df[['Relevance Score', 'Movie Title']]
df_resumido.head(15)

Elasticsearch results


Unnamed: 0,Relevance Score,Movie Title
0,38.46595,Jornada nas Estrelas: Primeiro Contato
1,37.94318,Jornada nas Estrelas: Generations
2,37.425777,Jornada nas Estrelas: N√™mesis
3,35.40126,Bambi 2
4,33.74765,Gnomeu e Julieta
5,33.230247,Excalibur
6,31.769058,O Menino Que Queria Ser Rei
7,31.310133,Teoria da Conspira√ß√£o
8,29.627586,Jornada nas Estrelas: Insurrei√ß√£o
9,29.59979,Sala Verde


Porque Jornada nas Estrelas: Insurrei√ß√£o foi parar na 9¬™ posi√ß√£o? ü§î

In [24]:
df.head(15)

Unnamed: 0,Num,Relevance Score,Movie Title,Overview,Cast,Director
0,1,38.46595,Jornada nas Estrelas: Primeiro Contato,"O capit√£o Jean-Luc e a tripula√ß√£o da Enterprise embarcam em uma nova aventura, a qual √© um confronto com os Borgs, criaturas meio org√¢nicas e meio m√°quinas que formam uma comunidade que possui um √∫nico objetivo: conquistar e assimilar todas as ra√ßas. Liderados por sua sedutora e s√°dica rainha, os Borgs seguem para a Terra com um plano demon√≠aco para alterar a hist√≥ria. O √∫ltimo encontro entre Picard e os Borgs quase o matou e agora ele quer vingan√ßa.","[Patrick Stewart, Jonathan Frakes, Brent Spiner, LeVar Burton, Michael Dorn, Gates McFadden, Marina Sirtis, James Cromwell, Alfre Woodard, Alice Krige, Neal McDonough, Dwight Schultz, Cameron Oppenheimer, Robert Picardo, Adam Scott]",[Jonathan Frakes]
1,2,37.94318,Jornada nas Estrelas: Generations,"A viagem inaugural da terceira nave Enterprise est√° amea√ßada pelo cientista louco Soren e apenas uma pessoa pode det√™-lo, mas ela est√° morta h√° 78 anos.","[Patrick Stewart, Jonathan Frakes, Brent Spiner, LeVar Burton, Michael Dorn, Gates McFadden, Marina Sirtis, William Shatner, James Doohan, Walter Koenig, Malcolm McDowell, Alan Ruck, Whoopi Goldberg, Thomas Dekker, Cameron Oppenheimer, Jenette Goldstein, Tim Russ]",[David Carson]
2,3,37.425777,Jornada nas Estrelas: N√™mesis,"O capit√£o Jean-Luc Picard e a tripula√ß√£o da Enterprise s√£o enviados em uma miss√£o diplom√°tica de paz rumo ao planeta Romulus. L√° eles precisam deter uma rebeli√£o liderada por Shinzou que amea√ßa destruir a Terra, bem como enfrentar um perigoso clone do pr√≥prio capit√£o Picard.","[Patrick Stewart, Jonathan Frakes, Brent Spiner, LeVar Burton, Michael Dorn, Gates McFadden, Marina Sirtis, Tom Hardy, Ron Perlman, Shannon Cochran, Dina Meyer, Kate Mulgrew, Wil Wheaton, Whoopi Goldberg, Stuart Baird, Alan Dale, Bryan Singer, David Ralphe]",[Stuart Baird]
3,4,35.40126,Bambi 2,"A hist√≥ria de Bambi crescendo sob os cuidados de seu pai, o Grande Pr√≠ncipe da Floresta.","[Patrick Stewart, Alexander Gould, Keith Ferguson, Brendon Baerg, Nicky Jones, Andrea Bowen, Anthony Ghannam, Makenna Cowgill, Emma Rose Lima, Ariel Winter, Brian Pimental, Carolyn Hennesy, Cree Summer]",[Brian Pimental]
4,5,33.74765,Gnomeu e Julieta,"Gnomeu (James McAvoy) e Julieta (Emily Blunt) s√£o an√µes de jardim cujas fam√≠lias s√£o vizinhas e rivais. Um dia eles se apaixonam, para desgosto dos familiares. Para ficarem juntos, eles precisar√£o enfrentar diversos obst√°culos.","[James McAvoy, Emily Blunt, Michael Caine, Maggie Smith, Julie Walters, Jim Cummings, Jason Statham, Ashley Jensen, Matt Lucas, Ozzy Osbourne, Patrick Stewart, Stephen Merchant, Dolly Parton, Hulk Hogan, Richard Wilson, Julio Bonet, Julia Braams]",[Kelly Asbury]
5,6,33.230247,Excalibur,"O mago Merlin (Nicol Williamson) d√° ao rei Uther Pendragon (Gabriel Byrne) a m√≠stica Excalibur, a espada do poder. Durante uma emboscada Uther √© ferido mortalmente e, pouco antes de morrer, enterra a espada em uma pedra. Fica ent√£o decidido que o cavaleiro que puder retir√°-la da pedra ser√° o novo rei, mas ningu√©m consegue. Anos depois o pa√≠s estava divido em guerra entre os senhores feudais e Arthur (Nigel Terry), um jovem escudeiro, retira facilmente a espada da pedra. Alguns nobres juram fidelidade ao novo rei e Merlin relata que Arthur √© um filho bastardo de Uther, mas alguns nobres n√£o aceitam sua autoridade.","[Nigel Terry, Helen Mirren, Nicholas Clay, Cherie Lunghi, Paul Geoffrey, Nicol Williamson, Corin Redgrave, Patrick Stewart, Keith Buckley, Clive Swift, Liam Neeson, Gabriel Byrne, Robert Addie, Katrine Boorman, Ciar√°n Hinds, Niall O'Brien, Charley Boorman, Br√≠d Brennan]",[John Boorman]
6,7,31.769058,O Menino Que Queria Ser Rei,"Alex (Louis Serkis) √© um garoto que enfrenta problemas no col√©gio, por sempre defender o amigo Bedders (Dean Chaumoo) dos valent√µes Lance (Tom Taylor) e Kaye (Rhianna Dorris). Um dia, ao fugir da dupla, ele se esconde em um canteiro de obras abandonado. L√° encontra uma espada encravada em uma pedra, da qual retira com grande facilidade. O que Alex n√£o sabia era que a espada era a lend√°ria Excalibur e que, como seu novo portador, precisa agora enfrentar a meia-irm√£ do rei Arthur, Morgana (Rebecca Ferguson), que est√° prestes a retomar seu poder. Para tanto, ele conta com a ajuda do mago Merlin (Angus Imrie), transformado em uma vers√£o bem mais jovem.","[Louis Ashbourne Serkis, Dean Chaumoo, Tom Taylor, Rhianna Dorris, Denise Gough, Angus Imrie, Patrick Stewart, Rebecca Ferguson, Genevieve O'Reilly, Noma Dumezweni, Nathan Stewart-Jarrett, Mark Bonnar, Alexandra Roach, Nick Mohammed, Adam Buxton, Claudie Blakley, Myra McFadyen, Adam Leese, Joey Ansah]",[Joe Cornish]
7,8,31.310133,Teoria da Conspira√ß√£o,"Em Nova York, Jerry Fletcher (Mel Gibson) √© um motorista de taxi que critica o governo e fala sempre da exist√™ncia de uma conspira√ß√£o envolvendo altos escal√µes. Ele ama Alice Sutton (Julia Roberts), uma mulher que ele observa √† dist√¢ncia e que ironicamente trabalha para o governo. Por√©m, nela Jerry acredita, tanto que faz alvoro√ßo no Departamento de Justi√ßa para falar com Alice, mas ningu√©m lhe d√° aten√ß√£o sobre suas teorias, que envolvem alien√≠genas e assassinatos. No entanto, ele escreveu algo em seu jornal (com apenas 5 assinantes) que algu√©m acreditou, pois decidiram mat√°-lo de qualquer jeito.","[Mel Gibson, Julia Roberts, Patrick Stewart, Cylk Cozart, Steve Kahan, Terry Alexander, Alex McArthur, Rod McLachlan, Michael Potts, Jim Sterling, Rich Hebert, Brian J. Williams, G. A. Aguilar, Cece Neber Labao, Saxon Trainor, Sage Allen, Joanna Sanchez, Andrew Lauren, Danny Smith]",[Richard Donner]
8,9,29.627586,Jornada nas Estrelas: Insurrei√ß√£o,"No planeta Ba'ku, com apenas 600 habitantes, uma esta√ß√£o arqueol√≥gica da Federa√ß√£o em conjunto com a ra√ßa So'na √© atacada pelo tenente-comandante Data, enviado para observa√ß√µes. Mandado para investigar, Picard recebe a ordem de atacar o planeta, mas ele se rebela. O motivo do ataque: os So'na e a Federa√ß√£o querem a fonte da juventude que existe em Ba'ku.","[Patrick Stewart, Jonathan Frakes, Brent Spiner, LeVar Burton, Michael Dorn, Gates McFadden, Marina Sirtis, Gregg Henry, F. Murray Abraham, Anthony Zerbe, Donna Murphy, Stephanie Niznik, Rico Bueno, Daniel Hugh Kelly, Michael Welch, Mark Deakins, Michael Horton, Bruce French, Breon Gorman, John Hostetter, Rick Worthy, Larry Anderson, D. Elliot Woods, Jennifer Tung, Raye Birk, Peggy Miley, Claudette Nevins, Greg Poland, Kenneth Lane Edwards, Joseph Ruskin, Zachary Isaiah Williams, McKenzie Westmore, Phillip Glasser]",[Jonathan Frakes]
9,10,29.59979,Sala Verde,"Ap√≥s terminarem seu show, uma banda de rock acaba testemunhando um terr√≠vel ato de viol√™ncia e um brutal assassinato. Como eles s√£o as √∫nicas testemunhas do crime, eles logos se tornam o principal alvo de uma gangue de skinheads. A banda, ent√£o, ter√° que se refugiar na ""sala verde"" se quiser sobreviver a ""queima de arquivos"" promovida pelos brutais assassinos.","[Anton Yelchin, Imogen Poots, Alia Shawkat, Joe Cole, Callum Turner, Patrick Stewart, Mark Webber, Eric Edelstein, Macon Blair, Kai Lennox, David W. Thompson, Michael Draper, Andy Copeland, Brent Werzner, Lj Klink, Kasey Brown, Taylor Tunes, Jake Love, Kyle Love, October Moore, Joseph Bert√≥t, Jacob Kasch, Samuel Summer, Mason Knight, Colton Ruscheinsky]",[Jeremy Saulnier]


In [25]:
query['explain'] = True
httpResp = requests.get('http://'+ ELASTIC_ADDR +'/tmdb/_search', data=json.dumps(query), headers=headers)
jsonResp = json.loads(httpResp.text)
print("Explain for %s" % jsonResp['hits']['hits'][0]['_source']['title'])
print(simplerExplain(jsonResp['hits']['hits'][0]['_explanation']))
print("Explain for %s" % jsonResp['hits']['hits'][1]['_source']['title'])
print(simplerExplain(jsonResp['hits']['hits'][1]['_explanation']))
print("Explain for %s" % jsonResp['hits']['hits'][2]['_source']['title'])
print(simplerExplain(jsonResp['hits']['hits'][2]['_explanation']))
print("Explain for %s" % jsonResp['hits']['hits'][3]['_source']['title'])
print(simplerExplain(jsonResp['hits']['hits'][3]['_explanation']))
print("Explain for %s" % jsonResp['hits']['hits'][8]['_source']['title'])
print(simplerExplain(jsonResp['hits']['hits'][8]['_explanation']))

Explain for Jornada nas Estrelas: Primeiro Contato
38.46595, max plus 0.4 times others of:
  9.084022, sum of:
    4.662507, weight(title:jornad in 1652) [PerFieldSimilarity], result of:
      4.662507, score(freq=1.0), computed as boost * idf * tf from:
        2.2, boost
        5.9343514, idf, computed as log(1 + (N - n + 0.5) / (n + 0.5)) from:
          19, n, number of documents containing term
          7366, N, total number of documents with field
        0.35712767, tf, computed as freq / (freq + k1 * (1 - b + b * dl / avgdl)) from:
          1.0, freq, occurrences of term within document
          1.2, k1, term saturation parameter
          0.75, b, length normalization parameter
          4.0, dl, length of field
          2.3998098, avgdl, average length of field
    4.4215145, weight(title:estrel in 1652) [PerFieldSimilarity], result of:
      4.4215145, score(freq=1.0), computed as boost * idf * tf from:
        2.2, boost
        5.627621, idf, computed as log(1 + (N - 

Ao analisar os c√°lculos, percebemos que o <b>Jornada nas Estrelas: Insurrei√ß√£o</b> est√° com uma pontua√ß√£o inferior aos outros jornadas nas estrelas por causa da normaliza√ß√£o pelo tamanho do documento. A quantidade de atores neste filme √© superior aos demais.

<b>Ser√° que faz sentido utilizar normaliza√ß√£o pelo tamanho do documento em um campo que cont√©m nome de atores e diretores?</b>

### 3. most_fields

Quando os usu√°rios especificam v√°rios crit√©rios, a classifica√ß√£o combinando os signals correspondentes tende a se alinhar melhor com suas expectativas. Enquanto best_fields teria trabalhado duro para criar resultados desiguais, most_fields cria uma mistura de todas as pontua√ß√µes de campo fornecidas. Quando as expectativas dos usu√°rios n√£o priorizam um campo ou outro, mas preferem uma cole√ß√£o ad hoc de v√°rios campos, o most_fields √© uma √≥tima op√ß√£o.

Quando os usu√°rios n√£o t√™m um "alvo" claro em termos de um tipo espec√≠fico de campo a ser correspondido e, em vez disso, listam muitos crit√©rios de igual import√¢ncia, o most_fields √© a solu√ß√£o.

In [26]:
usersSearch = 'jornada nas estrelas patrick stewart'
query = {
    'query': {
        'multi_match': { 
            'query': usersSearch,
            'fields': ['title', 'overview', 'cast.name.bigramed', 'directors.name.bigramed'],      
            'type': 'most_fields'
         }
    },
    'size': 50,
    'explain': True
}

df = search_elastic(usersSearch, query)
df_resumido = df[['Relevance Score', 'Movie Title']]
df_resumido.head(15)

Elasticsearch results


Unnamed: 0,Relevance Score,Movie Title
0,17.238358,Jornada nas Estrelas: Generations
1,17.134876,Jornada nas Estrelas: N√™mesis
2,16.05049,Jornada nas Estrelas: Primeiro Contato
3,15.575237,Jornada nas Estrelas: Insurrei√ß√£o
4,14.970866,X-Men: O Confronto Final
5,14.712927,A Estrela de Bel√©m
6,14.485273,Stardust - O Mist√©rio da Estrela
7,12.353184,Logan
8,11.130836,X-Men: Dias de um Futuro Esquecido
9,10.488827,Jornada nas Estrelas: O Filme


Embora o most_fields tente fornecer resultados que correspondam aos mais crit√©rios, <b>a pontua√ß√£o do campo nem sempre coopera</b>. Lembre-se de que a pontua√ß√£o de um campo pode, naturalmente, ser uma ordem de magnitude superior a outra, por nenhum motivo espec√≠fico. Devido a diferen√ßas de pontua√ß√£o, voc√™ pode ter resultados de pesquisa que se pare√ßam mais com os desequil√≠brios do best_fields do que com os esperados most_fields.

Lembre-se de que as pontua√ß√µes dos campos n√£o s√£o realmente compar√°veis.Voc√™ precisar√° fazer boost para obter uma f√≥rmula que ofere√ßa um comportamento equilibrado.

O ponto principal √© que voc√™ precisa ajustar cuidadosamente os impulsos para fazer com que most_fields cumpra sua promessa. Caso contr√°rio, com uma pontua√ß√£o de campo arbitrariamente forte, voc√™ ter√° resultados inesperadamente desequilibrados. Enquanto o aumento em best_fields declara prioridade sobre quais correspond√™ncias de campo devem ocorrer em primeiro lugar na desigualdade esperada, o aumento em most_fields traz equil√≠brio aos termos resumidos para restaurar uma pontua√ß√£o mais mista de campos ponderados.

### 4. o calcanhar de aquiles: matches adicionais n√£o importam nesta estrat√©gia

Continuando com jornada nas estrelas, vamos agora buscar os filmes que estrelam Patrick Stewart e William Shatner. 

A estrat√©gia most_fields leva os documentos ao topo que correspondem a todos os crit√©rios. Parece uma coisa sensata a se fazer. Mas, em muitos casos, ter dois signals fortes n√£o deve ampliar a relev√¢ncia de um documento.

In [27]:
usersSearch = 'jornada nas estrelas patrick stewart william shatner'
query = {
    'query': {
        'multi_match': { 
            'query': usersSearch,  #User's query
            'fields': ['title', 'overview', 'cast.name.bigramed', 'directors.name.bigramed'],      
            'type': 'most_fields'
         }
    },
    'size': 50,
    'explain': True
}

df = search_elastic(usersSearch, query)
df_resumido = df[['Relevance Score', 'Movie Title']]
df_resumido.head(15)

Elasticsearch results


Unnamed: 0,Relevance Score,Movie Title
0,29.747679,Jornada nas Estrelas: O Filme
1,24.56131,Jornada nas Estrelas: Generations
2,23.75351,Jornada nas Estrelas V: A √öltima Fronteira
3,17.134876,Jornada nas Estrelas: N√™mesis
4,16.652632,M√°quina Quase Mort√≠fera
5,16.05049,Jornada nas Estrelas: Primeiro Contato
6,15.575237,Jornada nas Estrelas: Insurrei√ß√£o
7,15.334024,Jornada nas Estrelas II: A Ira de Khan
8,14.970866,X-Men: O Confronto Final
9,14.712927,A Estrela de Bel√©m


In [28]:
df.head(15)

Unnamed: 0,Num,Relevance Score,Movie Title,Overview,Cast,Director
0,1,29.747679,Jornada nas Estrelas: O Filme,"Um fen√¥meno alien√≠gena de poder e tamanho descomunal se aproxima da Terra, destruindo tudo em seu caminho. A √∫nica nave que pode enfrentar esta for√ßa letal que amea√ßa a Terra √© a U.S.S. Enterprise. O lend√°rio comandante James T. Kirk (William Shatner) √© convocado para a miss√£o, mas um perigo n√£o previsto pode destruir a U.S.S. Enterprise e toda a sua tripula√ß√£o.","[William Shatner, Leonard Nimoy, DeForest Kelley, Stephen Collins, Persis Khambatta, James Doohan, Nichelle Nichols, George Takei, Walter Koenig, Majel Barrett, Grace Lee Whitney, Mark Lenard, Billy Van Zandt, Roger Aaron Brown, Gary Faga, Franklyn Seales]",[Robert Wise]
1,2,24.56131,Jornada nas Estrelas: Generations,"A viagem inaugural da terceira nave Enterprise est√° amea√ßada pelo cientista louco Soren e apenas uma pessoa pode det√™-lo, mas ela est√° morta h√° 78 anos.","[Patrick Stewart, Jonathan Frakes, Brent Spiner, LeVar Burton, Michael Dorn, Gates McFadden, Marina Sirtis, William Shatner, James Doohan, Walter Koenig, Malcolm McDowell, Alan Ruck, Whoopi Goldberg, Thomas Dekker, Cameron Oppenheimer, Jenette Goldstein, Tim Russ]",[David Carson]
2,3,23.75351,Jornada nas Estrelas V: A √öltima Fronteira,"Data estelar: 8454.130. O capit√£o Kirk, que est√° de f√©rias, tem que enfrentar dois desafios: escalar o El Capitan, no Yosemite, e ensinar cantigas de acampamento para Spock. Mas o lazer √© bruscamente interrompido quando um vulcaniano renegado rapta a Enterprise e a leva para desvendar os mais profundos segredos do universo.","[William Shatner, Leonard Nimoy, DeForest Kelley, James Doohan, Walter Koenig, Nichelle Nichols, George Takei, David Warner, Laurence Luckinbill, Charles Cooper, Cynthia Gouw, Todd Bryant, Spice Williams-Crosby, Rex Holman, George Murdock, Jonathan Simpson, Beverly Hart, Steve Susskind, Harve Bennett, Cynthia Blaise, Bill Quinn, Melanie Shatner, Michael Berryman]",[William Shatner]
3,4,17.134876,Jornada nas Estrelas: N√™mesis,"O capit√£o Jean-Luc Picard e a tripula√ß√£o da Enterprise s√£o enviados em uma miss√£o diplom√°tica de paz rumo ao planeta Romulus. L√° eles precisam deter uma rebeli√£o liderada por Shinzou que amea√ßa destruir a Terra, bem como enfrentar um perigoso clone do pr√≥prio capit√£o Picard.","[Patrick Stewart, Jonathan Frakes, Brent Spiner, LeVar Burton, Michael Dorn, Gates McFadden, Marina Sirtis, Tom Hardy, Ron Perlman, Shannon Cochran, Dina Meyer, Kate Mulgrew, Wil Wheaton, Whoopi Goldberg, Stuart Baird, Alan Dale, Bryan Singer, David Ralphe]",[Stuart Baird]
4,5,16.652632,M√°quina Quase Mort√≠fera,"Eles s√£o uma dupla de pol√≠ciais que n√£o combina em nada, mas v√£o ter que se unir de um jeito ou de outro para resolver um caso muito arriscado e tirar uma gangue de criminosos das ruas da cidade. Parece "" M√°quina Mort√≠fera""? Na verdade, √© ""M√°quina Mort√≠fera""! Depois do assassinato de sua parceira, o sargento Wes Luger (Samuel L. Jackson) acaba fazendo uma explosiva parceria com o policial esquentadinho Jack Colt (Emilio Estevez) para impedir que um grupo de bandidos liderado pelo General Curtis Mortars (William Shatner) consiga a t√£o sonhada f√≥rmula que transforma coca√≠na em... Biscoitos!","[Emilio Estevez, Samuel L. Jackson, William Shatner, Tim Curry, Kathy Ireland, Whoopi Goldberg, Jon Lovitz, Frank McRae, F. Murray Abraham, Richard Moll, Denis Leary, Charlie Sheen, Corey Feldman, Bruce Willis, Lance Kinsey, Bill Nunn, Lin Shaye, James Doohan, Denise Richards, Phil Hartman, Charles Cyphers, Charles Napier, Rick Ducommun, Paul Gleason, Joyce Brothers, J.T. Walsh]",[Gene Quintano]
5,6,16.05049,Jornada nas Estrelas: Primeiro Contato,"O capit√£o Jean-Luc e a tripula√ß√£o da Enterprise embarcam em uma nova aventura, a qual √© um confronto com os Borgs, criaturas meio org√¢nicas e meio m√°quinas que formam uma comunidade que possui um √∫nico objetivo: conquistar e assimilar todas as ra√ßas. Liderados por sua sedutora e s√°dica rainha, os Borgs seguem para a Terra com um plano demon√≠aco para alterar a hist√≥ria. O √∫ltimo encontro entre Picard e os Borgs quase o matou e agora ele quer vingan√ßa.","[Patrick Stewart, Jonathan Frakes, Brent Spiner, LeVar Burton, Michael Dorn, Gates McFadden, Marina Sirtis, James Cromwell, Alfre Woodard, Alice Krige, Neal McDonough, Dwight Schultz, Cameron Oppenheimer, Robert Picardo, Adam Scott]",[Jonathan Frakes]
6,7,15.575237,Jornada nas Estrelas: Insurrei√ß√£o,"No planeta Ba'ku, com apenas 600 habitantes, uma esta√ß√£o arqueol√≥gica da Federa√ß√£o em conjunto com a ra√ßa So'na √© atacada pelo tenente-comandante Data, enviado para observa√ß√µes. Mandado para investigar, Picard recebe a ordem de atacar o planeta, mas ele se rebela. O motivo do ataque: os So'na e a Federa√ß√£o querem a fonte da juventude que existe em Ba'ku.","[Patrick Stewart, Jonathan Frakes, Brent Spiner, LeVar Burton, Michael Dorn, Gates McFadden, Marina Sirtis, Gregg Henry, F. Murray Abraham, Anthony Zerbe, Donna Murphy, Stephanie Niznik, Rico Bueno, Daniel Hugh Kelly, Michael Welch, Mark Deakins, Michael Horton, Bruce French, Breon Gorman, John Hostetter, Rick Worthy, Larry Anderson, D. Elliot Woods, Jennifer Tung, Raye Birk, Peggy Miley, Claudette Nevins, Greg Poland, Kenneth Lane Edwards, Joseph Ruskin, Zachary Isaiah Williams, McKenzie Westmore, Phillip Glasser]",[Jonathan Frakes]
7,8,15.334024,Jornada nas Estrelas II: A Ira de Khan,"Sentido que o futuro em nada se parece com o passado que vivemos, o Almirante James T. Kirk come√ßa a acreditar que cavalgar pelo cosmos √© um jogo para os jovens. At√© que numa viagem de rotina para inspecionar a U.S.S. Enterprise, a carreira de Kirk na Frota Estelar entra em um novo cap√≠tulo quando surge um antigo inimigo, Khan Noonien Singh, um conquistador do s√©culo 20 geneticamente alterado. Escapando de sua pris√£o, Khan planeja capturar o Projeto Genesis, um artefato que pode criar e destruir um planeta num piscar de olhos, e destruir seu velho ""amigo"", Kirk.","[William Shatner, Leonard Nimoy, DeForest Kelley, Ricardo Montalban, Kirstie Alley, Bibi Besch, Merritt Butrick, Walter Koenig, James Doohan, Nichelle Nichols, George Takei, Paul Winfield, Judson Scott, Ike Eisenmann, John Vargas, John Winston, Paul Kent]",[Nicholas Meyer]
8,9,14.970866,X-Men: O Confronto Final,"√â descoberta uma cura para os mutantes, que agora podem optar por manter seus poderes ou se tornarem seres humanos normais. A descoberta p√µe em campos opostos Magneto (Ian McKellen), que acredita que esta cura se tornar√° uma arma contra os mutantes, e os X-Men, liderados pelo professor Charles Xavier (Patrick Stewart).","[Hugh Jackman, Halle Berry, Ian McKellen, Patrick Stewart, Famke Janssen, Anna Paquin, Kelsey Grammer, James Marsden, Rebecca Romijn, Shawn Ashmore, Aaron Stanford, Vinnie Jones, Ellen Page, Daniel Cudmore, Ben Foster, Michael Murphy, Dania Ramirez, Shohreh Aghdashloo, Josef Sommer, Bill Duke, Eric Dane, Desiree Zurowski, Adrian Hough, Haley Ramm, Chris Claremont, Stan Lee, Cayden Boyd, Tanya Newbould, Anthony Heald, Cameron Bright, Connor Widdows, Kea Wong, Shauna Kain, Luke Pohl, Julian Richings, Lloyd Adams, Richard Yee, Via Saleaumua, Meiling Melan√ßon, Omahyra Mota, Clayton Watmough, Ken Leung, Julian Christopher, Brad Kelly, Makenzie Vega Norfolk, Mi-Jung Lee, Benita Ha, Ron James, R. Lee Ermey, Lance Gibson, Aaron Pearl, Chelah Horsdal, John Pyper-Ferguson, Brenna O'Brien, Justin Callan, Alex Ferris, Peter Kawasaki, Ron Blecker, Emy Aneke, David Smith, Olivia Williams]",[Brett Ratner]
9,10,14.712927,A Estrela de Bel√©m,"Na mais nova anima√ß√£o da Sony Pictures Animation, A Estrela, um pequeno e destemido burro chamado Bo anseia por uma vida que v√° al√©m da cota di√°ria de trabalho no moinho da vila. Um dia ele encontra coragem para fugir, e finalmente viver as aventuras que tanto sonhou. Em sua jornada, ele logo se alia √† Ruth, uma ovelha ador√°vel que se perdeu de seu bando; e √† Dave, um pombo com aspira√ß√µes grandiosas. E junto com 3 s√°bios camelos e outros animais exc√™ntricos de um est√°bulo, Bo e seus novos amigos seguem A Estrela e se tornam her√≥is improv√°veis na maior hist√≥ria j√° contada ‚Äì o primeiro Natal.","[Steven Yeun, Keegan-Michael Key, Aidy Bryant, Oprah Winfrey, Tyler Perry, Gina Rodriguez, Zachary Levi, Kelly Clarkson, Christopher Plummer, Tracy Morgan, Kristin Chenoweth, Anthony Anderson, Ving Rhames, Gabriel Iglesias, Patricia Heaton, Kris Kristofferson, Mariah Carey, Fred Tatasciore, Kari Wahlgren, Gregg Berger, Joel Osteen, Lex Lang, Roger Craig Smith, William Townsend, Stephen Apostolina, Kirk Baily, David Cowgill, June Christopher, Eddie Frierson, Rif Hutton, Mona Marshall, Caitlin McKenna-Wilkinson, Scott Menville, Warren Sroka, Pepper Sweeney, Grant George, Bridget Hoffman, Moira Quirk, Michelle Ruff, Joseph Sanfelippo, Justin Shenkarow]",[Timothy Reckart]


In [29]:
query['explain'] = True
httpResp = requests.get('http://'+ ELASTIC_ADDR +'/tmdb/_search', data=json.dumps(query), headers=headers)
jsonResp = json.loads(httpResp.text)
print("Explain for %s" % jsonResp['hits']['hits'][0]['_source']['title'])
print(simplerExplain(jsonResp['hits']['hits'][0]['_explanation']))
print("Explain for %s" % jsonResp['hits']['hits'][1]['_source']['title'])
print(simplerExplain(jsonResp['hits']['hits'][1]['_explanation']))
print("Explain for %s" % jsonResp['hits']['hits'][2]['_source']['title'])
print(simplerExplain(jsonResp['hits']['hits'][2]['_explanation']))
print("Explain for %s" % jsonResp['hits']['hits'][3]['_source']['title'])
print(simplerExplain(jsonResp['hits']['hits'][3]['_explanation']))
print("Explain for %s" % jsonResp['hits']['hits'][4]['_source']['title'])
print(simplerExplain(jsonResp['hits']['hits'][4]['_explanation']))
print("Explain for %s" % jsonResp['hits']['hits'][5]['_source']['title'])
print(simplerExplain(jsonResp['hits']['hits'][5]['_explanation']))

Explain for Jornada nas Estrelas: O Filme
29.747679, sum of:
  4.298673, weight(overview:william in 4067) [PerFieldSimilarity], result of:
    4.298673, score(freq=1.0), computed as boost * idf * tf from:
      2.2, boost
      4.146858, idf, computed as log(1 + (N - n + 0.5) / (n + 0.5)) from:
        108, n, number of documents containing term
        6860, N, total number of documents with field
      0.47118622, tf, computed as freq / (freq + k1 * (1 - b + b * dl / avgdl)) from:
        1.0, freq, occurrences of term within document
        1.2, k1, term saturation parameter
        0.75, b, length normalization parameter
        39.0, dl, length of field
        42.684986, avgdl, average length of field
  7.8583775, weight(overview:shatner in 4067) [PerFieldSimilarity], result of:
    7.8583775, score(freq=1.0), computed as boost * idf * tf from:
      2.2, boost
      7.5808454, idf, computed as log(1 + (N - n + 0.5) / (n + 0.5)) from:
        3, n, number of documents containing

Este √© o problema descrito como <b>o problema do elefante albino</b>: falha em dar um score maior para documentos que d√£o match em mais termos.

Entender o problema do elefante albino √© fundamental para honrar todos os termos de busca do usu√°rio. Ignorar termos de busca pode fazer sua pesquisa parecer burra para os usu√°rios.


H√° outro problema em rela√ß√£o √†s consultas centradas no campo: <b>signal discordance</b>. Este problema est√° relacionado a um score n√£o intuitivo das partes constituintes ao inv√©s de um score para todo o documento ou partes maiores mais intuitivas, como todo o texto do artigo ou todas as pessoas associadas ao filme.

A discord√¢ncia de sinal se manifesta com pontua√ß√µes de campo que n√£o s√£o mapeadas para as expectativas gerais do usu√°rio. Como os campos mant√™m suas pr√≥prias estat√≠sticas para classifica√ß√£o, como a frequ√™ncia de documentos de um termo, ter campos que n√£o s√£o mapeados para as expectativas mais gerais de nossos usu√°rios prejudica profundamente a classifica√ß√£o.

O exemplo anterior tamb√©m √© um exemplo de discord√¢ncia de signal, quando a ferramenta prioriza o documento "M√°quina Quase Mort√≠fera" em rela√ß√£o aos outros filmes de jornada nas estrelas.

<b>Assim, deve-se evitar um antipattern de most_fields: adicionar mais signals por causa dos signals! Muitas vezes, muitos matches em muitos campos n√£o correlacionam com uma maior relev√¢ncia.</b>