<img align="right" src="images/tf.png" width="128"/>
<img align="right" src="images/logo.png" width="128"/>
<img align="right" src="images/etcbc.png" width="128"/>
<img align="right" src="images/dans.png" width="128"/>

---

To get started: consult [start](start.ipynb)

---

# Search Introduction

*Search* in Text-Fabric is a template based way of looking for structural patterns in your dataset.

It is inspired by the idea of
[topographic query](http://books.google.nl/books?id=9ggOBRz1dO4C).

Within Text-Fabric we have the unique possibility to combine the ease of formulating search templates for
complicated patterns with the power of programmatically processing the results.

This notebook will show you how to get up and running.

## Alternative for hand-coding

Search is a powerful feature for a wide range of purposes.

Quite a bit of the implementation work has been dedicated to optimize performance.
Yet I do not pretend to have found optimal strategies for all 
possible search templates.
Some search tasks may turn out to be somewhat costly or even very costly.

That being said, I think search might turn out helpful in many cases,
especially by reducing the amount of hand-coding needed to work with special subsets of your data.

## Easy command

Search is as simple as saying (just an example)

```python
results = A.search(template)
A.show(results)
```

See all ins and outs in the
[search template docs](https://annotation.github.io/text-fabric/Use/Search/#search-templates).

In [1]:
%load_ext autoreload
%autoreload 2

In [2]:
from tf.app import use

If you want to use a version of the NENA texts ahead of a release, use the incantation with `hot` in it.
That will take time, not only for the download itself, but also for the one-time preprocessing of the data.

If you are content with the latest stable release, use the line without the `hot`.

In [10]:
#A = use('nena:hot', checkout='hot', hoist=globals())
A = use('nena:clone', checkout='clone', hoist=globals())
#A = use('nena', hoist=globals())

Using TF-app in /Users/dirk/github/annotation/app-nena/code:
	repo clone offline under ~/github (local github)
Using data in /Users/dirk/github/CambridgeSemiticsLab/nena_tf/tf/0.02:
	repo clone offline under ~/github (local github)
   |     0.00s No structure info in otext, the structure part of the T-API cannot be used


# Basic search command

We start with the most simple form of issuing a query.

Let's look for the foreign words.

In [11]:
query = '''
word foreign
'''
results = A.search(query)
A.table(results, end=10, showWord=True)

  0.10s 534 results


n,p,word
1,"Barwar, Gozali and Nozali, Ln. 21",everèst-
2,"Barwar, Gozali and Nozali, Ln. 29",ok
3,"Barwar, Gozali and Nozali, Ln. 96",princess
4,"Barwar, Measure for Measure, Ln. 1",familyˈ
5,"Barwar, Tales From the 1001 Nights, Ln. 52",chance
6,"Barwar, The Battle With Yuwanəs the Armenian, Ln. 16",ok
7,"Urmi_C, A Cure for a Husband’s Madness, Ln. 3",xolɑ̄sèˈ
8,"Urmi_C, A Cure for a Husband’s Madness, Ln. 6",bàby
9,"Urmi_C, A Cure for a Husband’s Madness, Ln. 11",áddress
10,"Urmi_C, A Dragon in the Well, Ln. 5",nafas-


We have multiple uncertain signs per word, 
and for each sign we see the whole word repeated.

We can condense our results to words:

In [5]:
A.table(results, end=10, condensed=True, condenseType='word')

n,p,word,sign,sign.1,sign.2,sign.3
1,CD 12:23,מתהלכים,כ,י,ם,מ
2,CD 15:11,יתפתה,ת,,,
3,CD 19:4,יתהלכו,י,,,
4,1QS 7:24,יתערב,י,ת,,
5,1QSa 1:11,התיצב,ת,,,
6,1QSb 4:2,התערב,ה,,,
7,1QM 13:12,יתהלכו,ו,,,
8,1QM 15:15,מתעתדים,ת,,,
9,1QM 16:6,התקרב,ר,,,
10,1QM 16:13,מתקרבים,י,,,


We can show them in rich layout as well:

In [6]:
A.table(results, end=10, condensed=True, condenseType='word', fmt='layout-orig-full')

n,p,word,sign,sign.1,sign.2,sign.3
1,CD 12:23,מתהלכים,כ,י,ם,מ
2,CD 15:11,יתפתה,ת,,,
3,CD 19:4,יתהלכו,י,,,
4,1QS 7:24,יתערב,י,ת,,
5,1QSa 1:11,התיצב,ת,,,
6,1QSb 4:2,התערב,ה,,,
7,1QM 13:12,יתהלכו,ו,,,
8,1QM 15:15,מתעתדים,ת,,,
9,1QM 16:6,התקרב,ר,,,
10,1QM 16:13,מתקרבים,י,,,


Note that we can choose start and/or end points in the results list.

In [7]:
A.table(results, start=100, end=110, condensed=True, condenseType='word', fmt='layout-orig-full')

n,p,word,sign,sign.1,Unnamed: 5,Unnamed: 6,Unnamed: 7
100,4Q405 f23i:11,יתכונו,ו,י,,,
101,4Q405 f25:3,מתהלכים,מ,ת,ה,כ,ם
102,4Q415 f12:4,התששו #,ש,ו,,,
103,4Q417 f1i:12,התהלכ׳ו,ו,,,,
104,4Q417 f1i:23,תתחזק,ח,ז,ת,,
105,4Q417 f2i:8,תתהלך,ת,ה,,,
106,4Q417 f19:4,יתהלך,ך,י,ת,ה,
107,4Q418 f2+2a_c:4,יתר,ר,,,,
108,4Q418 f9+9a_c:9,תתהלך,ת,ל,ך,ת,
109,4Q418 f9+9a_c:10,תתהלך,ת,ת,ה,,


We can show the results more fully with `show()`.

In [8]:
A.show(results, fmt='layout-orig-full', start=1, end=3)

# Condense results

There are two fundamentally different ways of presenting the results: condensed and uncondensed.

In **uncondensed** view, all results are listed individually.
You can keep track of which parts belong to which results.
The display can become unwieldy.

This is the default view, because it is the straightest, most logical, answer to your query.

In **condensed** view all nodes of all results are grouped in containers first (e.g. lines), and then presented 
container by container.
You loose the information of what parts belong to what result.

As an example of the difference, we look for all proper nouns, but only in lines where there is also
a word marked with paleohebrew script.

In [9]:
query = '''
line
  word sp=subs cl=prp
  word script=paleohebrew
% NB: the order of both words is not specified
% NB: both 'word' items may be instantiated by the same word
'''

Note that you can have comments in a search template. Comment lines start with a `%`.

In [10]:
results = A.search(query)
A.table(results, start=22, end=25, fmt='layout-orig-full')

  0.91s 731 results


n,p,line,word,word.1
22,4Q171 f1_2ii:12,זומם רשע לצדיק וחורק עלי׳ו שני׳ו ׃ יהוה ישחק ל׳ו כיא ראה,יהוה,יהוה
23,4Q171 f1_2ii:24,יהוה יודע יהוה ימי תמימים ונחלת׳ם לעולם תהיה ׃ פשר׳ו על אנשי,יהוה,יהוה
24,4Q171 f1_2ii:24,יהוה יודע יהוה ימי תמימים ונחלת׳ם לעולם תהיה ׃ פשר׳ו על אנשי,יהוה,יהוה
25,4Q171 f1+3_4iii:14,כיא מיהוה מצעדי גבר כוננו בכול דרכ׳ו יחפץ ׃ כיא יפול לוא,יהוה,יהוה


Note result 23: here both words in the query are instantiated by the same word, which satisfies both criteria!

In [11]:
A.table(results, start=30, end=40, fmt='layout-orig-full')

n,p,line,word,word.1
30,4Q183 f3:1,ε יהוה ε ׃,יהוה,יהוה
31,4Q267 f9v:4,יהודה ׃ וכול המתהלכים באלה ברית אל נאמנת,יהודה,אל
32,4Q318 4:9,תשרי בא֜ ובא֜א֜ עקרבא בא֜א֜א֜ ובא֜א֜א֜אׄ קשתא ובא֜א֜א֜א֜א֜ ובא֜א֜א֜א֜א֜א֜ ובא֜א֜א֜א֜א֜א֜א֜ גדיא בא֜א֜א֜אׄא֜א֜א֜אׄ ׃,תשרי,א֜
33,4Q318 4:9,תשרי בא֜ ובא֜א֜ עקרבא בא֜א֜א֜ ובא֜א֜א֜אׄ קשתא ובא֜א֜א֜א֜א֜ ובא֜א֜א֜א֜א֜א֜ ובא֜א֜א֜א֜א֜א֜א֜ גדיא בא֜א֜א֜אׄא֜א֜א֜אׄ ׃,תשרי,א֜א֜
34,4Q318 4:9,תשרי בא֜ ובא֜א֜ עקרבא בא֜א֜א֜ ובא֜א֜א֜אׄ קשתא ובא֜א֜א֜א֜א֜ ובא֜א֜א֜א֜א֜א֜ ובא֜א֜א֜א֜א֜א֜א֜ גדיא בא֜א֜א֜אׄא֜א֜א֜אׄ ׃,תשרי,א֜א֜א֜
35,4Q318 4:9,תשרי בא֜ ובא֜א֜ עקרבא בא֜א֜א֜ ובא֜א֜א֜אׄ קשתא ובא֜א֜א֜א֜א֜ ובא֜א֜א֜א֜א֜א֜ ובא֜א֜א֜א֜א֜א֜א֜ גדיא בא֜א֜א֜אׄא֜א֜א֜אׄ ׃,תשרי,א֜א֜א֜אׄ
36,4Q318 4:9,תשרי בא֜ ובא֜א֜ עקרבא בא֜א֜א֜ ובא֜א֜א֜אׄ קשתא ובא֜א֜א֜א֜א֜ ובא֜א֜א֜א֜א֜א֜ ובא֜א֜א֜א֜א֜א֜א֜ גדיא בא֜א֜א֜אׄא֜א֜א֜אׄ ׃,תשרי,א֜א֜א֜א֜א֜
37,4Q318 4:9,תשרי בא֜ ובא֜א֜ עקרבא בא֜א֜א֜ ובא֜א֜א֜אׄ קשתא ובא֜א֜א֜א֜א֜ ובא֜א֜א֜א֜א֜א֜ ובא֜א֜א֜א֜א֜א֜א֜ גדיא בא֜א֜א֜אׄא֜א֜א֜אׄ ׃,תשרי,א֜א֜א֜א֜א֜א֜
38,4Q318 4:9,תשרי בא֜ ובא֜א֜ עקרבא בא֜א֜א֜ ובא֜א֜א֜אׄ קשתא ובא֜א֜א֜א֜א֜ ובא֜א֜א֜א֜א֜א֜ ובא֜א֜א֜א֜א֜א֜א֜ גדיא בא֜א֜א֜אׄא֜א֜א֜אׄ ׃,תשרי,א֜א֜א֜א֜א֜א֜א֜
39,4Q318 4:9,תשרי בא֜ ובא֜א֜ עקרבא בא֜א֜א֜ ובא֜א֜א֜אׄ קשתא ובא֜א֜א֜א֜א֜ ובא֜א֜א֜א֜א֜א֜ ובא֜א֜א֜א֜א֜א֜א֜ גדיא בא֜א֜א֜אׄא֜א֜א֜אׄ ׃,תשרי,א֜א֜א֜אׄא֜א֜א֜אׄ


Note in passing that *numerals* are also marked in as paleohebrew.

Note results 32-39, all in the same line. Let's switch to condensed view.
Because results are counted differently now, we narrow down our search as well.

In [12]:
query = '''
line scroll=4Q318 fragment=4 line=9
  word sp=subs cl=prp
  word script=paleohebrew
'''
results = A.search(query)
A.table(results, fmt='layout-orig-full', condensed=True)

  0.96s 8 results


n,p,line,word,word.1,word.2,word.3,word.4,word.5,word.6,word.7,word.8
1,4Q318 4:9,תשרי בא֜ ובא֜א֜ עקרבא בא֜א֜א֜ ובא֜א֜א֜אׄ קשתא ובא֜א֜א֜א֜א֜ ובא֜א֜א֜א֜א֜א֜ ובא֜א֜א֜א֜א֜א֜א֜ גדיא בא֜א֜א֜אׄא֜א֜א֜אׄ ׃,תשרי,א֜,א֜א֜,א֜א֜א֜,א֜א֜א֜אׄ,א֜א֜א֜א֜א֜,א֜א֜א֜א֜א֜א֜,א֜א֜א֜א֜א֜א֜א֜,א֜א֜א֜אׄא֜א֜א֜אׄ


Let's expand the results display, first uncondensed, which takes a lot of space, so we show only two results:

In [13]:
A.show(results, end=2, withNodes=True, fmt='layout-orig-full')

As you see, the results are listed per result tuple, even if they occur all in the same line.
This way you can keep track of what exactly belongs to each result.

Now in condensed mode, and let's forget about the rich layout for a while:

In [14]:
A.show(results, condensed=True)

This line has 8 results, and all of them are highlighted in the same line display.

We can modify the container in which we see our results.

By default, it is `line`, but we can make it `fragment` as well:

In [15]:
A.show(results, condensed=True, condenseType='fragment')

We now see the the displays of the whole fragment, with the line with the proper names in it highlighted and the proper names 
themselves highlighted as well.

# Custom highlighting

Let us make a new search where we look for different things in the same line.

In [16]:
query = '''
line
  word sp=verb
  word sp=subs cl=prp
    sign cor
'''

In [17]:
results = A.search(query)
A.table(results, end=10, fmt='layout-orig-full')

  1.99s 2886 results


n,p,line,word,word.1,sign
1,CD 5:4,ויהושע ויושוע והזקנים אשר עבדו את העשתרת ׃ ויטמון,עבדו,יושוע,ו
2,CD 5:4,ויהושע ויושוע והזקנים אשר עבדו את העשתרת ׃ ויטמון,יטמון,יושוע,ו
3,1Q20 21:29,דקרנין ולזומזמיא די בעמן ולאימיא די בשוה הקריות ולחוריא די בטורי גבל עד דבקו לאיל,דבקו,זומזמי,מ
4,4Q201 f1i:1,מלי ברכתה די ברך ב׳הן חנוך לבחירין קשיטין די להוון ביום עקתה לאעדיה כל סניה,ברך,חנוך,ו
5,4Q201 f1i:1,מלי ברכתה די ברך ב׳הן חנוך לבחירין קשיטין די להוון ביום עקתה לאעדיה כל סניה,להוון,חנוך,ו
6,4Q201 f1i:1,מלי ברכתה די ברך ב׳הן חנוך לבחירין קשיטין די להוון ביום עקתה לאעדיה כל סניה,אעדיה,חנוך,ו
7,4Q201 f1i:1,מלי ברכתה די ברך ב׳הן חנוך לבחירין קשיטין די להוון ביום עקתה לאעדיה כל סניה,סניה,חנוך,ו
8,4Q252 3:7,אברהם את יד׳ו ויקח ε השמים,יקח,אברהם,ה
9,4Q259 3:3,מאלה מיראת רוח נסוגה ׃ ובהיות אלה לביחד ביל יבדלו ממושב,נסוגה,יל,י
10,4Q259 3:3,מאלה מיראת רוח נסוגה ׃ ובהיות אלה לביחד ביל יבדלו ממושב,נסוגה,יל,ל


We can apply different highlight colors to different parts of the result.

The line is member 1.
the words are members 2 and 3,
and the sign is member 4.

We do not give a colour to the line, the verb will have thedefault color,
the proper name cyan, and the sign magenta.

**NB:** You can choose your colors from the
[CSS specification](https://developer.mozilla.org/en-US/docs/Web/CSS/color_value).

In [18]:
colorMap = {2: '', 3: 'cyan', 4: 'magenta'}

A.table(results, end=10, fmt='layout-orig-full', colorMap=colorMap)

n,p,line,word,word.1,sign
1,CD 5:4,ויהושע ויושוע והזקנים אשר עבדו את העשתרת ׃ ויטמון,עבדו,יושוע,ו
2,CD 5:4,ויהושע ויושוע והזקנים אשר עבדו את העשתרת ׃ ויטמון,יטמון,יושוע,ו
3,1Q20 21:29,דקרנין ולזומזמיא די בעמן ולאימיא די בשוה הקריות ולחוריא די בטורי גבל עד דבקו לאיל,דבקו,זומזמי,מ
4,4Q201 f1i:1,מלי ברכתה די ברך ב׳הן חנוך לבחירין קשיטין די להוון ביום עקתה לאעדיה כל סניה,ברך,חנוך,ו
5,4Q201 f1i:1,מלי ברכתה די ברך ב׳הן חנוך לבחירין קשיטין די להוון ביום עקתה לאעדיה כל סניה,להוון,חנוך,ו
6,4Q201 f1i:1,מלי ברכתה די ברך ב׳הן חנוך לבחירין קשיטין די להוון ביום עקתה לאעדיה כל סניה,אעדיה,חנוך,ו
7,4Q201 f1i:1,מלי ברכתה די ברך ב׳הן חנוך לבחירין קשיטין די להוון ביום עקתה לאעדיה כל סניה,סניה,חנוך,ו
8,4Q252 3:7,אברהם את יד׳ו ויקח ε השמים,יקח,אברהם,ה
9,4Q259 3:3,מאלה מיראת רוח נסוגה ׃ ובהיות אלה לביחד ביל יבדלו ממושב,נסוגה,יל,י
10,4Q259 3:3,מאלה מיראת רוח נסוגה ׃ ובהיות אלה לביחד ביל יבדלו ממושב,נסוגה,יל,ל


In [19]:
A.show(results, end=3, fmt='layout-orig-full', colorMap=colorMap)

Color mapping works best for uncondensed results. If you condense results, some nodes may occupy
different positions in different results. It is unpredictable which color will be used 
for such nodes:

# Constraining order
You can stipulate an order on the things in your template.
You only have to put a relational operator between them.
Say we want only lines where a proper noun with an ancient correction precedes a verb

In [20]:
query = '''
line
  word sp=subs cl=prp
    sign cor
  < word sp=verb
'''

In [21]:
results = A.search(query)
A.table(results, end=10, fmt='layout-orig-full')

  1.76s 1555 results


n,p,line,word,sign,word.1
1,CD 5:4,ויהושע ויושוע והזקנים אשר עבדו את העשתרת ׃ ויטמון,יושוע,ו,עבדו
2,CD 5:4,ויהושע ויושוע והזקנים אשר עבדו את העשתרת ׃ ויטמון,יושוע,ו,יטמון
3,1Q20 21:29,דקרנין ולזומזמיא די בעמן ולאימיא די בשוה הקריות ולחוריא די בטורי גבל עד דבקו לאיל,זומזמי,מ,דבקו
4,4Q201 f1i:1,מלי ברכתה די ברך ב׳הן חנוך לבחירין קשיטין די להוון ביום עקתה לאעדיה כל סניה,חנוך,ו,להוון
5,4Q201 f1i:1,מלי ברכתה די ברך ב׳הן חנוך לבחירין קשיטין די להוון ביום עקתה לאעדיה כל סניה,חנוך,ו,אעדיה
6,4Q201 f1i:1,מלי ברכתה די ברך ב׳הן חנוך לבחירין קשיטין די להוון ביום עקתה לאעדיה כל סניה,חנוך,ו,סניה
7,4Q252 3:7,אברהם את יד׳ו ויקח ε השמים,אברהם,ה,יקח
8,4Q259 3:3,מאלה מיראת רוח נסוגה ׃ ובהיות אלה לביחד ביל יבדלו ממושב,יל,י,יבדלו
9,4Q259 3:3,מאלה מיראת רוח נסוגה ׃ ובהיות אלה לביחד ביל יבדלו ממושב,יל,ל,יבדלו
10,4Q266 f3ii:10,אל ברית רישונים ויקם מאהרון נבונים ומישראל חכמים ׃ וישמיע׳ם ויחפורו את הבאר אשר אמר מושה באר,ישראל,י,יחפורו


We can also require the things to be adjacent.

In [22]:
query = '''
line
  word sp=subs cl=prp
    sign cor
  <: word sp=verb
'''

In [23]:
results = A.search(query)
colorMap = {2: 'cyan', 3: 'magenta', 4: ''}
A.table(results, end=10, colorMap=colorMap, fmt='layout-orig-full')
A.show(results, end=3, colorMap=colorMap, fmt='layout-orig-full')

  1.81s 40 results


n,p,line,word,sign,word.1
1,4Q259 3:3,מאלה מיראת רוח נסוגה ׃ ובהיות אלה לביחד ביל יבדלו ממושב,יל,י,יבדלו
2,4Q259 3:3,מאלה מיראת רוח נסוגה ׃ ובהיות אלה לביחד ביל יבדלו ממושב,יל,ל,יבדלו
3,4Q364 f11:2,ולבנימים נתן שלוש מאות כסף וחמש חליפות שמלות ׃ ולאבי׳הו שלח כזואת,בנימים,י,נתן
4,1Qisaa 33:7,השדה ׃ יבש חציר נבל ציצ כי רוח יייי נשבה ב׳וא הכן חציר העם ׃ יבש חציל נבל ציצ ודבר אלוהי׳נו ודבר אלוהי׳נו יקום לעולם ׃,יייי,י,נשבה
5,1Qisaa 33:7,השדה ׃ יבש חציר נבל ציצ כי רוח יייי נשבה ב׳וא הכן חציר העם ׃ יבש חציל נבל ציצ ודבר אלוהי׳נו ודבר אלוהי׳נו יקום לעולם ׃,יייי,י,נשבה
6,1Qisaa 33:7,השדה ׃ יבש חציר נבל ציצ כי רוח יייי נשבה ב׳וא הכן חציר העם ׃ יבש חציל נבל ציצ ודבר אלוהי׳נו ודבר אלוהי׳נו יקום לעולם ׃,יייי,י,נשבה
7,1Qisaa 33:7,השדה ׃ יבש חציר נבל ציצ כי רוח יייי נשבה ב׳וא הכן חציר העם ׃ יבש חציל נבל ציצ ודבר אלוהי׳נו ודבר אלוהי׳נו יקום לעולם ׃,יייי,י,נשבה
8,1Qisaa 38:17,מה תחולי׳ן ׃ כוה אמר יהוה קדוש ישראל יוצר האותות שאלו׳ני על בנ׳י ועל פועל,ישראל,י,יוצר
9,1Qisaa 38:17,מה תחולי׳ן ׃ כוה אמר יהוה קדוש ישראל יוצר האותות שאלו׳ני על בנ׳י ועל פועל,ישראל,ש,יוצר
10,1Qisaa 38:17,מה תחולי׳ן ׃ כוה אמר יהוה קדוש ישראל יוצר האותות שאלו׳ני על בנ׳י ועל פועל,ישראל,ר,יוצר


Finally, we want the proper name start near the start of the line, i.e. nut further away than three signs.

In [24]:
query = '''
line
  =3: word sp=subs cl=prp
    sign cor
  <: word sp=verb
'''

In [25]:
results = A.search(query)
colorMap = {2: 'cyan', 3: 'magenta', 4: ''}
A.table(results, end=10, colorMap=colorMap, fmt='layout-orig-full')
A.show(results, end=3, colorMap=colorMap, fmt='layout-orig-full')

  2.10s 5 results


n,p,line,word,sign,word.1
1,4Q364 f11:2,ולבנימים נתן שלוש מאות כסף וחמש חליפות שמלות ׃ ולאבי׳הו שלח כזואת,בנימים,י,נתן
2,1Qisaa 43:14,עוז ציון לבשי בגדי תפארת׳ך ירושלם עיר הקודש כיא לוא יוסיף ויבוא,ציון,צ,לבשי
3,1Qisaa 43:14,עוז ציון לבשי בגדי תפארת׳ך ירושלם עיר הקודש כיא לוא יוסיף ויבוא,ציון,י,לבשי
4,1Qisaa 43:14,עוז ציון לבשי בגדי תפארת׳ך ירושלם עיר הקודש כיא לוא יוסיף ויבוא,ציון,ו,לבשי
5,1Qisaa 43:14,עוז ציון לבשי בגדי תפארת׳ך ירושלם עיר הקודש כיא לוא יוסיף ויבוא,ציון,ן,לבשי


# Custom feature display

We would like to see the original Abegg code with the marks and brackets.
They are in the feature `fullo` on words.

The way to do that, is to perform a `A.prettySetup(features)` first.

We concentrate on one specific result.

In [26]:
A.displaySetup(extraFeatures='fullo')

In [27]:
A.show(results, end=1, colorMap=colorMap, fmt='layout-orig-full')

The features without meaningful values have been left out. We can also change that by passing a set of values
we think are not meaningful. The default set is 

```python
{None, 'NA', 'none', 'unknown'}
```

In [28]:
A.displaySetup(noneValues=set())
A.show(results, end=1, colorMap=colorMap, fmt='layout-orig-full')

This makes clear that it is convenient to keep `None` in the `noneValues`:

In [29]:
A.displaySetup(noneValues={None})
A.show(results, end=1, colorMap=colorMap, fmt='layout-orig-full')

We can even choose to suppress other values, e.g. the value 1.

That will remove all the features such as `rec`.

In [30]:
A.displaySetup(noneValues={None, 'NA', 'unknown', 1})
A.show(results, end=1, colorMap=colorMap, fmt='layout-orig-full')

In the rest of the notebook we stick to our normal setup, so we reset the extra features.

In [31]:
A.displayReset()
A.show(results, end=1, colorMap=colorMap, fmt='layout-orig-full')

# Features from queries

In earlier displays we saw the *types* of signs, because the query mentioned it.

Suppose we want to display the type also here, then we can modify the query by mentioning the feature `type`.

But we do not want to impose extra limitations, so we say `type*`, meaning: no conditions on type whatsoever.

In [32]:
query = '''
line
  =3: word sp=subs cl=prp
    sign cor type*
  <: word sp=verb
'''

In [33]:
results = A.search(query)
A.show(results, end=1, colorMap=colorMap, fmt='layout-orig-full')

  2.08s 5 results


# Show your own tuples

So far we have `show()`n the results of searches.
But you can also construct your own tuples and show them.

Whereas you can use search to get a pretty good approximation of what you want, most of the times
you do not arrive precisely at your destination.

Here is an example where we use search to come close, and then work our way to produce the end result.

## More reconstructed/uncertain than certain

We look for lines that have more reconstructed/uncertain consonants than certain consonants.

In our search templates we cannot formulate that a feature has different values on two nodes in the template.
We could spell out all possible combinations of values and make a search template for each of them, 
but that is needlessly complex.

Let's first use search to find all lines containing reconstructed/uncertain/certain consonants.

In [34]:
query = f'''
line
/with/
  sign type=cons rec
/or/
  sign type=cons unc
/-/
/with/
  sign type=cons rec# unc#
/-/
'''
results = A.search(query)

  2.79s 34455 results


That is a lot, how does that compare to the total number of lines?

In [35]:
queryl = '''
line
'''
resultsl = A.search(queryl)

  0.06s 52895 results


or, by hand-coding:

In [36]:
len(F.otype.s('line'))

52895

Now the real hand-coding begins. We are going to extract the tuples we want.
How are they structured?

In [37]:
for (i, tup) in enumerate(results[0:5]):
  print(f'tuple {i}')
  for (j, n) in enumerate(tup):
    print(f'\tmember {j} = {F.otype.v(n)} {n}')
  

tuple 0
	member 0 = line 1552976
tuple 1
	member 0 = line 1553005
tuple 2
	member 0 = line 1553010
tuple 3
	member 0 = line 1553011
tuple 4
	member 0 = line 1553015


Very simple indeed!

Now we have all lines with hypothetical and certain consonants.

For each line we make a set with its hypothetical consonants and one with its certain consonants.

We filter in order to retain the lines with more hypothetical than certain consonants.
We put all hypothetical consonants in one big set and all certain consonants in one big set.

In [38]:
answer = []
hypo = set()
cert = set()

for (line,) in results:
  signs = L.d(line, otype='sign')
  myHypo = set()
  myCert = set()
  for s in signs:
    if F.type.v(s) != 'cons':
      continue
    if F.rec.v(s) or F.unc.v(s):
      myHypo.add(s)
    else:
      myCert.add(s)
  if len(myHypo) > len(myCert):
    answer.append((line, *myHypo, *myCert))
    hypo |= myHypo
    cert |= myCert
len(answer)

16060

One third of the lines is more than half uncertain!

In [39]:
answer[0]

(1553248,
 11299,
 11300,
 11301,
 11302,
 11308,
 11309,
 11310,
 11316,
 11317,
 11318,
 11319,
 11322,
 11323,
 11324,
 11325,
 11326,
 11327,
 11328,
 11329,
 11330,
 11333,
 11334,
 11291,
 11292,
 11293,
 11294,
 11295,
 11296,
 11297,
 11298,
 11303,
 11304,
 11305,
 11306,
 11307,
 11311,
 11312,
 11313,
 11314,
 11315,
 11331,
 11332)

We are going to make a dictionary of highligts: one color for the hypothetical signs and one for the certain.

In [40]:
highlights = {}
colorH = 'lightsalmon'
colorC = 'mediumaquamarine'
for s in hypo:
  highlights[s] = colorH
for s in cert:
  highlights[s] = colorC

And now we can show them:

In [41]:
A.show(answer, start=1, end=5, highlights=highlights)

As you see, you have total control.

---

All chapters:

* **[start](start.ipynb)** become an expert in creating pretty displays of your text structures
* **[display](display.ipynb)** become an expert in creating pretty displays of your text structures
* **search** turbo charge your hand-coding with search templates
* **[exportExcel](exportExcel.ipynb)** make tailor-made spreadsheets out of your results
* **[share](share.ipynb)** draw in other people's data and let them use yours
* **[similarLines](similarLines.ipynb)** spot the similarities between lines

---

See the [cookbook](cookbook) for recipes for small, concrete tasks.