<img align="right" src="images/tf.png" width="200"/>
<img align="right" src="images/huc.png" width="200"/>
<img align="right" src="images/logo.png" width="200"/>

---

To get started: consult [start](start.ipynb)

---

# Search Introduction

*Search* in Text-Fabric is a template based way of looking for structural patterns in your dataset.

Within Text-Fabric we have the unique possibility to combine the ease of formulating search templates for
complicated syntactical patterns with the power of programmatically processing the results.

This notebook will show you how to get up and running.

## Easy command

Search is as simple as saying (just an example)

```python
results = A.search(template)
A.show(results)
```

See all ins and outs in the
[search template docs](https://annotation.github.io/text-fabric/tf/about/searchusage.html).

# Incantation

The ins and outs of installing Text-Fabric, getting the corpus, and initializing a notebook are
explained in the [start tutorial](start.ipynb).

In [1]:
%load_ext autoreload
%autoreload 2

In [2]:
from tf.app import use

In [3]:
A = use("annotation/mondriaan", hoist=globals())

**Locating corpus resources ...**

Name,# of nodes,# slots/node,% coverage
folder,1,13761.0,100
letter,14,982.93,100
body,14,849.93,86
text,14,849.93,86
chunk,86,160.0,100
div,93,219.99,149
teiHeader,14,124.57,13
p,95,73.39,51
postscript,6,62.83,3
revisionDesc,14,61.0,6


# Basic search command

Note that we have divided the material of the letters into chunks.
Let's examine those chunks.

We start with the most simple form of issuing a query.
Let's look for the 8th chunk of every letter.

Note that chunks are numbered within letters and that the chunk number is in feature `chunk`.

In [4]:
template = """
chunk chunk=6
"""

results = A.search(template)

  0.00s 14 results


We see the amount of results, but how do we get the results?

In [5]:
results[0:10]

[(13998,),
 (14004,),
 (14010,),
 (14016,),
 (14022,),
 (14028,),
 (14035,),
 (14041,),
 (14048,),
 (14054,)]

Nice try. These are indeed the results, but they are just the nodes, i.e. meaningless numbers (to us).

We get more flesh and blood by displaying the results.

In [6]:
A.table(results, end=10)

n,p,chunk
1,proeftuin@19090216y_IONG_1303:6,
2,proeftuin@19090407y_IONG_1739:6,
3,proeftuin@19090421y_IONG_1304:6,
4,proeftuin@19090426y_IONG_1738:6,
5,proeftuin@19090513y_IONG_1293:6,
6,proeftuin@19090624_IONG_1294:6,
7,proeftuin@19090807y_IONG_1296:6,
8,proeftuin@19090824y_KNAP_1747:6,
9,proeftuin@19090905y_IONG_1295:6,
10,proeftuin@190909XX_QUER_1654:6,


In front of each result you see the folder name, file name, and chunk number of the result.

We can also show the text:

In [7]:
A.table(results, end=3, full=True)

n,p,chunk
1,proeftuin@19090216y_IONG_1303:6,"Manuscript. De brief is geschreven op een dinsdag voorafgaand aan een van de drie woensdagen waarop Richard Buhlig on 1909 in de kleine zaal van het Concertgebouw een concert zou geven: 17 februari, 3 maart en 10 maart. Zie tevens noot 1. ​Aletta werd binnen haar familie aangesproken met de koosnaam 'Zus' (Heteren 2018, p. 25) Mondriaans gebruik van deze naam geeft aan dat hij op intieme voet stond met De Iongh. De Amerikaanse pianist Richard Moritz Buhlig (1880-1952) gaf begin 1909 drie concerten in de kleine zaal van het Concertgebouw, op woensdag 17 februari, woensdag 3 maart en woensdag 10 maart. Het is niet bekend voor welke van deze concerten Mondriaan kaarten had. Dear Zus,​ If you come to the entrance to the small auditorium in the Concertgebouw at a quarter to eight tomorrow (Wednesday) evening, I have a ticket for van Buhlig for you.[2] And then we can arrange a time other than Thursday afternoon because I can’t manage that. With my very best wishes, your Piet."
2,proeftuin@19090407y_IONG_1739:6,"Manuscript. De brief dateert van kort voor Pasen 1909 (zie r. ***-*** ), dat op 8 april viel. Omdat Mondriaan en De Iongh doorgaans afspraken op donderdagen (zie: MEP_1294 van circa 21 juni 1909) is het waarschijnlijk dat Mondriaan op de donderdag vóór Pasen wilde afspreken. Daarom dateren we de brief op woensdag 7 april 1909. ​De envelop is niet overgeleverd. Mondriaan was in 1903 toegetreden tot de zaalbeheercommissie van kunstenaarsvereniging Sint Lucas. Hij zou die functie bekleden tot (Gorter 2017, p. 19). De tentoonstelling die werd voorbereid was de 19e Jaarlijksche Tentoonstelling, die plaatshad in het Stedelijk Museum van 11 april tot 16 mei 1909. In Arnhem bracht Mondriaan de paasdagen (zondag 11 en maandag 12 april) door bij zijn vader. Om die reden kan hij de opening van de Sint Lucas-tentoonstelling op zondag 11 april niet hebben bijgewoond. Dear Zus, I’m sorry I’m sending you such a crumpled envelope, ​but I didn’t have any more in the house, and I had to tell you that unfortunately I have to be in the museum tomorrow afternoon when the paintings are hung because I’m on the St Lucas jury.​ I’ve already been there for a good part of the week. I’d like to come and see you between 4 and 5, otherwise I don’t think I’ll see you again in a week, because I ‘m going to Arnhem for Easter. ​So I’ll call round tomorrow to see if you’re home. Bye! With my very best wishes, your Piet."
3,proeftuin@19090421y_IONG_1304:6,"Manuscript. De brief dateert van vóór brief MEP_1293 van circa 13 mei 1909, waarin Mondriaan schrijft aan De Iongh dat hij nog geen portretten ontving van Waldenburg. De in deze brief voorgestelde fotosessie heeft dan dus reeds plaatsgevonden. We dateren de onderhavige brief daarom enkele weken eerder dan brief MEP_1293, in de week van maandag 19 tot en met vrijdag 23 april. Brief MEP_1738 zit nog tussen de onderhavige brief en brief MEP_1293 van circa 13 mei in. In die brief wordt meer concreet gestreefd naar een moment om de voorgestelde fotosessie te doen plaatsvinden. ​Met 'de schedelmeter' bedoelt Mondriaan Alfred Waldenburg. De fotosessie met Mondriaan en De Iongh heeft vermoedelijk kort na dit schrijven plaatsgevonden, hoewel de afdrukken pas in augustus gereed waren (zie MEP_1293). Tijdens die sessie maakte Waldenburg tevens een portretfoto van Mondriaan. Hoewel er enkele portretfoto's van De Iongh zijn overgeleverd, is geen daarvan met zekerheid toe te schrijven aan Waldenburg. Correspondentie tussen Mondriaan en Waldenburg is niet overgeleverd. De enige bewaard gebleven tekening van Mondriaan waarvan met zekerheid kan worden gesteld dat De Iongh er model voor stond is de krijttekening Piet Mondriaan, Leo Gestel, Meisjeskop, 1910 Alkmaar, Stedelijk Museum Alkmaar, inv./cat.nr. [..]. conté on papier. RKD 277201►[ Piet Mondriaan, Leo Gestel, Meisjeskop, 1910 Alkmaar, Stedelijk Museum Alkmaar, inv./cat.nr. [..]. conté on papier. RKD 277201►* Piet Mondriaan, Leo Gestel, Meisjeskop, 1910 Alkmaar, Stedelijk Museum Alkmaar, inv./cat.nr. [..]. conté on papier. RKD 277201►*Meisjeskop* Piet Mondriaan, Leo Gestel, Meisjeskop, 1910 Alkmaar, Stedelijk Museum Alkmaar, inv./cat.nr. [..]. conté on papier. RKD 277201►*] (UA38). Mogelijk stond zij ook model voor de tekening Piet Mondriaan, Female nude: bust portrait, ca. 1909-1911 Private collection. houtskool, zwart krijt on papier. RKD 68554►[ Piet Mondriaan, Female nude: bust portrait, ca. 1909-1911 Private collection. houtskool, zwart krijt on papier. RKD 68554►* Piet Mondriaan, Female nude: bust portrait, ca. 1909-1911 Private collection. houtskool, zwart krijt on papier. RKD 68554►*Female nude: bust portrait**] (A645). ​ Dear Zus, ​The “skull measurer” came round this morning; he saw the sketches of you and thought your forehead and the expression in your eyes so beautiful that he wanted to take a photograph of you. ​He’s coming here again on Sunday. If you have the time and the inclination, come to me at 10 o’clock, otherwise I’ll just write and tell him you can’t come, in the event that you’d rather decline. It might well take a while before you get a print from him and perhaps he’ll put you in a book later: I’m just warning you, then you can do as you wish. Let’s agree that if you don’t have the inclination or the time, drop me a line and otherwise come to me on Sunday morning at 10. Bye, my dear Zus, your Piet. Manuscript. ​  ​​"


In [8]:
A.show(results, end=3)

Or let's look for all closers;

In [9]:
results = A.search("""
closer
""")

  0.00s 31 results


In [10]:
A.table(results, end=10)

n,p,closer
1,proeftuin@19090216y_IONG_1303:5,Met vele beste groeten je Piet.
2,proeftuin@19090216y_IONG_1303:6,"With my very best wishes, your Piet."
3,proeftuin@19090407y_IONG_1739:5,Dag! Veel beste groeten je Piet.
4,proeftuin@19090407y_IONG_1739:6,"Bye! With my very best wishes, your Piet."
5,proeftuin@19090421y_IONG_1304:5,"Dag beste lieve Zus, je Piet."
6,proeftuin@19090421y_IONG_1304:6,"Bye, my dear Zus, your Piet."
7,proeftuin@19090426y_IONG_1738:5,Dag! hartelijke groeten van je Piet.
8,proeftuin@19090426y_IONG_1738:6,Bye! Warm wishes from your Piet.
9,proeftuin@19090513y_IONG_1293:5,"Dag Zus, vele beste groeten van je toegenegen Piet."
10,proeftuin@19090513y_IONG_1293:6,"Bye Zus, very best wishes from your affectionate Piet."


In [11]:
A.show(results, end=1)

Now closers with the word `lieve` in it:

In [12]:
query = """
closer
  token str=lieve
"""

results = A.search(query)

  0.01s 2 results


In [13]:
A.table(results)

n,p,closer,token
1,proeftuin@19090421y_IONG_1304:5,"Dag beste lieve Zus, je Piet.",lieve
2,proeftuin@19090905y_IONG_1295:5,"Dag, lieve Zus, vele groeten van je Piet.",lieve


---

# Contents

* **[start](start.ipynb)** intro and highlights
* **search** turbo charge your hand-coding with search templates
* **[compute](compute.ipynb)** sink down a level and compute it yourself
* **[exportExcel](exportExcel.ipynb)** make tailor-made spreadsheets out of your results

CC-BY Dirk Roorda