![title](./pic/selecting/verkuepfungsoperatoren/1_title.png)

In [16]:
import pandas as pd

In [17]:
df = pd.read_csv('./csv/titanic.csv')
df.head()

Unnamed: 0,PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
0,892,0,3,"Kelly, Mr. James",male,34.5,0,0,330911,7.8292,,Q
1,893,1,3,"Wilkes, Mrs. James (Ellen Needs)",female,47.0,1,0,363272,7.0,,S
2,894,0,2,"Myles, Mr. Thomas Francis",male,62.0,0,0,240276,9.6875,,Q
3,895,0,3,"Wirz, Mr. Albert",male,27.0,0,0,315154,8.6625,,S
4,896,1,3,"Hirvonen, Mrs. Alexander (Helga E Lindqvist)",female,22.0,1,1,3101298,12.2875,,S


<br>

In den meisten Fällen spielen mehrere Features zusammen eine wichtige Rolle. Daher kümmern wir uns in diesem Notebook um die beiden Operatioren `UND` und `ODER`. Mit diesen Operatoren können mehrere Abfragen und Bedingungen verknüpft werden.

---

## `&` - Operator

Beim `&`-Operator spielen beide (wenn zwei, ansonsten `n`) Bedingungen eine wichtige Rolle. Sowohl die erste, als auch die zweite Bedingung muss zutreffen, damit die jeweilige Zeile im neuen `DataFrame` erscheint. Wird nur eine der beiden Bedingungen erfüllt, gilt die gesamte Bedingung als nicht erfüllt, und die Zeile bleibt außen vor. Du kannst dir das so vorstellen:

> Sowohl Bedingung A als auch Bedingung B muss erfüllt sein. Ist eine der N Bedingungen nicht erfüllt, ist die Gesamtbedingung nicht erfüllt.

Wir können das kaufmännische **Und**-Operator (`&`) verwenden, um die beiden Bedingungen miteinander zu verbinden.

![title](./pic/selecting/verkuepfungsoperatoren/2_und.png)

<video width="1000" controls src="./pic/selecting/verkuepfungsoperatoren/3_und_example.mp4" />

Die Wahl des Accessors spielt hierbei keine Rolle. Du kannst sowohl die Form mit `[]` also auch `.spaltenname` verwenden.

In diesem Fall, wollen wir nicht nur wissen ob der Passagier vom Geschlecht Frau ist, sondern auch ob er überlebt hat. 
Die Passagiere werden in die Klassen 0 & 1 aufgeteilt, wobei 0 nicht überlebt und 1 überlebt bedeutet.

In [18]:
df.loc[(df['Sex'] == 'female') & (df.Survived == 1)]

Unnamed: 0,PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
1,893,1,3,"Wilkes, Mrs. James (Ellen Needs)",female,47.0,1,0,363272,7.0000,,S
4,896,1,3,"Hirvonen, Mrs. Alexander (Helga E Lindqvist)",female,22.0,1,1,3101298,12.2875,,S
6,898,1,3,"Connolly, Miss. Kate",female,30.0,0,0,330972,7.6292,,Q
8,900,1,3,"Abrahim, Mrs. Joseph (Sophie Halaut Easu)",female,18.0,0,0,2657,7.2292,,C
12,904,1,1,"Snyder, Mrs. John Pillsbury (Nelle Stevenson)",female,23.0,1,0,21228,82.2667,B45,S
...,...,...,...,...,...,...,...,...,...,...,...,...
409,1301,1,3,"Peacock, Miss. Treasteall",female,3.0,1,1,SOTON/O.Q. 3101315,13.7750,,S
410,1302,1,3,"Naughton, Miss. Hannah",female,,0,0,365237,7.7500,,Q
411,1303,1,1,"Minahan, Mrs. William Edward (Lillian E Thorpe)",female,37.0,1,0,19928,90.0000,C78,Q
412,1304,1,3,"Henriksson, Miss. Jenny Lovisa",female,28.0,0,0,347086,7.7750,,S


---

## `|` - Operator

Beim `|`-Operator spielen natürlich auch wieder beide (wenn zwei, ansonsten `n`) Bedingungen eine wichtige Rolle. 
Hierbei jedoch mit dem entscheidenden Unterschied: Sobald eine der Bedingungen erfüllt ist, wird die Zeile in das neue `DataFrame` aufgenommen. Auch wenn eine der beiden Bedingungen nicht erfüllt sein sollte, die andere jedoch schon, gilt die Gesamtbedingung als erfüllt und ausreichen.
Du kannst dir das so vorstellen:

>Entweder Bedingung A ist erfüllt, oder Bedingung B. Es reicht, wenn eine der beiden Bedingungen erfüllt ist. Ist das der Fall, gilt die Gesamtbedingung als erfüllt.

![title](./pic/selecting/verkuepfungsoperatoren/4_oder.png)

<video width="1000" controls src="./pic/selecting/verkuepfungsoperatoren/5_oder_example.mp4" />

Nehmen wir an, wir wollen **jede Frau sowie jeden Passagier der ersten Klasse**. Dafür verwenden wir den **Pipe**-Operator (`|`):

In [19]:
df[(df['Sex'] == 'female') | (df['Pclass'] == 1)]

Unnamed: 0,PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
1,893,1,3,"Wilkes, Mrs. James (Ellen Needs)",female,47.0,1,0,363272,7.0000,,S
4,896,1,3,"Hirvonen, Mrs. Alexander (Helga E Lindqvist)",female,22.0,1,1,3101298,12.2875,,S
6,898,1,3,"Connolly, Miss. Kate",female,30.0,0,0,330972,7.6292,,Q
8,900,1,3,"Abrahim, Mrs. Joseph (Sophie Halaut Easu)",female,18.0,0,0,2657,7.2292,,C
11,903,0,1,"Jones, Mr. Charles Cresson",male,46.0,0,0,694,26.0000,,S
...,...,...,...,...,...,...,...,...,...,...,...,...
409,1301,1,3,"Peacock, Miss. Treasteall",female,3.0,1,1,SOTON/O.Q. 3101315,13.7750,,S
410,1302,1,3,"Naughton, Miss. Hannah",female,,0,0,365237,7.7500,,Q
411,1303,1,1,"Minahan, Mrs. William Edward (Lillian E Thorpe)",female,37.0,1,0,19928,90.0000,C78,Q
412,1304,1,3,"Henriksson, Miss. Jenny Lovisa",female,28.0,0,0,347086,7.7750,,S


**Wörtlich übersetzt** bedeutet diese Abfrage:
    
> Gib mir jeden Passagier mit dem Geschlecht Frau zurück, sowie jeden Passagier der in der Ersten-Klasse reist.

---

## Mischung aus `&` und `|`

Für noch komplexere Abfragen, kann der `&`- mit dem `|`-Operator kombiniert werden.

> **Wir wollen nur Frauen die alleine in der ersten oder zweiten Klasse reisen**

---

**TIP**:

Zu Übungszwecken und den Überblick über die Abfrage zu behalten, würde ich dir raten, die einzelnen Abfragen erst einmal seperat voneinander zu formulieren und diese erst am Schluss zusammenzufügen.

---

#### 1) Nur Frauen

In [20]:
df[(df['Sex'] == 'female')]

Unnamed: 0,PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
1,893,1,3,"Wilkes, Mrs. James (Ellen Needs)",female,47.0,1,0,363272,7.0000,,S
4,896,1,3,"Hirvonen, Mrs. Alexander (Helga E Lindqvist)",female,22.0,1,1,3101298,12.2875,,S
6,898,1,3,"Connolly, Miss. Kate",female,30.0,0,0,330972,7.6292,,Q
8,900,1,3,"Abrahim, Mrs. Joseph (Sophie Halaut Easu)",female,18.0,0,0,2657,7.2292,,C
12,904,1,1,"Snyder, Mrs. John Pillsbury (Nelle Stevenson)",female,23.0,1,0,21228,82.2667,B45,S
...,...,...,...,...,...,...,...,...,...,...,...,...
409,1301,1,3,"Peacock, Miss. Treasteall",female,3.0,1,1,SOTON/O.Q. 3101315,13.7750,,S
410,1302,1,3,"Naughton, Miss. Hannah",female,,0,0,365237,7.7500,,Q
411,1303,1,1,"Minahan, Mrs. William Edward (Lillian E Thorpe)",female,37.0,1,0,19928,90.0000,C78,Q
412,1304,1,3,"Henriksson, Miss. Jenny Lovisa",female,28.0,0,0,347086,7.7750,,S


#### 2) Nur Frauen die alleine reisen

In [21]:
df[(df['Sex'] == 'female') & (df['SibSp'] == 0)]

Unnamed: 0,PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
6,898,1,3,"Connolly, Miss. Kate",female,30.0,0,0,330972,7.6292,,Q
8,900,1,3,"Abrahim, Mrs. Joseph (Sophie Halaut Easu)",female,18.0,0,0,2657,7.2292,,C
19,911,1,3,"Assaf Khalil, Mrs. Mariana (Miriam"")""",female,45.0,0,0,2696,7.2250,,C
22,914,1,1,"Flegenheim, Mrs. Alfred (Antoinette)",female,,0,0,PC 17598,31.6833,,S
26,918,1,1,"Ostby, Miss. Helene Ragnhild",female,22.0,0,1,113509,61.9792,B36,C
...,...,...,...,...,...,...,...,...,...,...,...,...
402,1294,1,1,"Gibson, Miss. Dorothy Winifred",female,22.0,0,1,112378,59.4000,,C
408,1300,1,3,"Riordan, Miss. Johanna Hannah""""",female,,0,0,334915,7.7208,,Q
410,1302,1,3,"Naughton, Miss. Hannah",female,,0,0,365237,7.7500,,Q
412,1304,1,3,"Henriksson, Miss. Jenny Lovisa",female,28.0,0,0,347086,7.7750,,S


#### 3) Nur Frauen die alleine in der Ersten Klasse reisen

In [22]:
df[(df['Sex'] == 'female') & (df['SibSp'] == 0) & (df['Pclass'] == 1)]

Unnamed: 0,PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
22,914,1,1,"Flegenheim, Mrs. Alfred (Antoinette)",female,,0,0,PC 17598,31.6833,,S
26,918,1,1,"Ostby, Miss. Helene Ragnhild",female,22.0,0,1,113509,61.9792,B36,C
48,940,1,1,"Bucknell, Mrs. William Robert (Emma Eliza Ward)",female,60.0,0,0,11813,76.2917,D15,C
59,951,1,1,"Chaudanson, Miss. Victorine",female,36.0,0,0,PC 17608,262.375,B61,C
74,966,1,1,"Geiger, Miss. Amalie",female,35.0,0,0,113503,211.5,C130,C
112,1004,1,1,"Evans, Miss. Edith Corse",female,36.0,0,0,PC 17531,31.6792,A29,C
141,1033,1,1,"Daniels, Miss. Sarah",female,33.0,0,0,113781,151.55,,S
150,1042,1,1,"Earnshaw, Mrs. Boulton (Olive Potter)",female,23.0,0,1,11767,83.1583,C54,C
156,1048,1,1,"Bird, Miss. Ellen",female,29.0,0,0,PC 17483,221.7792,C97,S
168,1060,1,1,"Cassebeer, Mrs. Henry Arthur Jr (Eleanor Genev...",female,,0,0,17770,27.7208,,C


#### 4) Nun ist die Abfrage zur Hälfte vollständig, die andere Hälfte erhältst du mit dem `|`-Operator

In [23]:
df[(df['Sex'] == 'female') &
   (df['SibSp'] == 0) &
   (df['Pclass'] == 1) |
   (df['Sex'] == 'female') &
   (df['SibSp'] == 0) &
   (df['Pclass'] == 2)]

Unnamed: 0,PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
22,914,1,1,"Flegenheim, Mrs. Alfred (Antoinette)",female,,0,0,PC 17598,31.6833,,S
26,918,1,1,"Ostby, Miss. Helene Ragnhild",female,22.0,0,1,113509,61.9792,B36,C
43,935,1,2,"Corbett, Mrs. Walter H (Irene Colvin)",female,30.0,0,0,237249,13.0,,S
48,940,1,1,"Bucknell, Mrs. William Robert (Emma Eliza Ward)",female,60.0,0,0,11813,76.2917,D15,C
59,951,1,1,"Chaudanson, Miss. Victorine",female,36.0,0,0,PC 17608,262.375,B61,C
65,957,1,2,"Corey, Mrs. Percy C (Mary Phyllis Elizabeth Mi...",female,,0,0,F.C.C. 13534,21.0,,S
74,966,1,1,"Geiger, Miss. Amalie",female,35.0,0,0,113503,211.5,C130,C
112,1004,1,1,"Evans, Miss. Edith Corse",female,36.0,0,0,PC 17531,31.6792,A29,C
120,1012,1,2,"Watt, Miss. Bertha J",female,12.0,0,0,C.A. 33595,15.75,,S
141,1033,1,1,"Daniels, Miss. Sarah",female,33.0,0,0,113781,151.55,,S


<br>

Sehr empfehlenswert ist auch diese Seite. Falls du SQL bereits beherrscht und dich in Pandas noch etwas schwer tust, schau dir einfach diese Beispiele an:
>**[PANDAS vs. SQL](https://pandas.pydata.org/pandas-docs/stable/getting_started/comparison/comparison_with_sql.html)**