# Absolute Temperatur aus pV

Zunächst importieren wir alle benötigten Bibliotheken

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

## Schritt 1: Laden der Daten

Laden Sie Ihre Daten aus Pasco

In [None]:
# Ihr code hier

## Schritt 2a: Vereinigen des Datensatzes

Wir benötigen zwei Arrays für `T` und `p`.

Je nachdem, wie Sie Pasco benutzt haben, sind die Messungen aber auf mehrere Spalten verteilt. Diese führen wir nun zusammen. Das geht am einfachsten mit etwas wie: `data.iloc[: , 1]`.

Lassen Sie mich das erklären. Mit `iloc` greift man auf Einträge eines DataFrames über ihren Index zu. In eckigen Klammern folgen zwei durch Komma getrennte Zahlen: die Zeile und die Spalte, jeweils beginnend bei Null.

Es gibt noch ein paar Tricks: Ein Doppelpunkt ohne weitere Zahlen bedeutet „alles”, also in diesem Fall die ganze Spalte. Ein Doppelpunkt zwischen zwei Zahlen (z. B. „3:7”) meint alles zwischen 3 und 7, also 3, 4, 5, 6 und 7. Das Beispiel liefert also die Spalte Nummber 1, also die zweite Spalte.


 `data.iloc[: , 1].values` konvertiert die DataFrames-Tabelle in ein Array von Zahlen, mit dem wir weiter arbeiten können.

 Dann brauchen wir noch eine Schleife über alle Spalten, die wir haben wollen. Das geht mit der Konstruktion `[ Funktion(Wert) for Wert in Liste]`. Beachten Sie die eckigen Klammern. Das erzeugt eine Liste in der nacheinander alle Werte von `Liste` als `Wert` in die Funktion eingesetzt werden. Beispiel: `[data.iloc[:, i].values for i in [1, 4, 7]]` erzeugt eine Liste deren Einträge aus den Spalten 1, 4 und 7 besteht.

 Schließlich müssen wir die Arrays noch hintereinander zusammenfügen. Das geht mit `np.concatenate`.

 Ingesamt brauchen wir also 
 `T = np.concatenate([data.iloc[:, i].values for i in [1, 4, 7]])`
wobei sie die Zahlen 1,4,7 an ihre Spaltennummer (beginnend bei Null) anpassen müssen. Und analog für den Druck `p`



In [None]:
# Ihr code hier

## Schritt 2b: Umbenennen / Kopieren der Spalten

Falls Sie Pasco die ganze Zeit haben aufzeichnen lassen, Ihr Datensatz also für $T$ und $p$ nur je eine einzige Spalte beinhaltet, dann können Sie diese einfach den Variablen zuweisen, via `T = datat.iloc[:,2].values` für die 3. Spalte.

In [None]:
# Ihr code hier

## Schritt 3: Plotten der Daten als Punktwolke. 

Mit `plt.scatter(T,p, marker='o', s=2)` können Sie die Daten als Punktwolke darstellen lassen. Der Parameter `s` bestimmt die Größe der Symbole. Beschriften Sie die Achsen.


In [None]:
# Ihr code hier

## Schritt 4: Bereinigen der Daten

Pasco markiert fehlende Einträge mit „NaN” (Not a Number). Dies ist beispielsweise der Fall, wenn ein Sensor eine höhere Datenrate liefert als der andere oder eine Messung weniger Punkte umfasst. Beim Plotten stört das nicht. Einträge, die ein „NaN” enthalten, werden einfach nicht angezeigt. Beim Rechnen ist dies problematisch, da Summen dann ebenfalls „NaN” sind. Daher müssen wir alle Einträge entfernen, bei denen entweder der Temperatur- oder der Druckwert fehlt.

Die „guten” Werte finden wir mit `guteWerte = ~np.isnan(T) & ~np.isnan(p)`. Das `~` negiert und `&` ist ein logisches Und. Gute Werte sind also (kein „NaN” in T) und (kein „NaN” in p). Die Indizes dieser Werte speichern wir. Dann können wir via
        `T = T[guteWerte]` die guten Werte herausfiltern und nur mit diesen weiterarbeiten. Das Gleiche gilt für p.

Nebenbemerkung: `guteWerte` ist ein Array vom Typ Boolean, das nur die Werte „True” und „False” annehmen kann. Auch mit einem solchen Array kann man ein anderes Array indizieren, und nicht nur mit einer Liste von Indizes.

Bereinigen Sie Ihre Messwerte also auf diese Weise.

In [None]:
# Ihr code hier

## Schitt 5: Fitten einer Geraden

Benutzen Sie das in Kapitel 2 gezeigte Verfahren, um eine Gerade der Form `y =a + b * T` an die Druck-Werte anzupassen. Berechnen Sie also die am besten passende Werte für `a` und `b` und daraus den Wert $T_0$, bei dem die Gerade die x-Achse schneidet. Dies ist dann Ihr Wert für den absoluten Tempeartur-Nullpunkt. 

In [None]:
# Ihr code hier

## Schritt 5: Plotten der Daten mit Geraden

Erstellen Sie einen neuen Graphen, ähnlich wie in Schitt 3, nur nun zusammen mit der Ausgleichsgeraden.

In [None]:
# Ihr code hier

## Schitt 6: Abweichung zwischen Modell und Daten

Plotten Sie die Abweichung zwiscen Modell und Daten als Punktwolke $\Delta p = p_{gemessen} - p_{modell}$ über $T$.

In [None]:
# Ihr code hier

## Schitt 7: Unsicherheit der Absoluten Nullpunkt-Temperatur

Berechnen Sie die Unsicherheit der Geradenparameter $a$ und $b$ sowie die daraus resultierende Unsicherheit in $T_0$, wie in Kapitel 2 gezeigt.

In [None]:
# Ihr code hier

## Schritt 8: Mittelung des Druck-Sensors

Die Auflösung des Drucksensors ist eher gering, dafür ist seine Datenrate tendenziell höher. Wenn Sie so gemessen haben, dass deutlich mehr p- als T-Werte vorliegen, ist das Wegwerfen der zusätzlichen p-Werte, wie oben angewandt, suboptimal. Sie könnten beispielsweise zehn aufeinanderfolgende Druckwerte mitteln. Das ist jedoch nicht notwendig, wenn Sie immer nur Paare von Werten haben, da beim Berechnen der Geraden bereits ausreichend gemittelt wird.

Sollten Sie also mitteln wollen, geht das mit `p  = np.convolve(p, np.ones(10)/10, mode='same')`. Dabei wird über zehn Werte gemittelt, d. h., es wird mit einem Rechteck der Breite 10 und der Höhe 1/10 (also Fläche 1) gefaltet.

Wenden Sie diese Verbesserung vor Schritt 4 („Bereinigen der Werte”) an. Bitte beachten Sie, dass der Kernel sich alte Ergebnisse merkt. Sie müssen daher ggf. manches noch einmal ausführen.

In [None]:
# Ihr code ggf. hier 

## Schritt 9: Temperatur-Gleichgewicht

Oft sind Probe und Temperatursensor nicht im Gleichgewicht. Es kann das Ergebnis also verbessern, wenn man diese Werte entfernt, da Druck und Temperatur dort nicht zusammenpassen.

Zunächst müssen wir diese Werte ermitteln. Dazu ist es hilfreich, den zeitlichen Verlauf von p und T in einem Diagramm mit zwei separaten y-Achsen darzustellen. Bei einem idealen linearen Zusammenhang zwischen p und T würden diese beiden Kurven übereinanderliegen.

Das ist etwas aufwändig und erfordert ggf. Google oder eine KI. Darum hier ein Gerüst.

In [None]:
# Code vom ChatGPT
fig, ax1 = plt.subplots()   # Create a figure and axis

x = np.arange(len(p))  # common x-axis (Datenpunkt Nr)

line1 = ax1.scatter(x,p, s=1, color='b', label='Druck')   # Plot data on primary y-axis
ax1.set_xlabel('Datenpunkt Nr')
ax1.set_ylabel('Druck (kPa)', color='b')

ax2 = ax1.twinx()  # Create a second y-axis sharing the same x-axis
line2 = ax2.scatter(x,T, s=1, color='r', label='Temperatur') # Plot data on secondary y-axis
ax2.set_ylabel('Temperatur (deg C)', color='r')

# Combine legends from both axes
lines = [line1, line2]
labels = [line.get_label() for line in lines]
ax1.legend(lines, labels, loc='upper right')

plt.show()

Dann könnte man eine Liste `behalten` anlegen. Diese steht zunächst vollständig auf „true” und einige Werte werden anschließend auf „false” gesetzt. Mit dieser Liste können sowohl P als auch T ausgestanzt werden. Anschließend kann alles wie oben beschrieben angewendet werden.

```python
behalten = np.ones(len(p), dtype=bool)
behalten[600:700] = False
p = p[behalten]
T = T[behalten]
```

In [None]:
# hier Ihr Code 