# Measurements

In diesem Datensatz haben wir es mit einer Vielzahl unterschiedlicher Maße zu tun. Zum einen wurden viele verschiedene Knochentypen vermessen, zum anderen wurden die einzelnen Knochentypen auch noch auf verschiedene Weisen vermessen, was durch das Attribut 'MEASTYPE' angezeigt wird. Das bedeutet, dass selbst die Maße für den gleichen Knochentyp nicht unbedingt vergleichbar sind, weil z.B. manche Maße die Länge des Knochens, andere die Breite an einer bestimmten Stelle und wieder andere den Umfang angeben. Das bedeutet, dass bei der Auswertung nicht nur nach Knochentyp unterschieden werden muss, sondern innerhalb des Knochentyps auch noch mal nach 'MEASTYPE', um die Maße auch wirklich vergleichbar zu halten. Erst dann kann eine Entwicklung über die Zeit betrachtet werden.

In [1]:
import pandas as pd

import utils.load_write as lw
import utils.datastructure_operations as dataops

df_horse = lw.load_csv("data/csv/abmap_horse.csv")
measures_per_bone = df_horse.BONEID.value_counts()
#print(measures_per_bone)

print("Es liegen", len(df_horse.index) , "Maße von insgesamt", len(measures_per_bone), "Knochen vor.")
print("Jeder Datenpunkt hat", len(df_horse.columns), "Attribute:")
dataops.pretty_print(list(df_horse.columns))


Es liegen 3099 Maße von insgesamt 1038 Knochen vor.
Jeder Datenpunkt hat 17 Attribute:
[ 'BONEID', 'MEASURE', 'MEASTYPE', 'SPECIES', 'ELEMENT', 'SIDE', 'COMMENTS',
  'CONTEXT', 'PERIOD', 'CDATE', 'RANGE', 'PHASE', 'SITECODE', 'SITE', 'COUNTY',
  'GRIDREF', 'REFERENCE']


Zuerst gruppieren wir also die Daten nach Knochentyp, weil wir nur innerhalb dieser Gruppen valide Vergleiche machen können.

In [9]:
element_grp = df_horse.groupby(['ELEMENT'])
time_ranges_condensed = lw.load_json("data/json/time-ranges-condensed.json")
astragalus = dataops.update_period(element_grp.get_group('Astragalus'), time_ranges_condensed)
calcaneum = dataops.update_period(element_grp.get_group('Calcaneum'), time_ranges_condensed)
femur = dataops.update_period(element_grp.get_group('Femur'), time_ranges_condensed)
first_phalanx = dataops.update_period(element_grp.get_group('First phalanx'), time_ranges_condensed)
humerus = dataops.update_period(element_grp.get_group('Humerus'), time_ranges_condensed)
mandible = dataops.update_period(element_grp.get_group('Mandible'), time_ranges_condensed)
metacarpal = dataops.update_period(element_grp.get_group('Metacarpal'), time_ranges_condensed)
pelvis = dataops.update_period(element_grp.get_group('Pelvis'), time_ranges_condensed)
radius = dataops.update_period(element_grp.get_group('Radius'), time_ranges_condensed)
scapula = dataops.update_period(element_grp.get_group('Scapula'), time_ranges_condensed)
second_phalanx = dataops.update_period(element_grp.get_group('Second phalanx'), time_ranges_condensed)
tibia = dataops.update_period(element_grp.get_group('Tibia'), time_ranges_condensed)
ulna = dataops.update_period(element_grp.get_group('Ulna'), time_ranges_condensed)

ulna

Unnamed: 0,BONEID,MEASURE,MEASTYPE,SPECIES,ELEMENT,SIDE,COMMENTS,CONTEXT,PERIOD,CDATE,RANGE,PHASE,SITECODE,SITE,COUNTY,GRIDREF,REFERENCE
2055,J_GRIMM_08WA57960-69,39.7,BPC,Horse,Ulna,Left,,476,Medieval,C13 - C14,1225 -- 1350,,WA57960,Fulston Manor; Sittingbourne,Kent,NGR 590800 162400,Wessex Archaeology (2006) Fulston Manor; Sitti...
2056,J_GRIMM_08WA57960-69,59.2,DPA,Horse,Ulna,Left,,476,Medieval,C13 - C14,1225 -- 1350,,WA57960,Fulston Manor; Sittingbourne,Kent,NGR 590800 162400,Wessex Archaeology (2006) Fulston Manor; Sitti...
2111,J_GRIMM_08WA58720-31,62.0,DPA,Horse,Ulna,Right,,131,Medieval,C11 - C12,1075 -- 1125,,WA58720,Land at Coles Lane; Oakington,Cambridgeshire,NGR 541198/264704,Powell; A. et al. (forthcoming). Medieval encl...
2112,J_GRIMM_08WA58720-31,52.9,SDO,Horse,Ulna,Right,,131,Medieval,C11 - C12,1075 -- 1125,,WA58720,Land at Coles Lane; Oakington,Cambridgeshire,NGR 541198/264704,Powell; A. et al. (forthcoming). Medieval encl...
2162,J_GRIMM_08WA59480-1382,36.0,BPC,Horse,Ulna,Left,,1642,Bronze - Iron Age,C1 - C2,100 -- 150,,WA59480,Margate to Weatherlees Hill (wastewater treatm...,Kent,NGR 638400 17160 to NGR 633250 162920,Egging; K. et al.; (forthcoming) Thanet's long...
2163,J_GRIMM_08WA59480-1382,58.2,DPA,Horse,Ulna,Left,,1642,Bronze - Iron Age,C1 - C2,100 -- 150,,WA59480,Margate to Weatherlees Hill (wastewater treatm...,Kent,NGR 638400 17160 to NGR 633250 162920,Egging; K. et al.; (forthcoming) Thanet's long...
2164,J_GRIMM_08WA59480-1382,47.5,SDO,Horse,Ulna,Left,,1642,Bronze - Iron Age,C1 - C2,100 -- 150,,WA59480,Margate to Weatherlees Hill (wastewater treatm...,Kent,NGR 638400 17160 to NGR 633250 162920,Egging; K. et al.; (forthcoming) Thanet's long...
2255,J_GRIMM_08WA61900-25,42.5,BPC,Horse,Ulna,Left,,2014,Medieval,C12 - C13,1100 -- 1299,,WA61900,Land at Queen Street; Stotfold,Bedfordshire,NGR 52230 236550,Gibson; C. & Budd; C. (forthcoming). Late Bron...
2256,J_GRIMM_08WA61900-25,65.2,DPA,Horse,Ulna,Left,,2014,Medieval,C12 - C13,1100 -- 1299,,WA61900,Land at Queen Street; Stotfold,Bedfordshire,NGR 52230 236550,Gibson; C. & Budd; C. (forthcoming). Late Bron...
2263,J_GRIMM_08WA61900-2,39.3,BPC,Horse,Ulna,Left,,2018,Medieval,C12 - C13,1100 -- 1299,,WA61900,Land at Queen Street; Stotfold,Bedfordshire,NGR 52230 236550,Gibson; C. & Budd; C. (forthcoming). Late Bron...


Nun haben wir die einzelnen Knochentypen gruppiert und die Zeitperioden jeweils so geupdatet, dass wir nur noch mit unseren zuvor festgelegt vier gröberen Intervallen arbeiten.
Ein weiteres Problem ist jedoch, dass die verfügbaren Maße für die einzelnen Knochentypen nicht alle dieselbe Dimension haben (z.B. "Länge"). Beim Vermessen von Knochen gibt es einen Haufen verschiedener Maße (s. z.B. Levine1981). Um zu sehen, ob sich die Größe eines Knochens über die Zeit verändert hat, müssen wir also alle Maße einzeln vergleichen (also die Längen untereinander vergleichen, die Breiten, die Umfänge etc.).
Hierbei wird jedoch schnell offensichtlich, dass die vergleichbare Datenmenge plötzlich sehr klein wird und kaum noch für eine aussagekräftige Statistik genutzt werden kann.
Der Versuch, statt aller verfügbarer Pferdeknochen beispielsweise alle Knochen desselben Typs einer Tierart zu untersuchen, die viel mehr Funde vorweisen kann, scheitert leider daran, dass die Datenbank des ABMAP-Projekts momentan nicht verfügbar ist (SCREENSHOT). Wir müssen also mit den Maßen arbeiten, die wir haben.

Zunächst wollen wir also herausfinden, mit welchen und wie vielen verschiedenen Maß-Dimensionen wir es hier zu tun haben und was sie bedeuten - ggf. kann man sie zusammenfassen. Dazu zählen wir zuerst, wie viele verschiedene Dimensionen pro Knochentyp vorliegen:

In [10]:
df_element_meastype = element_grp['MEASTYPE'].value_counts().to_frame(name='COUNT').reset_index()
df_element_meastype

Unnamed: 0,ELEMENT,MEASTYPE,COUNT
0,Astragalus,GB,65
1,Astragalus,GH,60
2,Astragalus,BFd,51
3,Astragalus,LmT,51
4,Astragalus,Lm,1
5,Calcaneum,GB,24
6,Calcaneum,GL,22
7,Femur,DC,24
8,Femur,SD,24
9,Femur,Bd,23


Anschließend fügen wir die entsprechenden Erklärungen für die Dimensionen in die Tabelle ein, um eine bssere Übersicht zu bekommen, welche Dimensionen sich ggf. zusammenfassen lassen. Diesen Datafame speichern wir als Tabelle ab, um ihn besser lesen zu können:

In [None]:
df_meastypes = lw.load_csv("data/csv/meastype.csv")
df_element_meastype['EXPLANATION'] = pd.Series(dtype='string')
for code, explanation in zip(df_meastypes.Code, df_meastypes.Measurement):
    filt = (df_element_meastype['MEASTYPE'] == code)
    df_element_meastype.loc[filt, 'EXPLANATION'] = explanation

#lw.save_csv(df_element_meastype, "data/csv/bone-elements-w-meastype.csv")

Wahrscheinlich ist das Zusammenfassen der Dimensionen nicht sinnvoll. Also suchen wir uns für jeden Knochentpy die 2-3 häufigsten Dimensionen heraus und werten diese statistisch aus, um anschließend einen Vergleich über die vier Zeitperioden ziehen zu können.