## Open Government Data, provided by **opendata.swiss**
*Autogenerated Python starter code for data set with identifier* **e2b9ad28-2a72-4fbc-933e-ddde376ce9a5@stadt-zurich**

## Dataset
# **Fotos im Archiv von Hans Himmelheber (1908–2003) im Museum Rietberg**

## Description

Das Museum Rietberg ist das einzige Museum für aussereuropäische Kunst in der Schweiz. Die international renommierte Sammlung beherbergt bedeutende Werke aus Asien, Afrika, Amerika und Ozeanien.

Hans Himmelheber nahm auf seinen Reisen mehr als 15'000 Fotografien auf. Diese Bilder sind wichtige visuelle Dokumente der von ihm untersuchten Phänomene. Die Fotografien liefern uns zudem wertvolle Hinweise zu ihrem Entstehungskontext und den abgebildeten Personen. Darüber hinaus bilden die Fotografien einen Ausgangspunkt für kritische postkoloniale Fragestellungen. Weil Himmelheber seine Kameras oft aus der Hand gegeben hat, ist die Autorenschaft bei einigen Fotografien nicht mehr festzustellen. Mit Sicherheit finden sich unter den Fotografien solche, die von Assistent*innen, Mitgliedern seiner Familie  oder seinen wichtigsten Vertrauten vor Ort aufgenommen wurden.
2013 übergab die Erbengemeinschaft Hans Himmelheber das Fotoarchiv an das Museum Rietberg und finanzierte dessen Aufarbeitung. Bei der digitalen Bereitstellung der Fotografien halten wir uns an folgende Richtlinien:

Wo immer möglich, wurden die auf den Fotografien abgebildeten Personen identifiziert und ihre Namen erfasst.
Um den zeitgeschichtlichen Kontext der fotografischen Momente zu verdeutlichen, sind möglichst präzise Angaben zu Aufnahmedatum und -ort hinzugefügt.
Fotografien, auf denen die Würde der abgebildeten Personen verletzt wird, wurden gesperrt. Dazu gehören Situationen, in denen die abgebildeten Personen im fotografischen Moment keinerlei Handlungsmacht besassen, etwa Fotografien von Gefangenen, Sterbenden oder Personen, denen Gewalt widerfuhr.
Weiter wurden Fotografien gesperrt, die an Orten aufgenommen wurden und/oder Gegenstände zeigen, die im Ursprungskontext nur einem kleinen, eingeweihten Kreis von berechtigten Personen zugänglich waren. Dazu zählen beispielsweise nur Initiierten vorbehaltene Rituale oder Räume.
Fotografien von Frauen und Mädchen, die in erotisierender Weise dargestellt sind und Fotografien von unbekleideten Kindern sind ebenfalls nicht zugänglich.
Originalnotizen von Hans Himmelheber zu einzelnen Fotos sind durch Anführungszeichen gekennzeichnet. Beleidigende oder diskriminierend Wörter haben wir gestrichen.

## Data set links

[Direct link by opendata.swiss for dataset](https://opendata.swiss/de/dataset/fotos-im-archiv-von-hans-himmelheber-19082003-im-museum-rietberg)<br>
[Direct link by Stadt Zürich for dataset](https://data.stadt-zuerich.ch/dataset/mrz_himmelheber_fotos)

## Metadata
- **Publisher.name** `Museum Rietberg, Präsidialdepartement`
- **Organization.display_name.de** `Stadt Zürich`
- **Organization.url** `http://www.stadt-zuerich.ch/opendata`
- **Maintainer** `Open Data Zürich`
- **Maintainer_email** `opendata@zuerich.ch`
- **Keywords.de** `['ethnologie', 'afirka', 'alaska', 'himmelheber', 'kunst', 'archiv', 'reisen', 'fotografie']`
- **Issued** `2023-06-06T00:00:00`
- **Metadata_created** `2023-06-27T01:06:55.393550`
- **Metadata_modified** `2025-04-16T03:32:44.021960`


## Imports and helper functions

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt
plt.style.use('ggplot')

params = {
    'text.color': (0.25, 0.25, 0.25),
    'figure.figsize': [18, 6],
   }

plt.rcParams.update(params)

import pandas as pd 

In [None]:
# helper function for reading datasets with proper separator
def get_dataset(url):
    if url[-3:] != "csv":
        print("The data set URL has no proper 'csv' extension. Reading the dataset might not have worked as expected.\nPlease check the dataset link and adjust pandas' read_csv() parameters accordingly.")
    data = pd.read_csv(url, sep=",", on_bad_lines='warn', encoding_errors='ignore', low_memory=False)
    # if dataframe only has one column or less the data is not comma separated, use ";" instead
    if data.shape[1] <= 1:
        data = pd.read_csv(url, sep=';', on_bad_lines='warn', encoding_errors='ignore', low_memory=False)
        if data.shape[1] <= 1:
            print("The data wasn't imported properly. Very likely the correct separator couldn't be found.\nPlease check the dataset manually and adjust the code.")
    return data

## Load data

- The dataset has **`1` distribution(s)** in CSV format.
- All available CSV distributions are listed below and can be read into a pandas dataframe.

In [None]:
# Distribution 0
# Package_id               : 6dd4c953-400c-45ad-a2ef-2136cf0ed2e7
# Description              : 
# Issued                   : 2023-06-26T12:40:29.970859
# Modified                 : 2025-04-14T17:16:51.642274
# Rights                   : https://opendata.swiss/terms-of-use#terms_by

df = get_dataset('https://data.stadt-zuerich.ch/dataset/mrz_himmelheber_fotos/download/mrz_himmelheber_fotos.csv')



## Analyze data

In [None]:
# drop columns that have no values
df.dropna(how='all', axis=1, inplace=True)

In [None]:
print(f'The dataset has {df.shape[0]:,.0f} rows (observations) and {df.shape[1]:,.0f} columns (variables).')
print(f'There seem to be {df.duplicated().sum()} exact duplicates in the data.')

In [None]:
df.info(memory_usage='deep', verbose=True)

In [None]:
df.head()

In [None]:
# display a small random sample transposed in order to see all variables
df.sample(3).T

In [None]:
# describe non-numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(exclude='number'))
except:
    print("No categorical data in dataset.")

In [None]:
# describe numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(include='number'))
except:
    print("No numercial data in dataset.")

In [None]:
# check missing values with missingno
# https://github.com/ResidentMario/missingno
import missingno as msno
msno.matrix(df, labels=True, sort='descending');

In [None]:
# plot a histogram for each numerical feature
try:
    df.hist(bins=25, rwidth=.9)
    plt.tight_layout()
    plt.show()
except:
    print("No numercial data to plot.") 

In [None]:
# continue your code here...

**Contact**: opendata@zuerich.ch | Open Data Zürich