# Tutorial 1: Corpora and Vector Spaces
See this *gensim* tutorial on the web [here](https://radimrehurek.com/gensim/tut1.html).

Don’t forget to set:

In [1]:
import logging
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)

In [4]:
import os
import tempfile
import codecs
TEMP_FOLDER = tempfile.gettempdir()
print('Folder "{}" will be used to save temporary dictionary and corpus.'.format(TEMP_FOLDER))

Folder "/tmp" will be used to save temporary dictionary and corpus.


if you want to see logging events.

## From Strings to Vectors

This time, let’s start from documents represented as strings:

In [5]:
from gensim import corpora

In [9]:
language = 'de'
documents = []
directory = "../corpus_samples/OCRd/ALL_DE/processed/"
filename = directory + language +'.txt'
with codecs.open(filename, encoding='utf_8') as f:
  documents = f.readlines()
print(documents[4])

Passageninstrument III Stand setzen Chrono- graph reinigen Samoa mehrer zurück- gebracht 8-zöllige Universal Möglichkeit renovieren Entwurf 10-zölliges Universal 8-zöllig gedenken arbeiten Verschiedene Umänderungen Hilfe nötigen Turmbeobachtungen hydrostatische Nivellementsanlage Erdbebeninstrumente Uhr Elektromotor Umwandlung Stadt geliefert Drehstrom Gleichstrom betreiben Zifferblätter dienen Teilkreis- untersucher Jäderinapparat neu Nivellierinstrument Nickelstahl Kühnens angeben erbauen alt Meißner und so weiter groß Arbeit verursachen Anfertigung Er- schütterungsmessers Eisenbahnverwaltung angeben Dr. Schweydar Nächstdem letzt begonnen Nivellierlatten Nickelstahl Verpackung fertigstellen Lineal Zelluloid arbeiten Juni Heimert -aumerae Königl Preußische Geodätische Institut FOLGE Nummer Jahresbericht Direktor Königliche Geodätische Institut April April Potsdam drucken Stankiewiez Buchdruckerei G.m Berlin Exzellenz Königliche Staatsminister Minister geistlich Unterrichts-Angelegenhe

This is a tiny corpus of nine documents, each consisting of only a single sentence.

First, let’s tokenize the documents, remove common words (using a toy stoplist) as well as words that only appear once in the corpus:

In [10]:
# remove common words and tokenize
texts = [[word for word in document.split()]
         for document in documents]

# remove words that appear only once
from collections import defaultdict
frequency = defaultdict(int)
for text in texts:
    for token in text:
        frequency[token] += 1

texts = [[token for token in text if frequency[token] > 1] for text in texts]

from pprint import pprint  # pretty-printer
pprint(texts)

[['Protokoll',
  'Verhandlung',
  'permanent',
  'Commission',
  'Europäische',
  'Gradmessung',
  'September',
  'WIEN',
  'Manuscript',
  'drucken',
  'Protokoll',
  'Verhandlung',
  'permanent',
  'Commission',
  'Europäische',
  'Gradmessung',
  'September',
  'WIEN',
  'Manuscript',
  'drucken',
  'Sitzung',
  'permanent',
  'Commission',
  'Verhandelt',
  'Wien',
  'September',
  'Anfang',
  'Sitzung',
  'Anwesend',
  'Mitglied',
  'permanent',
  'Commission',
  'Herr',
  'Fligely',
  'Bruhns',
  'Forsch',
  'Commissare',
  'Herr',
  'Barozzi',
  'Ganahl',
  'Perrier',
  'Plantamour',
  'Saget',
  'Thöt',
  'Tinter',
  'Vecchi',
  'Präsident',
  'Herr',
  'Fligely',
  'Präsident',
  'eröffnen',
  'Sitzung',
  'sprechen',
  'Bedauern',
  'permanent',
  'Commission',
  'Mitglied',
  'anwesend',
  'wodurch',
  'beschlussfähig',
  'verlesen',
  'Schreiben',
  'Herrn',
  'Baeyer',
  'Heidelberg',
  'erkranken',
  'Schreiben',
  'Herrn',
  'Bauernfeind',
  'Bad',
  'ge-',
  'brauchen',

  'points',
  'aussi',
  'mesur',
  'longitude',
  'par',
  'observation',
  'lunaires',
  'mais',
  'seulement',
  'pour',
  'avoir',
  'une',
  'valeur',
  'cet',
  '16-',
  'ment',
  'attendant',
  'une',
  'determination',
  'plus',
  'exacte',
  'par',
  'capitaine',
  'Perrier',
  'ensuite',
  'sur',
  'relier',
  'jour',
  'reseau',
  'geodesique',
  'Algerie',
  'avec',
  'celui',
  'rösulte',
  'effet',
  'une',
  'reconnaissance',
  'sur',
  'les',
  'cötes',
  'Algerie',
  'regard',
  'cötes',
  'Espagne',
  'que',
  'les',
  'points',
  'Espagne',
  'Algerie',
  'forment',
  'immense',
  'qui',
  'pourra',
  'servir',
  'reseau',
  'jonction',
  'entre',
  'les',
  'deux',
  'Europe',
  'tout',
  'moins',
  'une',
  'premiere',
  'bien',
  'reconnaissance',
  'pour',
  'cette',
  'grande',
  'operation',
  'internationale',
  'Ainsi',
  'Parc',
  'möridien',
  'frangais',
  'dejä',
  'vers',
  'nord',
  'jusqu',
  'aux',
  'Shetland',
  'pourra',
  's’&tendre',
  'bientöt',

  'chaine',
  'Strasbourg',
  'contraire',
  'partie',
  'occidentale',
  'parallöle',
  'Paris',
  'ainsi',
  'que',
  'les',
  'trois',
  'trongons',
  'möridienne',
  'sont',
  'erreurs',
  'tant',
  'moins',
  'que',
  'accorder',
  'une',
  'effets',
  'qui',
  'minutes',
  'plus',
  'sur',
  'les',
  'coordonndes',
  'point',
  'depart',
  'Paris',
  'est',
  'sans',
  'doute',
  'regrettable',
  'pouvoir',
  'offrir',
  'autres',
  'applications',
  'mais',
  'nous',
  'devons',
  'que',
  'les',
  'triangulations',
  'par',
  'notre',
  'collögue',
  'Capitaine',
  'Perrier',
  'vous',
  'annee',
  'prochaine',
  'rösultats',
  'interessants',
  'premier',
  'offre',
  'moyen',
  'contröle',
  'facile',
  'rapid',
  'geodesiques',
  'nous',
  'allons',
  'voir',
  'que',
  'combinaison',
  'avec',
  'second',
  'th&or&me',
  'permettent',
  'r&soudre',
  'une',
  'question',
  'qui',
  'avait',
  'möme',
  'pas',
  'celle',
  'determination',
  'vraie',
  'figure',
  'Terre',
 

  'Ergebnis',
  'Berichtsjahres',
  'übernehmen',
  'Wunsch',
  'Herrn',
  'Professor',
  'Dr.',
  'Kohlschütter',
  'endgültig',
  'Ableitung',
  'Schwerkrafts-',
  'werte',
  'Beobachtung',
  'Herr',
  'Professor',
  'Haasemann',
  'beschäftigen',
  'hauptsächlich',
  'Untersuchung',
  'Nickelstahlpendeln',
  'bereiten',
  'Hand-',
  'schrift',
  'Ergebnis',
  'Beobachtung',
  'letzt',
  'drucken',
  'Herr',
  'Dr.',
  'Förster',
  'führen',
  'verschieden',
  'Reihe',
  'Refraktionsbeobachtungen',
  'mittels',
  'Turm',
  'Grund',
  'Ing.',
  'Alfred',
  'Berroth',
  'ausgeführt',
  'Berechnung',
  'ergänzen',
  'Berliner',
  'Akademie',
  'Abhandlung',
  'verlaufen',
  'Schwer-',
  'kraft',
  'Länge',
  'breiten',
  'Meeresniveau',
  'vorlegen',
  'Gestalt',
  'erden',
  'ziehen',
  'scheinen',
  'sichern',
  'abweichen',
  'Herr',
  'Professor',
  'Dr.',
  'Dr.',
  'Budapest',
  'führen',
  'laufen',
  'Sommer',
  'Anschlußmessungen',
  'Schwer-',
  'kraft',
  'Budapest',
  'Potsd

  'Ab-',
  'weichung',
  'Geoids',
  'Zentral-',
  'finden',
  'hiermit',
  'stimmen',
  'Herrn',
  'findend',
  'Wert',
  'hinreichen',
  'überein',
  'erforderlich',
  'stereographischer',
  'karten',
  'Indien',
  'Projektion',
  'Herr',
  'Förster',
  'freundlichst',
  'zeichnen',
  'beginnen',
  'auftragen',
  'Herrn',
  'Geheimrat',
  'Helmert',
  'isostatischen',
  'Reduktion',
  'Küstenstationen',
  'befassen',
  'vergleiche',
  'Jahresbericht',
  'Petermanns',
  'geogr',
  'Mit-',
  'teilungen',
  'schreiben',
  'Aufsatz',
  'Isostasie',
  'Panamakanal',
  'vorig',
  'Bericht',
  'erwähnen',
  'Reduktion',
  'Niveaumeterablesungen',
  'hydrostatisch',
  'Nivellements',
  'Telegraphenberge',
  'Potsdam',
  'Umfang',
  'Bogen',
  'binden',
  'XIV',
  'Heft',
  'Beitrag',
  'Geophysik',
  'erscheinen',
  'Mondwelle',
  'ver-',
  'hindern',
  'infolge',
  'Fehlen',
  'Registriervorrichtung',
  'Einfluß',
  'Windstöße',
  'herausstellen',
  'Privatim',
  'schreiben',
  'Bemerkung',

  'Grundlinien',
  'Potsdam',
  'Draht-',
  'Schubin',
  'Drahtmessungen',
  'Berlin',
  'Drahtmessungen',
  'Schwerkrafts-',
  'Breitenbestimmungen',
  'Nähe',
  'Meridian',
  'östlich',
  'Greenwich',
  'Station',
  'tabellarisch',
  'Arbeit',
  'wesentlich',
  'ausführen',
  'früh',
  'gänzlich',
  'unabhängig',
  'Rechnung',
  'sichern',
  'stellen',
  'Herstellung',
  'Text',
  'Ausführung',
  'Anzahl',
  'klein',
  'Rechnung',
  'Genauigkeitsuntersuchungen',
  'vorläufig',
  'Ergebnis',
  'vorliegen',
  'harren',
  'Erledigung',
  'Bearbeitung',
  'Zeitbestimmungen',
  'Schwere-',
  'messungen',
  'herausstellen',
  'Niveau',
  'benutzen',
  'alt',
  'Universal-',
  'instruments',
  'Nähe',
  'Mitte',
  'Teilung',
  'ansetzen',
  'wodurch',
  'Genauigkeit',
  'einzeln',
  'Uhrkorrektion',
  'vergleichen',
  'erreichen',
  'schärfen',
  'Durchgangsbeobachtungen',
  'beeinträchtigen',
  'Einfluß',
  'Genauigkeit',
  'Uhrganges',
  'dürfen',
  'meist',
  'Umfang',
  'Zeitbestimmung'

  'gelingen',
  'nämlich',
  'Diskussion',
  'seismisch',
  'Be-',
  'obachtungen',
  'Upsala',
  '1907—1912',
  'Bemerkung',
  'Arbeit',
  'Herrn',
  'Professor',
  'Schweydar',
  'besorgen',
  'fern',
  'Ablesungen',
  'Freiberger',
  'Registrierung',
  'führen',
  'einig',
  'klein',
  'Kon-',
  'Ferner',
  'beteiligen',
  'Korrekturlesen',
  'Jahresberichts',
  'Tätigkeits-',
  'Zentralbureaus',
  'letzt',
  'Vierteljahr',
  'Berichtsjahres',
  'vorwiegen',
  'Ableitung',
  'Mondwelle',
  'Beobachtung',
  'hydrostatisch',
  'Nivellements',
  'beschäftigen',
  'Trotz',
  'umfangreich',
  'Rechnung',
  'abschließend',
  'Ergebnis',
  'langen',
  'Genauigkeit',
  'Niveaumeter',
  'hinreichen',
  'Zweck',
  'Betracht',
  'kommend',
  'Zeitraum',
  'letzt',
  'Feststellung',
  'halbe',
  'be-',
  'Gezeiten',
  'ermöglichen',
  'scheinen',
  'unbeträchtliche',
  'Fehler',
  'Herkunft',
  'vorhanden',
  'einstweilen',
  'absehen',
  'Elimination',
  'wünschenswert',
  'Sicherheit',
  'gel

  'Johannesburg',
  'Transvaal',
  'reduzieren',
  'freiwillig',
  'Kooperation',
  'Breitenforschung',
  'mehrer',
  'Sternwarten',
  'gaben',
  'Anlaß',
  'umfänglichen',
  'Briefwechsel',
  'auftragen',
  'Königlich',
  'Bayerische',
  'Gradmessungs-',
  'kommission',
  'Herr',
  'Professor',
  'Schnauder',
  'Observator',
  'Kommission',
  'Herrn',
  'Dr.',
  'Zapp',
  'Spätsommer',
  'Längen-',
  'bestimmungen',
  'München-Kirchheim',
  'München-Asten',
  'ausführen',
  'wodurch',
  'europäisch',
  'Längengradmessung',
  'Laplacesche',
  'punkten',
  'bereichern',
  'Vorjahr',
  'Herrn',
  'Geheimrat',
  'Albrecht',
  'Observator',
  'Herrü',
  'Professor',
  'Dr.',
  'Flotow',
  'ausgeführt',
  'Längen-',
  'bestimmungen',
  'berechnen',
  'veröffentlichen',
  'Nummer',
  'Zeit-',
  'Uhrendienst',
  'wiederum',
  'Herr',
  'Professor',
  'Wanach',
  'Unterstützung',
  'Herr',
  'Professor',
  'Dr.',
  'Flotow',
  'Dr.',
  'Boltz',
  'besorgen',
  'Leitung',
  'Mitwirkung',
  'Her

  'Ortsbestimmung',
  'Seminar',
  'orientalisch',
  'sprechen',
  'Dozent',
  'Praxis',
  'astro-',
  'nomischen',
  'Ortsbestimmung',
  'erhalten',
  'Veranlassung',
  'Reichskolonialamtes',
  'Herr',
  'abrundend',
  'Ausbildung',
  'Zweck',
  'Grenzregulierung',
  'Kongo',
  'Observator',
  'Prof',
  'Haasemann',
  'Monat',
  'April',
  'Mai',
  'Berichtsjahres',
  'widmen',
  'Untersuchung',
  'elektrisch',
  'geheizt',
  'Wärmekastens',
  'Reduktionsarbeiten',
  'Feldbeobachtungen',
  'Ein-',
  'führung',
  'Königlich',
  'Niederländische',
  'Ingenieur',
  'Herrn',
  'Vening-',
  'Meinesz',
  'üblich',
  'Beobachtung',
  'Reduktion',
  'Pendelbeobachtungen',
  'Herr',
  'Vening-Meinesz',
  'Beamter',
  'Königlich',
  'Niederländische',
  'Gradmessungskommission',
  'berufen',
  'Untersuchung',
  'verlaufen',
  'Schwerkraft',
  'Heimatlande',
  'ausführen',
  'Feldarbeiten',
  'Sommer',
  'besuchen',
  'genannt',
  'Herr',
  'Station',
  'beteiligen',
  'regster',
  'erfolgreich'

  'exceptionnellement',
  'considerablement',
  'les',
  'observations',
  'point',
  'permis',
  'leur',
  'faire',
  'une',
  'zöne',
  'plus',
  'tendue',
  'Les',
  'direetions',
  'ler',
  'ordre',
  'observees',
  'sont',
  'eroquis',
  'par',
  'lignes',
  'tracdes',
  'rouge',
  'Entre',
  'temps',
  'triangulation',
  'ordre',
  'entreprise',
  'pour',
  'servir',
  'base',
  'aux',
  'travaux',
  'construction',
  'carte',
  'pays',
  'Elle',
  'pour',
  'objet',
  'points',
  'suivants',
  'Tour',
  'St.',
  'elocher',
  'St.',
  'elocher',
  'Deux',
  'offieiers',
  'ont',
  'charges',
  'travail',
  'completement',
  'termine',
  'Les',
  'direetions',
  'ordre',
  'ainsi',
  'observees',
  'sont',
  'par',
  'lignes',
  'noire',
  'Enfin',
  'dans',
  'but',
  'rattacher',
  'niveau',
  'geodesique',
  '1er',
  'ordre',
  'elochers',
  'qui',
  'grand',
  'nombre',
  'dans',
  'pays',
  'commence',
  'une',
  'triangulation',
  'tous',
  'ces',
  'points',
  'dont',
  'le

  'entgegen',
  'wenig',
  'Landes-Vermessung',
  'disponibel',
  'geblieben',
  'Kraft',
  'verflossen',
  'Vervollständigung',
  'Berichtigung',
  'trigonome-',
  'trischen',
  'Höhenbestimmungen',
  'einig',
  'geometrische',
  'Nivellements',
  'ausführen',
  'nen',
  'nämlich',
  'Warnemünde',
  'Ostseepegel',
  'Warnemünde',
  'Ostseepegel',
  'Wismar',
  'Ostseepegel',
  'genannt',
  'Nivellementslinien',
  'Hauptpunkten',
  'trigonometrischen',
  'Nivellements',
  'nämlich',
  'nivellirten',
  'Strecke',
  'Länge',
  'Kilometer',
  'Strecke',
  'doppeln',
  'nivellirt',
  'Nivellementslinien',
  'laufen',
  'so',
  'genannt',
  'Schleife',
  'bilden',
  'Beitrag',
  'Bestimmung',
  'Zuverlässigkeit',
  'Nivellements',
  'liefern',
  'genannt',
  'Strecke',
  'betragen',
  'Summe',
  'Schleife',
  'Fehler',
  'Schleife',
  'übrig',
  'lassen',
  'ergiebt',
  'wahrscheinliche',
  'Unsicherheit',
  'Nivellements',
  'Kilometer',
  'Millimeter',
  'Unsicherheit',
  'grösser',
  'Sc

  'Zenithdistanzen',
  'Nähe',
  'Meridian',
  'verschieden',
  'Stand',
  'Kreis',
  'verscheiden',
  'jedesmal',
  'einstellen',
  'Einstellung',
  'unmittelbar',
  'ergiebt',
  'Biegung',
  'eliminiren',
  'Polarstern',
  'Norden',
  'beobachten',
  'hell',
  'Stern',
  'verschieden',
  'Zeit',
  'Süden',
  'Zenithdistanz',
  'nahe',
  'Polarsterns',
  'vollständig',
  'Breitenbestimmung',
  'Höhenmessungen',
  'Polarsterns',
  'verschieden',
  'Zeit',
  'anstellen',
  'Zeit',
  'womöglich',
  'wählen',
  'Hälfte',
  'Beobachtung',
  'Stunde',
  'grössern',
  'Polarsterns',
  'anstellen',
  'gewöhnlich',
  'ausführen',
  'Einstellung',
  'Ocular',
  'West',
  'Ost',
  'zeigen',
  'Ost',
  'West',
  'West',
  'Abend',
  'Südsterne',
  'nehmen',
  'Stern',
  'Einstellung',
  'kreisen',
  'Ost',
  'West',
  'Stern',
  'West',
  'Ost',
  'Ferner',
  'Breitenbestimmung',
  'Passagen-Instrument',
  'gebrochen',
  'Fern-',
  'rohr',
  'Lin',
  'Oeffnung',
  'Abend',
  'Abend',
  'Stern',
 

  'Nullpunkt',
  'zuletzt',
  'Operation',
  'Störung',
  'ausführen',
  'vorhanden',
  'Drehung',
  'eliminirt',
  'vorhanden',
  'sogar',
  'Objeet',
  'Lage',
  'Fernrohr',
  'sichtbar',
  'besonder',
  'Verbindung',
  'Lage',
  'Stellung',
  'Kreis',
  'nachholen',
  'Operation',
  'demnächst',
  'Stand',
  'Kreis',
  'wiederholen',
  'Nullpunkt',
  'Grad',
  'einstellen',
  'jed',
  'Objeet',
  'Grad',
  'verschieden',
  'Stelle',
  'Kreis',
  'einstellen',
  'jedesmal',
  'links',
  'rechts',
  'ablesen',
  'betragen',
  'zahlen',
  'mikroskopischen',
  'Ein-',
  'stellungen',
  'jed',
  'Objeet',
  'vortheilhaft',
  'Anwendung',
  'Nullpunktes',
  'Winkelmessung',
  'Erfahrung',
  'letzt',
  'Sommer',
  'ergeben',
  'mancherlei',
  'Uebelstände',
  'ver-',
  'bunden',
  'grösste',
  'Vorsicht',
  'anwenden',
  'Null-',
  'punkt',
  'dienend',
  'Thurmspitze',
  'entfernen',
  'nahe',
  'klar',
  'Bild',
  'Oculars',
  'geben',
  'ersteren',
  'fallen',
  'Phase',
  'befürchten',

  'serait',
  'moins',
  'fois',
  'les',
  'devaient',
  'tre',
  'observees',
  'quand',
  'les',
  'Les',
  'observations',
  'definitiv',
  'sont',
  'dejä',
  'faites',
  'stations',
  'observer',
  'par',
  'stations',
  'pour',
  'toutes',
  'celles',
  'qui',
  'sont',
  'termindes',
  'pre-',
  'partie',
  'directions',
  'les',
  'plus',
  'probables',
  'relativ',
  'chaque',
  'station',
  'les',
  'caleuls',
  'triangles',
  'fait',
  'avec',
  'ces',
  'resultats',
  'donnent',
  'certitude',
  'que',
  'les',
  'erreurs',
  'sont',
  'dans',
  'les',
  'limites',
  'par',
  'les',
  'geodesiques',
  'international',
  'Tous',
  'ces',
  'travaux',
  'poursuivent',
  'depuis',
  'par',
  'une',
  'commission',
  'speciale',
  'Officiers',
  'Artillerie',
  'Genie',
  'Major',
  'Les',
  'observations',
  'latitudes',
  'longitudes',
  'quelques',
  'points',
  'geodesiques',
  'sont',
  'Observatoire',
  'Madrid',
  'ainsi',
  'que',
  'determination',
  'positions',
  'v

  'bilden',
  'Brücke',
  'Schemel',
  'setzen',
  'Maassstäben',
  'Unterlage',
  'dienen',
  'Maassstab',
  'frei',
  'unabhängig',
  'Schemel',
  'ausdehnen',
  'Rolleylinder',
  'glasen',
  'quer',
  'Brücke',
  'legen',
  'Cylinder',
  'liegen',
  'senkrecht',
  'Längenaxe',
  'Maassstabes',
  'Maassstab',
  'Toise',
  'träge',
  'Ständer',
  'spiegeln',
  'Ende',
  'Toise',
  'mein',
  'Fuss',
  'Glaskasten',
  'orientirt',
  'Höhe',
  'stellen',
  'Mitte',
  'treffen',
  'Toise',
  'seitlich',
  'richten',
  'Axe',
  'Toise',
  'führen',
  'Apparat',
  'zusammenstellen',
  'dienen',
  'Stab',
  'Flüssigkeit',
  'setzen',
  'ete',
  'absolut',
  'Ausdehnung',
  'aufgelegt',
  'Toise',
  'be-',
  'stimmen',
  'Toise',
  'Meter',
  'vergleichen',
  'Toise',
  'Rolleylinder',
  'Meter',
  'unter',
  'Abschiebeeylinder',
  'Pfeiler',
  'drücken',
  'her-',
  'ausnehmen',
  'spiegeln',
  'Höhe',
  'verstellen',
  'Mitte',
  'Axe',
  'Toise',
  'Meter',
  'liegen',
  'Toisen',
  'vergl

  'da-',
  'Nordparallel',
  'erhalten',
  'Resultat',
  'Südhalbkugel',
  'übertragen',
  'Arbeit',
  'Geodätische',
  'Institut',
  'aus-',
  'führen',
  'erwähnen',
  'Einleitung',
  'Vorbereitung',
  'Sommer',
  'vorgenommen',
  'Längenbestimmungen',
  'Pots-',
  'Nottuln—Kaiserberg',
  'Kaiserberg—Lüß',
  'Kaiserberg—',
  'Potsdam',
  'vorjährigen',
  'Bericht',
  'erwähnen',
  'Plan',
  'Kooperation',
  'Coast',
  'and',
  'Geodetic',
  'Survey',
  'transatlantische',
  'Längenbestimmung',
  'ausführen',
  'bezug',
  'letzter',
  'insofern',
  'Verän-',
  'erfahren',
  'inzwischen',
  'französisch',
  'Seite',
  'drahtlose',
  'Längenbestimmung',
  'Eiffelturm',
  'Washington',
  'Angriff',
  'nehmen',
  'Geodätische',
  'Institut',
  'nehmen',
  'Ab-',
  'stehen',
  'geplant',
  'Längenbestimmung',
  'drahtlos',
  'Weg',
  'aus-',
  'zuführen',
  'Deutsch-Atlantischen',
  'Telegraphen-',
  'gesellschaft',
  'gehörig',
  'Kabel',
  'Emden',
  'York',
  'bedienen',
  'betreiben',


  'registrieren',
  'Störung',
  'technisch',
  'Dienst',
  'versehen',
  'Herr',
  'Sekretär',
  'kühn',
  'Aus-',
  'messung',
  'Seismogramm',
  'Zusammenstellung',
  'Veröffentlichung',
  'Seismometrischen',
  'Beobachtung',
  'besorgen',
  'Herr',
  'Meißner',
  'stellen',
  'Erdbebenhaus',
  'Neigung',
  'äußern',
  'empfindlich',
  'Horizontalpendel',
  'Bewegung',
  'photo-',
  'graphisch',
  'registrieren',
  'Studium',
  'Gravimeter',
  'beobachten',
  'Welle',
  'Minute',
  'Periode',
  'dienen',
  'Registrierung',
  'zeigen',
  'unruhig',
  'verkehren',
  'Stadt',
  'Potsdam',
  'verursachen',
  'Bewegung',
  'Tag',
  'reichen',
  'kurz',
  'Welle',
  'Amplitude',
  'Nacht',
  'weisen',
  'lang',
  'Welle',
  'Minute',
  'Minute',
  'Amplitude',
  'seismische',
  'Zweck',
  'dienend',
  'Horizontal-',
  'pendel',
  'Neigung',
  'empfindlich',
  'zeigen',
  'beschrieben',
  'Bewegung',
  'Gravimeter',
  'Aufstellung',
  'Brunnenkammer',
  'vorjährigen',
  'Bericht',
  'erwäh

  'holungen',
  'stets',
  'scheinen',
  'Ausführbarkeit',
  'Vorschlag',
  'genügen',
  'begründen',
  'kommen',
  'Nachmessung',
  'Basis',
  'dahier',
  'Anfang',
  'Entscheidung',
  'wünschenswerth',
  'stelle',
  'Commission',
  'anheim',
  'Zweitens',
  'Leistung',
  'Repsold',
  'schen',
  'Bessel',
  'Anwendung',
  'bringen',
  'vergleichen',
  'Zahl',
  'Resultat',
  'wirklich',
  'Vergleiehung',
  'Bestimmung',
  'mittler',
  'Fehler',
  'vollständig',
  'einmalig',
  'Vergleichung',
  'giebt',
  'sicher',
  'desshalb',
  'mittler',
  'Fehler',
  'Comparators',
  'vorläufig',
  'Vergleichungen',
  'Meterstäben',
  'ableiten',
  'Resultat',
  'Akademie',
  'Dezember',
  'ergeben',
  'Resultat',
  'nahe',
  '5mal',
  'klein',
  'Fehler',
  'giebt',
  'Vergleichung',
  'Comparator',
  'Sicherheit',
  'Vergleichungen',
  'Repsold',
  'schen',
  'Comparator',
  'giebt',
  'Vergleichungen',
  'mittler',
  'Fehler',
  'Sicherheit',
  'bestimmen',
  'Herr',
  'Professor',
  'Voit',
 

  'vorher',
  'Mühe',
  'bringen',
  'Behufe',
  'Untersuchung',
  'Exemplar',
  'Apparat',
  'Stand',
  'bringen',
  'absolut',
  'Bestimmung',
  'per-',
  'sönlichen',
  'Fehler',
  'eignen',
  'Monat',
  'Februar',
  'schreiben',
  'Herrn',
  'Director',
  'Quetelet',
  'Herrn',
  'Professor',
  'Argelander',
  'bitten',
  'nächst',
  'Sommer',
  'gleichzeitig',
  'Längenbestimmung',
  'Brüssel',
  'Bonn',
  'Leid',
  'mitwirken',
  'schlagen',
  'nahezu',
  'Methode',
  'befolgen',
  'Längenbestimmung',
  'Leipzig',
  'Dangast',
  'Göttingen',
  'Leid',
  'vorig',
  'anwenden',
  'bewähren',
  'fügen',
  'bitten',
  'aus-',
  'Beschreibung',
  'Abbildung',
  'Einrichtung',
  'hinzu',
  'vorig',
  'genannt',
  'Längenbestimmungen',
  'Leidener',
  'Sternwarte',
  'triefen',
  'bieten',
  'sogleich',
  'unbestimmt',
  'gebrauchen',
  'obengenannten',
  'Apparat',
  'Hoffnung',
  'Bestimmung',
  'persönlich',
  'Fehler',
  'versichern',
  'erleichtern',
  'Herrn',
  'Professor',
  'Ar

  'liegend',
  'punkten',
  'Hohelohr',
  'Astenberg',
  'spät',
  'Erweiterung',
  'Dreiecksnetzes',
  'Westphalen',
  'nehmen',
  'Hohelohr',
  'finden',
  'spuren',
  'Punkt',
  'zuletzt',
  'beobachten',
  'Auskunft',
  'erhalten',
  'Astenberg',
  'Signal',
  'formen',
  'Stange',
  'stark',
  'Knopf',
  'errichten',
  'umgehend',
  'Punkt',
  'vorläufig',
  'mar-',
  'Hasserod',
  'finden',
  'Börsch',
  'angegeben',
  'Marke',
  'Beobachtungspfeiler',
  'vorhanden',
  'demnach',
  'erbauen',
  'übernehmen',
  'letzter',
  'Geschäft',
  'schicken',
  'Recognoseirung',
  'punkten',
  'Dünstberg',
  'Feld-',
  'berg',
  'Fleckert',
  'punkten',
  'finden',
  'Nassauische',
  'Aufstellen',
  'Instrument',
  'tauglich',
  'Steinpfeiler',
  'Richtung',
  'aushauen',
  'Fleckert',
  'ebenfalls',
  'Nassauische',
  'Pfeiler',
  'vorhanden',
  'Feldberg',
  'Frankfurter',
  'Gesellschaft',
  'Restaurations-Gebäude',
  'aufführen',
  'nahe',
  'alt',
  'punkten',
  'Aufstellung',
  'unmög

  'Löwenburg',
  'arten',
  'Bergheim',
  'Sternw',
  'Passagen-Instrument',
  'Sternwarte',
  'Finkenberg',
  'Siegburg',
  'Löwenburg',
  'Michelsberg',
  'Meridianmarke',
  'lügen',
  'Entfern',
  'Entfern',
  'Gewicht',
  'Seite',
  'wahrscheinlicher',
  'Fehler',
  'Länge',
  'Oldenburg',
  'mitgetheilte',
  'Dreiecksnetz',
  'Verbindung',
  'Dangast',
  'Helgoland',
  'ausgleichen',
  'berechnen',
  'Winkelmessungen',
  'vorig',
  'Professor',
  'Sadebeck',
  'Dr.',
  'mein',
  'Bericht',
  'Station',
  'ausgleichen',
  'rechnungen',
  'ausführen',
  'Röderau',
  'Jüterbogk',
  'Leipzig',
  'Jüterbogk',
  'Berlin',
  'Neustadt-Eberswalde',
  'redueirt',
  'definitiv',
  'ausgleichen',
  'Ausgleichung',
  'Schluß',
  'Arbeit',
  'geschehen',
  'vorläufig',
  'Rechnung',
  'ergeben',
  'Fixpunkt',
  'Berliner',
  'Bahnhof',
  'Leipzig',
  'Bahnhof',
  'Röderau',
  'Umweg',
  'Jüterbogk',
  'finden',
  'Mittheilung',
  'Herrn',
  'Weisbach',
  'vorläufig',
  'Rechnung',
  'direeten'

  'unternehmen',
  'wo-',
  'badisch',
  'Seite',
  'Herr',
  'Professor',
  'Jordan',
  'Polytechnicum',
  'Carlsruhe',
  'seits',
  'unterzeichnen',
  'Commissär',
  'Baur',
  'Ueber',
  'günstig',
  'Stand',
  'hervorragend',
  'Höhe',
  'Odenwalds',
  'Theil',
  'früh',
  'Arbeit',
  'vorhanden',
  'Theil',
  'neu',
  'gebaut',
  'Thürme',
  'Pfeiler',
  'Arbeit',
  'mässigen',
  'betragen',
  'redueiren',
  'Jordan',
  'badisch',
  'Regierung',
  'gewünscht',
  'Bericht',
  'erstatten',
  'polytechnische',
  'schulen',
  'Stuttgart',
  'Zweck',
  'grösserer',
  'arbeiten',
  'Theodolith',
  'Pistor',
  'Martin',
  'Berlin',
  'bestellen',
  'Stuttgart',
  'Febr',
  'Baur',
  'Schoder',
  'Zech',
  'Nachtrag',
  'Oesterreich',
  'Bericht',
  'europäische',
  'Gradmessung',
  'ausgeführt',
  'astronomisch',
  'geodätisch',
  'Arbeit',
  'Generalbericht',
  'Arbeit',
  'summarisch',
  'anführen',
  'verfasst',
  'beschäftigen',
  'Officiere',
  'einlaufen',
  'Detail',
  'folgen',
  

  'Sternwarte',
  'Professor',
  'Leipzig',
  'nageln',
  'Professor',
  'polytechnisch',
  'schulen',
  'Dresden',
  'Schwede',
  'Norwegen',
  'Dr.',
  'Lindhagen',
  'Secretair',
  'Königl',
  'Akademie',
  'Professor',
  'Stockholm',
  'Dr.',
  'Fearnley',
  'Director',
  'Sternwarte',
  'Christiania',
  'Schweiz',
  'Dr.',
  'Hirsch',
  'Director',
  'Sternwarte',
  'Neuchatel',
  'Würtemberg',
  'Dr.',
  'Baur',
  'Professor',
  'Polytechnische',
  'schulen',
  'Stuttgart',
  'Conferenz',
  'Eingeladen',
  'Excellenz',
  'Minister',
  'geistlich',
  'Unterrichts-',
  'An-',
  'gelegenheiten',
  'Herr',
  'Dr.',
  'Mühler',
  'Berlin',
  'Dr.',
  'Auwers',
  'Mitglied',
  'Akademie',
  'Wissenschaft',
  'Berlin',
  'Dr.',
  'Excellenz',
  'General',
  'Berlin',
  'Chauvin',
  'Oberst',
  'Director',
  'Berlin',
  'Dr.',
  'Dove',
  'Geheimer',
  'Regierungsrath',
  'Professor',
  'Berlin',
  'Mitglied',
  'Akademie',
  'Wissenschaft',
  'Berlin',
  'Hesse',
  'Excellenz',
  'Gener

  'Herr',
  'Professor',
  'Schering',
  'eingehend',
  'Bemerkung',
  'hinzufügen',
  'Bericht',
  'Commission',
  'Conferenz',
  'annehmen',
  'Präsident',
  'Commission',
  'Herr',
  'Lindhagen',
  'ersuchen',
  'Herrn',
  'Wiitstein',
  'Berichterstatter',
  'Frage',
  'Programm',
  'Fehlervertheilung',
  'Anschlussseiten',
  'Berechnung',
  'Coordinaten',
  'astronomisch',
  'bestimmen',
  'punkten',
  'betreffen',
  'referiren',
  'anschliessend',
  'theilt',
  'Herr',
  'Hügel',
  'Darstellung',
  'Verfahren',
  'Ausgleichung',
  'Dreiecksnetzen',
  'lassen',
  'empfehlen',
  'Methode',
  'vortrefflich',
  'überreichen',
  'Centralbureau',
  'einig',
  'Exemplar',
  'versprechen',
  'sämmtliche',
  'Conferenzmitglieder',
  'Exemplar',
  'ab-',
  'drucken',
  'lassen',
  'überreichen',
  'Centralbureau',
  'Abschrift',
  'ausgeführt',
  'Rechnung',
  'Zusammenstellung',
  'Dreieck',
  'Rang',
  'Westphalen',
  'Herr',
  'Präsident',
  'danken',
  'Mittheilungen',
  'Geschenk',
  

  'bahnen',
  'Nordpols',
  'Herr',
  'Geheimrat',
  'Albrecht',
  'Astr',
  'Nachr',
  'Nummer',
  'Südhalbkugel',
  'lagen',
  'Beobachtung',
  'Oncativo',
  'Januar',
  'Juli',
  'Reduktion',
  'unterwerfen',
  'Ergebnis',
  'genügend',
  'Übereinstimmung',
  'Nordparallel',
  'Ferner',
  'Material',
  'Beobachtungsjahres',
  'Johannesburg',
  'Transvaal',
  'reduzieren',
  'freiwillig',
  'Kooperation',
  'Breitenforschung',
  'mehrer',
  'Sternwarten',
  'gaben',
  'Anlaß',
  'umfänglichen',
  'Briefwechsel',
  'auftragen',
  'Königlich',
  'Bayerische',
  'Gradmessungs-',
  'kommission',
  'Herr',
  'Professor',
  'Schnauder',
  'Observator',
  'Kommission',
  'Herrn',
  'Dr.',
  'Zapp',
  'Spätsommer',
  'Längen-',
  'bestimmungen',
  'München-Kirchheim',
  'München-Asten',
  'ausführen',
  'wodurch',
  'europäisch',
  'Längengradmessung',
  'Laplacesche',
  'punkten',
  'bereichern',
  'Vorjahr',
  'Herrn',
  'Geheimrat',
  'Albrecht',
  'Observator',
  'Herrü',
  'Professor',


  'Profil',
  'Brocken',
  'anschließen',
  'astro-',
  'nomischen',
  'Punkt',
  'Sophienhoi',
  'Schleswig',
  'Geoid',
  'Ellipsoid',
  'zusammenfallen',
  'ängenommen',
  'Sodann',
  'karten',
  'Geoids',
  'Maßstab',
  '1:250000',
  'zeichnen',
  'Isohypsen',
  'abstehen',
  'Arbeit',
  'Berechnung',
  'für-',
  'Unterschied',
  'N—N',
  'Wahl',
  'mittler',
  'dicht',
  'gebieten',
  'Gelände-Reduktionen',
  'bedingt',
  'Oktober',
  'Herrn',
  'Dr.',
  'Adrian',
  'wesentlich',
  'unterstützen',
  'verschieden',
  'Kon-',
  'ferenz',
  'Internationale',
  'Erdmessung',
  'Hamburg',
  'zusammen-',
  'hängend',
  'berichten',
  'Zusammenstellung',
  'Anspruch',
  'nehmen',
  'insbesondere',
  'verfassen',
  'Bericht',
  'Fortschritt',
  'Triangulationen',
  'druckfertig',
  'Mitte',
  'April',
  'rumänische',
  'Hauptmann',
  'Herr',
  'Georgescu',
  'Sebastien',
  'Bukarest',
  'Woche',
  'Aus-',
  'bildung',
  'Ausgleichungsrechnung',
  'mein',
  'geodätisch',
  'An-',
  'wendun

  'Fligely',
  'Forsch',
  'Hirsch',
  'Kaiser',
  'Ricei',
  'einig',
  'genehmigen',
  'Herr',
  'Baeyer',
  'Herrn',
  'Fligely',
  'sprechen',
  'Comm',
  'freundliche',
  'ale',
  'Sitzung',
  'gez',
  'Fligely',
  'gez',
  'Baeyer',
  'gez',
  'Ricei',
  'gez',
  'Forsch',
  'gez',
  'Kaiser',
  'gez',
  'Hirsch',
  'gez',
  'Bruhns',
  'Vicepräsident',
  'drucken',
  'Georg',
  'Reimer',
  'Berlin',
  'Protokoll',
  'Verhandlung',
  'Conferenz',
  'Europäische',
  'Gradmessung',
  'abhalten',
  'September',
  'WIEN',
  'Schriftführern',
  'permanent',
  'Commission',
  'Redigirt',
  'Dr.',
  'Bruhns',
  'Dr.',
  'Hirsch',
  'Manuseript',
  'drucken',
  'Oonferenz',
  'Europäische',
  'Grad-',
  'messung',
  'gegenwärtig',
  'bevollmächtigt',
  'Baden',
  'Herr',
  'Jordan',
  'Professor',
  'Polytechnikum',
  'Carlsruhe',
  'Bayer',
  'Dr.',
  'Bauernfeind',
  'Director',
  'Professor',
  'polytechnisch',
  'schulen',
  'München',
  'Dr.',
  'Seidel',
  'Professor',
  'München',

  'Wunsch',
  'Ausführung',
  'Antrages',
  'vortheilhaft',
  'Construction',
  'verschieden',
  'Anwendung',
  'befindliche',
  'registrirenden',
  'Pegel',
  'kennen',
  'lernen',
  'Herr',
  'Commissare',
  'Staat',
  'Pegel',
  'vor-',
  'handen',
  'ersuchen',
  'Beschreibung',
  'baldmöglichst',
  'Centralbüreau',
  'einsenden',
  'selbige',
  'zusammenstellen',
  'mittheilen',
  'Wunsch',
  'finden',
  'einstimmig',
  'Annahme',
  'Herr',
  'Präsident',
  'Depesche',
  'Herrn',
  'Delaunay',
  'mitge-',
  'theilt',
  'wonach',
  'selbiger',
  'Wahl',
  'Mitglied',
  'permanent',
  'Commission',
  'annehmen',
  'Sitzung',
  'Minute',
  'schließen',
  'Sitzung',
  'Verhandelt',
  'Wien',
  'September',
  'Anfang',
  'Sitzung',
  'Minute',
  'Anwesend',
  'Herr',
  'Commissare',
  'Baeyer',
  'Barozzi',
  'Bauernfeind',
  'Baur',
  'Bruhns',
  'Fearnley',
  'Fligely',
  'Forsch',
  'Herr',
  'Hirsch',
  'Hügel',
  'Ibanez',
  'Jordan',
  'Karlinski',
  'Paschen',
  'Peter',
  'Sade

  'Winkelmessung',
  'Polarstern',
  'malen',
  'Azimutes',
  'Nordmire',
  'Nedlitz',
  'erfolgen',
  'betreffen',
  'Dar-',
  'stellung',
  'Messungsergebnisse',
  'eben',
  'rechtwinklig',
  'Koor-',
  'dinaten',
  'unmittelbar',
  'nutzen',
  'wozu',
  'nötigen',
  'Einheit',
  'entfernen',
  'Besselsche',
  'Referenzellipsoid',
  'Mitteleuropa',
  'Meridianstreifen',
  'Längenunterschied',
  'teilen',
  'punkten',
  'direkt',
  'konforme',
  'Abbildung',
  'Ebene',
  'übertragen',
  'Geheimrat',
  'Krüger',
  'übernehmen',
  'nötig',
  'Formel',
  'zugehörig',
  'Beispiel',
  'Grund',
  'Veröffentlichung',
  'Abbildung',
  'Ebene',
  'gebrauchen',
  'zusammen-',
  'zustellen',
  'Weiterführung',
  'Lotabweichungsrechnungen',
  'Geheimrat',
  'Krüger',
  'Polhöhe',
  'Azimut',
  'bestimmen',
  'Station',
  'hessisch',
  'märkisch-thüringischen',
  'Netz',
  'mittels',
  'Lot-',
  'abweichungen',
  'Brocken',
  'Zentralpunkt',
  'astronomisch-geodätischen',
  'Netz',
  'anschließen'

  'Inhalt',
  'vorjährigen',
  'Bericht',
  'Weiterhin',
  'zeigen',
  'Stern',
  'Geschwindigkeitsebenen',
  'gleichzeitig',
  'zuordnen',
  'lassen',
  'gewiß',
  'Fall',
  'Entscheidung',
  'treffen',
  'lassen',
  'Annahme',
  'Ebene',
  'not-',
  'Verbesserung',
  'Parallaxe',
  'außerhalb',
  'fällen',
  'Weise',
  'treten',
  'einig',
  'Bedingungsgleichungen',
  'Bestimmung',
  'Lage',
  'Geschwindigkeitsebenen',
  'hinzu',
  'Auflösung',
  'führen',
  'Element',
  'gegeben',
  'Sternmaterial',
  'ableiten',
  'lassen',
  'systematische',
  'Untersuchung',
  'ge-',
  'Parallaxen',
  'Radialgeschwindigkeiten',
  'Aufschluß',
  'systematisch',
  'Abweichung',
  'verschieden',
  'Messung',
  'ge-',
  'geben',
  'erscheinen',
  'anbringen',
  'Erweiterung',
  'Material',
  'wesentlich',
  'Verbesserung',
  'Element',
  'erzielen',
  'punkte',
  'richten',
  'nahezu',
  'Lage',
  'Ge-',
  'legen',
  'Verbindung',
  'Newcomb',
  'Möglichkeit',
  'Existenz',
  'senkrecht',
  'Haupt-',

  'muni',
  'deux',
  'cercles',
  'Les',
  'observations',
  'ont',
  '6t6',
  'faites',
  'par',
  'cet',
  'qui',
  'Respighi',
  'qui',
  'resultat',
  'parfaitement',
  'accord',
  'avec',
  'celui',
  'Collöge',
  'Romain',
  'Ainsi',
  'toute',
  'raison',
  'esp6rer',
  'que',
  'cet',
  'soit',
  'parfaitement',
  'autant',
  'que',
  'demande',
  'science',
  'modern',
  'Dans',
  'les',
  'tudes',
  'cependant',
  'soussigne',
  'recu',
  'conviction',
  'peut',
  'servir',
  'anciennes',
  'op6rations',
  'que',
  'comme',
  '6tudes',
  'bien',
  'souvent',
  'stations',
  'plus',
  'convenables',
  'pour',
  'fondamentales',
  'toute',
  'fois',
  'relier',
  'par',
  'op6rations',
  'second',
  'ordre',
  'stations',
  'mais',
  'qui',
  'tr&s',
  'mal',
  'une',
  'operation',
  'grande',
  'pr&cision',
  'Telle',
  'est',
  'condition',
  'travaux',
  'geodesiques',
  'dans',
  'les',
  'Etat',
  'Pontificaux',
  'quil',
  'aurait',
  'immense',
  'avantage',
  'complet

  'beginnen',
  'Herr',
  'Professor',
  'nageln',
  'ver-',
  'Sommer',
  'Dreieckspunkte',
  'vollenden',
  'astronomisch',
  'Arbeit',
  'vollenden',
  'Längenbestimmung',
  'Berlin',
  'Gotha',
  'Göttingen',
  'Prag',
  'Wien',
  'Bonn',
  'Breslau',
  'letzter',
  'Herr',
  'Forsch',
  'Verbindung',
  'Zylinski',
  'ausführen',
  'vollenden',
  'astronomisch',
  'Bestimmung',
  'Freiberg',
  'Dresden',
  'Fichtelberg',
  'Herr',
  'Bruhns',
  'beabsichtigen',
  'Central-',
  'bureau',
  'angeschafft',
  'Reversionspendel',
  'nahe',
  'Meter',
  'Länge',
  'pendeln',
  'Maassstab',
  'Röhre',
  'bestehen',
  'letztern',
  'zinken',
  'Eisen',
  'Leipzig',
  'Dresden',
  'einig',
  'Ort',
  'Sachsen',
  'Pendelbeobachtungen',
  'Herr',
  'Hirsch',
  'berichten',
  'Arbeit',
  'Schweiz',
  'beschäftigen',
  'Methode',
  'Bessel',
  'Baeyer',
  'Netz',
  'Punkt',
  'Bedingungsgleichungen',
  'wovon',
  'Winkel-',
  'Seitengleichungen',
  'berechnen',
  'Beobachtung',
  'ver-',
  'sc

  'Höhe',
  'Meeresfläche',
  'ermitteln',
  'Reduction',
  'behandeln',
  'Herr',
  'Schering',
  'giebt',
  'einig',
  'Brief',
  'Protokoll',
  'aufnehmen',
  'einstimmig',
  'beschließen',
  'Brief',
  'lauten',
  'Abschrift',
  'Brief',
  'Gauss',
  'Generalmajor',
  'Baeyer',
  'trigonometrischen',
  'Abtheilung',
  'Preussischen',
  'Generalstabes',
  'Herr',
  'Generalmajor',
  'verbindlich',
  'abstatten',
  'gütig',
  'Schreiben',
  'Mai',
  'interessant',
  'Mittheilungen',
  '.die',
  'Verbindung',
  'verschieden',
  'Drei-',
  'betreffen',
  'entschuldigen',
  'Brief',
  'aufgestellt',
  'Frage',
  'angemessen',
  'Antwort',
  'geben',
  'berühren',
  'finden',
  'einig',
  'Platz',
  'erwarten',
  'finden',
  'bleiben',
  'übrig',
  'anstellen',
  'wobei',
  'Ueberzeugung',
  'blossen',
  'tief',
  'eindringend',
  'Untersuchung',
  'unerlässlich',
  'Hinsicht',
  'bemerken',
  'erläutern',
  'Figur',
  'Meridianebene',
  'Punkt',
  'gedenken',
  'DAE',
  'Theil',
  'Erd-

  'teils',
  'Maximum',
  'messen',
  'Verfahren',
  'Anwendung',
  'zweier',
  'schwer',
  'pendeln',
  'unvorteilhaft',
  'ungenau',
  'Berechnung',
  'Beobachtung',
  'bestätigen',
  'Verfahren',
  'erhalten',
  'Resultat',
  'zeigen',
  'Übereinstimmung',
  'Berechnung',
  'Mitschwingen',
  'Station',
  'durchführen',
  'infolge',
  'Konstruktionsfehlers',
  'ziemlich',
  'veränderlich',
  'Station',
  'Zeit-',
  'bestimmungen',
  'ableiten',
  'hinlänglich',
  'genähert',
  'Bestimmung',
  'einzeln',
  'Epoche',
  'Pendelbeobachtungen',
  'ermöglichen',
  'Station',
  'Zeitbestimmungen',
  'genügend',
  'Elimination',
  'Abweichung',
  'momentan',
  'Uhrganges',
  'durchschnittlich',
  'Stations-',
  'mitteln',
  'Schwingungsdauer',
  'erwarten',
  'den-',
  'rechnerisch',
  'Bearbeitung',
  'vor-',
  'liegend',
  'Material',
  'Hälfte',
  'erledigen',
  'zahl-',
  'reichen',
  'Kontrolle',
  'Monat',
  'unter-',
  'stützen',
  'Herr',
  'Meißner',
  'Ausführung',
  'Rechnung',
  

  'kurz',
  'Auszug',
  'Annalen',
  'Hydrographie',
  'veröffentlichen',
  'vorn',
  'Nummer',
  'angeben',
  'Institutsmechaniker',
  'Max',
  'Fechner',
  'Gehilfe',
  'arbeiten',
  'müssen',
  '5-zölligen',
  'Feldmeßtheodoliten',
  'Mikroskoplupen-Ablesung',
  'nahezu',
  'fertigstellen',
  'bauen',
  '10-zölligen',
  'Universal-Instruments',
  'wesentlich',
  'fördern',
  'Bifilargravimeter',
  'luftdicht',
  'Gehäuse',
  'Registrierapparat',
  'Brunnenkammer',
  'aufstellen',
  'sämtlich',
  'Instrument',
  'Längenbestimmung',
  'Potsdam—',
  'Babelsberg',
  'hierfür',
  'Stand',
  'setzen',
  'einig',
  'Änderung',
  'ausführen',
  'Eötvössche',
  'Drehwage',
  'Institut',
  'weitgehenden',
  'Änderung',
  'unterziehen',
  'angefertigt',
  'In-',
  'strumenten',
  'ausführen',
  'gehörig',
  'Aus-',
  'meßapparat',
  'vorliegend',
  'Ausmessungen',
  'zweck-',
  'entsprechend',
  'Weise',
  'umarbeiten',
  'Verpackungseinrichtungen',
  'Kampagne',
  'Herrn',
  'Professor',
  'S

  'a.|',
  'p.|',
  'p.|',
  'a.|',
  'Bremerhaven',
  'Travemünde',
  'Marienleuchte',
  'Wismar',
  'Warnemünde',
  'Mittelwasser',
  'N.N.',
  'Marien-',
  'Swinemünde',
  'Stolpmünde',
  'Pillau',
  'Memel',
  'Sek',
  'a.|',
  'Trave-',
  '|-—',
  'verstopfen',
  'Höchstes',
  'Hochwasser',
  'Niedrigstes',
  'Niedrigwasser',
  'Hochwasser',
  'haven',
  'münden',
  'leuchte',
  'Bremer-',
  '.|—',
  'Marienleuchte',
  'Wismar',
  'Ergebnis',
  'ungünstig',
  'abweichen',
  'Messung',
  'zeigen',
  'betreffend',
  'wesentlich',
  'un-',
  'verändern',
  'bleiben',
  'September',
  'Oktober',
  'November',
  'August',
  'Dezember',
  'Travemünde',
  'November',
  'Marienleuchte',
  'Januar',
  'teilweise',
  'teilweise',
  'Februar',
  'teilweise',
  'März',
  'teilweise',
  'Mai',
  'teilweise',
  'September',
  'teilweise',
  'Dezember',
  'teilweise',
  'Wismar',
  'Juli',
  'teilweise',
  'September',
  'teilweise',
  'Warnemünde',
  'Dezember',
  'teilweise',
  'Arkona',
  'Ja

  'befindliche',
  '10-zöllige',
  'Universalinstrument',
  'fertigen',
  'Um-',
  'arbeitung',
  'Passagen-Instrument',
  'beenden',
  'reinigen',
  'Eötvösschen',
  'Drehwage',
  'Institut',
  'einig',
  'Änderung',
  'vornehmen',
  'Veranlassung',
  'Professor',
  'Schweydar',
  'konstruieren',
  'Fechner',
  'Instrument',
  'elektrisch',
  'Faden',
  'Brauchbarkeit',
  'prüfen',
  'Konstantenbestimmung',
  'Wage',
  'Professor',
  'Schweydar',
  'behilflich',
  'Professor',
  'Förster',
  'herstellen',
  'Ver-',
  'gleichungen',
  'Brunnerschen',
  'Meßstange',
  'ermöglichen',
  'laufend',
  'Dienst',
  'Fechner',
  'früh',
  'versehen',
  'April',
  'Krüger'],
 ['europäisch',
  'Gradmessung',
  'Zusammengestellt',
  'lithographirten',
  'Tafel',
  'Berlin',
  'Verlag',
  'Georg',
  'Reimer',
  'General-Bericht',
  'europäisch',
  'Gradmessung',
  'Zusammengestellt',
  'Baden',
  'Beobachtungspfeilern',
  'Baden',
  'Dreieckspunkte',
  'Europäische',
  'Gradmessung',
  'unvollende

  'ältern',
  'Punkt',
  'hagen',
  'befinden',
  'hoch',
  'Kuppe',
  'liegen',
  'hierdurch',
  'Schaden',
  'gekommen',
  'Stein',
  'Gauss',
  'Seite',
  'Punkt',
  'alt',
  'nehmen',
  'Flinsberg',
  'Gieseberg',
  'gehend',
  'Richtung',
  'Erhöhung',
  'Stand',
  'Fuss',
  'Weeper',
  'Richtung',
  'Hils',
  'Fuss',
  'nöthig',
  'Meissner',
  'Inselsberg',
  'Brocken',
  'anbringen',
  'hin-',
  'befinden',
  'alt',
  'punkten',
  'Hils',
  'niedrig',
  'höchstens',
  'Fuss',
  'hoch',
  'Wald',
  'Fuss',
  'Hülfe',
  'hin-',
  'Richtung',
  'erreichen',
  'Hils',
  'befinden',
  'stark',
  'steinern',
  'Pfeiler',
  'Fuss',
  'Boden',
  'nung',
  'ältern',
  'Punkt',
  'Stein',
  'Boden',
  'einlassen',
  'trotzen',
  'Grösse',
  'Schwere',
  'Flinsberg',
  'Thurm',
  'Struth',
  'erreichen',
  'liegend',
  'bedeutend',
  'bewirken',
  'Hierzu',
  'Tafel',
  'Berlin',
  'October',
  'gez',
  'Morozowicz',
  'Bericht',
  'Herrn',
  'Professor',
  'Sadebeck',
  'beschränken',
  

  'Winkelmessungen',
  'vornehmen',
  'unterbrechen',
  'aufhalten',
  'un-',
  'günstige',
  'Witterung',
  'Umstand',
  'Beobachter',
  'insbesondere',
  'Krankheit',
  'Collegen',
  'öfters',
  'Dresden',
  'reisen',
  'genöthigt',
  'Obliegenheiten',
  'Königliche',
  'nachkommen',
  'erwähnen',
  'Station',
  'genannt',
  'Richtung',
  'Beobachtungsreihen',
  'gegenseitig',
  'festlegen',
  'Hierunter',
  'befinden',
  'Station',
  'Collm',
  'Richtung',
  'Meile',
  'entfernen',
  'Fichtelberg',
  'Entfernung',
  'grösste',
  'auftreten',
  'Sächsische',
  'Netz',
  'Nächst',
  'Station',
  'eingestellt',
  'testen',
  'punkten',
  'Kahleberg',
  'Meile',
  'Röden',
  'Meile',
  'Meile',
  'Winkelbeobachtungen',
  'nunmehr',
  'Punkt',
  'beendigt',
  'Punkt',
  'Hohburg',
  'Leipzig',
  'Röden',
  'Reust',
  'Fichtelberg',
  'Kapellenberg',
  'Stelze',
  'Kuhberg',
  'vornehmen',
  'Sommer',
  'nageln',
  'August',
  'September',
  'Fortsetzung',
  'Winkelbeobachtungen',
  'verw

  'Herr',
  'Herr',
  'Commissare',
  'Hannover',
  'Schweiz',
  'eröffnen',
  'Sitzung',
  'Unveränderter',
  'Abdruck',
  'ursprünglich',
  'lithographirten',
  'Protokoll',
  'Präsident',
  'Herr',
  'Fligely',
  'Schriftführer',
  'Herr',
  'Bruhns',
  'Hirsch',
  'Herr',
  'Fligely',
  'bitten',
  'Herrn',
  'Baeyer',
  'Generalbericht',
  'laut',
  'Be-',
  'Sitzung',
  'permanent',
  'Commission',
  'vorig',
  'Zu-',
  'Commission',
  'drucken',
  'vorlegen',
  'Herr',
  'Bayer',
  'giebt',
  'Herr',
  'vorläufig',
  'Abdruck',
  'be-',
  'schließen',
  'etwaige',
  'Nachtrag',
  'Bemerkung',
  'Mai',
  'Präsident',
  'permanent',
  'Commission',
  'Herrn',
  'Baeyer',
  'einsenden',
  'berichten',
  'Herr',
  'Baeyer',
  'Inhalt',
  'theilt',
  'Hessen-Darmstadt',
  'Bericht',
  'Kurhessen',
  'Bericht',
  'letzt',
  'eingehen',
  'Nachtrag',
  'können',
  'Belgien',
  'Bericht',
  'vorhanden',
  'Commissar',
  'verdienen',
  'Oberst',
  'sterben',
  'Besprechung',
  'Sächsisch

  'Uebereinstimmung',
  'finden',
  'nöthig',
  'Badische',
  'Triangulation',
  'angegeben',
  'Signal',
  'müssten',
  'Tranchot',
  'Eckhardt',
  'benutzen',
  'anwenden',
  'gebrauchen',
  'müssten',
  'badisch',
  'Triangulation',
  'ordentlich',
  'prüfen',
  'beantragen',
  'permanente',
  'Commission',
  'Schreiben',
  'badisch',
  'Regierung',
  'bitten',
  'mögen',
  'Originaldreiecke',
  'senden',
  'mehrfach',
  'Besprechung',
  'Herr',
  'Hirsch',
  'erwählen',
  'Schreiben',
  'abfassen',
  'nächst',
  'Sitzung',
  'vorlegen',
  'Herr',
  'Baeyer',
  'theilt',
  'Schreiben',
  'Herrn',
  'Dr.',
  'Stamkart',
  'Amsterdam',
  'worin',
  'selbiger',
  'auftragen',
  'Regierung',
  'einig',
  'Dreiecksketten',
  'Holland',
  'Interesse',
  'Mitteleuropäische',
  'Gradmessung',
  'messen',
  'Anschluss',
  'Gauss',
  'gemessen',
  'Dreieck',
  'beantragen',
  'Herr',
  'Baeyer',
  'Hannoversche',
  'Regierung',
  'bitten',
  'richten',
  'einig',
  'Dreieck',
  'punkten',
  '

  'Directeur',
  'Depöt',
  'Guerre',
  'Mr.',
  'Pillarceau',
  'membre',
  'Institut',
  'Mr.',
  'Commandant',
  'Perrier',
  'membre',
  'Bureau',
  'longitudes',
  'Mr.',
  'Lieutenant-Colonel',
  'Ferrero',
  'Mr.',
  'General',
  'Liagre',
  'Invites',
  'Mr.',
  'Maus',
  'Inspecteur-General',
  'Mr.',
  'Stas',
  'membre',
  'Academie',
  'Mr.',
  'General',
  'Brialmont',
  'Membre',
  'Academie',
  'Inspecteur-General',
  'Corps',
  'genie',
  'Mr.',
  'Folie',
  'membre',
  'Acadömie',
  'Mr.',
  'Lieutenant',
  'Colonel',
  'een',
  'Henrionet',
  'ancien',
  'Chef',
  'service',
  'Depöt',
  'Guerre',
  'Mr.',
  'Terlinden',
  'ancien',
  'major',
  'Etat-major',
  'Mr.',
  'Schmit',
  'Professeur',
  'Mr.',
  'Capitaine',
  'Hennequin',
  'Professeur',
  'geodesie',
  'Ecole',
  'guerre',
  'Mr.',
  'Capitaine',
  'Peny',
  'Professeur',
  'geodesie',
  'militaire',
  'Mr.',
  'President',
  'ouvre',
  'seance',
  'heures',
  'quart',
  'Mr.',
  'Aspremont-Lynden',
  'Mi

  'häter',
  'acquisition',
  'avais',
  'demander',
  'mon',
  'gouvernement',
  'avancer',
  'les',
  'fonds',
  'projet',
  '6t6',
  'vers',
  'fin',
  'annde',
  'Mai',
  'demande',
  'pas',
  'accueillie',
  'par',
  'Ministre',
  'une',
  'pro-',
  'aussi',
  'pourrait',
  'amener',
  'difficultes',
  'contre',
  'Mr.',
  'Ministre',
  'con-',
  'acquerir',
  'appareil',
  'pour',
  'Institut',
  'geodesique',
  'serait',
  'disposition',
  'Bureau',
  'Central',
  'pour',
  'les',
  'travaux',
  'Association',
  'internationale',
  'consequence',
  'appareil',
  'commande',
  'Brunner',
  'Paris',
  'sera',
  'fait',
  'apres',
  'appareil',
  'espagnol',
  'seulement',
  'rögle',
  'lieu',
  'd’&tre',
  'platine',
  'sera',
  'faite',
  'platine',
  'iridi6',
  'premier',
  'mois',
  'mars',
  'par',
  'Ministere',
  'etrangeres',
  'Dans',
  'quatrieme',
  'Ten',
  'Commission',
  'permanente',
  'Bureau',
  'Central',
  'avait',
  'charge',
  'publier',
  'liste',
  'publicat

  'Mr.',
  'Hirsch',
  'donne',
  'lecture',
  'passage',
  'que',
  'Yun',
  'Mr.',
  'Seibt',
  'fait',
  'Swinemunde',
  'recherches',
  'qui',
  'paraissent',
  'une',
  'attention',
  'speciale',
  'Mr.',
  'Seibt',
  'constate',
  'que',
  'pour',
  'Swinemunde',
  'moyenne',
  'indications',
  'enregistreur',
  'pendant',
  'periode',
  '1871—1875',
  'differe',
  'seulement',
  'moyenne',
  'lectures',
  'faites',
  'directement',
  'midi',
  'Mr.',
  'General',
  'Baeyer',
  'propose',
  'que',
  'Commission',
  'recommande',
  'comparaisons',
  'aux',
  'qui',
  'ont',
  'mareographes',
  'leur',
  'disposition',
  'maniere',
  'pouvoir',
  'constater',
  'autres',
  'points',
  'produit',
  'galement',
  'coincidence',
  'niveau',
  'moyen',
  'mer',
  'avec',
  'hauteur',
  'moyenne',
  'une',
  'certaine',
  'heure',
  'sont',
  'soit',
  'mise',
  'mesure',
  'etablir',
  'nouveaux',
  'appareils',
  'port',
  'Bureau',
  'Central',
  'Mr.',
  'Hirsch',
  'pense',
  'que'

  'Mr.',
  'President',
  'prie',
  'Messieurs',
  'les',
  'vouloir',
  'bien',
  'r&unir',
  'octobre',
  'heures',
  'Depöt',
  'Guerre',
  'pour',
  'visite',
  'geodesie',
  'topographie',
  'invite',
  'les',
  'membres',
  'Commission',
  'permanente',
  'r&unir',
  'rant',
  'heures',
  'relevee',
  'chez',
  'Mr.',
  'General',
  'Baeyer',
  'pour',
  'entendre',
  'lecture',
  'procös-verbal',
  'seance',
  'jour',
  'pour',
  'proc&der',
  'signature',
  'session',
  'Mr.',
  'President',
  'prononce',
  'ensuite',
  'les',
  'paroles',
  'suivantes',
  'crois',
  'tre',
  'Commission',
  'permanente',
  'tous',
  'les',
  'delegu6s',
  'qui',
  'ont',
  'pris',
  'part',
  'nos',
  'travaux',
  'les',
  'invit6s',
  'qui',
  'ont',
  'bien',
  'voulu',
  'assister',
  'nos',
  'Messieurs',
  'les',
  'membres',
  'Commission',
  'permanente',
  'associent',
  'aux',
  'ments',
  'Mr.',
  'President',
  'Mr.',
  'General',
  'Ibanez',
  'propose',
  'ensuite',
  'que',
  'Co

  'Ausführung',
  'Beschluß',
  'permanent',
  'Commission',
  'Bezug',
  'Vergleichung',
  'Pendel-Apparate',
  'Herr',
  'Commissare',
  'Ausführung',
  'Pendelbeobachtungen',
  'beschäftigen',
  'März',
  'Ausführung',
  'Pendelbeobachtungen',
  'Berlin',
  'einladen',
  'gleichzeitig',
  'anzeigen',
  'Herr',
  'Director',
  'Förster',
  'Ausführung',
  'genannt',
  'Beobachtung',
  'bereitwilligst',
  'Gebäude',
  'Commission',
  'Verfügung',
  'stellen',
  'Einladung',
  'Herrn',
  'Professor',
  'Dr.',
  'Oppolser',
  'Antwort',
  'eingehen',
  'Herr',
  'mitgetheilt',
  'anderweitig',
  'Arbeit',
  'verhindern',
  'sein',
  'Frühjahr',
  'genannt',
  'Zweck',
  'Berlin',
  'spät',
  'bereiten',
  'Herr',
  'Peirce',
  'gehörend',
  'pendeln',
  'Apparat',
  'Repsold',
  'Berlin',
  'eintreffen',
  'unternehmen',
  'Mitte',
  'März',
  'Mitte',
  'Mai',
  'Beobachtung',
  'Bestimmung',
  'Länge',
  'Bestimmung',
  'Einfluß',
  'Mitschwingen',
  'Stativs',
  'Resultat',
  'Pendel

  'Sitzung',
  'befriedigend',
  'Lösung',
  'aufgestellt',
  'Frage',
  'gelingen',
  'Herr',
  'Hörsch',
  'Ansicht',
  'Bureau',
  'gedenken',
  'gegenwärtig',
  'Sitzung',
  'Lösung',
  'schwierig',
  'Frage',
  'gelingen',
  'glauben',
  'zweckmässig',
  'Mitglied',
  'speciell',
  'Frage',
  'beschäftigen',
  'auffordern',
  'Bureau',
  'punkten',
  'Programm',
  'bringen',
  'einfach',
  'Bildung',
  'beson-',
  'Comite',
  'Auge',
  'auftragen',
  'Frage',
  'gründlich',
  'prüfen',
  'nächst',
  'General',
  'Conferenz',
  'Ergebniss',
  'Untersuchung',
  'Bürsch',
  'fern',
  'Bemerkung',
  'betheiligte',
  'Land',
  'Lösung',
  'Problem',
  'dringlich',
  'Seite',
  'zum',
  'Beispiel',
  'Ansicht',
  'aussprechen',
  'Ausgleichungen',
  'stets',
  'Netz',
  'erstrecken',
  'müssten',
  'Seite',
  'Netz',
  'Gruppe',
  'getrieben',
  'Widerspruch',
  'erheben',
  'wünschenswerth',
  'halten',
  'hoffen',
  'antragen',
  'Herrn',
  'Vecchi',
  'Herr',
  'Vecchi',
  'erwidern'

  'une',
  'periode',
  'jours',
  'les',
  'courbes',
  'sans',
  'confondre',
  'feuille',
  'tant',
  'pendant',
  'quelques',
  'instants',
  'par',
  'forte',
  'fer',
  'obtient',
  'une',
  'dont',
  'par',
  'exemplaires',
  'malgr',
  'tous',
  'les',
  'avantages',
  'que',
  'cette',
  'methode',
  'procure',
  'adopter',
  'sur',
  'cuivre',
  'procede',
  'suivant',
  'Aprös',
  'avoir',
  'avance',
  'plusieurs',
  'feuilles',
  'papier',
  'm&me',
  'papier',
  'ordinaire',
  'les',
  'trempe',
  'dans',
  'contenant',
  'une',
  'petite',
  'quantit',
  'Lorsque',
  'les',
  'feuilles',
  'seront',
  'sera',
  'fixen',
  'pour',
  'puisse',
  'ces',
  'feuilles',
  'sans',
  'que',
  'les',
  'une',
  'fine',
  'pointe',
  'acier',
  'obtiendra',
  'dont',
  'vivement',
  'sur',
  'fond',
  'noire',
  'qui',
  'papier',
  'dans',
  'vernis',
  'aura',
  'ailleurs',
  'cet',
  'heureux',
  'r6sultat',
  'lui',
  'presque',
  'totalement',
  'ses',
  'Quant',
  'dispositi

  'est',
  'done',
  'partie',
  'base',
  'Nous',
  'avons',
  'pris',
  'les',
  'logarithmes',
  'huit',
  'exactes',
  'tables',
  'tant',
  'pour',
  'formation',
  'quations',
  'condition',
  'que',
  'pour',
  'caleul',
  'triangles',
  'les',
  'logarithmes',
  'pour',
  'tous',
  'les',
  'autres',
  'calculs',
  'Nous',
  'avons',
  'employ',
  'aux',
  'coefficients',
  'dans',
  'les',
  '6quations',
  'poids',
  'dans',
  'les',
  'quations',
  'aux',
  'angles',
  'aux',
  'termes',
  'quations',
  'aux',
  'cötes',
  'aux',
  'coeffieients',
  'corrections',
  'dans',
  'les',
  'quations',
  'aux',
  'cöt&s',
  'aux',
  'coefficients',
  'correlatifs',
  'dans',
  'les',
  'tions',
  'aux',
  'coeffieients',
  'correlatifs',
  'ainsi',
  'aux',
  'corrections',
  'directions',
  'Pendant',
  'möme',
  'temps',
  'officier',
  'mise',
  'ordre',
  'registres',
  'contenant',
  'les',
  'caleuls',
  'directions',
  'probables',
  'stations',
  'sont',
  'bientöt',
  'pou

  'Valhöi',
  'Nicolai',
  'Hollenderby',
  'Mörkemosebjerg',
  'Julianehöi',
  'Roskilde',
  'Valhöi',
  'Petri',
  'Nicolai',
  'Kongelunden',
  'Store',
  'Möllehöi',
  'Mörkemosebjerg',
  'Veirhöi',
  'Petri',
  'Roskilde',
  'Snoldelev',
  'Station',
  'Valhöi',
  'Azimuthe',
  'Station',
  'Kongelunden',
  'Station',
  'Snoldelev',
  'Station',
  'Log.d',
  'Entfern',
  'Toisen',
  'Station',
  'Mörkemosebjerg',
  'Log',
  'Entfern',
  'Azimuthe',
  'Toisen',
  'Klöveshöi',
  'Knösen',
  'Veirhöi',
  'Staarup',
  'met',
  'Julianehöi',
  'Station',
  'Veirhöi',
  'Saltofte',
  'Alleshauge',
  'Refsnes',
  'Staarup',
  'Julianehöi',
  'Mörkemosebjerg',
  'Knösen',
  'Station',
  'Klöveshöi',
  'Bögebjarg',
  'Refsnes',
  'Saltofte',
  'Alleshauge',
  'Veirhöi',
  'Bavnehöi',
  'Knösen',
  'Mörkemosebjerg',
  'Station',
  'Bögebjerg',
  'Veirhöi',
  'Saltofte',
  'Klöveshöi',
  'Log',
  'Entfern',
  'Toisen',
  'Azimuthe',
  'Station',
  'Bögebjerg',
  'Dyrebanke',
  'Troldemoseban

  'Liezen',
  'gemacht',
  'Beobachtung',
  'folgend',
  'Bestimmung',
  'breiten',
  'Satz',
  'Polaris',
  'Einstellung',
  'Ursae',
  'minimal',
  'Bootis',
  'Herculis',
  'Hereulis',
  'Satz',
  'Einstellung',
  'Bestim-',
  'mungen',
  'stets',
  'regelmässig',
  'verstellt',
  'Höhenkreise',
  'Vertikal',
  'folgend',
  'Stern',
  'Herculis',
  'Abend',
  'Bestimmung',
  'Lyrae',
  'Abend',
  'Cygni',
  'Cygni',
  'Andromedae',
  'Persei',
  'Stern',
  'Bestimmung',
  'Bestimmung',
  'Objekt',
  'wählen',
  'punkten',
  'Polarsterne',
  'Satz',
  'Einstellung',
  'bekannt',
  'Weise',
  'Azimuthalkreis',
  'regelmässig',
  'verstellen',
  'heurigen',
  'Zweck',
  'europäisch',
  'Gradmessung',
  'ausgeführt',
  'folgend',
  'Beendigung',
  'Triangulirung',
  'Ordnung',
  'Galizien',
  'Verbindung',
  'der-',
  'selben',
  'Russland',
  'gemessen',
  'Dreiecksnetze',
  'Arbeit',
  'Polygonkette',
  'herstellen',
  'sischen',
  'grenzen',
  'Galizien',
  'Siebenbürgen',
  'reichen

  'Bruhns',
  'Faye',
  'Ferrero',
  'Forsch',
  'Bürsch',
  'Hügel',
  'Ibanez',
  'nageln',
  'Oppolzer',
  'Perrier',
  'Peter',
  'Villarceau',
  'Schoder',
  'astronomische',
  'Section',
  'Frage',
  'geodätisch',
  'Frage',
  'behandeln',
  'Geschäftsordnung',
  'gemäss',
  'verlesen',
  'Herr',
  'Bruhns',
  'Bericht',
  'permanent',
  'Commission',
  'Thätigkeit',
  'Fortschritt',
  'Europäische',
  'Grad-',
  'messung',
  'mitgetheilt',
  'bisherig',
  'Präsident',
  'Fligely',
  'ausscheiden',
  'bezügliche',
  'Schreiben',
  'verlesen',
  'Antrag',
  'Herrn',
  'Bamernfeind',
  'Conferenz',
  'Herrn',
  'Fligely',
  'Bedauern',
  'Ausscheiden',
  'erfolgreich',
  'Wirksamkeit',
  'aussprechen',
  'Telegramm',
  'Wien',
  'absenden',
  'Verhandlung',
  'Commission',
  'September',
  'theilt',
  'Herr',
  'Bruhms',
  'permanent',
  'Commission',
  'Herr',
  'Bruhns',
  'Forsch',
  'Vecchi',
  'ausscheiden',
  'Stelle',
  'Conferenz',
  'nächst',
  'Sitzung',
  'Mitglied',
  '

  'einstimmig',
  'annehmen',
  'Programm',
  'Verhandlung',
  'erledigen',
  'Herr',
  'Vecchi',
  'berichten',
  'topographischen',
  'Karte',
  'Italien',
  'legen',
  'verschieden',
  'Sectionen',
  'Conferenz',
  'erheben',
  'Antrag',
  'Präsident',
  'königlich',
  'Sächsische',
  'Regierung',
  'mein',
  'innig',
  'Unterstützung',
  'Aufnahme',
  'auszu-',
  'sprechen',
  'Herr',
  'Oppolzer',
  'sprechen',
  'Präsidium',
  'Herr',
  'Hügel',
  'Herr',
  'Perrier',
  'Herrn',
  'nageln',
  'Herr',
  'Bauernfeind',
  'setzen',
  'Sitzung',
  'permanent',
  'Commission',
  'Nachmittag',
  'Protokoll',
  'verlesen',
  'genehmigen',
  'Schluss',
  'Sitzung',
  'Minute',
  'Dresden',
  'September',
  'Forsch',
  'Baeyer',
  'Bauernfeind',
  'Faye',
  'Bruhns',
  'Hirsch',
  'drucken',
  'Engelhardt',
  'Leipzig',
  'Protokoll',
  'Verhandlung',
  'permanent',
  'Commission',
  'Europäische',
  'Gradmessung',
  'September',
  'Manuseript',
  'drucken']]


Your way of processing the documents will likely vary; here, I only split on whitespace to tokenize, followed by lowercasing each word. In fact, I use this particular (simplistic and inefficient) setup to mimic the experiment done in [Deerwester et al.’s original LSA article](http://www.cs.bham.ac.uk/~pxt/IDA/lsa_ind.pdf) (Table 2).

The ways to process documents are so varied and application- and language-dependent that I decided to not constrain them by any interface. Instead, a document is represented by the features extracted from it, not by its “surface” string form: how you get to the features is up to you. Below I describe one common, general-purpose approach (called bag-of-words), but keep in mind that different application domains call for different features, and, as always, it’s [garbage in, garbage out](https://en.wikipedia.org/wiki/Garbage_in,_garbage_out)...

To convert documents to vectors, we’ll use a document representation called [bag-of-words](https://en.wikipedia.org/wiki/Bag-of-words_model). In this representation, each document is represented by one vector where a vector element `i` represents the number of times the `i`th word appears in the document.

It is advantageous to represent the questions only by their (integer) ids. The mapping between the questions and ids is called a dictionary:

In [14]:
dictionary = corpora.Dictionary(texts)
dictionary.save(os.path.join(TEMP_FOLDER, 'deerwester.dict'))  # store the dictionary, for future reference
print(dictionary)

Dictionary(10829 unique tokens: ['.Bessel', '.auf', '16-', '1er', '1’Association']...)


Here we assigned a unique integer ID to all words appearing in the processed corpus with the [gensim.corpora.dictionary.Dictionary](https://radimrehurek.com/gensim/corpora/dictionary.html#gensim.corpora.dictionary.Dictionary) class. This sweeps across the texts, collecting word counts and relevant statistics. In the end, we see there are twelve distinct words in the processed corpus, which means each document will be represented by twelve numbers (ie., by a 12-D vector). To see the mapping between words and their ids:

In [15]:
print(dictionary.token2id)

{'.Bessel': 0, '.auf': 1, '16-': 2, '1er': 3, '1’Association': 4, '6t6': 5, '6tait': 6, '6toiles': 7, 'Abends': 8, 'Ablenkung': 9, 'Ablesungsfehler': 10, 'Ablothungsfernrohrs': 11, 'Abtheilung': 12, 'Abweichung': 13, 'Aenderung': 14, 'Ainsi': 15, 'Albania': 16, 'Albrecht': 17, 'Alger': 18, 'Algerie': 19, 'Algier': 20, 'Alicante': 21, 'Alpi': 22, 'Altona': 23, 'Altonaer': 24, 'An-': 25, 'Anfang': 26, 'Angelegenheit': 27, 'Angelo': 28, 'Angriff': 29, 'Antrag': 30, 'Antwort': 31, 'Anwendung': 32, 'Anwesend': 33, 'Anzahl': 34, 'Apparat': 35, 'Appendix': 36, 'Ar-': 37, 'Arbeit': 38, 'Art': 39, 'Ascoli': 40, 'Asse': 41, 'Association': 42, 'Atri': 43, 'Aufnahme': 44, 'Aufstellung': 45, 'Aufstellungsort': 46, 'August': 47, 'Ausdehnungscoefficienten': 48, 'Ausführung': 49, 'Ausgabe': 50, 'Austria': 51, 'Auszug': 52, 'Ayant': 53, 'Azimuth': 54, 'Azimuthe': 55, 'Azimuthes': 56, 'Bad': 57, 'Baeyer': 58, 'Bairische': 59, 'Barogei': 60, 'Barozzi': 61, 'Basis': 62, 'Basisapparate': 63, 'Basisapparate

To actually convert tokenized documents to vectors:

In [13]:
new_doc = "Anwesend Pascal"
new_vec = dictionary.doc2bow(new_doc.lower().split())
print(new_vec)  # the word "Pascal" does not appear in the dictionary and is ignored

[(688, 1)]


The function `doc2bow()` simply counts the number of occurrences of each distinct word, converts the word to its integer word id and returns the result as a bag-of-words--a sparse vector, in the form of `[(word_id, word_count), ...]`. 

As the token_id is 0 for *"human"* and 2 for *"computer"*, the new document *“Human computer interaction”* will be transformed to [(0, 1), (2, 1)]. The words *"computer"* and *"human"* exist in the dictionary and appear once. Thus, they become (0, 1), (2, 1) respectively in the sparse vector. The word *"interaction"* doesn't exist in the dictionary and, thus, will not show up in the sparse vector. The other ten dictionary words, that appear (implicitly) zero times, will not show up in the sparse vector and , ,there will never be a element in the sparse vector like (3, 0).

For people familiar with scikit learn, `doc2bow()` has similar behaviors as calling `transform()` on [`CountVectorizer`](http://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html). `doc2bow()` can behave like `fit_transform()` as well. For more details, please look at [gensim API Doc](https://radimrehurek.com/gensim/corpora/dictionary.html#gensim.corpora.dictionary.Dictionary.doc2bow).

In [12]:
corpus = [dictionary.doc2bow(text) for text in texts]
corpora.MmCorpus.serialize(os.path.join(TEMP_FOLDER, 'deerwester.mm'), corpus)  # store to disk, for later use
for c in corpus:
    print(c)

2019-05-25 15:37:52,123 : INFO : storing corpus in Matrix Market format to /tmp/deerwester.mm
2019-05-25 15:37:52,127 : INFO : saving sparse matrix to /tmp/deerwester.mm
2019-05-25 15:37:52,128 : INFO : PROGRESS: saving document #0
2019-05-25 15:37:52,131 : INFO : saved 9x12 matrix, density=25.926% (28/108)
2019-05-25 15:37:52,134 : INFO : saving MmCorpus index to /tmp/deerwester.mm.index


[(0, 1), (1, 1), (2, 1)]
[(0, 1), (3, 1), (4, 1), (5, 1), (6, 1), (7, 1)]
[(2, 1), (5, 1), (7, 1), (8, 1)]
[(1, 1), (5, 2), (8, 1)]
[(3, 1), (6, 1), (7, 1)]
[(9, 1)]
[(9, 1), (10, 1)]
[(9, 1), (10, 1), (11, 1)]
[(4, 1), (10, 1), (11, 1)]


By now it should be clear that the vector feature with `id=10` represents the number of times the word "graph" occurs in the document.  The answer is “zero” for the first six documents and “one” for the remaining three. As a matter of fact, we have arrived at exactly the same corpus of vectors as in the [Quick Example](https://radimrehurek.com/gensim/tutorial.html#first-example). If you're running this notebook yourself the word IDs may differ, but you should be able to check the consistency between documents comparing their vectors. 

## Corpus Streaming – One Document at a Time

Note that *corpus* above resides fully in memory, as a plain Python list. In this simple example, it doesn’t matter much, but just to make things clear, let’s assume there are millions of documents in the corpus. Storing all of them in RAM won’t do. Instead, let’s assume the documents are stored in a file on disk, one document per line. Gensim only requires that a corpus be able to return one document vector at a time:

In [16]:
from smart_open import smart_open
class MyCorpus(object):
    def __iter__(self):
        for line in smart_open(filename, 'rb'):
            # assume there's one document per line, tokens separated by whitespace
            yield dictionary.doc2bow(line.lower().split())

The assumption that each document occupies one line in a single file is not important; you can design the `__iter__` function to fit your input format, whatever that may be - walking directories, parsing XML, accessing network nodes... Just parse your input to retrieve a clean list of tokens in each document, then convert the tokens via a dictionary to their IDs and yield the resulting sparse vector inside `__iter__`.

In [17]:
corpus_memory_friendly = MyCorpus() # doesn't load the corpus into memory!
print(corpus_memory_friendly)

<__main__.MyCorpus object at 0x7f72e467b080>


`corpus_memory_friendly` is now an object. We didn’t define any way to print it, so `print` just outputs address of the object in memory. Not very useful. To see the constituent vectors, let’s iterate over the corpus and print each document vector (one at a time):

In [18]:
for vector in corpus_memory_friendly:  # load one vector into memory at a time
    print(vector)

[(1, 2), (2, 2), (3, 6), (5, 17), (6, 4), (7, 3), (632, 3), (633, 7), (634, 4), (635, 4), (636, 14), (637, 56), (638, 17), (639, 3), (640, 31), (641, 7), (642, 2), (643, 2), (644, 10), (645, 3), (646, 2), (647, 6), (648, 2), (649, 8), (650, 14), (651, 31), (652, 4), (653, 6), (654, 3), (655, 9), (656, 27), (657, 3), (658, 9), (659, 13), (660, 74), (661, 2), (662, 2), (663, 7), (664, 2), (665, 3), (666, 11), (667, 2), (668, 2), (669, 4), (670, 7), (671, 24), (672, 2), (673, 3), (674, 2), (675, 3), (676, 15), (677, 12), (678, 158), (679, 6), (680, 13), (681, 3), (682, 7), (683, 26), (684, 28), (685, 8), (686, 60), (687, 37), (688, 53), (689, 6), (690, 3), (691, 4), (692, 4), (693, 4), (694, 2), (695, 6), (696, 22), (697, 9), (698, 36), (699, 6), (700, 7), (701, 2), (702, 7), (703, 2), (704, 23), (705, 4), (706, 27), (707, 174), (708, 36), (709, 69), (710, 2), (711, 2), (712, 4), (713, 4), (714, 2), (715, 2), (716, 3), (717, 5), (718, 15), (719, 5), (720, 6), (721, 45), (722, 9), (723, 71

Although the output is the same as for the plain Python list, the corpus is now much more memory friendly, because at most one vector resides in RAM at a time. Your corpus can now be as large as you want.

We are going to create the dictionary from the mycorpus.txt file without loading the entire file into memory. Then, we will generate the list of token ids to remove from this dictionary by querying the dictionary for the token ids of the stop words, and by querying the document frequencies dictionary (`dictionary.dfs`) for token ids that only appear once. Finally, we will filter these token ids out of our dictionary. Keep in mind that `dictionary.filter_tokens` (and some other functions such as `dictionary.add_document`) will call `dictionary.compactify()` to remove the gaps in the token id series thus enumeration of remaining tokens can be changed.

In [19]:
from six import iteritems
from smart_open import smart_open

# collect statistics about all tokens
dictionary = corpora.Dictionary(line.lower().split() for line in smart_open(filename, 'rb'))

once_ids = [tokenid for tokenid, docfreq in iteritems(dictionary.dfs) if docfreq == 1]

# remove stop words and words that appear only once
dictionary.filter_tokens(once_ids)
print(dictionary)

Dictionary(0 unique tokens: [])


And that is all there is to it! At least as far as bag-of-words representation is concerned. Of course, what we do with such a corpus is another question; it is not at all clear how counting the frequency of distinct words could be useful. As it turns out, it isn’t, and we will need to apply a transformation on this simple representation first, before we can use it to compute any meaningful document vs. document similarities. Transformations are covered in the [next tutorial](https://radimrehurek.com/gensim/tut2.html), but before that, let’s briefly turn our attention to *corpus persistency*.

## Corpus Formats

There exist several file formats for serializing a Vector Space corpus (~sequence of vectors) to disk. *Gensim* implements them via the *streaming corpus interface* mentioned earlier: documents are read from (or stored to) disk in a lazy fashion, one document at a time, without the whole corpus being read into main memory at once.

One of the more notable file formats is the [Matrix Market format](http://math.nist.gov/MatrixMarket/formats.html). To save a corpus in the Matrix Market format:

Other formats include [Joachim’s SVMlight format](http://svmlight.joachims.org/), [Blei’s LDA-C format](http://www.cs.columbia.edu/~blei/lda-c/) and [GibbsLDA++ format](http://gibbslda.sourceforge.net/).

In [11]:
corpora.SvmLightCorpus.serialize(os.path.join(TEMP_FOLDER, 'corpus.svmlight'), corpus)
corpora.BleiCorpus.serialize(os.path.join(TEMP_FOLDER, 'corpus.lda-c'), corpus)
corpora.LowCorpus.serialize(os.path.join(TEMP_FOLDER, 'corpus.low'), corpus)

Conversely, to load a corpus iterator from a Matrix Market file:

In [12]:
corpus = corpora.MmCorpus(os.path.join(TEMP_FOLDER, 'corpus.mm'))

Corpus objects are streams, so typically you won’t be able to print them directly:

In [13]:
print(corpus)

MmCorpus(2 documents, 2 features, 1 non-zero entries)


Instead, to view the contents of a corpus:

In [14]:
# one way of printing a corpus: load it entirely into memory
print(list(corpus))  # calling list() will convert any sequence to a plain Python list

[[(1, 0.5)], []]


or

In [15]:
# another way of doing it: print one document at a time, making use of the streaming interface
for doc in corpus:
    print(doc)

[(1, 0.5)]
[]


The second way is obviously more memory-friendly, but for testing and development purposes, nothing beats the simplicity of calling `list(corpus)`.

To save the same Matrix Market document stream in Blei’s LDA-C format,

In [16]:
corpora.BleiCorpus.serialize(os.path.join(TEMP_FOLDER, 'corpus.lda-c'), corpus)

In this way, *gensim* can also be used as a memory-efficient **I/O format conversion tool**: just load a document stream using one format and immediately save it in another format. Adding new formats is dead easy, check out the [code for the SVMlight corpus](https://github.com/piskvorky/gensim/blob/develop/gensim/corpora/svmlightcorpus.py) for an example.

## Compatibility with NumPy and SciPy

Gensim also contains [efficient utility functions](http://radimrehurek.com/gensim/matutils.html) to help converting from/to `numpy` matrices:

In [17]:
import gensim
import numpy as np
numpy_matrix = np.random.randint(10, size=[5,2])
corpus = gensim.matutils.Dense2Corpus(numpy_matrix)
numpy_matrix_dense = gensim.matutils.corpus2dense(corpus, num_terms=10)

and from/to `scipy.sparse` matrices:

In [18]:
import scipy.sparse
scipy_sparse_matrix = scipy.sparse.random(5,2)
corpus = gensim.matutils.Sparse2Corpus(scipy_sparse_matrix)
scipy_csc_matrix = gensim.matutils.corpus2csc(corpus)

For a complete reference (want to prune the dictionary to a smaller size? Optimize converting between corpora and NumPy/SciPy arrays?), see the [API documentation](https://radimrehurek.com/gensim/apiref.html). Or continue to the next tutorial on Topics and Transformations ([notebook](Topics_and_Transformations.ipynb) 
or [website](https://radimrehurek.com/gensim/tut2.html)).