Korpuslinguistik war noch nie so einfach...
Switch branches/tags
Nothing to show
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Failed to load latest commit information.
BitCutStudios.CorpusExplorer
CorpusExplorer.Core
CorpusExplorer.Installer.Sdk
CorpusExplorer.Installer.VirtualHost
CorpusExplorer.Installer
CorpusExplorer.Port.TreeTaggerTrainer
CorpusExplorer.Sdk.Addon.Example
CorpusExplorer.Sdk.Compatibility
CorpusExplorer.Sdk.Db.Addon
CorpusExplorer.Sdk.Db.Elastic.Sdk
CorpusExplorer.Sdk.Db.Elastic
CorpusExplorer.Sdk.Db.Gui
CorpusExplorer.Sdk.Db.LinqConnect.Core
CorpusExplorer.Sdk.Db.MySql
CorpusExplorer.Sdk.Diagnostic
CorpusExplorer.Sdk.EchtzeitEngine.CalculationPyramid
CorpusExplorer.Sdk.EchtzeitEngine.Reporting
CorpusExplorer.Sdk.EchtzeitEngine
CorpusExplorer.Sdk.Extern.AStemmer
CorpusExplorer.Sdk.Extern.BerkeleyParser
CorpusExplorer.Sdk.Extern.Binary.Test
CorpusExplorer.Sdk.Extern.Binary
CorpusExplorer.Sdk.Extern.Epub
CorpusExplorer.Sdk.Extern.FuzzyCloneDetection
CorpusExplorer.Sdk.Extern.Heideltime
CorpusExplorer.Sdk.Extern.Json.Test
CorpusExplorer.Sdk.Extern.Json
CorpusExplorer.Sdk.Extern.MarMoT
CorpusExplorer.Sdk.Extern.OpenNLP
CorpusExplorer.Sdk.Extern.Pandoc
CorpusExplorer.Sdk.Extern.Plaintext.Test
CorpusExplorer.Sdk.Extern.Plaintext.WET
CorpusExplorer.Sdk.Extern.Plaintext
CorpusExplorer.Sdk.Extern.SaltAndPepper
CorpusExplorer.Sdk.Extern.SentimentDetection.Test
CorpusExplorer.Sdk.Extern.SentimentDetection
CorpusExplorer.Sdk.Extern.SocialMedia.Gui
CorpusExplorer.Sdk.Extern.SocialMedia
CorpusExplorer.Sdk.Extern.StanfordNLP
CorpusExplorer.Sdk.Extern.Test
CorpusExplorer.Sdk.Extern.Tika
CorpusExplorer.Sdk.Extern.Toxy
CorpusExplorer.Sdk.Extern.UdPipe
CorpusExplorer.Sdk.Extern.Wiki
CorpusExplorer.Sdk.Extern.Xml.Test
CorpusExplorer.Sdk.Extern.Xml
CorpusExplorer.Sdk.Extern.iTextSharp
CorpusExplorer.Sdk.Obsolete
CorpusExplorer.Sdk.Test
CorpusExplorer.Sdk.Toolkit.Compatibility
CorpusExplorer.Sdk
CorpusExplorer.Terminal.WebCrawler
CorpusExplorer.Terminal.WinForm
.gitignore
CODE_OF_CONDUCT.md
LICENSE
README.md

README.md

CorpusExplorer2.0

Software für Korpuslinguist*innen und Text-/Data-Mining Interessierte. Der CorpusExplorer vereint über 45 interaktiven Auswertungsmöglichkeiten mit einer einfachen Bedienung. Routineaufgaben wie z. B. Textakquise, Taggen oder die grafische Aufbereitung von Ergebnissen werden vollständig automatisiert. Die einfache Handhabung erleichtert den Einsatz in der universitären Lehre und führt zu schnellen sowie gehaltvollen Ergebnissen. Dabei ist der CorpusExplorer offen für viele Standards (XML, CSV, JSON, R, uvm.) und bietet darüber hinaus ein eigenes Software Development Kit (SDK) an, mit dem es möglich ist, alle Funktionen in eigene Programme zu integrieren.

Key Features

  • Unterstützt über 100 unterschiedliche Datei-/Textformate für Im-/Export - inkl. vieler linguistischer XML-Formate.
  • Integrierter Webcrawler zum Sammeln eigener Webkorpora.
  • Sehr einfache Programmoberfläche / Korpus mit wenigen Mausklicks automatisch bereinigen und annotieren - direkt analysefertig.
  • Anbindung unterschiedlicher Tagger - z. B. TreeTagger, OpenNLP, Stanford POS, uvm.
  • Erlaubt Analyse unterschiedlichster Quellen - z. B. Transkripte, Zeitungsartikel, PDF, E-Mails, Tweets, Webseiten, eBooks, uvm.
  • Im Hintergrund arbeitet eine sehr schnelle In-Memory Datenbank - speziell für die Korpusanalyse entwickelt. Diese Datenbank kann gegen verschiedene SQL- (MySQL, SQLite) und NoSQL-Datenbanken (ElasticSearch) ausgetauscht werden.
  • Unbegrenzte Korpusgröße - Verteilte Verarbeitung möglich.
  • Über 45 Visualisierungen - z. B.: Frequenzanalyse, N-Gramme, Phrasen, Kookkurrenzen, KWIC, DIFF, Stilmetriken, Korpusverteilung.
  • Auswertungen/Visualisierungen werden vom Ausgangsmaterial/Korpora vollständig durch Schnappschüsse isoliert. Dadurch sind Ergebnisse reproduzierbar, selbst wenn sich das Korpusmaterial ändert.
  • Per Shell/Konsole steuerbar (siehe https://github.com/notesjor/CorpusExplorer.Terminal.Console). Dies ist eine gute Anlaufstelle, wenn Sie den CorpusExplorer in eigene Skripte (R, python, etc.) integrieren möchten.
  • Flexibles SDK (Software Development Kit) für alle .NET-Sprachen (https://de.wikipedia.org/wiki/Liste_von_.NET-Sprachen). Erlaubt eigene Erweiterungen für den CorpusExplorer zu entwickeln oder den CorpusExplorer in eigene Anwendungen zu integrieren.

Systemvoraussetzungen:

Download / Handbuch / Video-Anleitung / Erweiterungen

http://www.corpusexplorer.de