Wissenschaftler sind manchmal so unkompliziert

Für meine Doktorarbeit besteht eine meiner Aufgaben darin, Attribute aus Freitext zu extrahieren. Dadurch will ich aus dem an sich unstrukturierten Textdaten strukturierte Daten erstellen, mit denen man dann statistische Analysen durchführen kann und bessere Text-Analysen durchführen kann.

Jetzt ist die Frage natürlich, wie man aus Texten solche Attribute ermitteln kann. Eine sehr schöne Arbeit liefert meiner Meinung nach die Doktor-Arbeit von Eugene Agichtein von der University of Columbia, welcher das System “Snowball” erstellt hat (nicht zu verwechseln mit dem Stemming-Algorithmus Snowball, welches Wörter auf eine Grundform reduzieren kann und damit für viele Suchalgorithmen eine Grundlage darstellt.)

Nun hab ich vor zwei Tagen eine Mail an Eugene geschickt, inwieweit er sich mit n-ären Relationen beschäftigt hat und ob es möglich sei, das bisher erstellte System für Evaluationszwecke und Erweiterungen zu verwenden. Und heut kam die Antwort mit Link auf den Sourcecode und der freundlichen Genehmigung zur Nutzung und Erweiterung des bisherigen Systems.

Das gefällt mir so im Forschungsbereich: Das Ziel ist, immer im Thema weiter zu kommen. Und bevor man da sich auf Urheberrechte versteift, bieten die meisten lieber ihre Unterstützung an.

Ein dickes Dankeschön von dieser Seite!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.