Ein Interview mit Denny Vrandečić
Mit Abstract Wikipedia entsteht ein neues, multilinguales Projekt im Wikiversum. Benutzer*innen sollen Wikipedia-Artikel sprachunabhängig erstellen und pflegen können. Das würde es allen ermöglichen, die Artikel in ihrer Landessprache zu lesen. Warum ist dieses Vorhaben so relevant?
Denny Vrandečić: Für die deutsche Community scheint das im ersten Moment nicht so wichtig zu sein, denn die deutsche Wikipedia ist sehr groß. Aber das Interessante ist: Die englische Wikipedia ist deutlich größer als die deutsche Wikipedia, jedoch kommt die Hälfte der deutschen Wikipedia gar nicht in der englischen vor. Es gibt also wenig inhaltliche Überschneidung. Gerade für die kleineren Wikipedien ist es natürlich schwer, eine umfassende Enzyklopädie anzubieten, weil sie schlichtweg nicht genug Beitragende haben. Das grundlegende Problem ist, dass wir derzeit versuchen, über 300 Sprachen zu unterstützen. Es gibt 20 Millionen Themen, die Wikipedia Artikel haben. Wenn wir diese tatsächlich in alle Sprachen übersetzen wollen würden, müssten wir sechs Milliarden Artikel schreiben. Derzeit haben wir aber gerade mal 50 Millionen Artikel.
Wie hilft Abstract Wikipedia da konkret?
Das Ziel ist, die sprachliche Dimension und die inhaltliche Dimension unabhängig voneinander zu erzeugen und zu verwalten. Die notwendige Arbeit, um die Inhalte zu schaffen und in der Zukunft auch zu warten, wird so um den Faktor 300 gesenkt. Das ist dann wieder eine Größenordnung, die wir als Wikipedia-Communitys durchaus erreichen können. Die Inhalte, die in den Wikipedien vorhanden sind, sollen so dargestellt werden, dass sie wieder in beliebig viele Sprachen übersetzt werden können. Diese so erstellten Texte stehen dann den Wikipedien zur Verfügung, wenn die Communitys das wollen. Das soll nichts ersetzen, sondern Lücken füllen, die derzeit bestehen.
Warum reicht eine einfache Übersetzung nicht aus?
Gerade in den Sprachen, in denen Übersetzungsprogramme tatsächlich gebraucht werden, sind sie oft am schlechtesten. Das liegt daran, dass der Korpus, mit dem diese Programme trainiert werden, aus Texten in den häufig gesprochenen Sprachen besteht. Besonders bei Themen wie Gesundheit und der Covid-19-Pandemie, wo akkurate Informationen sehr wichtig sind, sind diese Übersetzungen schwierig. Da möchten wir unterstützen. Statt Übersetzungen verwenden wir Funktionen. Dafür stellen wir ein neues Wikimedia-Projekt vor, das Wikifunctions heißen wird. In diesem Projekt wollen wir dann Funktionen erstellen, die Texte in natürlicher Sprache generieren.
Was ermöglichen solche Funktionen genau?
Letztlich sind das Programme, die in verschiedenen Programmiersprachen geschrieben sein können und von einem Computer ausgeführt werden. Diese Programme werden wir in einem neuen Wiki vorhalten. Auch die großen Tech-Firmen bieten immer mehr Schnittstellen an, die uns Funktionen verwenden lassen. Wenn man Google Assistant, Siri oder Alexa nutzt, gibt es eine wachsende Anzahl an Fragen, die man stellen kann. Das sind auch Funktionen, aber sie werden von den Unternehmen angeboten. Es gibt ein Team in San Francisco oder Seattle, das diese Funktion erstellt und zur Verfügung stellt. Und damit sind wir ja genau in der gleichen Situation, in der wir vor 15 oder 20 Jahren noch mit Enzyklopädien waren. Eine Enzyklopädie ist eben das, was eine Firma anbietet.
Was macht Wikifunctions da anders?
Wir wollen, dass sich jeder am Wissen beteiligen und Funktionen erstellen kann. Nur weil Siri einen bestimmten Skill hat, kann man ihn nicht in anderen Kontexten verwenden. Wir wollen mit Wikifunctions erreichen, dass die Funktionen breit verfügbar sind und von allen in jedem beliebigen Kontext verwendet werden können. Alle sollen sich daran beteiligen können, neue Funktionen zu erschaffen. Damit es mehr gibt als das, was die Leute bei Amazon oder Google oder Apple interessant finden. Um Inhalte in der abstrakten Wikipedia beizutragen, braucht man auch keine Fähigkeiten im Programmieren. Das ist uns sehr wichtig.
Welche Rolle spielen Wikidata und die lexikografischen Daten?
Die sind ein wichtiger Bestandteil. Da wir abstrakte Sprache in Texte verwandeln, brauchen wir eine große Anzahl an lexikografischen Daten. Wir müssen wissen: Was ist der Plural von „Stadt“, wie macht man den, wie beugt man den in den Sätzen? All dieses Wissen steht ja jetzt schon in den lexikografischen Erweiterungen von Wikidata. Darauf müssen wir zugreifen können, das heißt, wir werden bestehende Projekte verwenden, um zusammen dann Inhalte in mehr Sprachen abbilden zu können.
Funktioniert Sprache in allen Kulturen so, dass sich Texte aus Funktionen erstellen lassen?
Tatsächlich war das in der Linguistik lange eine offene Frage. Die meisten Linguistinnen und Linguisten sind heute aber der Meinung, dass wir von jeder Sprache in eine beliebige andere Sprache übersetzen können. Es gibt diesen Mythos von den Inuit und ihren vierzig Wörtern für Schnee. Selbst wenn das stimmen sollte und es für all diese Schneearten eigene Wörter gibt, können diese in anderen Worten auch beschrieben werden. Und so etwas würde dann in einer Funktion wieder gehen.
Können von diesem Projekt auch die Communitys aus nicht westlichen Kulturen profitieren? Besteht nicht die Gefahr, dass man nur die westlichen Gesellschaften erreicht?
Wir wollen Menschen aus bislang weniger dokumentierten Kulturen die Möglichkeit geben, selbst Inhalte zu erstellen. Ich selbst habe in der kroatischen Wikipedia angefangen und wollte eigentlich über das Dorf meiner Mutter schreiben. Aber dann habe ich festgestellt, dass die kroatische Wikipedia noch keinen Artikel über Nigeria oder China hatte – und mich gefragt: Kann ich als Enzyklopädist unter diesen Voraussetzungen einen Text über ein Dorf mit 156 Einwohnerinnen und Einwohnern verfassen? Durch die abstrakte Wikipedia erlauben wir es den Menschen, über genau die Themen zu schreiben, zu denen sie einen einzigartigen Zugang und einzigartige Quellen haben. So kann jede und jeder eine einzigartige Perspektive beitragen. Und wir können tatsächlich das Wissen der Welt bereichern.
Weitere Infos: