Software

Bit by Bit zu Freiem Wissen – wie Wikimedia Deutschland die digitale Zukunft mitgestaltet

Zarah Ziadi
Grafik von mehreren, bunten Quadraten.

Freies Wissen braucht freie Software – denn nur wenn die Werkzeuge, mit denen Wissen gesammelt, strukturiert und geteilt wird, für alle offen zugänglich sind, können wirklich alle daran teilhaben. Wikimedia Deutschland setzt sich deshalb nicht nur für offene Inhalte ein, sondern entwickelt auch die technischen Grundlagen, die Wissen weltweit verfügbar machen. Egal ob offene Schnittstellen, transparente Entwicklung oder kollaborative Zusammenarbeit, auch 2024 hat die Software-Abteilung bei Wikimedia Deutschland mit voller Kraft daran gearbeitet, Freies Wissen als Gemeingut zu stärken.

In einer digitalen Welt, in der große Tech-Konzerne zunehmend die Kontrolle über Daten und Algorithmen übernehmen, wird eine freie und zuverlässige Wissensinfrastruktur immer wichtiger. Mit der Weiterentwicklung von Wikidata wollen wir sicherstellen, dass strukturierte und belegte Daten für alle verfügbar sind – unabhängig von Systemen, die einzelnen Unternehmen gehören. Open-Source-Entwicklerteams, Forschende und gemeinnützige Projekte sollen deshalb einen direkten, barrierefreien Zugang zu hochwertigen Daten haben, ohne sich auf Plattformen mit intransparenten Algorithmen verlassen zu müssen. Unser Ziel ist es, digitale Selbstbestimmung zu stärken, Desinformation entgegenzuwirken und ein offenes Wissensökosystem zu schaffen, das allen gehört.

It’s a match! KI trifft auf Wikidata

Wikidata ist eine der größten offenen Wissensquellen der Welt: Hochwertige, geprüfte und frei zugängliche Daten zu Millionen von Begriffen bzw. Konzepten stehen zur Verfügung – kontinuierlich aktualisiert von einer globalen Gemeinschaft mit über 13.000 engagierten Freiwilligen. Dieser riesige offene Wissensgraph wird bereits in zahlreichen Projekten genutzt und verzeichnet jeden Monat Milliarden von Datenabfragen – jetzt wird das Potential von Wikidata noch weiter ausgebaut.

Grafik mit zwei Sprechblasen in der Mitte. Links davon sind drei Sterne zu sehen und rechts ein Oberkörper mit einer Denkblase.

2024 haben wir gemeinsam mit DataStax, einem führenden Anbieter für KI-Datenbankmanagement, und Jina AI, einem Berliner Experten für intelligente Suchtechnologien, ein neues Projekt gestartet. Ziel ist es, Open-Source-Entwickler*innen den Zugang zu Wikidata-Daten zu erleichtern und dadurch innovative, gemeinnützige Lösungen im Bereich von KI-Anwendungen zu fördern. Denn: Viele ehrenamtliche Entwickler*innen aus der Open-Source-Szene haben nicht die finanziellen oder technischen Ressourcen, um Zugang zu großen Datensätzen für ihre Projekte zu erhalten – genau hier setzt das neue Projekt an.

Der Schlüssel ist die sogenannte Vector-Embedding-Technologie: DataStax speichert die strukturierten Wikidata-Daten in einer speziellen KI-gestützten Datenbank, die eine semantische Suche ermöglicht. Während herkömmliche strukturierte Daten exakte Abfragen erfordern, ermöglicht die semantische Suche die Interaktion mit den Daten in natürlicher Sprache – so wie Menschen sprechen und schreiben. Diese Art der Verarbeitung ist entscheidend, da generative KI-Modelle auf natürlicher Sprache trainiert werden.

Mehr als eine Datenbank: Der Wissensgraph Wikidata

Wikidata ist mehr als eine gewöhnliche Datenbank. Während klassische Datenbanken Informationen oft isoliert speichern, setzt Wikidata Daten in Beziehung zueinander. So werden nicht nur einzelne Fakten wie „Berlin – Einwohnerzahl – 3.782.202“ gespeichert, sondern auch Verknüpfungen wie „Deutschland – Hauptstadt – Berlin“. Man kann sich das wie eine riesige, vernetzte Wissenslandkarte vorstellen, in der alles miteinander verbunden ist. Genau deshalb ist Wikidata ein Wissensgraph – keine einfache Sammlung von Daten, sondern ein intelligentes Netzwerk von Wissen.

Aktuell befindet sich das Projekt in einer Testphase. Gemeinsam mit DataStax und Jina AI werden verschiedene technische Ansätze in mehreren Sprachen – darunter Arabisch, Deutsch und Englisch – erprobt. Besonders spannend dabei ist, dass die Vector-Datenbank an sogenannte RAG (Retrieval-Augmented Generation)-Systeme angeschlossen werden kann. Dadurch erhalten generative KI-Modelle direkten Zugriff auf die aktuellsten Wikidata-Daten – das führt zu präziseren Antworten und weniger Halluzinationen, also falschen oder irreführenden Ergebnissen, die von KI-Modellen generiert werden. Darüber hinaus werden auf diesem Weg generative KI-Modelle dazu gebracht, marginalisierte Wissensquellen präziser mit einzubeziehen.

Bis Ende 2025 könnte der erste Prototyp fertiggestellt werden. Die Zukunft des Freien Wissens entwickelt sich weiter – und wir sind mittendrin!

Wikidata wird einfacher – mit einer stabilen neuen Schnittstelle und Hilfeseite für Entwickler*innen

Wikidata ist eine riesige Sammlung von Wissen, aber wie kommen Computer an diese Informationen? Dafür gibt es eine Programmierschnittstelle, kurz API genannt. Sie funktioniert wie eine Tür: Wer die richtigen Schlüssel hat, kann sich Wissen aus Wikidata holen oder neue Informationen hinzufügen. Webseiten, Apps und sogar smarte Geräte können damit einfacher auf die freien Daten von Wikidata zugreifen. Im November 2024 haben wir eine neue Version der Schnittstelle veröffentlicht: Die REST API Version 1. Sie ist standardisiert, klarer aufgebaut und einfacher anzuwenden als die Vorgängerversion.

Damit noch mehr Menschen Wikidata nutzen, gibt es jetzt auch ein Portal für Entwickler*innen. Hier finden alle einfache Erklärungen und Schritt-für-Schritt-Anleitungen, um Wikidata besser zu verstehen und für eigene Anwendungen zu nutzen.

Wikidata & Wikibase – ein unschlagbares Team

Hinter Wikidata steckt die freie Software Wikibase, die ebenfalls von Wikimedia Deutschland entwickelt und gepflegt wird. Sie ermöglicht es beispielsweise Institutionen und Einzelpersonen, ihre eigenen offenen Datengraphen aufzubauen und darin spezialisiertes Wissen zu speichern. Wikibase gibt es in zwei Varianten: Wikibase Suite für lokale Installationen und Wikibase Cloud für eine einfache Nutzung in der Cloud. Das Besondere ist, dass alle individuellen Wikibase-Instanzen sich mit Wikidata verknüpfen lassen. So wächst nach und nach ein riesiges, offenes Ökosystem freien, gemeinschaftlich erstellten Wissens.

Gemeinsam für Freies Wissen: Events & neue Partnerschaften

Auch 2024 haben wir uns weltweit für offene Daten und digitale Teilhabe eingesetzt. Drei zentrale Projekte zeigen, wie mit Wikidata und dem Prinzip von Linked Open Data neue Partnerschaften und ein internationaler Austausch entstanden sind.

Ein wichtiges Beispiel ist unser Beitrag zur besseren Vernetzung von E-Government-Systemen. Ein effizienter Datenaustausch zwischen Behörden ist unerlässlich – aber inkompatible Systeme und uneinheitliche Standards erschweren oft die Zusammenarbeit. Um dieses Problem zu lösen, hat die Europäische Kommission im Jahr 2022 das Projekt „Interoperable Europe“ vorgestellt. Ziel ist es, Verwaltungen besser zu vernetzen und das Datenmanagement länder- und behördenübergreifend effizienter zu gestalten. Ein zentraler Bestandteil ist der Interoperable Europe Act, der digitale Lösungen und klare Regeln für den Datenaustausch schafft. Auf der SEMIC 2024 in Brüssel – einer Konferenz der Europäischen Kommission zur besseren digitalen Zusammenarbeit von Behörden – haben wir gezeigt, wie Wikidata als Linked-Open-Data-Plattform dazu beitragen kann, Verwaltungsdaten sinnvoll zu verknüpfen und so die digitale Zusammenarbeit in Europa zu erleichtern.

Linked Open Data – das offene Wissensnetzwerk

Linked Open Data (LOD) sind frei zugängliche Daten im Internet, die unter einer offenen Lizenz stehen. Das Besondere: Jede Information hat eine eindeutige Web-Adresse (URI) und kann direkt mit anderen Daten verknüpft werden. So entsteht ein riesiges, vernetztes Wissenssystem, in dem Informationen nicht isoliert, sondern miteinander verbunden sind. Wikidata und Wikibase nutzen dieses Prinzip – aber auch viele andere Projekte und Institutionen setzen auf Linked Open Data, um Wissen offen und zugänglich zu machen.

Außerdem waren wir 2024 Teil der Internationalen Dialogkonferenz, die vom Bundesministerium für Digitales und Verkehr und der Gesellschaft für Internationale Zusammenarbeit (GIZ) organisiert wurde. Unser Ziel war es, das Potenzial von offenen Daten zu diskutieren. Sie sind ein Schlüssel zu einer gerechteren digitalen Zukunft, ermöglichen es, nachhaltige Informationsökosysteme zu schaffen und fördern Transparenz und Zugang zu Wissen – besonders in Regionen, in denen digitale Infrastrukturen noch im Aufbau sind. Auf der Digitalkonferenz konnten wir deutlich machen, wie Wikidata und Linked Open Data als offene Datenstrukturen dazu beitragen, nachhaltige Informationsnetzwerke weltweit zu stärken. Besonders die GIZ kann hier als starke Partnerin international die Reichweite und Wirkung von Wikidata nutzen und weiter ausbauen. Eine enge Zusammenarbeit kann digitale Infrastrukturen in Entwicklungsländern fördern und dafür sorgen, dass offene Daten transparent und für alle nutzbar sind. Weitere Gespräche mit der GIZ dazu sind für 2025 geplant.

Ebenfalls besonders wichtig war unsere Teilnahme an der vom Goethe-Institut Tokyo organisierten Veranstaltung „Tokyo and Berlin – Capital of Women Scientists“. Dabei hoben wir hervor, wie bedeutend die Repräsentation von japanischen Wissenschaftlerinnen in Wikidata ist, und zeigten, wie offene Daten zu einer besseren Sichtbarkeit von Frauen in der Wissenschaft beitragen können. Ein Highlight war ein Edit-a-thon im Rahmen der Veranstaltung. Die Teilnehmenden erstellten Wikipedia-Artikel zu japanischen Wissenschaftlerinnen und trugen aktiv dazu bei, den Gender Gap in der Wissenschaft zu verringern. Mit Unterstützung erfahrener Wikipedianer*innen wurde ein wertvoller Beitrag zur digitalen Repräsentation von Frauen geleistet – und gleichzeitig die Partnerschaft zwischen Berlin und Tokio weiter gestärkt.

Ein Selfie von drei Personen vor einer Leinwand mit der Aufschrift „Tokyo & Berlin – Hauptstädte der Wissenschaftlerinnen“.
Alan Ang von Wikimedia Deutschland (links) bei der vom Goethe-Institut Tokyo organisierten Veranstaltung „Tokyo and Berlin – Capital of Women Scientists“.

Unterstützung für Bibliotheken in aller Welt

Bibliotheken sind ein öffentlich zugänglicher Ort des Wissens – da liegt es auf der Hand, dass Wikimedia Deutschland viele Partnerschaften mit ihnen pflegt. 2024 fanden zwei wichtige Schlüsselprojekte statt.

Eines davon war die Kollaboration mit AFLIA, dem Dachverband afrikanischer Bibliotheksverbände, der das IWIPALE-Projekt initiiert hat. IWIPALE steht für Integrating Wikimedia Projects into African Libraries‘ Ecosystem und zielt darauf ab, Wikimedia-Projekte in das Ökosystem afrikanischer Bibliotheken zu integrieren und so den Zugang zu freiem Wissen zu stärken. Gerade bei der Bewahrung und Verbreitung von regionalem Wissen spielen die Bibliotheken vor Ort eine wichtige Rolle – aber es fehlt oft an digitalen Strukturen, um afrikanische Inhalte sichtbar zu machen. Genau hier setzt das Projekt an: Es unterstützt Bibliotheken dabei, Wikipedia und Wikidata effektiver zu nutzen und so die Sichtbarkeit regionaler Inhalte zu fördern. Um das Projekt zu realisieren, hat Wikimedia Deutschland eng mit AFLIA zusammengearbeitet – vom Förderantrag bei der Wikimedia Foundation über die Entwicklung eines Trainingsprogramms bis hin zu einem Online-Seminar mit der Nationalbibliothek von Nigeria.

Ein besonderes Augenmerk liegt auf der Überarbeitung der sogenannten Authority Control – einem System zur Verknüpfung und Validierung von Daten. Bislang müssen afrikanische Bibliotheken oft auf Quellen außerhalb des Kontinents zurückgreifen, um die Authentizität ihrer Inhalte nachzuweisen. IWIPALE will das ändern: Afrikanische Bibliotheken sollen ihre eigenen Quellen und Referenzen direkt in Wikidata hinterlegen können. So entsteht eine gerechtere Wissensverteilung, die die afrikanische Perspektive stärkt. Weitere Workshops sind bereits für 2025 geplant.

Die zweite Kollaboration fand im Oktober 2024 statt. Gemeinsam mit dem langjährigen Wikidata-Freiwilligen Epidosis führten wir einen intensiven dreitägigen Wikidata-Präsenz-Workshop für 30 Bibliothekar*innen der lettischen Nationalbibliothek in Riga durch. Ziel des Workshops war es, den Teilnehmenden zu zeigen, wie sie Wikidata in ihre Arbeit integrieren können. Obwohl die Bibliothekar*innen zu Beginn keine Erfahrung mit Wikidata hatten, lernten sie schnell, wie sie Daten abfragen, Verweise hinzufügen und ihre Kataloge mit Wikidata aktualisieren können. Innerhalb von drei Tagen erzielten sie beeindruckende Ergebnisse: 1.841 hinzugefügte Referenzen, 386 bearbeitete Einträge und insgesamt 3.535 Bearbeitungen kamen zustande.

Diese Veranstaltung wurde durch die Unterstützung von Wikimedia Deutschland und einer Finanzierung für die Teilnahme von Epidosis als Trainer ermöglicht. Der Workshop bot somit eine wertvolle Gelegenheit, die Arbeit eines Wikidata-Community-Mitglieds wertzuschätzen und gleichzeitig eine neue Partnerschaft zu fördern.

Gruppenfoto
Gruppenfoto vom Wikidata-Workshop 2024 in der Lettischen Nationalbibliothek.

Wikidata leicht gemacht – mit neuem Online-Kurs

Um weltweit noch mehr Menschen dafür zu gewinnen, an Wikidata mitzuarbeiten, haben wir 2024 gemeinsam mit Wikimedia Frankreich den ersten internationalen, permanenten Online-Kurs für Wikidata-Einsteiger*innen etabliert. Die Teilnehmenden lernen über niedrigschwellige und interaktive Formate, wie Wikidata funktioniert und wie sie neue Daten hinzufügen. Die Lerneinheiten können flexibel und im eigenen Tempo absolviert werden, die Teilnehmenden tauschen sich mit anderen im Kursforum oder auf Telegram aus und erhalten am Ende ein Zertifikat. 58 Interessierte aus fünf Kontinenten, darunter Lehrkräfte und GLAM-Fachleute, haben 2024 den Kurs erfolgreich abgeschlossen.

Ursprünglich wurde der Kurs auf Französisch von Wikimedia Frankreich entwickelt. Dank der Übersetzung und der englischen Untertitel für die Videos – finanziert von Wikimedia Deutschland – hat der Kurs internationale Reichweite gewonnen und freut sich auf weitere Teilnehmende.

Freies Wissen braucht Hardware – Wikimedia rüstet Communitys aus

Grafik von einem Computer mit Maus

Viele Menschen wollen zu Freiem Wissen beitragen, können es aber nicht, weil ihnen die nötige Hardware fehlt. Mit dem Wikidata Hardware Donation Programm wollen wir das ändern, indem wir Ehrenamtliche weltweit mit dringend benötigten Laptops und Zubehör ausrüsten. Im Rahmen des Programms wurden bislang 23 Geräte gespendet, vor allem an die Communitys in Afrika und Asien – generalüberholt, mit Ubuntu Linux ausgestattet und bereit für den Einsatz. Wenn möglich, werden die Hardware-Spenden über internationale Wikimedia-Konferenzen verteilt, um die Versandkosten zu sparen.

2025 wird das Programm weiterentwickelt – schließlich braucht Freies Wissen nicht nur großartige Ideen, sondern auch Technik, um sie zu verwirklichen!