„Die Nutzer*innen sprechen von einem Gamechanger“: Lydia Pintscher zum Wikidata Query Builder

Lydia Pintscher, Produktmanagerin für Wikidata, über den neuen Zugang zur freien und offenen Wissensdatenbank.

Der Query Builder wird als neue „Superpower“ in der Welt von Open Data bezeichnet – welche Kräfte verbergen sich dahinter?

In Wikidata sind riesige Mengen an Daten verfügbar. Die Einwohnerzahl Berlins genau so wie der Name der Hauptstadt Paraguays oder der Gewinnerin des „Oscars“ für den besten Tonschnitt. Der Punkt ist nur, dass diese Daten für sich genommen wenig aussagekräftig sind. Relevanter ist das Wissen, das aus ihnen gewonnen werden kann. Eine Frage könnte sein: Wie viele Menschen aus Asien haben „Oscars“ gewonnen im Vergleich zu Menschen aus Europa oder den USA? Dazu muss man wissen: Wer hat einen „Oscar“ gewonnen, wo wurde diese Person geboren, auf welchem Kontinent liegt der Ort? Es geht darum, Verknüpfungen herzustellen. Dazu muss man in Wikidata Abfragen auf die Daten starten. Das ermöglicht der Query Builder.

Wie waren diese Abfragen zuvor möglich?

Zuvor musste man eine Abfragesprache namens SPARQL beherrschen, die spezifisch für Wissensdatenbanken wie Wikidata ist – allerdings auch sehr komplex zu lernen. Alle Editor*innen, die mit den Daten in Wikidata arbeiten, die zum Beispiel eine App darauf aufbauen wollten, mussten SPARQL lernen. Oder eine Person kennen, die es beherrscht. Das ist aufwendig und schließt Menschen aus. Genau das wollen wir nicht. Wir wollen allen Zugang zu Wissen ermöglichen, was die Daten in Wikidata einschließt. Der Query Builder soll helfen, diese Zugangsschwelle erheblich zu senken.

Wie funktioniert das ganz praktisch?

Der Query Builder präsentiert ein Interface, auf dem sich eine Abfrage zusammenklicken lässt – und übersetzt diese im Hintergrund in SPARQL. Suchen lassen sich zum Beispiel bestimmte Aussagen auf einem Datenobjekt in Wikidata. Das Datenobjekt für Berlin trägt unter anderem die Aussage: Land: Deutschland. Im Query Builder könnte man alle Datenobjekte abfragen, die auch die Aussage Land: Deutschland haben. Oder: alle Personen, die einen „Oscar“ gewonnen haben und in diesem Land, oder auf jenem Kontinent geboren wurden. Diese Bedingungen kann man der Reihe nach eintragen und verknüpfen. Der Query Builder kann zwar noch nicht das volle Potenzial von SPARQL abdecken, aber er liefert Ergebnisse, mit denen sich weiterarbeiten lässt.

In welchen Gebieten findet der Query Builder Anwendung und wer soll ihn nutzen?

In der ersten Version richtet sich der Query Builder hauptsächlich an Menschen, die Wikidata editieren. Ein häufiger Vorgang in der Editierarbeit ist beispielsweise, eine Abfrage zu schreiben, um gezielt nach fehlenden Daten oder fehlerhaften Datensätzen in Wikidata zu suchen. Etwa nach Personen, die in der Zukunft geboren sind. Dabei könnte es sich natürlich um einen fiktiven Charakter handeln. Oder um einen Fehler. Die Abfrage ermöglicht es jedenfalls, solche Fälle aufzuspüren, ohne Millionen Datenobjekte einzeln von Hand durchsuchen zu müssen.

Ist auch der Einsatz in wissenschaftlichen Kontexten möglich?

In Wikidata sind jede Menge Datenobjekte zu wissenschaftlichen Papers und Veröffentlichungen gesammelt. Viele davon sind getagt mit dem Thema, über das geschrieben wurde, und mit dem Namen der Autorin oder des Autors. Eine Möglichkeit für Wissenschaftler*innen wäre, mit dem Query Builder zu schauen: Welche Veröffentlichungen existieren auf meinem Fachgebiet, die ich vielleicht noch nicht kenne, oder: Welche Kolleg*innen sollte ich zur Kenntnis nehmen?

Welche Entwicklungsgeschichte hat der Query Builder?

Die Idee existiert schon, seit es den Query Service für Wikidata gibt, seit man SPARQL-Abfragen für Wikidata schreiben kann – und klar wurde, wie komplex das ist. Wir haben 2015 begonnen, mit einer Hochschule zusammenzuarbeiten und im Rahmen von Bachelor-Arbeiten erste Konzepte, später dann einen Prototyp zu entwerfen, aus dem wir viel lernen konnten: Wie muss eine Nutzeroberfläche aussehen, die für die Nutzer*innen funktioniert? Wie lassen sich bestimmte Interaktionskonzepte verständlich machen? Vor mittlerweile zwei Jahren ist dann die Entwicklung des Query Builders gestartet, den wir 2021 veröffentlichen konnten und der jetzt live auf Wikidata ist.

Welche Reaktionen gab es bisher?

Die Nutzer*innen nennen den Query Builder einen Gamechanger. Viele der Editor*innen hatten das Problem, dass sie sich selbst vielleicht mühsam SPARQL angeeignet hatten – aber damit andere nicht zum Mitmachen anstiften konnten, denen das viel zu komplex klang. Diese Hemmschwelle haben wir mit Query Builder stark gesenkt.

Welche Erweiterungen sind noch denkbar?

Wir werden daran arbeiten, noch weitere Teile des SPARQL-Standards zu implementieren, um mehr Abfragen zu ermöglichen. Denkbar sind auch weitere Visualisierungen für die Ergebnisse der Suchabfrage. Mit der SPARQL-Oberfläche, die wir haben, kann man sich die Ergebnisse auf einer Karte anzeigen lassen, als Balkendiagramm oder auch als Bildergalerie, wenn nach Bildern gesucht wird. Der Query Builder liefert diese Visualisierungen noch nicht umfänglich.

Welche Suchanfragen könnten in Zukunft möglich sein?

Das hängt definitiv davon ab, wonach die Editor*innen fragen. Unsere Entwicklungsarbeit basiert ja zu großen Teilen auf dem Feedback, das wir von Nutzer*innen bekommen. Ein Beispiel, das ich gern verwende, ist die Abfrage „Weibliche Staatsoberhäupter“ – sehr komplex, weil man dafür in viele verschiedene Datensätze schauen muss. Aber es könnte möglich werden!