von Jelena Hauß

Das Semantische Web als „Antwortmaschine“

Ganz im Habitus großer Medienkonzerne liefert auch Google wieder einen Jahresrückblick 2011. Das Video „Zeitgeist 2011“ stilisiert die Suchmaske und weitere Anwendungen Googles als Tor zur Welt. Was zunächst nur als schöne Animation erscheint, kommt der tatsächlichen Bedeutung der Suchmaschinen für unsere Wissensbestände jedoch sehr nah. Diese mächtigen Filter ermöglichen es erst, das Web und darin gespeicherte Informationen nutzen zu können. Eine Facebookgruppe bringt die heutigen Nutzungsgewohnheiten – sei dahingestellt ob bewusst oder unbewusst – auf den Punkt: „Wir denken nicht, wir googeln“. Angesichts der Alltäglichkeit von Suchanfragen haben wir offenbar vergessen, welche Transferleistungen wir stets an der Schnittstelle zwischen Mensch und Maschine erbringen müssen, denn Google funktioniert grundlegend anders als das menschliche Gehirn. Eine Zukunftsvision für das Internet und die Filterung der dort verfügbaren Daten widmet sich der Überwindung genau dieser Kluft: Das „Semantische Web“ und die „Semantischen Suchmaschinen“, die uns nicht mehr nur Suchergebnisse auflisten, sondern Antworten auf unsere Fragen geben.

Transferleistung? Fehlanzeige!

„Das Internet soll klüger werden“, überschrieb SpiegelOnline einen Artikel zum Semantischen Web und trifft damit das Kernanliegen. Bisher ist das Netz ein Ort der Datenberge, die mit mächtigen Suchmaschinen durchwühlt und uns dann in einer von Algorithmen bestimmten Reihenfolge angeboten werden. Die eingesetzten Rechner und Anwendungen können jedoch nicht die inhaltlichen Bedeutung von Suchanfragen erfassen, keine Informationen verknüpfen und so keine Antworten im ursprünglichen Sinne liefern. Stets ist der Nutzer gefragt: Webinhalte querlesen, einschätzen, möglicherweise eine neue Suchanfrage starten, um schließlich Zusammenhänge herstellen zu können. Schon einfache, alltagsnahe Fragen, werden so zu einer mühseligen Aufgabe für den Nutzer, wie Micheal Osl treffend beschreibt. Diese Kleinteiligkeit der Informationsgewinnung im Netz soll das Semantische Netz beenden, wie Wikipedia verdeutlicht:

Die Daten in einem Semantischen Web sind strukturiert und in einer Form aufbereitet, welche es Computern ermöglicht, sie entsprechend ihrer inhaltlichen Bedeutung zu verarbeiten. Zudem erlaubt ein Semantisches Web Computern […], aus den vielen Informationen der weltweiten Daten Wissen herzuleiten und neues Wissen zu generieren.

Eine verführerische Idee, die auch deswegen ernst zu nehmen ist, weil sie von Tim Berners-Lee entwickelt wurde, dem Erfinder des Internets, wie wir es heute nutzen. Sein erster Artikel zu diesem Thema ist inzwischen über zehn Jahre alt – doch wo steht das Semantic Web heute?

Von ersten Erfolgen hin zur Utopie

Der Herausforderung, diese weitreichenden Ideen in umsetzbare Konzepte zu gießen, stellten und stellen sich Experten wie Informatiker und Kognitionswissenschaftler, muss doch der Transfer menschlicher Denkstrukturen auf die Maschinen gelingen. Einige grundlegende Techniken, wie Auszeichnungs- und Abfragesprachen, wurden so schon geschaffen. Diese Sprachen dienen unter anderem dazu, Daten im Netz mit sogenannten Metadaten zu hinterlegen, die dann Wortbedeutungen transportieren und so der Ausgangspunkt für Informationsknüpfung sind. Greifbare Ergebnisse liefern bisher semantische Suchmaschinen, wie etwa die im universitären Rahmen entwickelte Suchmaschine Sempria, die bereits deutlich bessere Ergebnisse als algorithmische Maschinen liefert. Auch WolframAlpha kann als Etappenerfolg gelten, liefert diese Webanwendung doch „sinnvolle“ Antworten, wenn auch vornehmlich für mathematisch oder physikalisch exakt zu beantwortende Fragen. Ein Zeichen, wie wichtig die Entwicklung einer Netzsemantik ist, setzte die deutsche Politik: Bereits 2006 rief die Bundesregierung das interdisziplinäre Forschungsprogramm Theseus ins Leben.

Jenseits aller Detailarbeit und Interessensgruppen, die am Semantic Web arbeiten, scheint das Szenario, auf das hingearbeitet wird, in der Webgemeinde jedoch ausgemachte Sache: Das Netz und die Websuche sollen eine „Antwortmaschine“ werden, so zum Beispiel dargestellt in einem anderen aktuellen Video von Google: Man stellt Fragen, die einer natürlichen Gesprächssituation gleichen – und erhält eine ebenfalls „menschliche“ Antwort in Form eines Aussagesatzes.

Was auf den ersten Blick traumhaft einfach erscheint, könnte jedoch auch zu einfach sein: Antworten, deren Quellen nicht erschlossen werden können, sind kaum etwas wert. Die Frage, ob als Grundfunktion die Komplexitätsreduktion bei der Semantischen Suche auch stets nachvollzogen und aufgeschlüsselt werden können sollte, wird derzeit offenbar noch kaum diskutiert –die Expertenbeschäftigen sich vor allem damit, die „Antwortmaschinen“ erst mal zum Laufen zu bekommen. Wolfram Alpha als Vorreiterprojekt liefert einen erste Lösung hierfür: Mit einem Klick kann man einen Blick in die „Source information“ der Suchergebnisse werfen. Zukunftsvisionen für das Semantische Web reichen jedoch noch viel weiter; solche umreißt der Wissenschaftler Michael Herzog einer Sendung des Deutschlandradios Kultur: Beispielsweise könnten mithilfe dieser Technologie „Augmented Reality“Anwendungen die Unterschiede zwischen Mensch und Maschine verwischen oder ganz verschwinden lassen.

Mensch und Maschine in Seligkeit vereint?

Heute besteht jedoch nur ein Bruchteil des Netzes aus semantisch angereicherten Daten und es gibt bisher nur vage Vorschläge, wie die unvorstellbare große Menge an notwendigen Metadaten in das Web 2.0 eingepflegt werden könnte. Auch ist es ein sensibler Punkt, wer mit welchen Interessen Daten welche Bedeutungen zumisst, womit gerade im Semantic Web Fragen zur Macht über Wirklichkeitskonstruktionen umso dringlicher gestellt werden müssen. Die erste Frage, die man folglich einer perfekt funktionierenden semantischen Suchmaschine stellen sollte, ist wohl: „Ist das Semantische Web ein Fluch oder Segen für die Menschheit?“ Eine Antwort, destilliert aus allem, was dazu jemals an Daten ins Netz gespeist wurde, wäre sicherlich aufschlussreich.

Foto: Flickr/Jeffrey Beall (CC BY-ND 2.0)