Das Semantic Web

By on 20. Dezember 2007

Viele der größten kommerziellen Erfolge des Internet-Geschäfts in den letzten Jahren gehen auf Suchanwendungen im Internet zurück. Diese haben jedoch einen Hacken: Über Google und andere Anbieter kann man, will man nicht die vielen Verzeichnisse durchblättern, lediglich Zeichenketten, nicht aber Inhalte selbst suchen. Wer etwa bei Google nach „Grillen“ sucht, kann ebenso gut Dokumente über die gleichnamigen Insekten, wie auch Informationen und Angebote für das Zubereiten von Lebensmitteln auf offenem Feuer finden. Der Grund für dieses Problem ist die Mehrdeutigkeit von Wörtern. Viele Fachbegriffe sind der normalen Alltagssprache entlehnt, und daher kann ein Begriff häufig die verschiedensten Dinge benennen. Zwar kann man dieses Problem dadurch verringern, dass man mehrere aus einem Themenbereich stammende Wörter nebeneinander in der Suchanfrage platziert; So würden etwa die Paare „Grillen“, „Insekten“ sowie „Grillen“ „Lebensmittel“ bessere Ergebnisse liefern. Es bleibt jedoch das Problem, dass die Suche an bestimmten Begriffen hängt. Tatsächlich kann heute im Wesentlichen entweder in thematisch geordneten Verzeichnissen nach Informationen suchen, oder nach Begriffen, die für den Rechner nur Zeichenketten sind.

Eine Lösung dieses Problems wird durch eine Vielzahl von Software-Entwicklungen in greifbare Nähe gerückt, die unter dem Namen „semantic web“ zusammengefasst werden. Dabei geht es im Wesentlichen darum, Dokumente mit Metadaten zu versehen, die der Suchmaschine ihre Arbeit erleichtern. Diese Metadaten sind jedoch ihrerseits nicht nur anonyme Zeichenketten; vielmehr sind sie Teil einer „Ontologie“, d. h. eines Systems von miteinander je nach thematischer Nähe verbundenen Begriffen. Wer etwa „Grillen“ in eine Semantic-Web-Suchmaschine eingibt, kann je nach System eine Rückfrage zur Vereindeutigung des Suchbegriffs erwarten; Das System würde sich in diesem Fall rückversichern, ob nach Insekten oder nach Dingen rund um den „Grill“ gesucht werden sollte. Die Grafik zeigt ein Ontologiesystem der Semantic-Web-Anbieters W3c.