Was ist der Unterschied zwischen ontologie- und keywordbasiertem Matching/Search? Teil 3/10

Im letzten Beitrag (Was bedeutet eigentlich genau Job- bzw. Skills-Matching? In der Rekrutierung und im HR-Management? Teil 2/10) habe ich Ihnen ja bereits angekündet, dass es zwei verschiedene Formen von Matching gibt: das keywordbasierte und das ontologiebasierte. Nun richte ich mich mit diesem Blogartikel nicht an IT-Spezialisten. Ich  möchte vielmehr Ihnen als an HR-Themen interessierten Lesern konkret den Unterschied aufzeigen. So können wir uns mit dem gleichen Wissenstand der nächsten Frage zuwenden, was gutes Jobmatching eigentlich kann. Um uns den beiden Formen von Suche oder eben Matchings genauer anzunehmen, schauen wir uns folgendes Szenario an.

Supercomputer Watson gewinnt TV-Quizshow

Als das IBM-Computerprogramm Watson 2011 einen Auftritt bei der amerikanischen Quizsendung Jeopardy hatte, schlug es seine zwei menschlichen Gegner, die in der Show zuvor Rekordsummen gewonnen hatten, bei weitem. Schauen Sie sich die Show hier an:

Falls Sie das Video nicht sehen können, klicken Sie hier.

Wer das Spiel kennt, weiss, dass sich bei dem Quiz neben den schwierigen Wissensfragen viele andere Herausforderungen stellen, da die als Antworten gestellten Aufgaben meist bewusst mehrdeutig formuliert sind, häufig die Verknüpfung mehrerer Fakten erforderlich machen und die passende Frage innerhalb eines Zeitlimits von fünf Sekunden gefunden werden muss. Umso erstaunlicher, dass Watson die beiden Champions so in den Schatten gestellt hat.

Die Herangehensweise des Computers an die tückischen Fragen zeigt den Unterschied zwischen ontologie- und keywordbasiertem Matching/Search sehr gut auf und entlarvt das letztere als deutlich unterlegen.

 

janzz.technology_ibmwatson2011

Quelle: IBM.

Die Grafik illustriert, wie sich die Suche des Supercomputers von der herkömmlichen Stichwortsuche unterscheidet. Und zwar gleicht Watson Informationen, nicht Wörter miteinander ab. Er strukturiert die Informationen so, dass er zum Beispiel das 400-ste Jubiläum im Mai 1898 einem Ereignis im Mai 1498 gleichsetzt. So kann er in seiner Datenbank auch unterschiedlichste Formulierungen desselben Sachverhalts erkennen.

Die Art der Suche ist also entscheidend für den Supercomputer, aber eben auch für Matching im Allgemeinen. Darum schauen wir uns den Unterschied einmal im Detail an.

Keywordbasiertes Matching/Search

Die keywordbasierte Suche ist die einfachste Form der Suche in grossen Datenmengen. Basis der Suche bildet das eingegebene Keyword, welches dann ohne Berücksichtigung von Bedeutung, Kontext und Synonymen abgeglichen wird. Es ist offensichtlich, dass dies nicht funktionieren kann, oder nur zu einem gewissen Grad. Denn viele Wörter können je nach Kontext komplett unterschiedlich verwendet werden. Das Wort «Manager» ist ein gutes Beispiel für solche Auswüchse: «Sales Manager», «Campaign Manager» und «Office Manager» tauchen alle bei der gleichen Suche auf, haben aber schlichtweg nicht viel miteinander zu tun.

Mismatched_socks

Quelle: Pinterest.com

Zudem erkennt die keywordbasierte Suche keine Synonyme oder Bezeichnungen in anderen Sprachen: so sucht sie neben dem «CEO» nicht auch z. B. nach «Geschäftsführer/-in», «Geschäftsleiter/-in» oder «Managing Director» etc. Dafür findet sie Fehltreffer wie z. B. «Assistentin des CEO» oder «Sekretärin des Geschäftsführers». Die keywordbasierte Suche übersieht somit viele potenzielle Resultate und liefert derweil zahlreiche falsche Treffer, was nicht nur Zeit sondern auch Nerven kostet. Damit die keywordbasierte Suche besser funktionieren kann, braucht sie einen Thesaurus, der ihr hilft den richtigen Kontext und passende Zusammenhänge zu erkennen. Damit wären wir aber schon fast beim ontologiebasierten Matching.

Ontologiebasiertes Matching/Search

Das ontologiebasierte Matching stellt nicht den Suchbegriff als solchen, sondern dessen Bedeutung in den Vordergrund. Dies geschieht über einen Thesaurus (Wortnetz) und eine Ontologie (Datenbank). Dort sind die Begriffe nach Bedeutung gruppiert. Bei der Suchabfrage werden so Begriffe nach der korrekten Bedeutung miteinander verknüpft, auch wenn diese nicht mit der «Zeichenkette» übereinstimmen. Zudem werden bei Suchabfragen auch Synonyme und falls gewünscht, auch Bezeichnungen und Begriffe aus anderen Sprachen miteinbezogen. So erscheinen neben dem «Doktor» auch z. B. «Arzt/Ärztin», «Mediziner», «physician» etc. aber keine Fehltreffer wie z. B. «Doktorand/in» (PhD-Student/in) oder «Arzthelfer/in» etc. Zudem wurden in den letzten Jahren sehr viele, auch traditionelle Berufe z. B. mit allenfalls zeitgemässeren, aber oft im Sprachgebrauch sperrigen und daher kaum benutzten neuen Benennungen versehen. So wurden in den letzten Jahren z. B. aus einem «Mitarbeitenden für Kopien und Archiv» ein «Executive Document Manager» oder aus der «Reinigungsfachkraft» auch einmal eine «Raumveredlerin», um nur einige seltsame Auswüchse heutiger Job- und Berufsbeschreibungen zu nennen. Die ontologiebasierte Suche erkennt beide Ausdrücke, stellt problemlos den Zusammenhang her und kann so die Anzahl der richtigen Suchresultate maximieren.

Eine solche Form des Matchings wird oftmals auch als semantische Suche bezeichnet. Die Ergebnisse und die Präzision von semantischen Such- und Matchingprozessen sind von Umfang und Tiefe, aber natürlich auch von der Qualität und Vollständigkeit des verwendeten Kontext- und Hintergrundwissens, bzw. der verwendeten Ontologie abhängig.

Zukunft: ontologiebasiertes Matching

Sicherlich wird die ontologiebasierte Suche die zukunftsweisende Form sein, weil sie schlicht und einfach viel mehr kann. Denn sie verknüpft Inhalte und nicht Worte, was die Basis ist für eine erfolgreiche Suche. Doch eine Ontologie ist immer nur so gut wie Ihre Daten. Diese müssen sauber klassifiziert sein und stets aktualisiert werden. Denn eine umfangreiche und vielschichtige Ontologie deckt vor allem auch den «echten Alltags-Sprachgebrauch» der Nutzer in den verschiedenen Anwendungen, Branchen und Sprachen ab. Ohne diese grösstmögliche Abdeckung auch mitunter sehr «kreativer Begrifflichkeiten» der Benutzer kann eine Ontologie über einen längeren Zeitraum nicht erfolgreich bestehen. Und auch weiterhin müssen häufig benutzte herkömmliche Begriffe wie z. B. «Metzger/-in» oder «Krankenschwester» und nicht nur «Fleischfachleute» oder «Pflegefachfrau» erkannt werden. Für einen erfolgreichen Einsatz im HR und Recruiting braucht es also auch Daten aus realen Stellenangeboten in allen Branchen, Sprachen und Regionen oder CV’s von Stellensuchenden. Nur so kann eine grösstmögliche Aktualität und Alltagstauglichkeit in den Such- und Matchingvorgängen garantiert werden und nur so können sie ontologiebasiertes Matching erfolgreich einsetzen.

Die Strukturierung, der kontinuierliche Ausbau und Unterhalt sowie die Pflege und Verfeinerung solcher hochkomplexer Ontologien erfordert meist den Umgang mit speziellen, für Experten ausgelegte Werkzeuge wie z. B. Ontologieeditoren und setzen langjährige Erfahrung und Know-how im Bereich der Wissensmodellierung voraus. Da solche, meist langjährigen und aufwendigen Arbeiten selten durch eigene Ressourcen abgedeckt werden können, gibt es cloudbasierte Lösungen, die Unternehmen in Ihre bestehenden Prozesse integrieren können.

Doch wer zukünftig auf die ontologiebasierte Suche setzt, wird sich viel Zeit mit dem Durchforsten von unpassenden Suchresultaten sparen. Denn es wird ihm nur noch das Resultat angezeigt, dass auch wirklich inhaltlich zu seiner Suche passt. Wie das ontologiebasierte Matching bei der Jobsuche zum Tragen kommt, welche Auswirkungen das hat, und wo es das HR unterstützt, werde ich Ihnen mit dem nächsten Blog ausführlich beantworten.

Der Beitrag ist Teil meiner Reihe Was Sie schon immer über technologische Trends und Themen im HR wissen wollten, aber bisher nicht zu fragen wagten.