Ontologie und Taxonomie – hören Sie auf, Dinge zu vergleichen, die nicht vergleichbar sind
Für viele Menschen mag das Wort „Ontologie“ abstrakt klingen. Es hat seinen Ursprung in Tim Berners-Lees Traum, das World Wide Web zu erfinden. Dieser Traum beinhaltete, dass das Web in der Lage wurde, ein sogenanntes „Semantic Web“ zu definieren, indem es alle Webdaten analysierte, einschließlich Inhalt, Links und Computer-Person-Transaktionen. Im Semantic Web haben sich das Resource Description Framework (RDF) und die Web Ontology Language (OWL) als Standardformate für den Austausch und die Integration von Daten und Wissen etabliert – letzteres in Form von umfangreichen konzeptionellen Schemata, die als Ontologien bezeichnet werden. In diesem Artikel dient das Wort Ontologie als Arbeitsdefinition, es ist jedoch erwähnenswert, dass es in der heutigen IT-Welt auch eine breite Verwendung des Begriffs „knowledge graph“ gibt, um auf dieses Konzept zu verweisen.
Warum Ontologien auch Sie kümmern sollten
Im Bereich der künstlichen Intelligenz (KI) ersetzen die Begriffe „Big Data“, „Machine Learning“ und „Deep Learning“ langsam die Verwendung von „KI“. Um Adrian Bowles zu zitieren: „Es gibt keine maschinelle Intelligenz ohne (Wissens-)Repräsentation.“ Mit anderen Worten, die KI benötigt einige Elemente der Wissenstechnik, der Informationsarchitektur und ein beträchtliches Mass an menschlicher Arbeit, um ihre „magische neuronale Arbeit“ zu leisten. Alexander Wissner-Gross stellt fest, dass wir vielleicht vor allem erkennen müssen, dass es sich um intelligente Datensätze und nicht um Algorithmen handelt, die wahrscheinlich der Schlüsselfaktor für die Entwicklung der künstlichen Intelligenz auf menschlicher Ebene sein werden.
„Es gibt keine maschinelle Intelligenz ohne (Wissens-)Repräsentation.“
Eine Ontologie ist eine strukturierte und formale Darstellung von relativem Wissen in einem bestimmten Bereich. Dies ist notwendig, denn im Gegensatz zum Menschen kann er sich nicht direkt auf das menschliche Hintergrundwissen über die korrekte Verwendung eines Begriffs verlassen. Was eine Ontologie jedoch tun kann, ist, die semantische Bedeutung eines Begriffs durch die Verknüpfungen zwischen den Konzepten in ihrem System „zu erlernen“. In bestimmten Bereichen existieren bereits leistungsfähige Ontologien, wie z.B. die Financial Industry Business Ontology (FIBO) sowie zahlreiche Ontologien für Gesundheit, Geographie oder Berufe.
Ein weiterer wichtiger Teil der KI ist die semantische Argumentation. Neben der Identifizierung potenziell betrügerischer Transaktionen, der Bestimmung der Absicht der Benutzer anhand ihrer Browserhistorie und der Abgabe von Produktempfehlungen kann die KI auch Folgendes tun: Es kann Aufgaben ausführen, die eine explizite Argumentation auf der Grundlage von allgemeinem und domänenspezifischem Wissen erfordern, wie z.B. das Verstehen von Nachrichtenartikeln, die Zubereitung von Speisen oder den Kauf eines Autos. Solche Aufgaben erfordern daher Informationen, die nicht Teil der Eingangsdaten sind, sondern dynamisch mit Wissen kombiniert werden müssen. Diese Art der maschinellen Argumentation kann nur mit Ontologien und der Art und Weise, wie ihr Wissen modelliert wird, erreicht werden. [2]
Taxonomie und Ontologie sind grundsätzlich unterschiedlich.
Ontologie wird oft mit Taxonomie verwechselt. Abgesehen davon, dass beide zu den Bereichen KI, Semantic Web und System Engineering gehören, gibt es wirklich nicht viel, was sie als Synonyme charakterisieren würde. Taxonomische Klassifikationen wie O*NET (Occupational Information Network) und ESCO (European Skills/Competences, qualifications and Occupations) sind einfach nicht mit komplexen und umfassenden Ontologien vergleichbar. Sie bieten einen viel einfacheren Ansatz zur Klassifizierung von Objekten, da sie eine hierarchische Struktur haben und nur Eltern-Kind-Beziehungen ohne zusätzliche, komplexere Verknüpfungen verwenden. Ontologien hingegen sind eine viel komplexere Form der Kategorisierung. Metaphorisch gesprochen, ist eine Taxonomie gleich einem Baum, während eine Ontologie einem Wald näher kommt.
Zum Beispiel: Der Begriff „Golf“ könnte in mehreren Taxonomien vorkommen. Es könnte sich unter einer Rubrik „Human Activities“ befinden.Baum (menschliche Aktivitäten -> Freizeitaktivitäten -> Sport -> Golf). Sie finden sie auch unter einer Taxonomie für Bekleidung (Bekleidung -> Freizeit-/Aktivbekleidung -> Sportbekleidung -> Golfbekleidung und Accessoires). Es könnte sogar in etwas ganz anderem erscheinen, zum Beispiel in einer Automobil-Taxonomie (Automobil -> Deutschland -> VW -> Golf). Jede dieser Taxonomien kann als ein Baum betrachtet werden, dessen Äste sich an ihren golfbezogenen Knoten berühren. [3]
Anders ausgedrückt, stellen Taxonomien eine Sammlung von Themen mit „ist-a“-Beziehungen dar, während Ontologien viel komplexere Zusammenhänge ermöglichen, wie beispielsweise „has-a“- und „use-a“-Beziehungen. [4] Wenn wir also auf das obige Klassifizierungsbeispiel zurückkommen, fehlt den Taxonomien die Fähigkeit, untergeordnete Konzepte zu vergleichen.
In der Klassifizierung von ESCO sind fast alle Fachärzte unter dem Begriff „Fachärzte“ zusammengefasst. Darüber hinaus werden Fachkompetenzen einfach in Listen ohne Bezug zu den jeweiligen Fachberufen zusammengefasst. Warum ist das so? Ein Grund dafür ist, dass Klassifizierungen hauptsächlich zu statistischen Zwecken verwendet werden. Unter diesem Gesichtspunkt ist es nicht notwendig, alle einzelnen Fachärzte weiter zu klassifizieren.
Daher können Spezialisierungen nach Taxonomien nur an der Berufsbezeichnung erkannt werden und man muss auf andere Quellen zurückgreifen, um ihre individuelle Bedeutung besser zu verstehen.
Der Aufbau einer Ontologie von Berufen, Qualifikationen und Kompetenzen ermöglicht es, Ähnlichkeiten und Unterschiede zwischen Berufsbezeichnungen automatisch zu erkennen. So haben beispielsweise Kinderärzte und Neonatologen ähnliche Tätigkeiten, die sich beide mit der medizinischen Versorgung von Neugeborenen befassen. Mit der Ontologie-Modellierung Ansatzes ist es möglich, festzustellen, dass ein Kinderarzt einen sehr hohen Prozentsatz an ähnlichen Fähigkeiten hat wie ein Neonatologe. Kinderärzte können die Arbeit des Neonatologen jedoch erst nach einer Weiterbildung übernehmen. All diese Informationen können in einer Ontologie durch die Wechselbeziehungen zwischen den Konzepten dargestellt werden. Dies geht über die Kapazität einer einfachen Taxonomie hinaus.
Ontologien ermöglichen den Abgleich von Datensätzen
Wenn es um das Matching geht, sagen wir das Matching von Lebensläufen mit offenen Stellen, gibt es keinen besseren Weg, als eine Ontologie zu nutzen. Allzu oft werden dazu einfache keyword-basierte Matching-Methoden oder Fuzzy Machine Learning-Methoden verwendet, was bedeutet, dass viele Ähnlichkeiten unentdeckt bleiben und nicht abgeglichen werden können, wie z.B. Keyword-Variationen, Synonyme und alternative Phrasen. Beim Abgleich ist es wichtig, die Semantik (die zugrunde liegende Bedeutung) von zwei Elementen und nicht den Wortlaut zu vergleichen. Hier kommen Ontologien ins Spiel. Sie können eine semantische Modellierung bereitstellen, die die zugrunde liegenden Bedeutungen und Ähnlichkeiten in Lebensläufen und Stellenbeschreibungen aufdecken kann.
Die Ontologie-Matching-Technik stellt eine grundlegende Technik in vielen Bereichen dar, wie z.B. der Zusammenführung der Ontologie. In Bereichen mit sehr komplexen Regeln (und komplexen Interaktionen zwischen Regeln) gibt es keinen Ersatz für Ontologien. Dies wird z.B. angezeigt, wenn Sie überlegen, disparate Domänen zu integrieren. Nehmen wir an, es gibt zwei getrennte Ontologien, eine Wetterontologie und eine geographische Ontologie, wenn es um Navigations- oder Versicherungsrisiken geht, um eine dritte Ontologie zu schaffen, die die beiden anderen integriert und nutzt, ist ein überschaubarer Vorschlag. [5]
Der wahre Wert von Ontologien
Das semantische System basiert auf expliziten, menschenverständlichen Darstellungen von Konzepten, Beziehungen und Regeln, um das gewünschte Domänenwissen zu entwickeln. Es ist unmöglich, sich ausschließlich auf Programmierer zu verlassen, um ein solches System auf der Grundlage von maschinellem Lernen aufzubauen, da ihnen das Wissen fehlt, das sie benötigen, um Beziehungen zwischen Konzepten in den spezifischen Bereichen zu definieren. Daher muss das Fachwissen von Fachleuten mit unterschiedlichem Hintergrund (z.B. Immaterialgüterrecht, Strömungsdynamik, Autoreparatur, offene Herzchirurgie oder Bildungs- und Berufssysteme) erworben werden. Dieser Prozess ist entscheidend für die Schaffung einer umfassenden Wissensrepräsentation.
Für die mehrsprachige JANZZ Ontologie sind Sprachkenntnisse ein wichtiger Punkt. In vielen Fällen ist eine Einzelübersetzung eines Konzepts in mehrere Sprachen nicht möglich, aber da die Schweiz klein und multikulturell ist, sprechen alle Kuratoren der JANZZOntologie mindestens zwei Sprachen fließend und einige sogar mehr als vier (einschließlich Chinesisch und Arabisch). Dieser Vorteil garantiert die Konsistenz und Qualität der Ontologie in verschiedenen Sprachen.
Vor etwa einem Jahrzehnt begann JANZZ seine Ontologie auf verschiedenen Berufstaxonomien aufzubauen, nämlich ISCO-08, ESCO und allen länderspezifischen Klassifizierungen. Im Laufe der Jahre hat JANZZ Tausende neuer Berufe und Funktionen (z.B. Market Research Data Miner, Millennial Generational Expert und Social Media Manager) in die JANZZ Ontologie aufgenommen, die es in keiner der bekannten Taxonomien zuvor gab. Neben den Berufsbezeichnungen wurden auch aktuelle Kenntnisse, Ausbildung, Erfahrung und Spezialisierungen in die Ontologie aufgenommen. Es ist das richtige Instrument für HR und öffentliche Arbeitsmarktorganisationen, das die Ähnlichkeiten und Unklarheiten zwischen den Berufsbezeichnungen erkennt und nicht wie eine Taxonomie eine Sammlung von Begriffen ist. Heute ist die JANZZ Ontologie mit Abstand die größte, komplizierteste und vollständigste Berufsdatenontologie der Welt.
Für Privatunternehmen und öffentliche Arbeitsmarktorganisationen, die versuchen, zwischen einem Klassifizierungssystem auf der Grundlage einer Taxonomie und einem Klassifizierungssystem auf der Grundlage einer Ontologie zu wählen, hoffen wir, dass dieser Artikel Sie dabei unterstützt, die richtige Entscheidung zu treffen und Ihnen hilft zu erkennen, dass Investitionen in ein nicht-semantisches System (ohne Inhalt) Sie leider nicht weiterbringen werden. Glücklicherweise haben einige Regierungen und Unternehmen den richtigen Weg gewählt und profitieren bereits von unseren neuesten Technologien . Wenn Sie mehr über die JANZZZ-Ontologie bzw. den JANZZ Knowledge-graph erfahren möchten, nehmen Sie doch unter sales@janzz.technology Kontakt mit uns auf.
[1] Ian Horrocks. 2008. Ontologies and the Semantic Web. URL: http://www.cs.ox.ac.uk/ian.horrocks/Publications/download/2008/Horr08a.pdf [2019.02.01 ]
[2] Larry Lefkowitz. 2018. Semantic Reasoning: The (Almost) Forgotten Half of AI. URL: https://aibusiness.com/semantic-reasoning-ai/ [2019.02.01]
[3] New Idea Engineering. 2018. What’s the difference between Taxonomies and Ontologies? URL: http://www.ideaeng.com/taxonomies-ontologies-0602 [2019.02.01]
[4] Daniel Tunkelang. 2017. Taxonomies and Ontologies. URL: https://queryunderstanding.com/taxonomies-and-ontologies-8e4812a79cb2 [2019.02.01]
[5] Nathan Winant. 2014. What are the advantages of semantic reasoning over machine learning? URL: https://www.quora.com/What-are-the-advantages-of-semantic-reasoning-over-machine-learning [2019.02.01 ]