Die JANZZ Ontologie – Daten befähigen und smarte Applikationen realisieren

Das Wort «Ontologie» gehört seit 40 Jahren zum Vokabular der Forschung über die künstliche Intelligenz (KI). [1] Genau wie andere Trends haben auch Ontologien ihre Höhen und Tiefen. Nachdem sie in den 1980-er Jahren eingeführt wurden etablierten sich Ontologien erst Mitte der 1990-ern. Als Maschinelles Lernen (ML) um 2000 die Szene betrat war die verbreitete Ansicht, dass alle Aufgaben, die mittels Computer (in Verbindung mit AI und ML) erfüllt werden, zukünftig mit einem intelligenten Algorithmus gelöst werden können. In der Hoffnung den nächsten KI-Durchbruch zu erzielen investierten deshalb viele Firmen massiv in solche Algorithmen.

Mit der schnellen Entwicklung von KI und ML, die sich insbesondere nach dem Aufkommen von künstlichen neuralen Netzen (CNN) beschleunigte, wuchs die Haupttechnologie – Deep Learning (DL) – rapide im Hinblick auf Paramater-Grösse und Komplexität des Computing. Heute umfassen einige der komplexesten Modelle eine Dimension mit Milliarden von Parametern. [2]

Dennoch wurden Bedenken bezüglich des aktuellen Mainstream DL geäussert. Nehmen wir als Beispiel das überwachte Lernen in der Bilderkennung: Die Bilder die beim Training der KI-Modellen gebraucht werden müssen im Hinblick auf Position und Kontur ihrer Zielobjekte manuell identifiziert werden, um die Modelle nach dem Vergleichen verschiedener Labeling-Resultate zur Erkennung impliziter Muster-Features zu befähigen. Wenn wir dies mit der Art und Weise wie wir Dinge als Kleinkinder lernen vergleichen fällt auf, dass im Menschen solche Mechanismen inhärent sind und keinerlei Instruktion bedürfen. [2]

DL-Methoden haben enormen Fortschritt gemacht und sind inzwischen in der Lage, Wissen von Trainingsdaten zu extrahieren. Jedoch ist dieses Wissen nicht explizit ‘erklärbar’ (explainable), weil das sogenannte “Black-Box-Training” die komplexen Verbindungen die im Inneren der Modelle versteckt sind nicht offenlegt. Bei Problemen sind die jetzigen Modelle unfähig, das akquirierte Wissen für das Lösen neuer Herausforderungen effektiv anzuwenden. [2]

Zusätzlich gibt es ein grosses Problem betreffend Big Data und dem damit verbundenen Thema Datenschutz. Die momentanen DL-Methoden basieren überdies auf Big Data die nicht auf Industrien wie Medizin oder HR, welche kleine Mengen an Daten generieren, anwendbar sind. Dieser Fall erfordert, dass KI-Systeme die Fähigkeit besitzen, logisch zu denken und zu urteilen, was nur in gewissen Bereichen möglich ist. [3]

Es existieren bereits zahlreiche leistungsstarke Ontologien für spezifische Domänen wie beispielsweise die Financial Industry Business Ontology (FIBO) oder auch einige Ontologien für Gesundheitswesen, Geografie oder Berufe. Es wird allgemein angenommen, dass Wissensintegration und DL wichtige Faktoren für die Verstärkung der Effektivität sind. Aus diesem Grund sind Ontologien zusammen mit vielen Pendants wie Knowledge Graphs oder Wissensrepräsentationen zurück in den Mittelpunkt gerückt.

Bei JANZZ.technology haben wir in 2008, bevor der Tech Gigant Google den Begriff “Knowledge Graph” erfand und populär machte, angefangen, unsere eigene Ontologie – JANZZon! – zu kreieren. JANZZ.technology baut seine Ontologie mithilfe von Domänen-Experten mit verschiedenen Hintergründen (z.B. Recht zu geistigem Eigentum, Fluiddynamik, Autoreparatur, offene Herzoperation oder Bildungs- und Ausbildungssysteme) auf.

Heute ist JANZZon! die grösste mehrsprachige enzyklopädische Wissensrepräsentation im Bereich Berufsdaten. Der Hauptfokus liegt dabei auf Berufen, Berufsklassifikationen, Hard und Soft Skills sowie Ausbildung/Qualifikationen. Die Anzahl an erfassten Verknüpfungen und Relationen beträgt mehr als 350 Millionen!

Mit datengetriebenen und qualifiziert-beratenen Taxonomien integriert, beinhaltet JANZZon! ESCO, O*Net, ISCO-08, GB/T 6556-2015, DISCO II und die UK Skills-Taxonomie von Nesta. Gegenwärtig sind 9 Sprachen (Deutsch, Englisch, Französisch, Italienisch, Spanisch, Portugiesisch, Niederländisch, Arabisch und Norwegisch) vollständig in den Kategorien Beruf, Skills, Spezialisierungen, Funktion, Ausbildung abgedeckt und wir arbeiten daran, dasselbe Niveau in insgesamt 50 Sprachen bis 2020 zu erreichen.

Als Rückgrat unserer Beruf- und Skill-Matching-Technologie repräsentiert JANZZon! Wissen auf dem komplexesten Level wo alle Einheiten im semantischen Raum kodiert und vektorisiert worden sind. Daher kann unsere Technologie beim Suchen und Matchen Konzepte und deren semantische Bedeutung wirklich verstehen und somit aussagekräftige Resultate erzielen.

Falls Sie sich nun fragen, wie Ontologien dabei helfen können, Ihre Daten im Bereich von HR und Arbeitsmärkte zu verbessern und wie sie die Realisierung smarter Applikationen unterstützen schreiben Sie an sales@janzz.technology

 

[1] ODSC. 2018. Where Ontologies End and Knowledge Graphs Begin. URL: https://medium.com/predict/where-ontologies-end-and-knowledge-graphs-begin-6fe0cdede1ed [2019.11.20]

[2] Li Jun. 2019. Shen Du Xue Xi: Xin Shi Dai De Lian Jin Shu. URL : https://www.ftchinese.com/story/001084827?page=1&archive [2019.11.20]

[3] Cai Fangfang. 2019. Qin Hua Zi Ran Yu Yan Chu Li Ke Xue Jia Sun Maosong: Shen Du Xue Xi Peng Pi Zhi Hou, Wo Men Hai Neng Zuo Shen Me? URL: https://www.infoq.cn/article/OvhfhpPChTLpsMgrf43N [2019.11.20]