JANZZ本体 – 赋能数据,实现智能应用
在过去的40年中,本体一直存在于人工智能(AI)的研究中。[1] 就像流行趋势总是来来去去一样,本体同样经历了起伏。本体在80年代被引入,并在90年代中期开始流行。在2000年机器学习(ML)出现之后,当时普遍的观点是,将来用计算机执行的任何任务(借助AI和ML)都可以用智能算法来解决。许多公司在这些算法上投入了大量资金,希望在人工智能方向取得新的突破。
随着AI和ML的飞速发展,特别是在卷积神经网络(CNN)出现之后,其核心技术-深度学习(DL)-在参数大小和计算复杂性方面迅猛发展。今天,一些最复杂的模型已达到数十亿参数的规模。 [2]
尽管如此,人们对当前主流的DL提出了担忧。以图像识别中的监督学习为例:用于训练AI模型的图像需要根据目标对象的位置和轮廓手动识别,以使模型能够在比较不同标记结果的数据后,找到图像之间的隐含模式特征。如果我们回想婴儿时代的学习方式,我们人类无需这种指导便可以轻松地识别和分类不同的对象。 [2]
尽管DL方法取得了长足的进步,能够从训练数据中提取知识。但是,这种知识无法被明确解释,因为所谓的“黑匣子”训练无法揭示模型内隐藏的复杂关系。当面对新问题时,当前的DL模型无法将其获得的知识有效地用于解决新挑战。 [2]
关于大数据及其相关的隐私问题同样值得担忧。此外,当前的DL方法基于海量数据,不适用于生成少量数据的行业,例如医学和人力资源中的某些领域。这种情况要求AI系统具有推理和判断的能力,目前只有在特定领域才能成功。 [3]
其实,在某些领域已经存在许多强大的本体,例如金融业业务本体(FIBO)以及用于医疗保健,地理或职业的众多本体。当前学界普遍认为,整合知识和DL是进一步扩大DL有效性的重要思路。因此,本体以及诸如知识图谱或知识表示之类的许多相似研究重新成为人们关注的焦点。
在2008年JANZZ.technology便开始构建其本体-JANZZon!,远远早于科技巨头Google发明并普及 “知识图谱”一词。 JANZZ本体一直由具有不同背景的领域专家构建(例如知识产权法,流体动力学,汽车维修,心脏直视手术或教育和职业系统等领域)。
如今,JANZZon!是职业数据领域中最大的多语言百科知识表示。其数据重点关注于工作,工作分类,软硬件技能,培训/资格等。其存储的节点和关系数超过3.5亿!
由数据驱动和专家咨询分类法集成,JANZZon!涵盖了Nesta的英国技能分类法,ESCO,O * Net,ISCO-08,GB / T 6556-2015,DISCO II等。目前,有9种语言(德语,英语,法语,意大利语,西班牙语,葡萄牙语,荷兰语,阿拉伯语和挪威语)全面涵盖职业,技能,专业,功能,教育等,我们正在努力于2020年实现同一水平的40种语言可供选择。
作为我们工作和技能匹配技术的核心,JANZZon!代表最底层的知识,其中所有实体都已在语义空间中进行了编码和向量化。因此,在搜索和匹配时,我们的技术可以真正理解一个概念及其语义含义,从而保证有意义的结果。
如果您想知道本体可以如何帮助您在人力资源和劳动力市场领域中增强数据能力并实现智能应用,请立即写信至 sales@janzz.technology
[1] ODSC. 2018. Where Ontologies End and Knowledge Graphs Begin. URL: https://medium.com/predict/where-ontologies-end-and-knowledge-graphs-begin-6fe0cdede1ed [2019.11.20]
[2] 李军. 2019. 深度学习: 新时代的炼金术. URL : https://www.ftchinese.com/story/001084827?page=1&archive [2019.11.20]
[3] 蔡芳芳. 2019. 清华自然语言处理科学家孙茂松:深度学习碰壁之后,我们还能做什么? URL: https://www.infoq.cn/article/OvhfhpPChTLpsMgrf43N [2019.11.20]