ESCO:我们期待的是一个本体 — 而得到却是一个令人失望的术语集合

四年的时间转眼即逝。我们在翘首期盼 — 我们迫切希望知道欧盟会宣布什么样的结果。人们都在非常兴奋地期待着它能解决众所周知的分类体系问题。欧盟的职业数据分类体系称为“ESCO”(欧洲技能、能力、资格和职业框架)。截至目前,所有国家都解决了自己的分类问题,例如法国的 ROME、德国的 KLdB 或意大利的 CP。世界上绝大部分的分类体系通常都以国际劳工组织在 1960 年左右制定的国际标准职业分类 (ISCO) 体系为基础,但它们之间却不一定具有可比性 — 它们包含不同的数字、字母以及可以区分分类的不同分类法级别。

janzz_esco_unsatisfied

其他分类体系的首要开发目的是用于统计。因此,可以将具有识别号码的职业组合到类别中,然后再提出统计数据,但这些体系并没有加深对单个职业的理解。类别安排通常过于宽泛、过于笼统。例如,所有医学专家都被归类在一起,并且这个类别只使用一套针对所有专家的技能来描述。这意味着,肿瘤学家的技能描述可能会与胃肠病专家、妇科医生或病理学家完全相同。因此,根据分类法,他们具有完全相同的知识,他们的专业程度只能通过他们的职位来加以识别。在这样不准确的描述中,您肯定无法更好地理解单个职位。

欧盟不希望 ESCO 成为另一个过于模糊的框架,而是要使用 26 种语言来形成对职业、技能、知识和资格的共识,以便雇主、员工和教育机构更好地了解彼此的需求和要求。正如 Juncker 所说,这样能够通过人员的自由流动来弥补不同成员国的技能差距,并最终解决失业问题¹。

自试用版发布以来,现在已经有四年的时间了。所有可能的利益相关方(例如就业办公室、职业顾问、统计人员、科学家)都被要求以 26 种语言来创建这一分类。在经历近四年的测试、扩展、修改、返工之后,现在我坐在电脑前,将“Word”作为一项技能输入到在线数据库中,而数据库却无法识别这个词汇。唯一的替代建议是:WordPress,但这并不真正相关。如果我输入“PowerPoint”,系统会毫无反应,数据库不能识别这个词,它没有被存储²。

好的,让我们来真正的试一下。仅在德国,我使用搜索词汇“PowerPoint”就找到了 13000 多份招聘广告,而在法国和英国,我使用搜索词汇“PowerPoint”找到了近 8000 份招聘广告,但 PowerPoint 在整个欧洲并没有被列为一项技能。在 ESCO 中的 13485 项技能中,没有它的容身之地。员工是否应该认为潜在雇主并没有把 PowerPoint 当成一项重要的工作技能呢?

无可否认,当输入“Microsoft”时,数据库确实可以识别出“使用 Microsoft Office”,但数据库的语义理解也仅此而已。毕竟,“使用文字处理软件”只是被存储为一项与 Microsoft Office 没有任何关系的独立技能,这两种技能都没有将彼此视为同义词。

ESCO 表示,它收录了 2942 个职业。有趣的是,系统识别了“铁路物流协调员”,而且还提供了某些替代拼写方法,但没有包括物流人员。有时,还会发现具有类似问题的职业描述。另外,作为“政党代理人”的替代术语,给出的建议是“公共关系代理人”。这只是误用职位替代词的一个例子而已。

ESCO 现在将使用 26 种语言。具体是不是这样,我要认真看看。没错,职位是以 26 种语言提供的,嗯,技能也是如此。但是,术语解释采用的始终是英语,这意味着职位可以翻译成所有语言,但工作描述不能翻译为各种语言。它采用的始终都是英语。现在,值得怀疑的是,法国雇主能否更好地理解瑞典应聘者的职业 — 如果这个职业不用雇主的母语法语来定义的话。或者说,他是否理解这个分类是否真的与他的空缺相匹配。

而资格只能用一种语言提供:希腊语。只能找到使用这种语言的详细描述。不管怎样,其他成员国的雇主都不会更好地了解他或她的应聘者 — 即使他或她来自希腊。ESCO 本身报告说,成员国必须提供这些资格并不时进行整合。但是,27 个成员国给自己安排的时间都是遥遥无期。

现在,我必须总结的是,我不仅仅是有一点失望。自从我在 ESCO 大会上与其他人一起解释本体的多种可能性以来,我已经等了将近四年。但是他们并没有建立任何本体,建立的只是一种分类法或术语集合。在 ESCO 中囊括了 2942 项职业、13485 项技能和 672 项(希腊语)资格。ESCO 显然投入了大量时间,也可能在这项发展工作中投入了大量资金。但是,这能否实现 Juncker 的目标,还非常值得怀疑。

问题是:我们现在要做什么?满怀希望地再等四年,直到 ESCO 能够满足人力资源和公共就业服务机构的需求?也许,可以去寻找一个替代品?能不能使用包含语义识别的真正本体作为替代品?它能识别出政党员工与公关员工的不同。它知道 MS Word 是与 Microsoft Word 或文字处理相同的技能。而且,它还完全包含许多语言。有谁知道,是否存在这样的解决方案。也许,在线研究可能会在这方面取得成功。例如,在 http://janzz.technology 上。

 

[1] ESCO (2015 年)。ESCO 战略框架。愿景、使命、立场、附加价值和指导原则。Brüssel。

[2] 在本研究中,只使用了 ESCO 在线数据库。

NAV 选择基于 JANZZ 本体的解决方案来对劳动力市场平台进行现代化改造

在一次公开招标中,挪威劳工和福利局 (NAV) 选择瑞士科技公司 JANZZ 为其新的劳动力市场平台提供服务。在激烈的国际竞争中,JANZZ 赢得竞标,并将凭借其在职业和技能相关数据方面的专业知识为 NAV 提供支持。

NAV 即将推出其自助服务平台,以加速求职者的就业。NAV 旨在为所有劳动力市场运营者和参与者提供透明的服务,让所有用户都可以按相同条款使用这些服务。它正在开发一个灵活的工具,使挪威劳动力市场更加透明,并促进所有求职者更快地就业。

新平台将成为挪威劳动力市场信息的来源。收集、增强和分析有关工作与技能的数据和信息将成为未来平台的核心部分。通过将数据和分析纳入其核心战略愿景,NAV 打算创造一个可持续和动态的知识循环,而这将有利于劳动力市场的良好运营。

凭借基于本体的工作匹配技术,JANZZ 将为 NAV 提供构建创新且具有可持续性的新平台的理想工具。作为由职业和技能相关数据组成的 JANZZ 本体,它是包含职位、能力和教育情况的综合语义数据库。它理解简历和职位空缺之间的细微差别,并且可以帮助解释它们。再加上强大的语义工作匹配引擎,它将帮助 NAV 提供更相关和更透明的求职结果和建议,并获得对劳动力市场更准确的见解。

关于 NAV

挪威劳工和福利局 (NAV) 拥有约 19 000 名雇员(约 14 000 名国家级雇员和 5000 名市政级雇员)。
NAV 成立于 2006 年 7 月 1 日。地方当局和中央政府合作,通过分布在挪威所有 19 个郡的 456 个 NAV 办事处的市政当局为用户寻求良好的社会福利和就业服务解决方案。

NAV 负责挪威国家预算的三分之一,管理各种福利和就业计划(例如失业福利、工作评估津贴、疾病福利、儿童福利、现金换医疗福利和养老金)。

与劳动力市场相关的主要目标:

  • 让更多的人主动参加工作,减少依赖福利的人员
  • 运转良好的劳动力市场,高度的劳动力市场参与
  • 打造包容性社会,确保每个人都有机会参与
  • 全面和高效的劳动和福利管理

与劳动力市场相关的次要目标(工作目标):

  • 包容性工作场所
  • 企业和机构可以通过合格员工填补职位空缺
  • 让残障人士有机会积极地参与工作生活
  • 根据用户需求和情况提供量身定制的服务和信息

有关 NAV 的更多信息,请访问 www.nav.no

关于 JANZZ.technology

JANZZ.technology 是一家技术和咨询公司,致力于语义技能和工作匹配,以及复杂职业和技能数据的利用领域。它为就业门户网站、公共就业服务机构以及公司自有招聘网站的大数据建模、分析和使用提供标准和白标产品以及 SaaS 解决方案。它使用最新的语义技术、跨不同语言将资格要求与软技能和硬技能进行准确匹配,从而大大缓解就业市场中与不对称搜索机制相关的匹配问题。

有关 JANZZ.technology 的更多信息,请访问 www.janzz.technology

在大数据中迷失方向?
统治数据宇宙的误导思想

lost_in_big_data

“…在那个帝国,制图技艺是如此地精湛绝伦,省级地图绘制得如同一个城市一般大,而帝国地图绘制得如同一个省一般大。在那个时候,人们对这些不合常理的地图仍不满意,绘图师 Guilds 绘制了一幅面积与实际国土一样大的地图,其中的每个点都与实际国土无异。[…]”

《论科学的精确性》
豪尔赫·路易斯·博尔赫斯

在博尔赫斯的故事所设想的帝国中,人们沉迷于创造完美表示其国土的想法。这个虚构的帝国已经完全沉浸在创建与其国土完全吻合的地图中。今天,我不禁想到,我们自己也处在一个非常相似的环境中:数据正在深刻地改变着我们的世界,也改变着我们看待世界的方式。我们发现自己处于一场汹涌澎湃的数据革命之中。数据的影响无处不在;我们努力使用大数据来改变整个行业 — 市场营销、销售、天气预报、医疗诊断、食品包装、文件存储、软件使用、通信等等。事实上,与博尔赫斯的虚构帝国非常相似,我们盲目地认为,收集和分析的数据越多,我们获得的有关世界和人类生活的知识就越多。我们简直就是愚蠢的数据疯子。

现在盛行的观点是,大数据几乎可以在生活各个方面提供可操作的见解。Philip Evans 和 Patrick Forth 认为:“信息通过基本的人工智能新方法得到理解和应用,通过使用大量嘈杂数据集的算法形成见解。由于更大的数据集可以产生更好的见解,因此大即是美”(摘自 bcg.perspectives 的联合文章)。与这些观点相符的现象是,我们对数据的渴求在不断增加,我们的数字生态系统正在加速:传感器、互连设备、社交媒体和越来越多的云,不断产生供我们收集和分析的新数据。国际数据公司 (IDC) 的研究表明,数字宇宙每两年将翻一番。从 2005 年到 2020 年,数据量将增长 300 倍,达到 40 泽字节数据(一个泽字节是数字后面再跟 21 个零)。在这个数据呈指数级增长的世界里,积累数据的冲动势不可挡。就像博尔赫斯虚构的帝国一样,我们希望使用外部极限是 1:1 的比例尺,对我们的世界进行完整的数字表示。

今天,IBM 或 LinkedIn 这样的公司已经在向这个极限迈进。IBM 正在对其称为 Watson 的认知计算系统进行培训,以便能够回答几乎任何问题。为此,IBM Watson 正在收集数量空前的数据,以形成庞大的信息库。该公司刚刚以 26 亿美元现金收购了 Truven Health Analytics,将美国数千家医院、雇主和州政府的健康数据库融入其健康部门的主数据库。这是 IBM Watson 在 10 个月内对健康数据公司的第四次重大收购,显示了患者、诊断、治疗和医院的数字信息对这个计算机巨头人工智能系统的重要性。LinkedIn 的愿景同样非常宏大:他们正在创建一个经济图表,其规模堪称有关全球经济的数字地图。它打算在收录全球 30 亿劳动力成员的档案。它打算以数字化方式来表示每家公司、他们的产品和服务、他们提供的经济机会以及获得这些机会所需的技能。它计划以数字化形式来呈现全球所有高等教育机构。然而,这两家公司的工作只是冰山一角。他们对于在各自领域建立完整数字化表现形式的追求,象征着当今人们实现信息无处不在的普遍渴望。

像 IBM Watson 和 LinkedIn 这样的公司愿景,让人们联想到博尔赫斯所设想的世界。大数据的力量正在聚合并重现那个虚构帝国的制图追求。历史似乎正在重演。我们这个世界的数字化表现形式正在快速扩张并达到外部极限,表现形式和现实情况开始重合。世界和我们为其描绘的图片正在重合。突然,我们发现自己处于一个与博尔赫斯帝国非常相似的世界。

这是多么愚蠢的事情 — 博尔赫斯的故事仍在继续,这让我们对这种巨大表现形式的目的提出质疑。无论是制图还是数字,比例尺为 1:1 的地图都可能不如想象中的那样具有价值。

“[…] 后来的几代人,不太喜欢制图研究,因为他们看到那张巨大的地图毫无用处,他们将其弃之不用。在西方的沙漠中,这个地图的碎片直到今天仍不时可见,有的已成为动物和乞丐的栖身之所;在所有的土地上,再也不存在地理规范的遗迹。”

在博尔赫斯虚构的世界中,下一代遗弃了他们祖先的地图,因为他们没有像祖先那样沉迷其中,他们认识到 1:1 的地图是无用的。他们把它分解,剩下的只是祖先地图上的“破烂废墟”。他们认识到比例尺为 1:1 的地图实际上毫无意义,而我们无限拓展数字宇宙的做法最终也将迎来相同的结局。伦敦大学大数据研究所执行主任 Patrick Wolfe 教授警告说,“我们产生数据的速度正快速超过我们分析它的能力”。目前只有大约 0.5% 的数据被分析,Wolfe 表示,随着收集的数据越来更多,这个比例还正在缩小。所以,我们也开始意识到,我们所掌握的大量数据并没有实际意义。我们并没有通过数据获得对这个世界的更多了解,而是通过其庞大的规模创造出一个处于被湮没边缘的实体。

为了防止我们不断积累的数字集合遭受与博尔赫斯地图一样的命运 — 被我们的后代丢进废墟 — 我们必须从中获得具有可操作性的情报。因此,如何真正了解收集大量数据并从中获得相关知识的全部复杂性,将成为今天的最终竞争优势,在未来更是如此。

在将大数据转化为智能或智慧数据的过程中,许多人已经提出了这样的要求,但尚未出现有关如何实现这一转变的清晰解决方案。今天,应用数学、自然语言处理和机器学习同样在寻求着某种平衡,并取代可能产生的其他所有工具。人们的想法是,只要有了足够的数据,这些数据就能说明问题。再次想想 Evans 和 Forth 所说的“大即是美”。这个想法代表了硅谷文化,也延伸到了全世界的许多企业。

在当前的发现精神中,本体分类法语义等其他方法被完全忽视。如果说应用数学、机器学习和预测分析代表规模的话,那么本体、分类法和语义代表的就是含义理解。虽然后者看起来与前者的规模相比可能并不重要,但它们在确立公司竞争优势方面的作用将不容小觑。在过去几年数字规模呈指数级增长之后,我们已经达到了一定的复杂程度,需要深入了解我们已经获得的数据。这种了解是不能通过收集更多数据或实施算法来实现的。具有讽刺意味的是,这个远离“大即是美”的方向性转变却可以真正发挥大数据的全部作用。