Ontología y taxonomía: no son sinónimos. Comparemos para establecer sus diferencias

La palabra “ontología” puede que resulte abstracta para muchas personas. Tiene su origen en el sueño de Tim Berners-Lee de inventar la World Wide Web. Este sueño incluía que la Web fuera capaz de definir una llamada “web semántica”, mediante el análisis de todos los datos de la red, incluyendo contenido, enlaces y transacciones entre ordenadores y personas. En la web semántica, el Resource Description Framework (RDF) y el Web Ontology Language (OWL) se han establecido como formatos estándar para compartir e integrar datos y conocimiento, este último en forma de ricos esquemas conceptuales llamados ontologías [1.] En este artículo, emplearemos la palabra ontología como definición de la metodología de trabajo, sin embargo, vale la pena mencionar que en el mundo actual de las Tecnologías de la Información y Comunicación, el término «gráfico del conocimiento» es ampliamente usado como sinónimo de ontología.

Por qué es importante una ontología

Hablando de Inteligencia Artificial (IA), los términos «Big Data«, «aprendizaje automático» y «aprendizaje profundo» están reemplazando lentamente el uso del término «IA». Sin embargo, para citar a Adrian Bowles: «no hay inteligencia artificial sin representación del conocimiento». En otras palabras, la IA requiere elementos de ingeniería del conocimiento, arquitectura de la información y una cantidad significativa de trabajo humano para realizar su «trabajo neuronal mágico». Alexander Wissner-Gross afirma que, quizás lo más importante sea reconocer que son los conjuntos de datos inteligente y no los algoritmos, los que probablemente sean el factor clave limitante en el desarrollo de la inteligencia artificial a nivel humano.

             “No hay inteligencia artificial sin representación del conocimiento.”

Una ontología es una representación estructurada y formal del conocimiento relacionado con una determinada área. Esto es necesario porque, a diferencia de los humanos, la IA no puede basarse directamente en las nociones humanas preestablecidas sobre el uso correcto de un término. Lo que una ontología puede hacer, sin embargo, es «aprender» sobre el significado semántico de un término a través de los enlaces entre los conceptos de su sistema. Ya existen poderosas ontologías en campos específicos, como por ejemplo la Ontología de la Industria Empresarial Financiera (FIBO por sus siglas en inglés), así como numerosas ontologías para el área de la salud, la geografía o el sector del empleo.

Otra parte importante de la IA es el razonamiento semántico. Además de identificar transacciones potencialmente fraudulentas, determinar la intención de los usuarios basándose en el historial de su navegador y hacer recomendaciones de productos, la IA también puede hacer lo siguiente: ejecutar tareas que requieren un razonamiento explícito, basado en conocimientos generales y específicos de la materia, como entender artículos de noticias, preparar alimentos o comprar un automóvil. Este tipo de tareas requieren información que no forma parte de los datos de entrada y que debe combinarse dinámicamente con el conocimiento. Este tipo de razonamiento de la computadora, solo se puede lograr con ontologías y la forma en la cual se estructura el conocimiento que incluyen. [2]

Taxonomía y ontología son fundamentalmente diferentes

La ontología a menudo se confunde con la taxonomía.  Apartando el hecho de que ambos términos pertenecen a los campos de la IA, la web semántica y la ingeniería de sistemas, no hay mucho más que los defina como sinónimos. Las clasificaciones taxonómicas como O*NET (Occupational Information Network) y ESCO (European Skills/Competences, qualifications and Occupations), simplemente no se pueden comparar con las ontologías.  Las primeras proporcionan un enfoque mucho más sencillo cuyo fin es clasificar conceptos, ya que tienen una estructura jerárquica y utilizan únicamente las relaciones padre-hijo entre términos, sin ningún vínculo adicional más sofisticado. Las ontologías, por otro lado, son una forma mucho más compleja de categorización. Hablando metafóricamente, una taxonomía equivaldría a un árbol, mientras que una ontología sería a un bosque.

He aquí un ejemplo: El término “golf” podría aparecer en varias taxonomías.  Puede estar situado bajo un árbol de “Actividades humanas” (actividades humanas -> actividades de ocio -> deportes -> golf).  También puede encontrarse en una taxonomía relativa a la ropa (ropa -> ropa casual/activa -> ropa deportiva -> ropa y accesorios de golf). Podría incluso aparecer en algo muy diferente, por ejemplo, una taxonomía del automóvil (automóvil -> Alemania -> VW -> Golf). En una ontología, cada una de estas taxonomías puede ser considerada como un árbol, cuyas ramas conectan con el nodo “golf” de otras ramas, de otros árboles. [3]

 

 

Explicado de otra manera, las taxonomías representan una colección de tópicos, que tienen una relación cuyo propósito es definir “esto es…”, mientras que las ontologías desarrollan conexiones mucho más complejas, permitiendo relaciones que reconozcan que “esto” “tiene…” y “utiliza…”. [4] Por lo tanto, si regresamos al ejemplo de clasificación anterior, las taxonomías carecen de la capacidad de comparar conceptos hijos.

En la clasificación internacional ESCO, casi todos los médicos especialistas están agrupados bajo el título: Profesionales médicos especializados. Si analizamos este caso, se hace evidente que un/-a enfermero/-a especializado/-a en anestesia y un médico/-a anestesista, tienen conocimientos y habilidades en común, pero no pueden aplicar a un mismo puesto de trabajo. Adicionalmente, los conjuntos de habilidades especializadas se agrupan simplemente en listas generales, sin ningún vínculo con las correspondientes ocupaciones especializadas. ¿Por qué ocurre esto? Una de las razones es que las clasificaciones se utilizan principalmente con fines estadísticos. Desde este punto de vista, no hay necesidad de clasificar a todos los médicos especialistas de acuerdo con sus habilidades y formación específicas. Entonces, de acuerdo con las taxonomías, las especializaciones sólo pueden ser reconocidas por el título del puesto de trabajo y es necesario recurrir a otras fuentes para entender mejor su contenido específico.

 

 

La construcción de una ontología que contenga: ocupaciones, capacidades, competencias y formación, hace posible el reconocimiento automático de diferencias y similitudes entre títulos de puestos de trabajo. Por ejemplo: Pediatras y neonatólogos tienen trabajos parecidos, ya que ambos se dedican al cuidado de la salud de los recién nacidos. Con el enfoque de modelado ontológico, es posible determinar que un pediatra tiene un porcentaje muy alto de capacidades similares a las de un neonatólogo. Sin embargo, los pediatras sólo pueden hacerse cargo del trabajo del neonatólogo después de recibir formación adicional. Toda esta información puede ser representada en una ontología, a través de las interrelaciones entre conceptos. Estas relaciones exceden ampliamente la capacidad de una simple taxonomía.

 

 

Las ontologías permiten emparejar conjuntos de datos

Cuando se trata de emparejar (matching), digamos, por ejemplo, curricula vitae con vacantes de trabajo, no hay mejor sistema para ello que el uso de una ontología. Con demasiada frecuencia, se utilizan sencillas formas de emparejamiento, basadas en palabras clave, o métodos difusos de aprendizaje automático, lo que significa que muchas similitudes no se detectan, por lo tanto, no se obtienen resultados de correspondencia. Elementos que conducen a esta falta de resultados son, por ejemplo, variaciones de las palabras claves introducidas, sinónimos y frases alternativas. Para conseguir una correspondencia eficiente, es importante comparar la semántica (el significado subyacente) de dos elementos, en lugar de la redacción del texto. Aquí es donde entran en juego las ontologías. Las mismas se basan en un modelo semántico, capaz de detectar los significados subyacentes y las similitudes entre CV y descripciones de puestos de trabajo.

La técnica de emparejamiento ontológico es una técnica fundamental que tiene aplicación en muchas áreas, como la combinación de ontologías. En dominios con reglas muy complejas, e interacciones complejas entre reglas, no hay sustituto para las ontologías. Esto se muestra, por ejemplo, cuando se considera la integración de dominios muy diferentes entre sí. Supongamos que hay dos ontologías separadas, una ontología meteorológica y una ontología geográfica. Crear una tercera ontología que integre y aproveche en contenido de las dos, es una propuesta manejable, que proporcionaría valiosa información para evaluar riesgos de navegación o para el ámbito de los seguros.[5]

El verdadero valor de las ontologías

El sistema semántico se basa en representaciones explícitas, y comprensibles para el ser humano, de conceptos, relaciones y reglas para desarrollar el conocimiento de una determinada área. Es imposible confiar únicamente en los programadores para construir un sistema de este tipo, basado en el aprendizaje automático, ya que carecen de los conocimientos necesarios para definir las relaciones entre los conceptos de cada dominio específico. Por lo tanto, el conocimiento de un área específica debe provenir de expertos en esa materia y es necesaria la integración de conocimiento experto en distintos campos (Ej.: derecho de propiedad intelectual, dinámica de fluidos, reparación de automóviles, cirugía a corazón abierto, o sistemas educativos y vocacionales). Este proceso es crucial para crear una representación integral del conocimiento.

Para la ontología multilingüe de JANZZ, las capacidades son un punto clave. En muchos casos, la traducción literal de un concepto a muchos idiomas no es posible, sin embargo, gracias que Suiza es un país pequeño y multicultural, todos nuestros curadores de ontología dominan fluidamente al menos dos idiomas, y algunos hasta más de cuatro (incluyendo chino y árabe). Esto nos proporciona una gran ventaja, la cual nos permite garantizar la calidad y consistencia de los contenidos en diferentes idiomas.

Hace aproximadamente una década, JANZZ comenzó a construir su ontología sobre varias taxonomías de ocupación, a saber: CIUO-08, ESCO y clasificaciones específicas muchos países. A lo largo de los años, JANZZ ha incluido en su ontología miles de nuevas profesiones y funciones (Ej.: Investigador/-a de mercado, minero/-a de datos, experto/-a en generación milenial, gerente/-a de medios sociales, community manager, etc.) los cuales no existían previamente en ninguna de las taxonomías conocidas. Además de nuevos títulos de puestos de trabajo, la ontología se actualiza constantemente con la inclusión de términos nuevos en todos los campos: habilidades, educación, experiencia y especializaciones. El hecho de que nuestra ontología es capaz de reconocer semejanzas y ambigüedades entre puestos de trabajo y demás áreas relevantes en el ámbito de la colocación laboral, la convierte en la herramienta perfecta para empresas de RRHH y servicios públicos de empleo. Hoy en día, la ontología de JANZZ es, con diferencia, la ontología de datos de colocación laboral más grande, compleja y completa del mundo.

Por suerte algunos gobiernos y empresas han escogido el camino correcto y actualmente se benefician ampliamente de nuestra tecnología de punta. Si desea más información sobre la ontología de JANZZ, escríbanos por favor a sales@janzz.technology. Le agradecemos de antemano su interés y estaremos encantados de responder a todas sus preguntas.

[1] Ian Horrocks. 2008. Ontologies and the Semantic Web. URL: http://www.cs.ox.ac.uk/ian.horrocks/Publications/download/2008/Horr08a.pdf [2019.02.01 ]

[2] Larry Lefkowitz. 2018. Semantic Reasoning: The (Almost) Forgotten Half of AI. URL: https://aibusiness.com/semantic-reasoning-ai/ [2019.02.01]

[3] New Idea Engineering. 2018. What’s the difference between Taxonomies and Ontologies? URL: http://www.ideaeng.com/taxonomies-ontologies-0602 [2019.02.01]

[4] Daniel Tunkelang. 2017. Taxonomies and Ontologies. URL: https://queryunderstanding.com/taxonomies-and-ontologies-8e4812a79cb2 [2019.02.01]

[5] Nathan Winant. 2014. What are the advantages of semantic reasoning over machine learning? URL: https://www.quora.com/What-are-the-advantages-of-semantic-reasoning-over-machine-learning [2019.02.01 ]
[/av_textblock]