ESCO : Nous nous attendions à une ontologie – nous avons obtenu une décevante collection de termes

2017-09-29/dans Base de savoirs, News /par JANZZ.technology

Près de quatre ans ont passé. En attente depuis de temps, nous sommes impatients de découvrir ce que l’UE avait annoncé dans son intégralité. Impatients depuis , de savoir si, et de quelle manière, les problèmes bien connus des systèmes de classification ont été résolus.

La classification de l’Union européenne pour les données professionnelles se nomme « ESCO » (European Skills, Competences, Qualifications and Occupations). Jusqu’ à présent, tous les pays ont résolu seuls des classifications telles que ROME en France ou KLdB en Allemagne ou CP en Italie. La plupart d’entre elles sont fondées sur la mère de toutes les classifications, la Classification internationale type des professions (CITP) de l’Organisation internationale du Travail vers 1960, mais elles ne sont pas nécessairement comparables – des chiffres, des lettres et des niveaux de taxonomie différents peuvent différencier les classifications.

D’autres systèmes de classification ont d’abord et avant tout été élaborés pour des raisons de statistiques Il fut donc possible de regrouper les professions par des numéros d’identification par groupes et de recueillir ainsi des chiffres, mais ces systèmes n’avaient pas inclus la compréhension des professions individuelles. Les formations de groupes étaient souvent trop générales, trop génériques. Par exemple, tous les médecins spécialistes sont regroupés en un seul groupe, et ce groupe est décrit avec un seul ensemble de compétences pour tous les médecins spécialistes. Ce qui signifie qu’un oncologue y est décrit avec exactement les mêmes compétences qu’un gastro-entérologue, un gynécologue ou un pathologiste. Selon les taxonomies, ils ont donc exactement les mêmes connaissances, leurs spécialisations ne peuvent être reconnues que par leur titre. Avec de telles descriptions imprécises, l’incompréhension des titres d’emplois individuels est assurée.

L’UE ne voulait pas faire de l’ESCO un environnement supplémentaire beaucoup trop vague, mais visait plutôt à créer une compréhension commune des professions, des compétences, des connaissances et des qualifications en 26 langues afin que les employeurs, les salariés et les établissements d’enseignement comprennent mieux leurs besoins et leurs exigences mutuels. Grâce à la liberté de circulation les lacunes en matière de qualifications ainsi que le chômage dans divers États membres pourraient être comblés, affirme Juncker [1].

Aujourd’hui, près de quatre ans se sont écoulés depuis la version d’essai. Toutes les parties prenantes possibles devraient à présent être impliquées, telles que les agences pour l’emploi, les conseillers de carrière, les statisticiens, les scientifiques… pour créer cette classification en 26 langues. Pendant près de quatre ans, les systèmes ont été testés, prolongés, modifiés, révisés… Et maintenant, je me retrouve assis devant mon ordinateur, tape « Word » en tant que compétence requise – et…la base de données ne reconnaît pas le terme. L’unique suggestion alternative proposée : WordPress – une apparentée à chercher dans les méandres des terminologies. Nouvel essai en tapant « PowerPoint » avec comme unique résultat : erreur, la base de données ne reconnaît pas le terme, il n’est pas stocké.

D’accord, essayons donc sur Indeed. Rien qu’en Allemagne, je trouve déjà plus de 13 000 offres d’emploi contenant le terme de recherche « PowerPoint », en France et au Royaume-Uni environ 8 000, mais PowerPoint n’est pas classé dans la catégorie des compétences en Europe. Et aucune place au sein des 13 485 compétences réunies dans l’ESCO. Ainsi, un employé devrait-il mieux comprendre un employeur potentiel dans la mesure où PowerPoint ne serait pas une connaissance importante pour l’emploi ?

Certes, la base de données reconnaît bien « Utiliser Microsoft Office » lorsque « Microsoft » est saisi, mais la compréhension sémantique de la base de données ne va pas plus loin. Après tout, « Utiliser des programmes de traitement de texte » est même stocké en tant que compétence autonome sans connexion avec Microsoft Office, aucune des deux compétences ne se propose comme synonyme.

L’ESCO affirme qu’elle reconnaît 2 942 professions. Il est intéressant de noter que le système reconnaît déjà un « coordinateur logistique pour le transport ferroviaire »[2] et propose également certaines orthographes alternatives, mais pas le prestataire logistique². On y découvre souvent ici et là des professions souffrant de maladies similaires. De plus, comme terme alternatif pour un/une « employé-e de parti », « l’employé-e RP » ² est également suggéré. Ceci, à titre d’exemple d’une alternative de titre d’emploi erronée.

L’ESCO fonctionne désormais en 26 langues. Et je découvre que oui et non. Oui, les titres des postes sont disponibles en 26 langues, oui, les connaissances le sont également. Cependant, l’explication d’un terme ne peut être trouvée qu’en anglais, ce qui signifie qu’un titre peut être traduit dans toutes les langues, mais pas la description du poste. Il reste toujours rédigé en anglais. On peut aujourd’hui se demander si un employeur français comprend mieux la profession de son candidat suédois sans la définir en français dans sa propre langue. Ou s’il comprend si la classification correspond vraiment à son poste vacant.

Et puis, je note le fait que les qualifications sont disponibles uniquement dans une seule langue : En grec. Les descriptions détaillées aussi ne sont disponibles que dans cette langue. En tout état de cause, un employeur d’un autre État membre ne comprend pas mieux son candidat, même s’il vient de Grèce. L’ESCO elle-même signale que les qualifications doivent être fournies par les États membres et qu’elles sont intégrées temporairement. On peut donc constater que 27 États membres se sont laissés beaucoup de temps.

En résumé, j’avoue que je suis plus que déçu. Voilà presque quatre ans que j’attends depuis que j’ai expliqué les multiples possibilités des ontologies aux autres participants au congrès de l’ESCO. Toutefois pas une seule trace de quelconque ontologie, mais uniquement une taxonomie ou un ensemble de termes. 2 942 professions,
13 485 compétences et 672 qualifications (grecques) ont été intégrées et classées dans l’ESCO. ESCO aura apparemment investi beaucoup de temps et très certainement beaucoup d’argent dans ce développement. Mais la question de savoir si ESCO est véritablement la percée vers l’objectif de Juncker reste fondamentalement discutable.

Et la question qui se pose aujourd’hui : Qu’est-ce qu’on fait maintenant ? Espérer et attendre quatre ans de plus avant que l’ESCO puisse répondre aux besoins des RH et des services publics de l’emploi ? Ou peut-être préférer chercher une alternative ? Que diriez-vous d’une alternative qui représente une véritable ontologie dotée d’une reconnaissance sémantique simultanée ? Elle reconnaît qu’un employé d’un parti ne fait pas la même chose qu’un employé des relations publiques. Elle sait que MS Word est la même compétence que Microsoft Word ou le traitement de texte. Et qui intègre de nombreuses langues dans leur intégralité. Qui sait, peut-être qu’une telle chose existe déjà. Peut-être qu’une recherche en ligne pourrait être couronnée de succès par la suite. Par exemple sur JANZZ.technology.

[1] ESCO (2015). ESCO strategic framework. Vision, mission, position, added value and guiding principles. Bruxelles.

[2] Seule la base de données en ligne de l’ESCO a été utilisée pour cette recherche.

La NAV choisit la technologie ontologique de JANZZ pour moderniser sa plate-forme du marché du travail.

2017-07-11/dans News, Presse /par JANZZ.technology

L’agence norvégienne du travail et de la protection sociale (NAV) a choisi l’entreprise technologique suisse JANZZ dans le cadre d’un appel d’offres public pour la mise à disposition de composantes dans sa nouvelle plate-forme du marché du travail. JANZZ a gagné contre la concurrence internationale dans le processus d’appel d’offres et soutiendra la NAV de son expertise dans les données professionnelles et de compétences.

Dans le cadre de son programme visant à améliorer la transition des demandeurs d’emploi vers l’emploi, la NAV réinvente sa plateforme d’emploi libre-service. NAV vise à fournir un service transparent à toutes les parties prenantes du marché du travail et pouvant être utilisé par tous et sous les mêmes conditions. Cette mesure vise à rendre le marché du travail norvégien encore plus transparent et à permettre à tous les demandeurs d’emploi de réintégrer plus rapidement le marché du travail norvégien.

En outre, la nouvelle plate-forme du marché du travail devra également constituer une source de connaissances et de savoirs sur le marché du travail norvégien. La collecte, l’enrichissement et l’analyse de données et d’informations sur les métiers et les compétences sont au cœur de la vision stratégique de la NAV et feront partie intégrante de la future plate-forme. L’objectif des analyses de données est de créer un système de connaissances, aptitudes et des savoirs pérenne et dynamique qui profite au marché du travail.

Avec sa technologie d’adéquation basée sur l’ontologie, JANZZ offre à la NAV la base idéale pour construire une nouvelle plate-forme innovante et pérenne. L’ontologie des métiers et des compétences professionnelles de JANZZ est une base de données sémantique complète de titres d’emploi, de compétences/aptitudes et de formations. Elle sait les infimes nuances des CV et des offres d’emploi et est capable de les interpréter individuellement entre elles. En combinaison avec le moteur d’adéquation sémantique, elle permettra à la NAV de fournir des résultats de recherche et des propositions d’emploi nettement plus pertinents et transparents et d’obtenir des informations plus précises sur le marché du travail.

La NAV en bref

L’agence norvégienne du travail et de la protection sociale (NAV) emploie environ 19 000 personnes (environ 14 000 employés du secteur public et 5 000 employés municipaux).

La NAV a été fondée le 1er juillet 2006. Les municipalités et le gouvernement coopèrent pour offrir de bonnes solutions dans le secteur des services sociaux et des services de l’emploi par le biais de 456 agences dans les 19 provinces administratives de Norvège.

La NAV est responsable d’un tiers du budget national norvégien. L’Office gère divers programmes de prévoyance et de travail (indemnité chômage, assurance-invalidité, maladie, allocations familiales, allocations aux proches aidants de la famille, allocations familiales et retraites).

Principaux objectifs quant au marché du travail:

Davantage de personnes actives et en emploi, moins de bénéficiaires de prestations sociales
Un marché du travail qui fonctionne bien avec un taux d’activité élevé
Une société inclusive qui assure à tous et toutes la possibilité de participation
Des services sociaux et des services de recrutement professionnels complets et efficients

Objectifs secondaires liés au marché du travail:

Postes de travail inclusifs
Les entreprises et les agences peuvent combler les postes de travail vacants avec des employés qualifiés.
Les personnes handicapées peuvent participer activement à la vie professionnelle
Services et informations adaptés aux besoins et à la situation des usagers

Davantage d’informations sur www.nav.no

JANZZ.technology en bref

JANZZ.technology est une société de technologie et de conseil active dans le domaine des compétences sémantiques et de l’adéquation des emplois, ainsi que dans l’utilisation des données professionnelles et des compétences professionnelles complexes. Elle propose des produits standard, des produits en marque blanche et des solutions SaaS pour la modélisation, l’analyse et l’utilisation de Big Data sur les portails d’emploi, les plateformes du marché du travail gouvernementales et les sites de carrières propres aux entreprises individuelles. En utilisant les technologies sémantiques les plus récentes, une adéquation précise et multilingue des qualifications, des aptitudes et des compétences est rendue possible. Ce qui permet de réduire considérablement les problèmes de mise en adéquation des postes à pourvoir avec les candidats idéaux sur les marchés du travail.

Pour davantage d’informations, veuillez consulter le site www.janzz.technology

Google lance son moteur de recherche d’emploi par ontologie. Et alors ?

2017-06-23/dans News, Presse /par JANZZ.technology

Cette semaine, la recherche d’emploi en ligne a pris une ampleur significative, avec des implications de grande envergure. Comme l’annonçait sa dernière initiative « Google for Jobs », Google a lancé un nouvel outil de recherche d’emploi disponible sur sa page de résultats qui permet à l’utilisateur de naviguer virtuellement sur tous les principaux sites d’offres. Cette nouvelle initiative de Google pourrait bien révolutionner le marché de l’emploi en ligne et son modèle de données sous-jacent, une ontologie des emplois, pourrait modifier la nature d’une fonction et les recherches d’un candidat. Nous ne devrions pas en être surpris puisque nous avons travaillé sur les ontologies du travail basée sur les fonctions professionnelles au cours des 8 dernières années.

Les avancées de Google en matière de recherche d’emploi menacent de nombreux acteurs existants. D’une part parce que davantage d’utilisateurs seront enclins à effectuer leurs recherches d’emploi sur son propre site, mais également parce que la qualité des résultats excédera d’autres services, grâce à la conception de son modèle de recherche basé sur l’ontologie. Les autres sites d’emploi en ligne devront examiner attentivement les alternatives qui leur permettront de contrer cette évolution de Google. Certains pourront établir un partenariat avec Google. D’autres devront chercher une solution ailleurs. Le cas échéant, nous sommes à même de proposer une ontologie nettement plus exhaustive portant autant sur les fonctions que sur les compétences.

Nombreux sont les utilisateurs qui commencent déjà leurs recherches sur Google. Néanmoins, cette nouvelle fonctionnalité leur permettra désormais d’envisager Google sous un angle différent. Avant, les résultats de recherches d’emploi sur Google, par exemple « retail jobs » (emploi dans la vente) affichaient une liste de liens vers des sites Web tels que Indeed et ZipRecruiter. L’utilisateur cliquait alors sur les premiers liens pour poursuivre sa recherche sur le site de son choix. Cependant, la nouvelle fonctionnalité de Google augmentera de manière significative le trafic en termes de recherches sur son propre site puisqu’elle affichera simplement les offres dans un champ se trouvant au-dessus des résultats habituels. Les informations proviendront de sites de recherche d’emploi spécialisés, notamment Glassdoor et LinkedIn, et en droite ligne des sections carrière des sites Web de nombreuses autres sociétés. Les demandeurs d’emploi cliqueront alors sur la nouvelle liste et Google affichera davantage d’informations quant au poste à pourvoir. Un bouton « Lire davantage » les conduira directement vers le site ou l’appli mobile contenant les offres d’emploi originales publiées.

Une infortune pour les sites d’offres d’emploi
Si l’initiative de Google repose sur un partenariat initial établi avec les principaux ténors du marché de l’emploi, notamment CareerBuilder, Monster, LinkedIn et Glassdoor, elle génère également un grand vent d’incertitude sur les modèles commerciaux de nombreux acteurs du monde du recrutement. Indeed figure parmi les premiers fournisseurs d’offres d’emploi directement touchés. Chris Russell, consultant en technologie et sites de recrutement au service de RecTech Media, a déclaré à SHRM que « c’est comme ça ! Indeed ne peut plus se targuer d’être le » Google de l’emploi « . » D’autres experts en technologie et recrutement vont encore plus loin et affirment qu’« il est possible que dans 10 ans, Indeed devienne une réflexion après coup, mais elle se voile la face si elle pense qu’elle n’est pas en plein DEFCON 1 (SHRM). Le trafic SEO d’Indeed connaîtra certainement une baisse à mesure que Google s’emparera des meilleurs sites pour les résultats de recherche, un secteur en ligne convoité, occupé actuellement par Indeed. En outre, les entreprises pourraient bien être tentées de publier moins de postes à pourvoir sur les sites de recherche d’emploi, souvent payants, si Google venait à puiser directement dans la section carrière de leur site Internet.

Mais ceci n’est qu’un bref résumé décrivant comment la nouvelle initiative de Google peut affecter le statu quo de la recherche d’emploi en ligne. Bien d’autres facteurs doivent également être pris en considération et Google doit bien évidemment respecter certaines obligations à l’égard de nombreux autres acteurs lui garantissant ses autres sources de revenus, en particulier son département publicitaire – des relations que Google ne souhaite certainement pas mettre à mal. Quoi qu’il en soit, le bouleversement majeur pourrait tenir au modèle de données sous-jacent et à l’approche adoptés par Google pour concevoir sa solution: l’ontologie professionnelle ou basée sur l’emploi. Les ontologies ne constituent pas un phénomène neuf, mais jamais elles ne furent appliquées à grande échelle. L’initiative de Google place l’ontologie des emplois au cœur de ses préoccupations, ce qui pourrait bien modifier la manière dont les entreprises et les fournisseurs technologiques abordent le problème inhérent de la conformité maximale entre les candidats et les postes à pourvoir.

La correspondance entre les candidats et les offres d’emploi
Le problème le plus délicat pour une entreprise reste de trouver le candidat adéquat pour un poste spécifique. Les raisons ne manquent pas. Tout d’abord, les nombreux critères qui déterminent si une position correspond à un candidat, notamment la personnalité et le style de vie, ne sont pas intégrés dans les descriptions de fonction. Puis, nombre de descriptions de fonction sont limitées, dépassées et souvent mal rédigées. Enfin, les employeurs ont leur propre dialectique pour décrire une même fonction. Pour un poste proposé, des centaines de titres existent, ce qui rend la recherche d’emploi ou de candidats souvent inexacte et trompeuse. D’où une certaine inadéquation sur le marché de l’emploi : Les employeurs prétendent avoir des difficultés à pourvoir leurs postes vacants. De même que les candidats potentiels ne sont pas toujours conscients qu’un poste est disponible près de chez eux puisque les moteurs de recherche ne parviennent pas à détecter les fonctions réellement dignes d’intérêt.

Entrez l’ontologie des emplois.
C’est ici que l’ontologie des emplois entre en scène. Elle fonctionne telle une pierre de Rosette entre le chercheur d’emploi et les employeurs : elle regroupe les titres de fonctions similaires, les compétences, l’éducation et ainsi de suite, et permet de comprendre les infimes nuances entre les CV et les postes vacants. Une ontologie intelligente regroupe des titres de fonction similaire en familles de fonctions de manière à développer un « univers de fonctions » réellement utile et consultable, organisé par disciplines et domaines fonctionnels. En comprenant les relations entre le contenu d’une fonction, les compétences, l’expérience et l’éducation, une ontologie des emplois contribue à fournir des résultats et des recommandations plus pertinents.

Par conséquent, elle offre un soutien maximal aux demandeurs d’emploi comme aux employeurs. Une fois intégrée dans une plateforme consacrée à la recherche d’emploi, elle permet à ses utilisateurs d’obtenir les résultats souhaités sans se soucier de savoir si leurs critères de recherche sont trop vastes ou trop restreints. Contrairement à la recherche par mot clé/booléenne, une recherche basée sur l’ontologie fournira des résultats pour une recherche que vous n’avez pas explicitement lancée, mais qui sera liée aux critères saisis.

Par exemple, même un simple job comme « chauffeur de camion » s’affiche sous une pléthore de formules différentes, selon l’entreprise. FedEx Express appellent les chauffeurs « Couriers », FedEx Office, les « SameDay City Couriers » et FedEx Freight les surnomme « City Drivers ». Chacune de ces sociétés utilise un langage différent pour décrire une même fonction. Les résultats d’une recherche normale portant sur « chauffeur de camion » ne reprennent pas ces emplois. Cependant, une ontologie sait que ces emplois sont extrêmement similaires et peuvent tous les inclure, ainsi que d’autres, dans les résultats d’une recherche d’emploi.

Et alors ?
Développer une ontologie s’avère une tâche véritablement ardue, mais utilisée correctement, elle sert parfaitement notre économie et la société entière. Les premiers clients de Google se sont avérés ravis de la réussite engendrée par son moteur de recherche d’emploi. De même que nos clients furent surpris des progrès significatifs réalisés grâce à notre Knowledge Graph (JANZZon!). Google a actuellement mis en place une ontologie du travail en anglais. Durant les 8 dernières années, nous avons développé une ontologie des emplois en 8 langues axée sur les marchés de régions aussi diverses que les États-Unis, l’Allemagne, la Norvège et le Moyen-Orient. Nous avons compris que la dimension de l’ontologie croît proportionnellement à sa complexité et sa valeur.

Soulignons que si la nouvelle fonctionnalité de Google constitue un progrès majeur vers une recherche d’emploi de meilleure qualité, cette solution ne convient cependant pas à chaque acteur du marché. Certains d’entre eux, notamment Indeed, sont remarquablement exclus de toute collaboration avec Google pour des raisons de concurrence, d’autres tels que les services publics d’aide à l’emploi et les fournisseurs de services HCM peuvent rencontrer des besoins supérieurs en termes de sécurité de données et de personnalisation. Enfin, cette fonctionnalité conçue par Google existe actuellement en anglais uniquement. Vers qui les entreprises doivent-elles se tourner pour trouver la solution qui leur permettra de soutenir le rythme effréné de cette évolution technologique ?

Octroi d’une licence pour une ontologie propre
Certaines entreprises ont tenté de concevoir leur propre ontologie, mais ne sont pas parvenues à les conserver en raison d’un manque de connaissances pointues et de ressources ou de moyens financiers insuffisants. Ces dernières années, de nombreux cimetières numériques ont été générés dans le domaine des données touchant à l’emploi. La solution la plus simple consiste à obtenir une licence pour une ontologie des emplois sous la forme d’un service cloud. L’ontologie des emplois JANZZon! offre cette possibilité et permet aux entreprises ainsi qu’aux services publics la chance de recourir à de vastes connaissances sur l’emploi et les compétences et de s’en servir dans le cadre de leurs applications existantes. JANZZon! existe actuellement en 9 langues (but fixé : 40) et couvre toutes les industries et familles de fonctions professionnelles. Il s’agit de l’ontologie la plus complète à ce jour. Pourquoi ne pas opter pour la variante discrète qui voit plus loin que Google ??

Perdu dans Big Data?
L’idée erronée de contrôler l’univers des données.

2016-05-03/dans Base de savoirs, News /par JANZZ.technology

” …En cet empire, l’Art de la Cartographie fut poussé à une telle Perfection que la Carte d’une seule Province occupait toute une Ville et la Carte de l’Empire toute une Province. Avec le temps, ces Cartes Démesurées cessèrent de donner satisfaction et les Collèges de Cartographes levèrent une Carte de l’Empire, qui avait le Format de l’Empire et qui coïncidait avec lui, point par point. […]”

Extrait de l’œuvre de Jorge Luis Borges «Del rigor en la ciencia»
Traduction officielle «De la rigueur de la science»

L’histoire de Borges suit la vision d’un empire obsédé par l’idée de créer une image parfaite du monde. L’empire fictif est pleinement engagé dans la tâche de créer une carte cohérente avec le territoire de l’empire, point par point. Aujourd’hui, je ne peux m’empêcher de penser que nous sommes dans un environnement très similaire : Les données changent profondément le monde dans lequel nous vivons et la façon dont nous le percevons. Nous sommes au beau milieu d’une révolution des données si vaste, si globale et si nouvelle qu’il est presque impossible de la saisir dans son intégralité. L’impact des données se fait sentir sur une immense étendue ; nous aspirons à tirer parti de Big Data pour révolutionner des industries entières, du marketing et de la distribution aux prévisions météorologiques, des diagnostics médicaux aux emballages alimentaires, de la conservation des documents et de l’utilisation des logiciels jusqu’à la communication. En fait, à l’instar du royaume fictif de Borges, nous en sommes arrivés à la conclusion que plus nous recueillons et évaluons de données, plus nous acquérons de connaissances sur le monde et ses habitants. Que la phobie des données est donc devenue absurde.

Il est aujourd’hui largement considéré que Big Data est à même de fournir des informations pratiques sur presque tous les aspects de la vie. Philip Evans et Patrick Forth, eux, le contestent : « Les informations sont comprises et utilisées par des méthodes d’intelligence artificielle fondamentalement nouvelles qui visent à acquérir des connaissances via des algorithmes qui utilisent eux, des ensembles de données massifs et bruyants. Puisque des ensembles de données plus volumineux conduisent à une meilleure connaissance, Big Data est une bonne chose « (traduction selon leur article commun dans les perspectives bcg.). Conformément à ces lignes, notre besoin en données augmente et notre écosystème numérique alimente ce développement : capteurs, appareils connectés, médias sociaux et un nombre croissant de nuages produisent inlassablement de nouvelles données que nous pouvons collecter et analyser. Selon une étude de l’International Data Corporation (IDC), l’univers numérique doublera tous les deux ans. Entre 2005 et 2020, le volume des données a été multiplié par un facteur de 300 à 40 zettaoctets. Un zettabyte compte 21 zéros. Dans ce monde de croissance exponentielle des données, l’accumulation souhaitée de données se poursuit sans relâche. Comme dans le royaume fictif de Borges, la ligne limite d’échelle extérieure est d’un rapport de 1:1, voire, une représentation numérique complète de notre monde.

Certaines entreprises comme IBM ou LinkedIn approchent déjà cette limite à pas de géants. IBM entraîne son système informatique cognitif nommé Watson pour répondre littéralement à toute question. Dans ce but, IBM Watson collecte des quantités innombrables de données pour créer un ensemble impressionnant de données. La société a récemment acquis Truven Health Analytic pour 2.6 milliards de dollars, ce qui lui permet d’étendre ses activités dans le secteur de la santé avec un important dépôt de données sur la santé provenant de milliers d’hôpitaux, d’employeurs et de gouvernements fédéraux aux États-Unis. Il s’agit là de la quatrième acquisition la plus importante d’une société de données sur la santé depuis le lancement d’IBM Watson il y a dix mois. Ce qui montre l’importance que tient la cartographie numérique des patients, des diagnostics, des traitements et des hôpitaux dans le système d’intelligence artificielle du géant informatique. La vision de LinkedIn est tout aussi ambitieuse : elle crée « Economic Graph », rien de moins qu’une cartographie numérique de l’économie mondiale. On dit que la carte contient un profil des 3 milliards de travailleurs consécutifs dans le monde entier. Toutes les entreprises, l’ensemble de leurs produits et services, les opportunités économiques offertes par les entreprises et les compétences requises pour réaliser ces opportunités doivent faire l’objet d’une cartographie numérique. En outre, l’intégration d’une présence numérique de tous les établissements d’enseignement supérieur au monde est prévue. Mais les efforts des deux entreprises ne sont que la pointe de l’iceberg. Leur intention de créer une représentation numérique complète des domaines respectifs symbolise l’aspiration plus générale à créer une société de l’information omniprésente.

Les visions d’entreprises telles qu’IBM Watson et LinkedIn insufflent donc déjà vie à un monde qui correspond aux visions de Borges. La puissance des Big Data transforme et recrée les objectifs cartographiques de l’histoire de l’empire de Borges. Le monde devient un point de référence pour lui-même. L’image numérique de notre monde prend rapidement de l’ampleur et, aux frontières extérieures, l’image et la réalité commencent déjà à se confondre. Le monde et l’image que nous en avons convergent. Tout à coup, nous nous retrouvons dans un monde qui ressemble étonnamment à l’empire de Borges.

Quelle folie – En suivant son cours, l’histoire de Borges remet en question le sens d’une telle cartographie massive. Une carte à l’échelle 1:1, qu’elle soit cartographique ou numérique, n’est probablement pas aussi précieuse qu’initialement présumée et des entreprises comme IBM ou LinkedIn approchent déjà de cette limite à grands pas. Une carte à l’échelle 1:1, qu’elle soit cartographique ou numérique, n’est probablement pas aussi précieuse qu’initialement présumée.

« […] Moins passionnées pour l’Étude de la Cartographie, les Générations Suivantes réfléchirent que cette Carte Dilatée était inutile et, non sans impiété, elles l’abandonnèrent à l’Inclémence du Soleil et des Hivers. Dans les Déserts de l’Ouest, subsistent des Ruines très abîmées de la Carte. Des Animaux et des Mendiants les habitent. Dans tout le Pays, il n’y a plus d’autre trace des Disciplines Géographiques. »

Dans le monde fictif de Borges, les générations futures se sont débarrassées de la carte de leurs ancêtres parce qu’ils n’étaient pas pris par la même ambition que ne l’avaient été leurs ancêtres et qu’ils avaient réalisé qu’une carte 1:1 serait sans utilité aucune. Ils ont abandonné la carte à sa détérioration. La seule trace qui en faisait preuve était les « restes déchiquetés » de la carte de leurs ancêtres. Le constat qu’une carte à l’échelle 1 : 1 est pratiquement inutile reflète également notre expérience avec l’univers des données en expansion. Le professeur Patrick Wolfe, Directeur exécutif du Big Data Institute de l’University College of London, met en garde : « Le rythme auquel nous produisons des données dépasse rapidement notre capacité à les analyser. À l’heure actuelle, seul environ 0,5 % de toutes les données sont évaluées et Wolfe croit que ce pourcentage continuera de diminuer au fur et à mesure que d’autres données seront recueillies. Nous commençons donc à prendre conscience de la futilité des masses de données que nous gérons. Au lieu d’utiliser les données pour acquérir de façon exponentielle davantage de connaissances sur le monde, nous créons une entité qui menace d’être oubliée en raison de son volume brut.

Afin de préserver notre collection numérique en constante expansion du même sort que celui de la carte de Borges – qui se détériore au fil des générations pour n’être plus que des fragments déchiquetés -, il est d’une importance capitale de tirer des conclusions applicables de toutes ces informations. Par conséquent, la capacité de comprendre pleinement ces masses de données recueillies et d’en tirer des enseignements pertinents constituera l’avantage concurrentiel ultime aujourd’hui et surtout à l’avenir.

Bien que de nombreuses personnes se déclarent déjà favorables à la conversion de Big Data en Smart Data, voire, données intelligentes, aucune solution viable n’ a encore vu le jour pour effectivement concrétiser cette transformation. Les mathématiques appliquées, le traitement naturel du langage et l’apprentissage machine s’équilibrent mutuellement, évinçant tout autre outil qui pourrait être appliqué. L’idée est qu’avec une quantité suffisante de données, les chiffres parlent d’eux-mêmes. Ou, pour reprendre les termes d’Evans et Forth : « Les Big Data sont une bonne chose ». Cette idée modifie la culture de la Silicon Valley et de nombreuses autres entreprises à travers le monde.

D’autres méthodologies telles que les ontologies, les taxonomies et les sémantiques ne sont pas du tout prises en compte dans l’esprit actuel de la découverte. Les mathématiques appliquées, l’apprentissage machine et l’analyse prédictive sont synonymes de volume, alors que les ontologies, les taxonomies et la sémantique sont synonymes de signification et de compréhension. Et même si cette dernière catégorie peut sembler moins importante que les dimensions des catégories mentionnées ci-dessus, les sémantiques n’en sont pas moins importantes pour déterminer la compétitivité des entreprises. Au contraire. Suite à la croissance exponentielle de l’univers numérique au cours des dernières années, nous avons atteint un niveau de complexité qui impose l’impératif de l’introduction d’une compréhension profonde des données disponibles. C’est quelque chose qui ne peut pas être réalisé en recueillant davantage de données ou en implémentant un algorithme. Ironiquement, c’est donc un changement de cap qui s’éloigne de la devise « Les Big Data sont une bonne chose » pour mettre à profit tout le potentiel complet des Big Data.