ESCO: Esperávamos uma ontologia – ficamos desapontados com a coleção de termos que recebemos

2017-09-29/em Base de conhecimentos, Não categorizado, Notícias /por JANZZ.technology

Quase quatro anos se passaram. Esperamos por um longo tempo – e estávamos curiosos para ver o que a Europa anunciava com tanta grandiosidade. Constantemente ansiosos para sabermos se isto soluciona problemas bastante conhecidos dos sistemas de classificação. A classificação da União Europeia para dados ocupacionais é conhecida como ESCO – European Skills, Competences, Qualifications and Occupations (Competências, habilidades, qualificações e ocupações na Europa). Até o momento, as classificações têm sido solucionadas por todos os Estados por conta própria, como o ROME na França, o KLdB na Alemanha ou o CP na Itália. Geralmente, têm como base a mãe de todas as classificações, a Norma Internacional de Classificação de Ocupações (International Standard Classification of Occupations – ISCO) publicada pela Organização Internacional do Trabalho por volta de 1960, mas não são necessariamente comparáveis – números e letras diferentes, e níveis de taxonomia diferentes podem distinguir as classificações.

Outros sistemas de classificação foram desenvolvidos primeiro, mas com finalidade principalmente estatística. Desta forma, foi possível compor ocupações com números de identificação, em grupos e, em seguida, gerar estatísticas, mas esses sistemas não ampliam a compreensão de ocupações individuais. O sistema em grupos costumava ser amplo e genérico em demasia. Por exemplo, todos os médicos especialistas são reunidos no mesmo grupo e esse grupo é descrito apenas com um mesmo conjunto de competências para todos os especialistas. Isto quer dizer que as competências de um oncologista são descritas como idênticas às de um gastroenterologista, de um ginecologista ou de um patologista. Portanto, conforme as taxonomias, eles teriam os mesmos conhecimentos e suas especializações seriam reconhecidas somente pelo nome de seus cargos. Com esse nível de imprecisão nas descrições, certamente não seria possível uma melhor compreensão dos cargos individuais.

A União Europeia não queria que a ESCO se desenvolvesse como mais um esqueleto vago demais, mas sim criar um entendimento comum das ocupações, competências, habilidades, conhecimentos e qualificações em todos os 26 idiomas cobertos, de forma que os empregadores, profissionais e instituições educacionais pudessem compreender melhor as necessidades e os requisitos uns dos outros. Desta forma, a liberdade de movimentação poderia compensar as lacunas de competências e desemprego em diferentes estados-membro, segundo Juncker.¹

Quase quatro anos se passaram desde o lançamento da versão de testes. Todas as partes interessadas possíveis se envolveram, como agências de emprego, assessores de carreira, estatísticos, cientistas… a fim de criar essa classificação em 26 idiomas. Quase quatro anos de testes, extensões, modificações e retrabalho… e agora, estou aqui em frente ao meu PC, digitando em uma base de dados online “Word” como competência desejada e a base de dados não reconhece o termo. A única sugestão alternativa: WordPress. Não está relacionada à minha busca. Se eu digitar “PowerPoint”, nada acontece. A base de dados não reconhece o termo, é a busca não será armazenada.²

Muito bem, vamos experimentar o Indeed. Somente na Alemanha, encontreis mais de 13.000 anúncios de vagas com o termo de pesquisa “PowerPoint”. Na França e no Reino Unido, são mais de 8.000 anúncios. Mas o termo “PowerPoint” não está classificado como uma competência em toda a Europa. O termo não figura entre as 13.485 competências da ESCO. Um profissional deve entender o empregador em potencial melhor, no sentido de que “PowerPoint” não é uma competência importante para se recolocar no mercado?

A base de dados, temos de admitir, reconhece o termo “Microsoft Office” quando digitamos “Microsoft”, mas a compreensão semântica da base de dados não vai além disto. Afinal, e expressão “software de edição de texto” é armazenada como uma competência isolada, sem relação com o Microsoft Office, e nenhuma das duas competências sugerem que sejam sinônimas.

A ESCO declara reconhecer 2.942 ocupações. É interessante notar que o sistema identifica um «coordenador de logística ferroviária » e também oferece determinadas ortografias alternativas, mas não reconhece o termo “especialista em logística”. De tempos em tempos, ocupações com problemas semelhantes são encontradas. Além disto, uma alternativa sugerida para o termo “agente de partido político” é «agente de relações públicas». Apenas para exemplificar uma sugestão de cargo equivocada.

A ESCO agora será disponibilizada em 26 idiomas. Sim e não, vou descobrir. Sim, os cargos estão disponíveis em 26 idiomas; sim, as competências também estão disponíveis. Contudo, as explicações dos termos são sempre em inglês, o que significa que um cargo poder ser traduzido em todos os idiomas, mas não as descrições dos cargos. Elas permanecem somente em inglês. Agora questiona-se se um empregador da França compreende a descrição da profissão de um candidato sueco melhor sem uma definição em seu idioma nativo, o francês. Ou se ele poderá avaliar se a classificação realmente coincide com a vaga que está oferecendo.

Além do fato de as qualificações serem disponibilizadas somente em um idioma: Grego. As descrições detalhadas somente podem ser encontradas nesse idioma. Em qualquer caso, um empregador de outro estado-membro não entenderá melhor os dados do candidato, mesmo se este for grego. A própria ESCO relata que as qualificações devem ser fornecidas pelos estados-membro e que serão integradas regularmente. Entretanto, 27 estados-membros deixaram muito tempo passar.

Agora eu preciso compilar tudo. Estou mais do que desapontado com alguns aspectos marginais. Esperei quase quatro anos desde que comecei a explicar as possibilidades de coleta para ontologias em conjunto com outras pessoas no Congresso da ESCO. Mas nenhuma ontologia foi desenvolvida, apenas uma taxonomia ou uma coletânea de termos. 2.942 profissões, 13.485 competências e 672 qualificações (em grego) foram integradas à ESCO. A ESCO aparentemente investiu muito tempo e provavelmente muito dinheiro nesse desenvolvimento. Mas daí a ser uma revolução em relação à meta de Juncker é bastante questionável.

A pergunta agora é: O que fazemos agora? Vamos ter esperança e aguardar mais quatro anos até que a ESCO seja capaz de atender às necessidades dos serviços públicos e privados de RH e recolocação? Ou talvez devamos buscar uma alternativa? E quanto a uma alternativa que represente uma verdadeira ontologia, com reconhecimento semântico? Uma que reconheça que um funcionário de um partido não tem a mesma função que o de um RP. Que saiba que “MS Word’ é a mesma competência que “Microsoft Word” ou processamento de texto. E que contemple diversos idiomas em todos os campos. Quem sabe já existe uma solução assim? Talvez uma pesquisa online possa apresentar os resultados desejados, nesse sentido. Por exemplo, o site http://janzz.technology.

[1] ESCO (2015). Estrutura estratégica da ESCO. Visão, missão, posição, valor agregado e princípios orientativos. Brüssel.

[2] Somente a base de dados online da ESCO foi utilizada nesta pesquisa.

A NAV escolheu a solução da JANZZ baseada em ontologias para modernizar sua plataforma para o mercado de trabalho.

2017-07-11/em Não categorizado, Notícias /por JANZZ.technology

A Norwegian Labour and Welfare Administration (NAV) escolheu a empresa suíça de tecnologia JANZZ em um processo de licitação pública, para produzir os componentes de sua nova plataforma para o mercado de trabalho. A JANZZ venceu o processo de licitação contra concorrentes internacionais e vai prestar suporte à NAV com sua especialização em dados relativos a ocupações e competências.

A NAV está adaptando sua plataforma de autosserviço como parte da sua pauta para melhorar a recolocação de profissionais em busca de emprego. O objetivo da NAV é oferecer um serviço transparente a todos os operadores e participantes do mercado de trabalho, em que todos os usuários possam utilizar os serviços nos mesmos termos. A empresa está desenvolvendo uma ferramenta flexível que torna o mercado de trabalho norueguês mais transparente e proporciona uma recolocação profissional mais rápida a todos que estejam em busca de emprego.

A nova plataforma será uma fonte de conhecimento sobre o mercado de trabalho norueguês. A coleta, otimização e análise dos dados e informações sobre oportunidades de trabalho e competências serão uma parte central da futura plataforma. Ao incorporar dados e análises à sua visão estratégica central, a NAV almeja a criação de um ciclo de conhecimentos sustentável e dinâmico, que se beneficiará do bom funcionamento do mercado de trabalho.

Com sua tecnologia de correlação de oportunidades de trabalho baseada em ontologias, a JANZZ oferece a ferramenta ideal para a NAV construir uma nova plataforma inovadora e sustentável. Os dados da ontologia da JANZZ relacionados a ocupações e competências são uma base de dados semântica abrangente de cargos, competências e formações. O sistema compreende as nuances de CVs e vagas em aberto e pode ajudar a traduzi-los entre si. Em conjunto com o poderoso mecanismo de correlação semântica entre cargos e oportunidades, ele vai ajudar a NAV a gerar resultados e recomendações mais relevantes e transparentes nas pesquisas, e a obter perspectivas mais precisas em relação ao mercado de trabalho.

Sobre a NAV

A Norwegian Labour and Welfare Administration (NAV) tem aproximadamente 19.000 funcionários (cerca de 14.000 funcionários em nível nacional e 5.000 em nível municipal).
A NAV foi fundada em 1º de julho de 2006. As autoridades locais e o governo central cooperam entre si para formular soluções adequadas para os serviços sociais, de bem-estar e de recolocação profissional, para usuários dos 456 repartições do órgão nos municípios de todos os 19 condados da Noruega.

A NAV é responsável por um terço do orçamento nacional da Noruega, administrando diversos esquemas de benefícios e emprego (p. ex. seguro-desemprego, licenças remuneradas, auxílio-doença, auxílio-maternidade/paternidade, verbas para tratamento médico e pensões).

Principais objetivos em relação ao mercado de trabalho:

Mais pessoas ativas e empregadas, menos beneficiárias de verbas públicas
Um mercado de trabalho que funcione muito bem, com alto nível de participação da mão de obra ativa
Uma sociedade inclusiva, que assegure a todos a oportunidade de participar
Uma administração compreensiva e eficiente em prol do trabalho e do bem-estar

Objetivos secundários (objetivos trabalhistas) em relação ao mercado de trabalho:

Locais de trabalho inclusivos
Empresas e órgãos capazes de preencher suas vagas com profissionais qualificados
Assegurar aos portadores de deficiências ou parcialmente incapacitados de exercer suas funções a oportunidade de participar ativamente da vida funcional
Serviços e informações desenvolvidos conforme as necessidades e as circunstâncias dos usuários

Mais informações sobre a NAV disponíveis no site www.nav.no

Sobre a JANZZ.technology

A JANZZ.technology é uma empresa de tecnologia e consultoria ativa no setor de competências semânticas e correlação entre cargos e oportunidades e na utilização de dados complexos de ocupações e competências. A empresa oferece produtos convencionais e sem marca e soluções da SaaS para modelagem, análise e utilização de grandes volumes de dados empresas portais de oportunidades de trabalho, em serviços públicos de recolocação e em sites particulares de empresas. Utilizando tecnologias semânticas de última geração para fazer uma correlação precisa entre as qualificações e competências técnicas e interpessoais em diversos idiomas, a meta é mitigar consideravelmente os problemas de correlação associados a mecanismos de pesquisa assimétricos nos mercados de trabalho.

Mais informações sobre a JANZZ.technology disponíveis no site www.janzz.technology

Você se sente perdido com grandes volumes de dados?
A ideia mal interpretada que reina no universo dos dados.

2016-05-03/em Não categorizado, Notícias /por JANZZ.technology

“. . . Nesse império, a arte da cartografia atingiu um nível de perfeição tal que o mapa de uma única província ocupava a área de uma cidade inteira, e o mapa de um império ocupava a área de uma província inteira. Em tempo, esses mapas inconcebíveis não eram mais satisfatórios e as guildas dos cartógrafos traçaram um mapa do império com as mesmas dimensões do próprio império, coincidindo com a área original em cada ponto.[…]”

“Sobre o rigor nas ciências”
Jorge Luis Borges

A história de Borges narra um império imaginário, obcecado com a ideia de criar uma representação perfeita do mundo. O Império fictício se dedicou completamente à tarefa de criar um mapa que coincidisse com as terras ponto a ponto. Hoje, eu não posso evitar de pensar que nos encontramos em um ambiente muito parecido: os dados estão em profunda mudança no nosso mundo, assim como a maneira como os percebemos. Estamos em meio a uma revolução dos dados tão vasta, difundida e jovem que fica difícil absorver tudo. O impacto dos dados está se estendendo em uma escala realmente assustadora; estamos nos empenhando em utilizar grandes volumes de dados para transformar setores inteiros, do marketing e das vendas à previsão do tempo, dos diagnósticos clínicos às embalagens de alimentos e do armazenamento de documentos e do uso de software à comunicação. Na verdade, de uma maneira muito parecida com o império fictício de Borges, acabamos acreditando que quanto mais dados coletarmos e analisarmos, mais conhecimentos vamos adquirir do mundo e das pessoas que o habitam. Como se tornaram tolos os maníacos da informação.

Atualmente prevalece a convicção de que grandes volumes de dados geram perspectivas viáveis para quase todos os aspectos da vida. Philip Evans e Patrick Forth contestam, alegando que “as informações são compreendidas e aplicadas fundamentalmente por meio de novos métodos de inteligência artificial, que buscam perspectivas em algoritmos, utilizando conjuntos de dados volumosos e ruidosos. Como os conjuntos de dados mais volumosos geram perspectivas melhores, a imensidão é linda” (do artigo de coautoria dos cientistas bcg.perspectives). Ao longo dessas linhas, nosso apetite por dados está aumentando continuamente e nosso ecossistema digital está alimentando essa tendência: sensores, dispositivos conectados, redes sociais e um número crescente de nuvens produzem continuamente novos dados para coletarmos e analisarmos. Segundo um estudo da International Data Corporation (IDC), o universo digital deve dobrar, aproximadamente, a cada dois anos. De 2005 até 2020, o volume de dados vai crescer 300 vezes, atingindo 40 zetabytes de dados. Um zetabyte equivale a 10²¹bytes. Neste mundo em que os volumes de dados crescem exponencialmente, não há limites para a necessidade de acúmulo de dados. Assim como no império fictício de Borges, o limite externo é a escala 1:1, uma representação digital completa do nosso mundo.

Hoje em dia, empresas como a IBM ou o LinkedIn já procuram atingir esse limite. A IBM está treinando seu sistema de computação cognitiva, conhecido como Watson, para ser capaz de responder a praticamente qualquer pergunta. Para tanto, o IBM Watson está coletando volumes de dados sem precedentes, para compor um acervo impressionante de informações. A empresa acaba de adquirir a Truven Health Analytics por US$ 2,6 bilhões à vista, trazendo para sua unidade clínica um poderoso repositório de dados de milhares de hospitais, funcionários e governos de vários estados dos EUA, relacionados à saúde. Trata-se da quarta grande aquisição de empresas de dados na área de saúde nos 10 meses de vida do IBM Watson, demonstrando a importância da representação digital de pacientes, diagnósticos, tratamentos e hospitais para o sistema de inteligência artificial dessa gigante da informática. A visão do LinkedIn é igualmente ousada: a empresa está criando um Gráfico Econômico, que representa nada menos que o mapeamento digital da economia global. Outro objetivo do site é incluir um perfil para cada um dos 3 bilhões de membros da força de trabalho ativa no planeta. O intuito é representar digitalmente cada empresa, seus produtos e serviços, as oportunidades econômicas que oferecem e as competências necessárias para se enquadrar nessas oportunidades. E a empresa planeja incluir uma presença digital para cada instituição de ensino superior n mundo. Ainda assim, o empenho dessas duas empresas é apenas a ponta do iceberg. Seus planos de manter uma apresentação digital em seus respectivos campos são ícones de uma aspiração mais geral dos dias de hoje em relação ao status das informações polivalentes.

A visão de empresas como IBM Watson e Linkedin já está, portanto, invocando o mundo idealizado por Borges. As forças dos grandes volumes de dados estão se convergindo e recriando as pretensões cartográficas do império da obra do escritor. O mundo está se tornando autorreferenciável. A representação digital do nosso mundo está se expandindo rapidamente e os limites externos, a representação e a realidade estão começando a se fundir. O mundo e nossa imagem do mundo estão se convergindo. De repente, nos vemos em um mundo que tem uma semelhança assustadora com o império de Borges.

Que bobagem – prossegue a narrativa de Borges, chamando a atenção para a questão da própria finalidade dessa imensa representação. Seja cartográfico ou digital, um mapa em escala 1:1 pode não ser tão importante quanto se supunha.

“[…] Menos dedicadas ao estudo da cartografia, as gerações seguintes decidiram que esse dilatado mapa era inútil e não sem impiedade entregaram-no às inclemências do sol e dos invernos. Nos desertos do oeste perduram despedaçadas ruínas do mapa habitadas por animais e por mendigos; em todo o País não há outra relíquia das Disciplinas Geográficas.”

No mundo fictício de Borges, as próximas gerações desprezaram o mapa de seus ancestrais, pois já não tinham mais a mesma ambição deles e reconheceram que um mapa em escala 1:1 era inútil. Eles deixaram o mapa se decompor e tudo o que sobrou foram “ruínas laceradas” do mapa de seus ancestrais. A conclusão de que um mapa em escala 1:1 praticamente não tem utilidade também ecoa em nossa experiência com o universo dos dados em franca expansão. O Professor Patrick Wolfe, Diretor Executivo do Instituto de Grandes Volumes de Dados do College of London, alerta que “a velocidade com que estamos gerando dados está superando rapidamente nossa capacidade de analisá-los.” Apenas cerca de 0,5% de todos os dados são analisados atualmente e Wolfe diz que esse percentual está se reduzindo à medida que mais dados são coletados. Portanto, também estamos começando a constatar a falta de praticidade das massas de dados com que estamos lidando. Em vez de adquirir mais conhecimentos, exponencialmente, sobre o nosso mundo, por meio dos dados, estamos criando uma entidade que corre o risco de cair no esquecimento, graças ao seu tamanho exagerado.

Para evitar que nossa coleção digital em eterno acúmulo tenha o mesmo destino do mapa de Borges – ser abandonada pelas próximas gerações até se tornar um amontoado de ruínas – é essencial gerar inteligência aproveitável com ela. Desta forma, a capacidade de realmente compreender inteiramente a complexidade das massas de dados coletados e produzir conhecimentos relevantes a partir delas será a vantagem competitiva definitiva da atualidade e ainda mais no futuro.

Apesar de várias pessoas já estarem transformando grandes volumes de dados em dados inteligentes, ainda não surgiu uma solução patente que determine como de fato chegar a essa transformação. No momento, a matemática aplicada, o processamento da linguagem natural e a aprendizagem de máquinas têm peso igual na balança e substituem todas as demais ferramentas que possam ser concebidas. É a ideia de que, com dados suficientes, os números falam por si próprios. Para reiterar o que Evans e Forth disseram, “a imensidão é linda”. Essa ideia supre de informações a cultura do Vale do Silício e, por extensão, a de diversos empreendimentos em todo o mundo.

Outras metodologias como as ontologias, taxonomias e semânticas são inteiramente desprezadas no atual espírito de descobrimento. Enquanto a matemática aplicada, a aprendizagem de máquinas e as análises preditivas se baseiam no volume, as ontologias, taxonomias e semânticas se baseiam no significado e na compreensão. E embora estas últimas possam parecer irrelevantes, se comparadas às dimensões daquelas, elas ainda têm um papel de igual importância na determinação da adequação competitiva das empresas. Depois do crescimento exponencial do universo digital nos últimos anos, atingimos um grau de complexidade que requer uma profunda compreensão dos temas em questão. Algo que não se obtém pela mera coleta de ainda mais dados ou com a implementação de um algoritmo. Portanto, por mais irônico que possa ser, é uma mudança de direção que nos afasta da ideia de que “o grande é lindo”, e que pode realmente alavancar o poder integral dos grandes volumes de dados.