Was bedeutet eigentlich Parsing, wo findet es Anwendung und wo liegen die Grenzen? Teil 5/10
Der Ruf nach CV-Parsing wird immer grösser. Fast alle Jobplattformen werben damit, dass Bewerber auf ihrer Seite innert weniger Klicks ihren Traumjob finden und erwecken so bei Jobsuchenden den Eindruck, dass sich die Suche nach der (perfekten) Stelle beinahe im Schlaf erledigt. Einfacher geht es fast nicht: die Kontaktangaben eingeben, den Lebenslauf hochladen, fertig. Nicht zuerst tausend Felder eines Online-Formulars ausfüllen mit Angaben, die man im Lebenslauf und in vielzähligen Netzwerken und Bewerbungen bereits erfasst hat. Schuld an dieser Fehleinschätzung trägt der Mythos des CV-Parsing. Daher möchte ich in diesem Teil meiner Reihe über technologische Trends und Themen im HR gerne den Fragen auf den Grund gehen, was man von CV-Parsing eigentlich erwarten kann und wie es die Zukunft des Recruiting beeinflussen könnte.
Was ist Parsing eigentlich?
Zuerst wollen wir uns einmal anschauen, was ein CV-Parser eigentlich macht. Denn im Rahmen der Werbung von Jobplattformen wird dieser als Wundertool beschrieben, das alle Informationen, wie Erfahrung, Ausbildung und Qualifikationen, aus dem Lebenslauf herauslesen, zusammenfassen und auch richtig interpretieren kann. Eines sei daher vorausgeschickt: Beim CV-Parsing handelt es sich lediglich um das Umwandeln von Lebensläufen in Fliesstext in ein Format, welches vom Computer verarbeitet werden kann. Auch Lebensläufe in Bild oder PDF-Format können über die Integration eines Schrifterkennungsprogramms (OCR) geparst werden. Die weitere Verarbeitung jedoch, wie zum Beispiel das Finden des Traumjobs, ist dann Sache des Matchings. Um die Informationen eines Lebenslaufs richtig in ein strukturiertes Bewerberprofil abzufüllen, muss der Parser eine syntaktische Analyse durchführen, um die wichtigen Elemente, wie zum Beispiel die Fähigkeiten, Arbeitserfahrung, Ausbildung und Kontaktangaben richtig zu erkennen und zu extrahieren. Natürlich kommt Parsing auch noch in anderen Bereichen des HR zum Einsatz: zum Beispiel bei Systemen für die Bewerberverwaltung (sog. ATS) und bei der Erfassung von Stellenanzeigen. Der Parser ist überall da zu finden, wo Daten für automatisierte Prozesse gebraucht werden. Im Folgenden wollen wir uns vor allem den CV-Parser genauer anschauen. Die Erkenntnisse sind aber auch auf die anderen Anwendungsgebiete übertragbar.
Die wichtigsten Infos aus einem CV herauszugreifen klingt einfach, ist für den Computer jedoch eine höchst komplexe Aufgabe. Denn die menschliche Sprache bietet fast unendlich verschiedene Möglichkeiten eine Sache darzustellen. In unterschiedlichen Kontexten kann das gleiche Wort komplett verschiedene Bedeutungen erlangen. Wenn zum Beispiel vom „Geschäftsführer“ die Rede ist, dann kann es sowohl sein, dass der Verfasser des Lebenslauf selbst Geschäftsführer war, als auch, dass er „dem Geschäftsführer direkt unterstellt“ war. Erfahrungen oder Qualifikationen sind selten stichwortartig genannt, sondern oft nur implizit im Text beschrieben. Daher muss ein CV Kontext durch eine semantische Analyse korrekt interpretieren können. Dazu kommt, dass jeder seinen Lebenslauf gliedert wie er will, denn dieser ist ja ein Spiegelbild der eigenen Persönlichkeit. Mehrere Versuche, die Struktur des Lebenslaufs zu standardisieren, wie zum Beispiel der Europass, sind gescheitert. Ein CV-Parser orientiert sich nämlich an den üblichen Überschriften eines Lebenslaufs, die Aufschluss darüber geben, was für Informationen im folgenden Abschnitt zu finden sind. Das Parsen von Lebensläufen ist daher im Vergleich zu Begleitschreiben oder Stelleninseraten einfach, da letztere noch viel unstrukturierter sind und von viel mehr „noise“ wie Werbung umgeben sind.
Wie gut funktioniert das CV-Parsing von heute?
Gibt man „CV-Parsing“ in Google ein, so finden sich auf der ersten Seite vor allem Werbung von Anbieterfirmen wie Textkernel, Joinvision, Daxtra und Sovren. Dazu kommen noch ein zwei kritische Artikel zum Thema mit Überschriften wie „CV-Parsing: Eine Krücke oder ein Zukunfts-Tool?“. Sucht man noch etwas ausgedehnter, dann fällt einem auf, dass die meisten Artikel zum Thema vor 5 oder mehr Jahren verfasst wurden. Obwohl diese das Potenzial des Parsings für Effizienzsteigerung durchaus erkennen, sind sie dem Parsing wegen seiner vielen Mängel und „Kinderkrankheiten“ meist kritisch gegenüber eingestellt. Nun sind doch schon ein paar Jahre vergangen, doch Berichte -wenn es denn Neue gibt- folgen immer noch einem ähnlichen Schema.
Das zeigt auf der einen Seite, dass es in den letzten Jahren keine massgeblichen Weiterentwicklungen beim Parsing gegeben hat und auf der anderen Seite unterstreicht es die enorme Komplexität, die in der Aufgabe des Parsers steckt, einen Fliesstext in strukturierter Information zusammenzufassen. Jobplattformen lehnen sich also weit aus dem Fenster, wenn sie dem Bewerber versprechen, dass das Hochladen des CV sie in Sekundenschnelle zum Traumjob führt. Das zeigt sich dann auch beim Testen einiger Bewerberplattformen: Die Arbeitserfahrung wird falsch oder erst gar nicht erfasst, da der Parser entweder Mühe hat, die Zeitspanne zu erkennen, während derer man einer Tätigkeit nachgegangen ist, oder den Aufgabenbereich und den Jobtitel richtig herauszulesen. Zudem ist es oft schwierig zwischen Ausbildung und Erfahrung zu unterscheiden (z. B. bei Praktika). Bei einigen Jobplattformen sieht man erst gar nicht, welche Informationen aus dem CV herausgenommen wurden und für die Jobsuche verwendet wurden. Solche Fehler sind umso ärgerlicher, da der Bewerber, die vom Lebenslauf extrahierte Information manuell korrigieren muss. Da braucht man dann auch schnell einmal mehr Zeit, als wenn man das Profil auf einer Jobseite von Anfang an selbständig ausgefüllt hätte. So unterstreicht auch Hermann Arnold, CEO von Umantis, dass „die Zeitersparnis kritisch mit dem Zeitaufwand der manuellen Korrektur abgeglichen werden muss“.
Genauso wichtig ist aber auch, die richtigen Erwartungen beim Benutzer zu wecken. Den Parser als nützliches Tool zur Zeiteinsparung, das aber auf manuelle Hilfe angewiesen ist, zu beschreiben, ist sicher nicht falsch. Ihn aber als Wundertool, das in 5 Sekunden zum Traumjob führt, darzustellen kreiert eine überhöhte Erwartung und verärgert den Bewerber letztendlich, was zu einer schlechten Candidate Experience führt. So weist die Studie, Recruiting Trends 2015 des Jobportals Monster auch darauf hin, dass CV-Parsing immer noch nicht einwandfrei funktioniert. Denn sie hat festgestellt, dass Onlineformularbewerbungen von Arbeitgebern wegen ihrer Standardisierung und der Übersichtlichkeit geliebt, von Bewerbern jedoch wegen des Aufwands gehasst werden. Umgekehrt sieht die Situation bei den Emailbewerbungen aus. Einerseits beleuchtet dieser Gegensatz das enorme Potenzial des CV-Parsing, da es Onlineformularbewerbungen durch automatisches Einfüllen enorm vereinfachen könnte. Jedoch deutet die fortwährende Unbeliebtheit der Online-Bewerbung, darauf hin, dass CV-Parsing von vielen Benutzern immer noch als ungenügsam empfunden wird.
Um Parsing in Zukunft besser nutzen zu können, muss sich also sowohl die Technologie, als auch die Einstellung von Bewerbern weiterentwickeln. Einen passenden Job oder gar den Traumjob zu finden ist schwierig. Zu erwarten, dass mit einem Click alles erledigt ist, ist daher unrealistisch.
Wie könnte Parsing die Zukunft des Recruiting beeinflussen?
Parsing bietet die Grundlage für automatisierte Prozesse im HR, somit reicht der potenzielle Einfluss von Parsing von der Jobsuche über die Bewerberselektion bis hin zum Talentmanagement und vielem mehr. Unter anderem, könnte Parsing helfen, das Recruiting in Zukunft transparenter und chancengleicher zu gestalten. Denn der Parser liest die Fähigkeiten, Erfahrungen und Qualifikationen eines Bewerbers unabhängig von dessen Namen, Geschlecht oder Alter aus dem Lebenslauf heraus. Er kann die Daten so aufbereiten, dass diese Eigenschaften im ersten Moment keine Auswirkung auf den Erfolg oder Misserfolg bei der Bewerbung spielen. Wie wichtig der Schutz vor Diskriminierung auf dem Arbeitsmarkt ist, zeigt die jüngste Entscheidung von David Cameron für die anonyme Bewerbung für Uniabsolventen in Grossbritannien. Mehr zu der produktiven Beziehung zwischen berufsbezogenen Daten und Recruiting in meinem nächsten Beitrag „Können Big (Occupation) Data zukünftig helfen, die richtigen Bewerbenden zu finden? Was wird damit sonst noch möglich?“.
Der Beitrag ist Teil meiner Reihe „Was Sie schon immer über technologische Trends und Themen im HR wissen wollten, aber bisher nicht zu fragen wagten“.