Karriere-Hemmnis CV-Parsing?
Ende Mai dieses Jahres hat Adzuna, eine international anerkannte Jobsuchmaschine, eine Presseaussendung veröffentlicht mit dem Titel: „Die gröbsten Bewerbungsfehler - aus der Sicht eines Computers“.

Darin wird den BewerberInnen angeraten, bei ihren Lebensläufen fünf bestimmte Fehler zu vermeiden. Diese könnten nämlich dazu führen, schon vorzeitig aus dem Bewerbungsprozess auszuscheiden, obwohl sie für die ausgeschriebene Stelle durchaus geeignet wären.
In Wahrheit lässt sich das Problem von zwei Seiten betrachten, womit sich auch zwei Möglichkeiten der Lösung ergeben:
- Die BewerberInnen werden "erzogen“, ihren Lebenslauf so und so, aber keinesfalls so abzufassen, oder aber
- Der Parser, der eingesetzt wird, um die Daten aus Lebensläufen zu extrahieren und aufzubereiten, ist in der Lage, auch mit "fehlerhaften“ Bewerbungsunterlagen umzugehen.
Wir von JoinVision neigen als Anbieter derartiger Software eher dazu, uns in die Pflicht zu nehmen. Es ist an uns, dafür Sorge zu tragen, dass unser CV-Parser CVlizer auch aus derartigen Lebensläufen korrekte Daten zur Verfügung stellt.
Zu den aufgezählten "Fehlern“ – den Herausforderungen! - im Einzelnen:
"Fehler" 1: Lebenslauf enthält Tabellen
Dafür haben wir eigene Strukturerkennungsalgorithmen für Zweispaltigkeit und komplexe Tabellenstrukturen entwickelt, wodurch der CVlizer in der Lage ist, damit – bis auf wenige Ausnahmen - umzugehen.
"Fehler“ 2: Verwendung von Grafiken zur Darstellung textlicher Inhalte
Eingescannte Bewerbungsdokumente, die als Grafiken gespeichert wurden, können von uns mit Hilfe von OCR ohne Probleme verarbeitet werden.
"Fehler“ 3: Datumsprobleme
Für diese haben wir im Rahmen des CVlizers ganz besonders viel Zeit investiert. Unser Parser erkennt jede erdenkliche Kombination von Datumsangaben, so z.B. 1.3-2.4.16, 2013-15 oder auch rückwärts geschriebene Angaben wie 2015-2012. Selbst wenn nur ein Zeitraum (2 Monate) angegeben ist, oder nur ein Datum oder dgl., erkennen wir in der Regel die korrekten Phasen.
"Fehler“ 4: CV im PDF-Format
Der Lebenslauf kann bei uns in jedem beliebigen Format übergeben werden. Der CV als PDF ist aus unserer Sicht sogar ein ideales Format, weil es die meisten Strukturinformationen enthält und strukturstabil ist.
"Fehler“ 5: Keine klare Benennung der Abschnitte
Der CVlizer ist in der Lage Phasen bestimmten Bereichen auch dann zuzuweisen, wenn keine Überschriften existieren oder diese nicht erkannt wurden. Hierfür werden zahlreiche Heuristiken eingesetzt, die eine Entscheidung auf Basis des Inhaltes einer Phase treffen (Arbeit vs. Ausbildung, Alter zum Zeitpunkt der Phase, ...). Dass klar separierte Sektionen und ausgezeichnete Überschriften das Parsen erleichtern, steht dabei natürlich außer Zweifel.
Das ist einfach unser Weg: uns immer wieder aufs Neue den Herausforderungen komplexer („fehlerhafter“) Lebensläufen zu stellen. Wir wollen nicht darauf warten, dass welch immer geartete Erziehungsmaßnahmen durch wen auch immer greifen, um parsergerechte Lebensläufe zu erhalten.