Das Parsen von Bewerbungsunterlagen will gelernt sein
Den Titel (Übersetzung für Nicht-Österreicher: Bei meinem Lebenslauf handelt es sich um einen ganz normalen Lebenslauf) hat ein österreichischer Recruiter von einem Bewerber vor einiger Zeit zu hören bekommen. Dem vorausgegangen war das fehlerhafte Parsen seiner Bewerbungsunterlagen.

Parsen ist eine Notwendigkeit geworden in der HR-Szene. Kein Bewerbermanagement-System, kein Jobportal und kein Unternehmen mit vielen Bewerbungen kommt daran mehr vorbei. Gleichzeitig hat sich in vielen Bereichen auch das Verhältnis zwischen Unternehmen und Bewerber nachhaltig verändert: der Bewerber ist zu einem Kunden geworden, der vom Unternehmen umworben werden muss, Stichwort: Candidate Experience, Stichwort: War for Talents.
Die große Herausforderung in all diesen genannten Fällen: welcher der vielen Parser, die es in der Zwischenzeit gibt, erfüllt am besten meine Anforderungen? Hier lohnt es sich in jedem Fall, sich darüber im Vorfeld bereits Gedanken zu machen und die in Frage kommenden Parser ausführlich zu testen.
Grundsätzlich sind drei Arten von Parsern zu unterscheiden (siehe lecturio-Artikel):
- Keywordbasierend
- Statistikbasierend
- Grammatikbasierend
JoinVision hat sich im Falle seines CV-Parsers CVlizer für einen Hybrid-Ansatz entschieden und damit die besten Ergebnisse erzielt. Hybrid bedeutet in diesem Fall, dass man sich in der Wahl der Methoden und Algorithmen für die Datenextraktion nicht auf ein Verfahren festlegt, sondern für jeden einzelnen Schritt den jeweils besten Ansatz wählt - oder sich sogar dynamisch, also situationsabhängig je nach Lebenslauf, für einen Ansatz entscheidet.
Da JoinVision davon überzeugt ist, dass hochflexible Bewerbungsunterlagen hochflexibler Lösungen bedürfen, wurde dieser Ansatz noch um selbstlernende Verfahren auf Basis des maschinellen Lernens ergänzt. Anpassungsfähige Algorithmen und die Kombination verschiedener Verfahren machen den CVlizer zu einem CV-Parser, der auf alle Herausforderungen an die semantische Extraktion von Bewerbungsunterlagen die richtige Antwort hat.
Um beim Parsen State of the Art zu bleiben, sind regelmäßige Optimierungen schlichtweg Notwendigkeiten. Gerade in den letzten Tagen und Wochen wurde im Falle des CVlizers die Extraktionsqualität nochmals verbessert. Neuartige Machine-Learning-Methoden machten es möglich, in mehrspaltigen Lebensläufen die Berufs- und Ausbildungsphasen besser zu erkennen. Zusätzlich konnte die Firmenerkennung verbessert und die Wissensbasis (= Ontologie) erweitert werden, um damit noch mehr Skills extrahieren und bewerten zu können.
Zum Testen der Verbesserungen geht es hier: CV-Parser-Test