loading
views
0 reacties
Filip De Geijter

Recruitment en de kracht van taaltechnologie

Filip De Geijter is directeur van Actonomy. Zijn achtergrond is IT-marketing. Actonomy levert een van de meest accurate semantische search en matching-technologie in de wereld, afgestemd op HRM communities en community sites. Actonomy biedt CV Matching en CV Extraction. Recruiters, uitzendorganisaties, vacaturebanken, corporate recruiters en community sites hebben allemaal hetzelfde doel: het vinden van de beste cv’s of profielen die in de behoeften van een functiebeschrijving te passen. Voor hen zijn de tools van Actonomy onmisbaar. In zijn columns schrijft hij over jobboards en jobsearch. X

2 mei 2012

Column Filip De Geijter, Actonomy
Actonomy levert optimale zoekmachine software voor Recruitment en HR-services. Filip De Geijter beschrijft in columns voor FlexNieuws technische en organisatorische aspecten van het vakgebied.

Recruitment en de kracht van taaltechnologie
We kennen het inmiddels allemaal: via spraak communiceren met onze computer, met onze smart phone etc. Wij spreken en krijgen zelfs antwoord! De computerachtige stem is daarbij al lang verleden tijd, alles klinkt netjes met de juiste intonatie. De spraak interface is daarbij slechts één deel van de oplossing: achter elke spraak interface zit de kern van het systeem, namelijk het verstaan van wat je eigenlijk vraagt, zoekt of wenst te weten. Met andere woorden, de analyse van de geschreven taal door een computer.

Dat een computer verstaat wat we ingeven, lijkt ons inmiddels zo normaal geworden. Neem de Google zoekfunctie: gebruiken we nog alleen keywords of typen we gewoon een vraag in voor wat we zoeken (waarbij we er dan vanuit gaan dat die verstaan wordt)? De tijd van AND en OR is bij Google al lang voorbij – gewoon intypen wat we zoeken en we verwachten ook de juiste resultaten. Bij Google zal dat doorgaans ook wel zo zijn. We krijgen immers in de meeste gevallen miljoenen hits en niemand kijkt verder dan enkele pagina’s. Dus de foute of minder relevante resultaten – omdat het syteem zoekt op verkeerde woorden – krijgen we niet te zien.

Is dat echter ook zo bij de ‘gemiddelde jobsite’ waar we eenvoudigweg ‘account manager Utrecht’ ingeven, zonder ons te bekommeren om AND en OR? Doorgaans niet! Als we gewoonweg de woorden ingeven die we denken te moeten zoeken, krijgen we nogal eens foute resultaten! Zelfs bij eenvoudige zoektermen loopt het wel al eens mis!

Semantisch zoeken lijkt de oplossing
Het feit dat er foute resultaten gevonden worden, lijkt erop dat het systeem niet begrijpt wat we zoeken. Als we ingeven ‘account manager Utrecht’, dan willen we enerzijds een ‘account manager’ en anderzijds ‘Utrecht’ als woonplaats. In elk geval geen resultaten waar gewoon ‘account’ in voorkomt maar dan in een andere betekenis. Met een semantische zoekmachine wordt dat allemaal opgelost, zeggen we dan. Die weet wat het allemaal betekent en komt alleen met de juiste resultaten terug.

Als we even snel bij Wikipedia te rade gaan, dan vinden we voor semantiek: “De semantiek of betekenisleer is een wetenschap die zich bezighoudt met de betekenis van symbolen, waarbij het in het bijzonder de bouwstenen van natuurlijke talen die voor de communicatie dienen ofwel woorden en zinnen betreft.” Dat is het dus, de oplossing voor al onze problemen bij zoeken.

Semantiek, context en nog zoveel meer
We weten het dus, semantiek is de oplossing! We kennen de betekenis van de woorden en zullen dan ook beter gaan zoeken. Maar er is meer: het volgende modewoord dient zich aan – ‘contextueel zoeken’. De betekenis kennen is één ding, maar dan moet het ook nog in de juiste context staan – of eenvoudig gezegd op de juiste plaats zodat het in het juiste verband gebracht wordt met de woorden die we zoeken.

Dus om goed te zoeken, hebben we meer nodig dan alleen de betekenis. Ook de juiste context is nodig. Dit is het dus: we hebben een systeem nodig dat weet wat we zoeken en waar we het moeten zoeken. Probleem opgelost.

Semantiek, semantiek…
Semantische technologie is niet nieuw, het bestaat al ruim meer dan 10 jaar, maar nu pas blijkt het door te dringen, of op zijn minst toch in het recruitmentlandschap. We zijn er allemaal van overtuigd dat we het nodig hebben omdat het ons sneller tot betere resultaten zal brengen. Time is money, dus dit kan ons helpen.

Zoals bij elke technologie is het ook hier oppassen geblazen: heel veel verwarring over wat het nu eigenlijk is – en of het daadwerkelijk altijd tot betere resultaten zal leiden. Zowat elke speler in deze markt geeft zijn eigen invulling aan wat het nu eigenlijk is – meteen ook de reden dat heel wat oplossingen op de markt nauwelijks beter functioneren dan gewoon zoeken.

Semantische oplossingen gedemystificeerd
Heel wat oplossingen gaan ervan uit dat als je de gegevens (voorbeeld een CV of vacaturebeschrijving) structureert en/of opdeelt in blokken (opleiding, werkervaring,….) en dan gaat zoeken in die blokken, dat je dan ‘semantisch zoekt’. Je zoekt immers in een bepaalde context en met een bepaalde betekenis. Dit is echter een foutieve of beperkende voorstelling van de realiteit. Op dat moment begrijpt het systeem nog steeds niet wat je zoekt, je weet enkel dat als je zoekt in een bepaald veld, je dan zoekt in bijvoorbeeld werkervaring. Bovendien niet altijd nauwkeurig omdat er nogal wat informatie verloren gaat bij het structureren. Dit zijn echter geen semantische zoekoplossingen.

Wat zijn semantische zoekoplossingen. Waarin onderscheiden ze zich?
De belangrijke aspecten:

  • Betekenis van woorden: zoals boven aangegeven is de betekenis van het woord in een tekst van groot belang en de essentie om tot een goede oplossing te kunnen komen. Dat betekent dat een semantische zoekoplossing van heel veel woorden de betekenis moet kennen! Het belang van een erg grote kennisbank met woorden en hun betekenis, is dus essentieel om een semantische zoekengine goed te doen werken. Alleen woorden opslaan in velden – doorgaans zonder betekenis – is geen goede oplossing.
  • Concepten: woorden of combinaties van woorden met een betekenis zijn concepten. Voorbeeld : ‘account manager’ is een concept en is niet langer de twee losse woorden ‘account’ en ‘manager’. De combinatie van de twee geeft aanleiding tot een nieuw concept met een eigen betekenis.
  • Context: ook al ken je de betekenis van woorden, dan nog moet je weten in welke context ze gebruikt worden en hoe andere woorden in die context de betekenis kunnen beïnvloeden. Het woord ‘manager’ heeft een betekenis, door het te combineren met ‘sales’ krijgen we een andere betekenis, dan door combinatie met ‘marketing’ etc. Met andere woorden, naast heel veel worden begrijpen, moet een systeem ook te betekenis in combinatie met andere woorden kunnen begrijpen. Context betekent dus ook dat je moet weten waar je de woorden/concepten vindt in een tekst (een CV vb.) zodat ze ook de juiste betekenis meekrijgen.

De conclusie is dan ook eenvoudig : gewoon opdelen van documenten (contexten creeëren) is ruim niet voldoende om het label ‘semantic search’ mee te krijgen, je moet ook nog de betekenis van de woorden kennen binnen de contexten. Pas dan zoek je goed en zoek je betekenisvol!

Nemen we als laatste het voorbeeld van de zoekopdracht ‘account manager Utrecht’. Hierin is het begrip ‘account manager’ als zijnde een sales functie en het begrip ‘Utrecht’ als zijnde een plaats van belang. Echte semantische technologie zal nu niet eenvoudig beide begrippen (namelijk ‘account manager’ en ‘Utrecht’) gaan zoeken in de velden die te maken hebben met werkervaring en plaats, maar zal daarbij ook rekening houden met de betekenis van de begrippen en niet alleen zoeken op de losse woorden. Het zijn concepten met betekenis die gevonden worden in de juiste delen van het CV of het CV gestructureerd is of niet, maakt daarbij niet uit.

Gerelateerd nieuws


Meer uit deze rubriek