Mai sunt utile testele de cod când candidații au asistenți IA?
Întrebarea pe care și-o pune orice responsabil de recrutare
Dacă un candidat poate copia orice întrebare standard de test de cod într-un LLM și primește un răspuns aproape perfect, ce mai măsoară de fapt evaluarea? Pentru testele algoritmice în stil LeetCode, răspunsul onest e: nu prea multe.
Dar asta nu înseamnă că testele de cod sunt moarte. Înseamnă că un anumit stil de test de cod e mort. Stilurile care supraviețuiesc — și devin mai valoroase, nu mai puțin — sunt altele.
Ce încă funcționează
1. Depanare live pe cod necunoscut
Candidatului i se dă o bază de cod mică și defectă și i se cere să găsească și să repare bug-ul. LLM-urile ajută mai puțin decât crede lumea pentru că bug-ul e în interacțiunea dintre fișiere concrete, iar candidatul trebuie să citească codul, nu să-l genereze. Uneltele accelerează ingineri buni și nu compensează ingineri slabi.
2. Take-home cu sesiune de discuție
O temă take-home de 90 de minute produce un artefact. O discuție pe lucrare de 30 de minute verifică dacă candidatul poate raționa pe el. Împreună rămân semnal puternic, chiar dacă IA a ajutat la artefact — pentru că discuția testează discernământul asupra muncii, iar IA nu i-l poate transfera candidatului.
E tiparul dominant care apare la echipele care s-au adaptat bine: nu lupta cu IA pe artefact, testează pe explicație.
3. Design de sistem
LLM-urile răspund la întrebări de design de sistem sub forma unui răspuns, dar ratează constant articularea compromisurilor, raționamentul pe moduri de eșec și conștiința costului pe care le aduc inginerii experimentați. O rundă de design de sistem ancorată în rubrică, cu intervenții active ale intervievatorului, rămâne semnal puternic.
4. Pair programming pe o sarcină reală
Muncă colaborativă în timp real. Se evaluează comunicarea, integrarea feedbackului și discernământul. Asistența IA în moment e ok — semnalul e ce face candidatul cu ea.
Ce a încetat să mai funcționeze
1. Întrebări algoritmice tip LeetCode
Dacă întrebarea se rezolvă punând-o în ChatGPT, filtrezi după cine are acces la ChatGPT. Scoate-le din uz.
2. Take-home-uri fără discuție
Evaluarea de pur artefact e irecuperabilă. Fie adaugi o discuție, fie nu mai folosi take-home-uri pentru decizii cu miză mare.
3. Trivia stil MCQ
„Care e complexitatea de timp a X?" răspuns izolat. Ușor de căutat, ușor de IA, nu măsoară discernământ. Folosește-le doar ca filtru în etapa de screening pentru lacune fundamentale clare, nu ca semnal decizional.
Ce trebuie adăugat
Semnale de integritate a procesului
La take-home-uri, capturează tipare de tastare și de iterare a editării. ClarityHire face asta implicit. Nu clasifică ca bun sau rău — scoate la suprafață tipare inconsecvente cu codul scris de mână, ca evaluatorul să poată sonda în discuție.
Apărare orală
Fă din capacitatea de apărare parte din fiecare evaluare. Candidatul care știe să folosească unelte IA eficient și să-și explice propria muncă e cel pe care îl vrei. Cel care a copiat fără să înțeleagă pică apărarea orală indiferent cum arată artefactul.
Probleme realiste
Depărtează-te de puzzle-uri și apropie-te de probleme care seamănă cu munca. Problemele reale au ambiguitate, context, compromisuri. Asistenții IA sunt cei mai utili la probleme bine specificate și cei mai puțin utili la cele ambigue — exact asimetria pe care o vrei.
Cadrul mai larg
Testele de cod n-au fost niciodată concepute să măsoare „poți scrie cod fără ajutor". Au fost concepute să prezică performanța la job. În 2026, performanța la job include să folosești bine asistenții IA. O evaluare care se preface că acești asistenți nu există măsoară lucrul greșit.
Evaluarea corectă în 2026 măsoară: poți produce muncă, poți să-ți explici munca, poți recunoaște când IA greșește, poți face față ambiguității. Prima e parțial automatizabilă. Celelalte trei nu sunt.
Păstrează evaluările. Reproiectează-le. Semnalul e încă acolo — e în alte locuri.