Come rilevare risposte di saggio generate da IA nelle valutazioni dei candidati
Le cattive notizie sui rilevatori di IA generici
I rilevatori generici di «contenuto generato da IA» — Turnitin, GPTZero, ZeroGPT — hanno un tasso di falsi positivi misurato tra il 4 e il 15 % nella scrittura inglese nativa, e peggio per i non madrelingua. Non sono sufficientemente accurati per rifiutare un candidato su questa base.
Se stai utilizzando un rilevatore generico di IA per fallire candidati, fermati. Stai filtrando per «non scrive come un libro di testo» più di quanto filtri per «ha usato l'IA». Stai introducendo pregiudizi contro gli scrittori ESL e contro i giovani scrittori che lucidano le loro bozze.
I segnali che contano davvero
I segnali di rilevamento utili sono comportamentali, non lessicali:
- Tempo fino alla prima pressione di tasto. Un candidato che legge il prompt per 15 secondi e poi digita 800 parole rifinite in 90 secondi non ha scritto quelle parole.
- Eventi di incolla. Un incolla pulito della risposta completa non è un candidato che scrive in tempo reale. Lo strato di integrità registra ogni evento di incolla con lunghezza e timestamp.
- Distanza di modifica durante la composizione. La scrittura in tempo reale produce una sequenza temporale di pressioni di tasti disordinata — inserimenti, eliminazioni, salti del cursore. L'incolla e il ritocco producono una sequenza temporale piatta, solo aggiuntiva.
- Switch di scheda e messa a fuoco. Il candidato ha lasciato la pagina a metà della domanda per 40 secondi? Probabilmente hanno chiesto a un LLM.
- Mancata corrispondenza tra voce e testo. Se hai un'intervista registrata con lo stesso candidato, confronta il suo vocabolario parlato con il suo saggio scritto. I saggi di IA utilizzano un registro molto più ampio e raffinato rispetto al linguaggio parlato del candidato.
I segnali da ignorare
- Caratteristiche lessicali che «suonano come IA». «Approfondire», «arazzo», «sfruttare» — questi sono ormai contaminati. I candidati reali li usano. I modelli reali li usano. Non puoi separarli solo dalla scelta delle parole.
- Grammatica perfetta. Molti candidati scrivono tramite Grammarly. Non è imbroglio; è come scrive il web moderno.
- Struttura generica («In conclusione…»). La struttura generica è quello che la maggior parte dei candidati ha imparato a scrivere dalle scuole superiori.
Il modello che funziona nella pratica
- Esegui saggi con rilevamento incolla attivato. Rifiuta gli incolla silenziosi o avverti il candidato che ne ha attivato uno — tua scelta. Quello che non devi fare è non registrare nulla e poi indovinare.
- Superficie i segnali comportamentali nel rapporto, non un singolo «punteggio di confidenza dell'IA». Un revisore che vede «30 secondi di lettura + un incolla di 740 caratteri a 0:31» può decidere; un revisore che vede «67 % IA» non può.
- Abbina il saggio con un follow-up in diretta di 5 minuti. Chiedi al candidato di spiegare un paragrafo specifico che ha scritto. I candidati che incollano e rifiniscono crollano rapidamente in un follow-up. I veri autori no.
Una nota sulla politica
Comunica ai candidati in anticipo se gli strumenti di IA sono consentiti. La maggior parte delle aziende dovrebbe dire «no in questa fase». Una piccola minoranza dovrebbe dire «sì, e dicci come l'hai usato» — una posizione valida per i ruoli senior dove l'IA fa parte del lavoro effettivo. Quello che non devi fare è penalizzare silenziosamente l'uso dell'IA che non hai mai vietato; quello è sia ingiusto che indifendibile se un candidato ricorre.
Come ClarityHire lo espone
Il nostro strato di integrità cattura gli eventi di incolla, le sequenze temporali dei tasti e i segnali di messa a fuoco della scheda per ogni valutazione. Il revisore vede la sequenza temporale, non un singolo punteggio di scatola nera. Il rilevamento dei contenuti generati da IA viene eseguito come un input tra molti — mai come un rifiuto automatico. Combina con una round di follow-up in diretta e avrai un processo difendibile e corretto nei confronti dei candidati.
TL;DR
Non rifiutare candidati su rilevatori lessicali di «IA» — i tassi di falsi positivi sono troppo alti. Invece, cattura il comportamento (eventi di incolla, tempo sul compito, messa a fuoco della scheda), esponi la sequenza temporale a un revisore umano e controlla con un breve follow-up in diretta. Quella combinazione è quello che assomiglia a un processo di assunzione competente nel 2026.