IA en Contratación

Cómo un asistente de cribado de IA puntúa ajuste de solicitud sin discriminar

ClarityHire Team(Editorial)6 min read

El cuello de botella de cribado

Un reclutador típico criба manualmente 100+ solicitudes por semana. Cada una toma 3–5 minutos: hojea el currículum, escanea la carta de presentación, puntúa contra los requisitos principales del trabajo, pasa a la siguiente. A escala, esto es agotador y propenso a errores. La fatiga se instala; el juicio se vuelve descuidado.

Un asistente de cribado de IA puede preprocesar esto: leer todas las 100 solicitudes, puntuar cada una contra los criterios explícitos del trabajo (5+ años de experiencia backend, envió un sistema de pago, etc.), y clasificar por ajuste. Un reclutador entonces revisa los 20 mejores, no los 100. Esa es la promesa.

El problema: si pides a una IA que «puntúe ajuste», alegremente correlacionará ajuste con género, raza, escuela, u otras características protegidas —no porque la IA sea maliciosa, sino porque los patrones de correlación están en los datos, y el modelo los encuentra. Las barreras tienen que ser explícitas.

Cómo definir criterios de puntuación sin accidentalmente hornear sesgo

El primer paso es definir qué ajuste realmente significa. No vibraciones. No «ajuste cultural». Criterios explícitos y medibles:

Imprescindibles (binarios):

  • ¿Ha enviado un servicio backend a producción?
  • ¿Conoce SQL?
  • ¿Está dispuesto a estar on-call?

Buen tener (puntuado 1–10):

  • Años de experiencia backend (puntuación: años limitado a 10)
  • Número de integraciones de pago enviadas (puntuación: recuento, limitado a 5)
  • Contribuciones de código abierto (puntuación: 1–5 subjetivo)

Los imprescindibles vigilan la puntuación. Si una candidatura falla cualquier imprescindible, no obtiene puntuación en buen tener. Son un «no», no un «3/10».

El buen tener luego clasifica dentro del grupo de «sí». Una candidatura con 8 años de experiencia y 2 integraciones de pago puntúa más alta que una con 4 años y 0 integraciones —dada que ambas despejaron los imprescindibles.

Qué no incluir en criterios de puntuación:

  • Escuela (Stanford vs. escuela estatal)
  • Marca de empleador anterior (Google vs. startup)
  • Edad / año de graduación (correlación de edad implícita)
  • Marcadores de diversidad (cualquier cosa que correlacione con características protegidas)
  • Rasgos de personalidad vagos («liderazgo», «iniciativa», «impulso»)

El marco de «explicar, no decidir»

Aquí está la opción de diseño crítica: La IA recomienda una puntuación y la explica. No autoriza ni autorrechaza. Un reclutador humano decide.

Un output de asistente de cribado podría verse como:

Candidatura: Sarah Chen

Puntuación de ajuste: 8.2/10

Análisis:

  • Imprescindibles: ✓ Todos cumplidos (envió servicio backend, conoce SQL, abierto a on-call)
  • Años de experiencia: 7 años (puntuación: 7/10)
  • Integraciones de pago: Stripe, Square (puntuación: 5/10)
  • Código abierto: 2 proyectos activos (puntuación: 3/5)
  • General: Experiencia sólida, buena profundidad de integración.

Recomendación: Entrevista

Tu decisión: [Acuerdo] [Anular: Pasar] [Anular: Cribar más]

El reclutador ve el razonamiento. Pueden estar de acuerdo, en desacuerdo, o hacer más preguntas. La IA ha hecho el trabajo pesado (leyendo 100 currículos, extrayendo datos), y el humano tiene palabra final.

Este es la clave: la IA puntúa, el humano decide.

Barreras de sesgo (y sus límites)

Tres barreras funcionan en la práctica:

1. Anonimización en entrada

Quita información identificadora antes de alimentar la solicitud al modelo de puntuación:

  • Sin nombre de candidatura
  • Sin escuela (solo «educación universitaria»)
  • Sin nombres de empresa (solo «empresa tech de tamaño medio»)
  • Sin ubicación (inferida de zona horaria solo)

El modelo no puede correlacionar identidad si la identidad no está presente.

2. Audita la correlación

Después de puntuar una cohorte (p. ej., 100 solicitudes), ejecuta una verificación estadística: ¿La puntuación correlaciona con características protegidas en tu grupo de solicitantes?

Si tu modelo puntúa candidaturas de mujeres significativamente más bajo que hombres en los mismos criterios, tienes un problema de sesgo. El modelo aprendió una correlación en los datos de entrenamiento que no está en tus criterios de trabajo. Bandera roja.

3. Seguimiento de anulación humana

Registra cada vez que un reclutador está de acuerdo con la puntuación, la anula hacia arriba, o la anula hacia abajo. Después de 2–4 semanas, pregunta: «¿Estamos constantemente anulando la IA en una dirección?» Si estamos mejorando 40% de candidaturas de mujeres y 10% de candidaturas de hombres, la IA está sesgada. Reentrena o ajusta.

La trampa de explicabilidad

«Explicabilidad» es un arma de doble filo. Mostrar al reclutador el razonamiento de la IA es bueno para la transparencia. Pero también puede amplificar sesgo si la explicación es incorrecta.

Ejemplo: Una IA puntúa una candidatura baja y explica «menos años de experiencia». Pero la candidatura realmente tiene 8 años, empacados en un formato de currículum corto. La explicación se parece razonable, pero se basa en malinterpretación.

Mejor práctica: Empareja la puntuación de IA con extracción real de datos. No «menos años» sino «currículum indica 8 años (2016–2024)». Verificable. Difícil de mentir al respecto.

Cuándo el asistente de cribado de IA se desmorona

Lucha con:

  • Fondos no tradicionales. Un graduado de bootcamp con 2 años de trabajo backend freelance vs. un titular de CS con 2 años. La IA ve señales diferentes; necesita guía sobre cómo ponderarlas.
  • Currículos internacionales. Diferentes formatos, sistemas educativos, nombres de empresa. Los datos de entrenamiento del modelo sesgan hacia EE.UU./Occidental.
  • Cambios de carrera. «Fui abogado durante 5 años, ahora estoy aprendiendo backend en un bootcamp». La IA ve sin experiencia de «servicio enviado» y puntúa bajo. Un reclutador humano podría ver experiencia de dominio y habilidades de comunicación dignas de sopesar más.

En todos estos casos, la barrera es: el reclutador humano anula la puntuación. La IA es un ahorrador de tiempo para los casos obvios, no un reemplazo para el juicio.

Qué medir

  • Tiempo ahorrado por reclutador: Cribar 100 solicitudes debería caer de 6–8 horas a 1–2 horas si la IA está funcionando.
  • Auditoría de sesgo: Distribución de puntuación por demografía (si la rastrean). Debería ser aproximadamente plana entre géneros/razas/fondos si los criterios son neutrales.
  • Frecuencia de anulación: Si los reclutadores anulan la IA > 50% del tiempo, el modelo no está alineado con tus criterios reales de contratación. Reentrena.
  • Contratación outcome por fuente: ¿Las candidaturas criba alta por la IA realmente funcionan mejor una vez contratadas? Si no, los criterios necesitan ajuste.

El asistente de cribado de ClarityHire puntúa solicitudes contra los criterios indicados del trabajo (imprescindibles y buen tener), proporciona explicaciones, y requiere que un reclutador humano confirme la decisión. Se construyó para sugerir, no para decidir.

Prueba el asistente de cribado en ClarityHire

cribado de iaevaluación de candidatosmitigación de sesgoequidad en la contrataciónautomatización

Artículos relacionados