Integrität & Cheat-Detection

Wie man ChatGPT-Nutzung in Coding-Interviews erkennt

ClarityHire Team(Editorial)2026-05-063 min read

Die neue Baseline: jede Kandidatin hat ChatGPT offen

Bis 2026 ist die Frage nicht mehr ob Kandidatinnen KI in Interviews nutzen — es ist wie viel, und ob sie dieselbe Arbeit ohne sie produzieren können. Wenn du dein Screening nicht anpasst, hirest du Leute, deren beworbener Skill der der KI ist, nicht ihrer.

Dieser Post ist ein Field-Guide zum Erkennen KI-assistierter Antworten in Live- und Async-Coding-Interviews, gezogen aus den Signalen, die unsere Integritäts-Engine aufzeigt.

Signal 1: Keystroke-Rhythmus, der nicht zu menschlicher Autorenschaft passt

Wenn eine Person Code schreibt, pausiert sie zum Denken, drückt Backspace, refactort Variablennamen und endet mitten auf der Zeile. Wenn eine Person Code einfügt, siehst du einen einzelnen Burst von Keystrokes — oft Hunderte Zeichen in unter einer Sekunde — gefolgt von Stille.

ClarityHires Keystroke-Biometrie-Modell flaggt zwei Muster:

Burst-Paste-Events. Anhaltende Tipprate über ~700 Zeichen/Minute, besonders wenn von 10-60-Sekunden-Stille vorausgegangen (das klassische "Alt-Tab zu ChatGPT"-Signal).
Authorship-Drift. Der Tipp-Fingerabdruck der Kandidatin verschiebt sich mid-Task. Die ersten 10 Minuten wirken wie eine Person; Minute 30 wirkt wie eine andere.

Keine allein schlüssig. Zusammen fast immer.

Signal 2: Code-Kohärenz bricht

LLM-generierter Code ist fließend, aber oft zu fließend. Echte Engineers hinterlassen Artefakte: ein TODO, das sie zu entfernen vergaßen, eine Variable namens x, die sie umbenennen wollten, ein leicht inkonsistenter Stil zwischen zwei Funktionen, 20 Minuten auseinander geschrieben.

Wir laufen einen LLM-Judge-Pass über die finale Submission der Kandidatin mit einer Frage: sieht das aus, als hätte eine Person es geschrieben, von Anfang bis Ende? Häufige Red Flags:

Kommentare, die trivialen Code in Lehrbuch-Prosa erklären
Plötzliche Idiom-Upgrades (rohe for-Loops in einer Funktion, elegante Comprehensions in der nächsten)
Defensives Error-Handling für Cases, die die Kandidatin nie testete

Signal 3: Question-to-Keystroke-Latenz

Wenn eine Kandidatin ein Problem liest und innerhalb von 8 Sekunden eine funktionierende Lösung zu tippen beginnt, denkt sie nicht — sie transkribiert. Wir messen Time-to-First-Meaningful-Keystroke und flaggen alles unplausibel schnell für die Schwierigkeit des Problems.

Was dagegen tun

Detection ist die halbe Antwort. Die andere Hälfte ist Interview-Design, das KI-Nutzung weniger nützlich macht:

Stelle Folgefragen live. "Warum hast du hier eine Hash-Map gewählt? Was passiert, wenn der Input sortiert ist?" Eine LLM-eingefügte Lösung hat eine Besitzerin, die nicht antworten kann.
Nutze Probleme mit neuartigen Constraints. Standard-LeetCode ist im Training-Set. Ein kleiner Twist — eine Custom-Datenform, eine ungewöhnliche Cost-Funktion — erzwingt echtes Denken.
Kombiniere Async mit Live. Ein 30-minütiges Live-Follow-up auf die Take-Home-Submission ist das einzige signalstärkste Interview, das die meisten Teams nicht fahren.

Modernes Hiring ist nicht anti-KI. Es ist anti-Fake. Kandidatinnen, die KI gut und transparent nutzen, sind genau die Leute, die du hiren willst. Das Ziel ist sicherzustellen, dass sie auch die Leute sind, die auftauchen.

chatgptki-cheatingcoding-interviewscheat-detection

Wie man ChatGPT-Nutzung in Coding-Interviews erkennt

Die neue Baseline: jede Kandidatin hat ChatGPT offen

Signal 1: Keystroke-Rhythmus, der nicht zu menschlicher Autorenschaft passt

Signal 2: Code-Kohärenz bricht

Signal 3: Question-to-Keystroke-Latenz

Was dagegen tun

Verwandte Artikel

Keystroke-Biometrie im Hiring: Wie es funktioniert und warum es wichtig ist

Gesichts-Kontinuitäts-Checks: Kandidatinnen-Identität verifizieren, ohne Biometrie zu speichern

10 Interview-Betrug-Warnzeichen, die jeder Recruiter kennen sollte