採用方法の予測妥当性:研究が実際に述べていること
「予測妥当性」が唯一重要な理由
予測妥当性は、0~1の係数rで表現された相関です。評価スコアと後の仕事上のパフォーマンスの間の相関。rの0.0はコイン投げです。0.5のrは真に有用です。0.7のrはノイジーな現実世界の環境で測定できる天井に近づいています。
ほぼすべての採用議論 — 「テイクホームを追加すべきか?」、「性格テストは価値があるか?」、「履歴書スクリーン壊れているか?」 — 妥当性数値を持ったら1つの質問に崩壊します:この方法は本当に強いパフォーマーが誰であるかを予測しますか?
この投稿はその文献の短く、権威的なバージョンです。
最初のソース
数十年間、参照はシュミットとハンターの1998年メタ分析でした。「人事心理学における選択方法の妥当性と有用性」は、約85年間の蓄積研究を統合しました。それは予測者とその一般的な精神能力テストを超えた増分貢献をランク付けしました。
2022年、サケット、張、ベリー、リーベンスは、以前の研究が範囲制限について過剰補正し、チャートのトップを膨らませていると主張する主要な補正(「個人選択における妥当性のメタ分析推定を再検討する」)を発表しました。彼らの再推定は、ほとんどの方法を下方に引き、順序付けをほぼそのまま残します。
以下の数値は、覚えやすく四捨五入された修正推定値です。それらを相対ランキングとして読んでください。福音ではなく。
すべての人が知るべきチャート
| 方法 | 約妥当性(r) |
|---|---|
| ワークサンプルテスト | 0.33 |
| 構造化面接 | 0.42 |
| 認知能力テスト | 0.31 |
| 完全性テスト | 0.31 |
| 職務知識テスト | 0.40 |
| 誠実さ(性格) | 0.19 |
| 非構造化面接 | 0.19 |
| 教育の年 | 0.10 |
| 経験年数 | 0.09 |
| リファレンスチェック | 0.13 |
| グラフォロジー/筆跡 | 0.02 |
いくつかのことが目立ちます:
- 構造化面接とワークサンプルがトップです。 共に、防衛可能な採用ループの負荷軸受ピラーです。
- 非構造化面接 — ほとんどのチームがデフォルトになるもの — 教育と経験をほぼ打ちます。 「彼らに会い、彼らは素晴らしい」はほぼコイン投げです。
- 参照チェックは弱いです。 それらは勝者を選ぶために災害を除外するのに有用です。
ランキングが実装的に意味すること
3つの意味、ほとんどのチームが不十分に内在化:
1。構造は長さを打つ
アンカー付き評価スケールを備えた30分の構造化面接は、90分の「あなたについて教えてください」会話より優れています。構造 — 同じ質問、同じルーブリック、同じ次元 — 時間投資よりも多く仕事をします。
2。ワークサンプルは最高のレバレッジの単一の追加です
ほとんどのループはいくつかのインタビューのフレーバーを含みます。はるかに少なくなります。よく設計されたワークサンプルを含みます。1つを追加すると、通常、利用可能な最大の妥当性ジャンプであり、それは直接ジョブをサンプルするため、より法的に防衛可能です。
3。認知テストは機能しますが、悪影響があります
認知能力テストは、役割全体でパフォーマンスを合理的に予測します。また、ワークサンプルよりも大きな人口統計学的スコアギャップを生成する傾向があります。これが最も現代的な採用ガイダンスが可能な場合、ジョブコンテンツ評価を好む理由です。
「権威的なソース」 — さらに読むために
一次ソースを望む実務家のために、3つを知ることは:
- シュミット、FL&ハンター、JE(1998年)。 人事心理学における選択方法の妥当性と有用性:85年の研究知見の実践的および理論的含意。 心理学速報、124(2)、262–274。
- サケット、PR、張、C、ベリー、CM&リーベンス、F(2022年)。 個人選択における妥当性のメタ分析推定を再検討:範囲制限の系統的過剰補正に対処。 応用心理学ジャーナル、107(11)、2040–2068。
- SIOPの原則(産業および組織心理学会)— 検証と公平性に関する実務家向けガイダンス。
サケット2022年の論文は、最も現在の権威的なソースです。採用設計ドキュメントで1つの数字を引用する場合は、そこから引用します。
ループにとってこれが意味すること
最短防衛可能な推奨:
- ワークサンプルを追加します。3時間以内に代表的なタスクを設計できるロール。
- すべてのインタビューを構造化面接]にする — 同じ質問、同じルーブリック、推奨の前に収集されたスコア。
- 非構造化「バイブチェック」ラウンドを社会的な予測的として扱います。 それらを短くしておき、低く加重します。
- リファレンスチェックをゴー/ノーゴー決定から削除します。 最終的な理性チェック層として使用してください。
その単一の変更セットは、予測されるrで典型的なループを0.2秒から0.5秒に移動します。1年の採用上の複合効果は膨大です。
ClarityHireがどのように適合するか
ClarityHireはこの優先順位ですべての周りに構築されます。デフォルトスコアカードテンプレートは構造化されています。評価テンプレートは琐事ではなく、仕事のサンプルの形をしています。完全性シグナルは、AI支援の世界でテイクホームワークサンプルを正直に保ちます。製品の見方は、研究から下流です。逆ではなく。
妥当性で方法を選びます。他はすべてスタイルです。