構造化行動面接:研究が実際に述べていること
見出しの知見
構造化行動面接は、非構造化面接の約2倍の精度で仕事上のパフォーマンスを予測します。これはわずかな効果ではありません。70年以上の産業心理学研究で最も大きく、最も一貫した知見の1つです。
妥当性係数の観点での数値(0~1の範囲、高いほどより予測的):
- 非構造化面接:~0.20
- 構造化行動面接:~0.45
- 認知能力の組み合わせ+構造化面接:~0.65
比較すると、その0.45はワークサンプルテストと同じくらいであり、経験ベースのスクリーニング、参照チェック、または年数の経験よりも意味があります。より広い採用方法の比較については、予測妥当性研究の要約を参照してください。
研究で「構造化」とは何を意味するか
0.4~0.5の妥当性数値を生成する研究は、特定の設計特性を共有しています。重要なものは:
- 同じ質問、同じ順序。 すべての候補者は同じプロンプトを取得します。
- アンカー付き評価スケール。 各回答は、事前に書かれた行動例に対して採点されます。各評価レベルが何に見えるか(BARS)。
- デブリーフ前のスコアリング。 面接官はパネルが候補者を議論する前に彼らのスコアをコミットします。
- 職務関連の力量。 質問は、ロールが必要とする特定の力量にマップされます。
これらの特性のいずれかをドロップする研究は、より低い妥当性を示しており、時には非構造化のベースラインに戻ることさえあります。フォーマット自体は十分ではありません。規律がシグナルを生成するものです。実装版については、設計ガイドを参照してください。
非構造化面接がこんなに弱いのはなぜか
非構造化面接は、わずかにあまり予測的ではありません。よく知られた認知バイアスによって支配されています:
- 第一印象の加重。 面接官は、最初の4~5分以内に採用/不採用の判断を下し、その後、インタビューの残りの確認を求めていると報告しています。
- 類似性バイアス。 面接官に似ている候補者(背景、コミュニケーションスタイル、趣味)は体系的にレーティングが高くなります。
- 記憶の歪み。 面接後にスコアを求められると、面接官は面接官は回収するのではなく再構築します。彼らは彼らの腹感に適合する瞬間を覚えています。残りを忘れてください。
- ハロー効果。 1つの次元(自信、通信)での強い印象は、無関係な次元(技術的スキル、判断)へのレーティングに出血します。
構造はこれらのバイアスを排除しません。それはそれらを含みます。同じ順序での同じ質問は、「バイブ」がどのくらい結果を変えることができるかを制限します。デブリーフ前のスコアリングは、部屋の上級者が他の全員を固定するのを防ぎます。アンカー付きスケールは「5中3」を面接官がその瞬間に感じるものを意味するのを防ぎます。
多様性の知見
構造化面接はまた、結果における人口統計学的グループの差を減らします。2022年のサケットら。メタ分析は、構造化面接が非構造化面接よりも小さな悪影響率を示すことを発見しました。つまり、構造化されたインタビューでは、人口統計学的グループ間での採用率がより類似しています。
メカニズムは簡単です:バイアスは自由度の機能です。すべての候補者が同じ質問で尋ねられ、同じルーブリックで採点される場合、バイアスが作用する判断の種類のための余地は少なくなります。これは、構造化面接がEEOCおよび大ほとんどの管轄区域の同等の機関によって推奨される理由の1つです。
また注目する価値があります:構造化面接は、それ自体でフェアネスを作成しません。バイアスの1つのソースを減らします。他のソース(ソーシング、JD言語、リクルーター画面)は残り、独自のコントロールが必要です。
構造化行動面接が過小信頼される場所
正直な部分。よく設計された構造化行動ラウンドでも、限界があります:
- 言語流暢さの混同。 行動面接は、仕事についての一貫したストーリーを伝えることができる候補者に報酬を与えます。いくつかの優れたエンジニアと運営者は、彼ら自身の実際の仕事が強いときでもこのフォーマットで苦労しています。ワークサンプルで行動をペアにして補正します。
- 記憶とリハーサル。 多くのインタビューを行った候補者は、既製のSTARストーリーを持っています。リハーサルされた回答を実際のものから区別することは、研究文献が認識するよりも難しいです。
- 文化と言語の適合。 STAR形式は、一部の文化とコミュニケーションスタイルではより自然です。プロービングスキルが重要です。同じ答え、面接官がフォローアップを尋ねるかどうかに応じて3または5でスコアを付けることができます。
救済策は、「構造化面接を放棄する」ではありません。妥当性はあまりにも確立されています。それらは:構造化行動を少なくとも1つの他の方法(ワークサンプル、認知テスト、技術面接)と組み合わせ、プロービングでトレーニング面接官、採用サイクルを通じてルーブリックドリフトを見守ります。
実践的な意味
あなたが真摯に研究を取ったら、意味は:
- 行動ラウンドはハイレバレッジです。 これは、意味のあるあなたのヒット率を移動する数少ないインタビュー形式の1つです。
- 実際に構造化されている場合にのみ機能します。 行動質問は十分ではありません。同じ質問、アンカー付きスケール、デブリーフ前のスコアリング。
- それを別の方法と組み合わせます。 構造化行動プラス構造化技術(またはワークサンプル)は、最も高い公開妥当性を持つ構成です。最高妥当性の採用ループ説明を参照してください。
- 四半期ごとに調整します。 ドリフトは実在します。紙のルーブリックは、面接官が使用をやめるまで何もしません。
設計ガイドと質問の例は、実装側をカバーしています。研究はこの仕事をする理由です。フォーマットは採用で証拠ベースが実際にサポートするいくつかのものの1つです。
ソース
- シュミット、FL&ハンター、JE(1998年)。人事心理学における選択方法の妥当性と有用性:85年の研究知見の実践的および理論的含意。心理学速報、124(2)、262–274。
- サケット、PR、張、C、ベリー、CM&リーベンス、F(2022)。個人選択における妥当性のメタ分析推定の再検討:範囲制限の系統的過剰補正に対処。応用心理学ジャーナル、107(11)、2040–2068。
- マクダニエル、MA、ウェッツェル、DL、シュミット、FL&マウラー、SD(1994年)。雇用面接の妥当性:包括的なレビューとメタ分析。応用心理学ジャーナル、79(4)、599–616。