Hoe te beoordeel DevOps engineers vaardigheden: methodologie & rubric
DevOps beoordeling fout
meest teams beoordeel DevOps kandidaten manier zij beoordeel software engineers: codering oefeningen. maar DevOps is niet primair over codering. het is over systeme denken, handel-af oordeel en operationeel veerkrachtigheid.
een kandidaat kan schrijven mooie Terraform en falen catastrofaal als database pagina's middernacht. conversely, kandidaat met vlekkerig code kan architectuur systeem dat overleeft gehele zone mislukking met nul handbediening interventie.
je moet ander raamwerk.
wat DevOps vaardigheden eigenlijk voorspel jobprestatie
1. systeme denken en faal mode redenering
kunnen zij naam faal modes? kunnen zij ontwerp voor hen proactief?
wat naar beoordeel: geef hun eenvoudig architectuur (web app praten naar RDS) en vraag: "wat breken hier? wat is blak straal? hoe doen jij verminderen?" niet vraag hun naar ontwerp Netflix. vraag hen naar harden basis setup.
goed antwoord: "RDS is enkelvoudige punt mislukking. ik zou voeg lees replica's voor failover en verbinding pool naar voorkomen verbinding uitputting. app zelf moet zijn staatloos en loadbalanced. ik zou voeg circuit breaker voor database."
zwak antwoord: "gebruik Kubernetes."
2. operationeel pragmatism
doen zij kies enkelvoudige oplossing dat eigenlijk werk? of doen zij bereik naar fanciest gereedschap?
wat naar beoordeel: "je nodig naar voering dagelijks backup job. je hebben twee opties: Kubernetes CronJob of Lambda. je team hebben geen bestaande Kubernetes. praat door handel-af's."
goed antwoord: "Lambda eenvoudiger naar exploiteer als je niet al voering Kubernetes. minder bewegende stukken, gemakkelijker naar debug, CloudWatch integratie ingebouwd. handel-af is 15-minuten timeout en koud start latency, wat niet zaak naar backup. ik zou gebruiken Lambda."
zwak antwoord: "altijd gebruiken Kubernetes omdat het meer draagbaar."
3. waarneembaarheid en debuggen
kunnen zij ontwerp monitoring? kunnen zij volgen problem vanuit waarschuwen naar root oorzaak?
wat naar beoordeel: live codering interviews niet toepassing hier. liever, geef hun producten waarschuwen: "CPU op 80% op je Postgres instance. kijkt willekeurig. diagnostisch?" vraag hun naar verhaal: wat query gereedschappen zij gebruiken, wat zij controleren, in wat volgorde?
goed antwoord: "allereerst, ik zou controleer pg_stat_statements naar langzaamste queries, toen controleer of correlaat met specifieke applicatie eindpunt, toen kijk naar index statistiek naar zie of index mist of bloated."
4. automatisering oordeel
wanneer moet iets geautomatiseerd versus handmatig?
wat naar beoordeel: "je implementeren 20 maal per dag, maar database migratie gebeuren alleen eens week. moet je automatiseer migratie zelfde manier als implementeren?"
goed antwoord: "nee. automatisering verminderen cognitief laad wanneer operatie frequent en laag-risico. migratie zijn infrequent en hoog-risico — je willen menselijk naar review en goedkeuren voordat voering en je willen droog-voering eerste."
zwak antwoord: "automatiseer alles."
5. wolk architectuur handel-af's
AWS versus Azure versus GCP niet over kenmerken — het over operatie's en kosten.
wat naar beoordeel: huidige scenario en vraag naar voordeel-nadeel uitsplitsing. "je bouw microservices platform. moet je gebruiken beheerd Kubernetes (EKS/AKS/GKE) of zelf-beheerd?"
ideaal, zij zeggen: "beheerd beter voor klein naar gemiddeld teams. het handvat controle vliegtuig, update's en netwerken voor je. handel-af is minder controle en iets hoger kosten. zelf-beheerd beter als je hebben dedicated team en specifieke netwerk vereisten."
beoordeling structuur
deel 1: take-home scenario (2 uren)
verstrek architectuur diagram of Terraform codebase met opzettelijk gaten of veiligheid kwesties. vraag:
- identificeer problemen
- stel fixes voor met handel-af analyse
- schets monitoring strategie naar dit systeem
dit async-vriendelijk en test kennis op schaal.
deel 2: live troubleshot (45 minuten)
scenario: producent latency spike. doorloop hoe je zou debug het.
kandidaat praat; je luisteren. je test:
- systematische benadering (niet raden)
- kennis waarneembaarheidgereedschappen
- prioritering (waar naar kijk eerst)
- communicatie (kunnen zij leg uit hun denking)
deel 3: architectuur gesprek (30 minuten)
present beperking of vereiste. "we nodig naar migreer 50TB van gegevens in nieuw database met nul downtime. wat is je benadering?"
dit test oordeel en pragmatism. er is geen juist antwoord — je luisteren naar redenering over blak straal, rollback plannen en operationeel complexiteit.
rubric: scoren raamwerk
| vaardigheid | niveau 1 (onder) | niveau 2 (ontmoeting) | niveau 3 (overtref) |
|---|---|---|---|
| faal mode redenering | naam duidelijk kwesties alleen | denk 2-3 lagen diep (primair faal en cascading) | anticipeer rand gevallen en blak straal |
| automatisering oordeel | automatiseer indiscriminately | kies juist gereedschap naar frequentie/risico | ontwerp automatisering met expliciet rollback en veiligheid gate's |
| waarneembaarheid | kennis basis metrieken; denk logs zijn naar debuggen | instrument naar beide monitoring en debuggen; begrijpen cardinality | ontwerp waarneembaarheid naar on-call ervaring; correleert signalen |
| kosten bewustzijn | negeer kosten; voorkeuren "meer krachtig" | evenwicht prestatie versus kosten in beperking | stel kosten optimalisatie voor zonder veiligheid offerend |
| systeem ontwerp | enkelvoudige punt mislukking; geen backup plan | voeg redundantie waar nodig; begrijpen RPO/RTO | ontwerp multi-regio of multi-wolk met duidelijk failover |
wat naar vermijd
niet:
- vraag DevOps kandidaten naar los LeetCode problemen. (zij score goed maar niet voorspel ter plaatse prestatie.)
- behandel DevOps als "software engineering lite." (het ander vaardigheid set.)
- focus op gereedschapp breedte. (Kubernetes kennis niet voorspel of zij kunnen exploiteer alles elke.)
- negeer live interviews. (praat door problem onthul hun redenering.)
doen:
- present realistisch constraint's. (budget limieten, tijd naar markt, team grootte.)
- test oordeel, niet feiten. (kunnen zij leg uit waarom zij koos Terraform over CloudFormation?)
- record hun uitleg's. (async troubleshot oefening's niet oppervlak redenering; live doet.)
DevOps aanneem schaal
als je aanneem 5+ DevOps engineers, gebruik gestructureerd beoordeling proces met dit rubric. sjabloon uit scenario's eenmaal, hergebruik hen en vergelijk resultaten over kandidaten. consistentie verbeteren signaal.
naar diepere vaardigheid-specifieke beoordelingen, verkennen AWS versus Azure versus GCP test raamwerken naar oppervlak wolk-specifieke gaten.