AWS vs Azure vs GCP Skills Тесты: Cloud Platform Assessment Guide
Cloud platform найма проблема
Вам нужен senior DevOps инженер. У вас есть пять отличных кандидатов. Два глубокие AWS; один это Azure-strong; один использует GCP; один это cloud-agnostic но менее операционной глубины.
Кого вы нанимаете? Это зависит. Но большинство команд это получают неправильно: они либо нанимают специфичную платформу и создают lock-in риск, либо они нанимают generalist и открывают платформа знание gap это более глубокая чем ожидается.
Правильный ответ это оценить оба: platform-специфичное операционное знание и transferable системное мышление.
Когда тестировать platform-специфичные навыки
Тест для AWS/Azure/GCP глубины если:
- Ваш existing stack это заблокирован в той платформе
- Ваша потребность найма это углубить expertise в той cloud
- Ваш контракт или требование compliance нужда специфичная cloud
Тест для cloud-agnostic фундамента если:
- Вы это multi-cloud или может быть migrate
- Вы это нанимание для системное мышление over tool mastery
- Кандидат будет работать через платформы
Большинство команд должно тестировать оба: "Могут ли они работать AWS хорошо?" AND "Могут ли они рассуждать об архитектуре platform-независимо?"
AWS assessment фреймворк
Навыки тестировать
-
IAM и security моделирование
- Могут ли они дизайн least-privilege доступ для microservices архитектуры?
- Они понимают SCPs vs. inline политики vs. управляемые политики?
- Могут ли они объяснить почему вы не должны использовать root credentials?
-
Networking и connectivity
- VPC дизайн: subnets, маршрутизация, NACLs, security groups
- Когда использовать direct connect vs. VPN vs. Internet Gateway
- Cross-account или cross-region networking trade-offs
-
Хранение и databases
- EBS оптимизация: gp3 vs. io2, provisioned throughput
- RDS failover и backup стратегии
- S3 lifecycle политики и versioning для data retention
-
Compute масштабирование
- EC2 Auto Scaling Groups vs. Spot Instances
- ECS vs. EKS trade-offs
- Lambda cold start последствия для production workloads
Assessment вопрос примеры
Take-home сценарий:
"Спроектируй систему к ingest 10GB логов в день из 100 EC2 instances, хранить их durably и query их с sub-second latency. Вы имеете бюджет $2,000/месяц. AWS только. Объясни твои choices."
Хороший ответ рассматривает:
- CloudWatch Logs для сбор (управляемый) vs. Firehose + S3 + Athena (стоимость оптимизированный)
- Log retention политики к управлению стоимостью
- Индексирование стратегия (Athena partitioning или Elasticsearch)
- Query паттерны и если sub-second latency это реальная или предполагаемая
Слабый ответ прыгает к Elasticsearch без вопроса если это необходимо.
Live troubleshooting:
"Ваш RDS instance достигнул 80% CPU и ваш auto-scaling ECS tasks не могут соединиться к database в течение 2 минут каждого часа, всегда в же самое время. Проведи меня через как бы ты дебугировал это."
Кандидат должен думать:
- Коррелируйте ECS соединение spikes с RDS загрузкой
- Проверьте для slow queries через Enhanced Monitoring
- Посмотрите для соединение leaks (приложение не закрывая соединения)
- Рассмотрите если что-либо другое работает в то время (backups, reports)
Azure assessment фреймворк
Навыки тестировать
-
Identity и access (Azure AD / Entra)
- Управляемое identity vs. service principals
- Role-based доступ контроль (RBAC) с custom ролей
- Conditional Access политики для security
-
Networking и security
- NSGs, UDRs и peering
- Azure Firewall vs. NVA
- Private endpoints и service endpoints
-
Хранение и compute
- Управляемые disks, premium SSD, ephemeral OS disks
- App Service vs. Container Instances vs. AKS
- Azure SQL failover groups vs. read replicas
-
Observability
- Application Insights vs. Azure Monitor
- Log Analytics queries (KQL)
- Диагностическое settings и retention
Assessment вопрос примеры
Take-home сценарий:
"Вы миграция on-premises приложение к Azure. Приложение нужда fixed IP, имеет strict compliance требования и должно быть изолировано из других tenants. Спроектируй network и identity архитектуру."
Хороший ответ включает:
- Dedicated subnet с NSG rules
- Private endpoint для databases
- Управляемое identity для приложение authentication
- Network политики для трафик контроль
Live разговор:
"Ваш Azure Web App это медленно но Azure Monitor показывает нормальный CPU. Latency spiked после развертывания новый код. Что вы проверьте первым?"
Кандидат должен думать о:
- Application Insights traces и dependencies
- App Service план CPU vs. приложение-уровень bottlenecks
- Code-уровень изменения (новый queries, blocking вызовы)
- Database соединение pooling
- Third-party dependency latency
GCP assessment фреймворк
Навыки тестировать
-
IAM и organization иерархия
- Service accounts и key management
- Custom ролей и least privilege
- Organization политики и constraints
-
Compute и orchestration
- Compute Engine zones и regions
- GKE cluster дизайн и autoscaling
- Cloud Run для serverless workloads
-
Данные и хранение
- Cloud Storage buckets, versioning, lifecycle
- BigQuery для data warehousing
- Cloud SQL и Cloud Spanner failover
-
Observability (Google Cloud Operations)
- Cloud Logging и log маршрутизация
- Cloud Trace и profiling
- Cloud Monitoring и custom метрики
Assessment вопрос примеры
Take-home сценарий:
"Вы имеете batch обработка job, который работает ежедневно на Compute Engine, обрабатывает 1TB данных и берет 2 часа. Вы хотите уменьшить стоимость пока сохраняя SLA. Спроектируй решение."
Хороший ответ может рассмотреть:
- Preemptible VMs (cost-эффективный, приемлемо для batch)
- BigQuery для querying (быстрее чем Compute Engine обработка)
- Cloud Run если parallelizable
- Spot VMs для fault-tolerant workloads
Live отладка:
"Ваш Cloud Run служба это timing out на некоторые requests. Логи это чистый. P99 latency ушёл из 50ms к 2s после deploy. Отследи это."
Кандидат должен думать:
- Проверьте traces для что операция это медленно
- Исследуйте новый dependencies (database, внешний APIs)
- Проверьте database соединение лимиты
- Review memory выделение (Cloud Run нужда больше?)
- Посмотрите для cold start паттерны
Cross-platform assessment (platform-agnostic)
Для кандидатов, которые использовали множество clouds, тест transferable навыки:
Вопрос:
"Вы спроектировали архитектуру систем на AWS и Azure. Какие дизайн паттерны передаются между ними? Что это фундаментально другой?"
Хороший ответ признаёт:
- Core концепты (VPCs, IAM, управляемые databases) это похоже
- Реализация детали отличаются значительно
- Стоимость модели отличаются (reserved instances vs. commitment)
- Learning кривая для каждый платформа это мелкая один раз вы понимаете первый
Это сигнализирует они не dogmatic и может движение между clouds.
Assessment структура для cloud найма
- 30-минутный take-home (platform-специфичный сценарий с constraints)
- 30-минутный live troubleshooting (используйте их платформа expertise)
- 15-минутный архитектура разговор (тест они понимают платформа trade-offs)
Когда нанять multi-cloud vs. platform-specialist
Нанять multi-cloud generalists если:
- Вы миграция между платформы
- Вы нужда гибкость к negotiate vendor термины
- Вы построение portable infrastructure-as-code
Нанять platform-specialists если:
- Ваша платформа решение это заблокирована в
- Вы нужда глубокий операционное знание той платформа's edge cases
- Вы оптимизация стоимости на специфичная cloud
Большинство здоровый инженерные орги нужда оба: несколько глубокие specialists и больше generalists кто может работать через clouds.
Построение справедливо assessments через платформы
Если вы оценка оба AWS и Azure кандидаты, структурируйте ваши вопросы консистентно. Спросите каждый кандидата дизайн же систему, просто на их платформа. Затем сравните: они архитектуры имеют equivalent trade-off мышление? Или один кандидат брал shortcuts?
Готово к построению вашего cloud найма assessment? Исследуйте DevOps и Cloud Engineering ресурсы и как интерпретировать assessment результаты.