100장. 다음 단계 — 기초 이후 어디로 갈 것인가
마무리하며
여기까지 왔다.
- 클라우드와 온프레미스의 차이에서 시작해
- VPC · EC2 · ALB · CloudFront 같은 인프라의 부품을 익히고
- 컨테이너와 ECS로 옮겨가
- DB · 캐시 · 메시징으로 데이터와 통신을 다루고
- IAM · KMS · Secrets Manager 로 보안을 깔고
- CloudWatch · X-Ray · CloudTrail 로 관측성을 갖추고
- IaC · CI/CD · 배포 전략으로 자동화하고
- 마지막으로 마이크로서비스 한 벌을 그렸다.
이 책은 “AWS의 모든 것” 을 다루지 않았다.
대신
실전 마이크로서비스를 처음부터 끝까지 운영하기 위한 한 묶음
을 다뤘다.
1. 다음 단계 — 같은 책의 다른 깊이
각 단원에는 한 권의 책이 따로 있다.
지금부터는 필요에 따라 깊이 들어간다.
네트워크
- Transit Gateway · 멀티 VPC 설계
- Direct Connect · 글로벌 백본
- Network Firewall · Resolver DNS
컨테이너
- EKS 본격 운영 (Helm · Argo · Karpenter)
- Service Mesh (App Mesh · Istio · Linkerd)
- Multi-cluster 운영
데이터
- DynamoDB 단일 테이블 설계 심화
- Aurora Global Database · DSQL
- OpenSearch · Athena · Glue · Redshift
- Kinesis · Kafka (MSK)
보안
- AWS Control Tower · 멀티 계정 거버넌스
- IAM Identity Center (SSO)
- Macie · Inspector · Detective
- PCI · ISO · SOC2 준수 설계
관측성
- OpenTelemetry 본격 도입
- Datadog · Honeycomb · New Relic 같은 외부 도구
- SLO 기반 알람 + Error Budget
자동화
- CDK / Pulumi (코드로 IaC)
- GitOps (Argo CD · Flux)
- Policy as Code (OPA · Sentinel · Checkov)
비용
- Cost Explorer · Cost and Usage Report 분석
- Savings Plans · RI · Spot 혼합 설계
- FinOps 도입
2. 서비스가 자랐을 때 — 진화의 길
Phase 1: 모놀리스 한 대
Phase 2: 도메인 3~5개 마이크로서비스
Phase 3: 비동기 메시징 본격 도입
Phase 4: 멀티 리전 · 글로벌
Phase 5: 데이터 플랫폼 (분석 · ML)
Phase 6: 멀티 클라우드 또는 하이브리드
이 책은 Phase 1 → 2 → 3 까지를 다뤘다.
각 다음 단계는
- 거대한 학습 곡선
- 새로운 도구
- 새로운 운영 패턴
을 가져온다.
그 모든 출발선이 지금까지 본 척추다.
3. 사람과 조직의 변화
기술만큼 중요한 게 사람과 운영 방식이다.
한 사람 → 여러 명 → 여러 팀 → 여러 조직
이 변화에는 다음이 필요해진다.
- 온콜 (On-call) 체계 — PagerDuty · Opsgenie
- Runbook · Postmortem 문화
- DevOps · SRE 분리 (필요 시)
- Platform Team (내부 플랫폼을 만드는 팀)
- 변경 관리 · 보안 검토 절차
기술은 사람이 운영한다.
조직이 자라지 않으면 시스템도 자라기 어렵다.
4. 어떤 실수를 가장 자주 하는가
기초 이후 운영에서 자주 보는 실수들.
1. 너무 일찍 마이크로서비스로 쪼갠다
3~5명 팀이 10개 마이크로서비스를 운영하려고 한다. 결국 모놀리스로 되돌아간다.
2. 보안을 나중으로 미룬다
“운영 안정되면 IAM 정리할게요” 가 영원히 미뤄진다. 첫 설계에 보안을 함께 넣는다.
3. 알람만 만들고 Runbook은 없다
울리는데 무엇을 해야 할지 모른다.
4. 복구를 한 번도 안 해본다
백업이 백업으로 동작하는지 모른다.
5. 비용을 보지 않는다
사용자가 늘면 청구서가 따라 늘어난다. 매주 보는 습관이 필요하다.
6. 기술 선택을 유행으로
“K8s가 멋지니까”, “Service Mesh가 멋지니까” — 운영 비용이 더 크다.
5. 학습을 이어가는 자료
AWS 공식
- AWS Well-Architected Framework — 모든 설계의 기준선
- AWS Solutions Architect 자격 — 폭을 다지는 데 좋음
- AWS Blogs · re:Invent 영상
운영
- The Twelve-Factor App — 클라우드 네이티브 앱의 기본
- SRE Book (Google) — 신뢰성 운영의 표준
- Building Microservices (Sam Newman)
- Domain-Driven Design (Eric Evans) — 도메인 분리의 토대
데이터
- Designing Data-Intensive Applications (Martin Kleppmann)
- The DynamoDB Book (Alex DeBrie)
보안
- AWS Security Hub · CIS Benchmark
- OWASP Top 10
6. 잊지 말아야 할 원칙들
이 책 전체를 한 줄씩 추렸을 때 남는 원칙들이다.
1. 단순함이 가장 비싼 자원이다.
2. 자동화되지 않은 절차는 결국 깨진다.
3. 모든 운영 자원은 죽을 수 있다 — 죽어도 살아남게 설계한다.
4. 보안은 마지막 단계가 아니라 첫 단계다.
5. 관측되지 않는 시스템은 운영되지 않는 시스템이다.
6. trace_id 하나가 운영의 절반이다.
7. 한 번도 시험해본 적 없는 복구 절차는 작동하지 않는다.
8. 작은 결합이 큰 사고를 만든다 — 그래서 분리한다.
9. 모든 비용은 누군가의 청구서다 — 운영자가 그 누군가.
10. 진짜 마이크로서비스는 데이터 분리에서 완성된다.
7. 그래서, 이제 무엇을 할까
이 책을 덮고 가장 먼저 권하는 것:
작은 마이크로서비스 한 개를 처음부터 끝까지 띄워본다
- Hello World API 1개
- CloudFront + API Gateway + ALB + ECS Fargate + RDS
- Terraform 으로 IaC
- GitHub Actions 로 CI/CD
- CloudWatch 대시보드 + 알람
규모는 작아도 된다.
한 사이클을 직접 돌려보는 것 이 1~99장의 모든 글보다 큰 학습이 된다.
8. 마지막으로
클라우드는 끝없는 분야다.
하지만 그 모든 흐름의 출발선은 같다.
사용자가 어떻게 우리 시스템에 닿는가 그 데이터는 어디에 있는가 누가 무엇을 할 수 있는가 그것이 잘 동작하는지 어떻게 보는가 잘못됐을 때 어떻게 되돌리는가
이 다섯 질문에 답할 수 있다면
어떤 새 도구가 나와도 자기 자리를 찾는다.
이 책이 그 출발점이 되기를.
책의 한 줄 요약
클라우드는 단순한 서버 임대가 아니다.
운영 가능한 시스템을 만드는 방식이며,
AWS는 그 방식을 부품으로 제공한다.
우리가 한 일은 그 부품들을 한 줄에 세우는 일이었다.