About

Taeji Kim
SRE / DevSecOps Engineer
AWS, Kubernetes, IaC, CI/CD, Observability, Security 영역을 함께 다루며 운영 가능한 플랫폼과 반복 가능한 인프라를 만드는 데 집중합니다. 장애 대응과 RCA, 자동화, 비용 최적화, 인증/인가 체계 개선 경험을 기반으로 서비스 신뢰성과 운영 효율을 높이는 일을 지향합니다.
Profile
Cloud Native 환경에서 운영, 배포, 보안, 관측 가능성을 연결해 서비스 신뢰성을 개선하는 엔지니어입니다. 현재는 번개장터에서 서비스 운영 및 고도화를 담당하며, EKS Upgrade, Terraform 모듈화, AWS 인프라 프로비저닝, Grafana / Datadog Dashboard, Packer 기반 Golden Image 자동화, 사내 장애대응 AI Agent, 백신 PoC, AWS 인증 방식 전환 등 운영 플랫폼의 안정성과 보안성을 개선하고 있습니다.
Skill Set
- AWS
- EC2
- EKS
- ECS
- ECR
- RDS
- VPC
- Route 53
- CloudFront
- CloudWatch
- Lambda
- API Gateway
- WAF
- Kubernetes
- EKS
- Helm
- Karpenter
- HPA
- IRSA
- Cilium
- Hubble
- Gateway API
- Envoy
- Terraform
- HCP Terraform
- Packer
- Jenkins
- GitHub Actions
- Argo CD
- Prometheus
- Grafana
- Datadog
- Thanos
- ELK
- CloudWatch Logs
- InfluxDB
- Apache Superset
- Keycloak
- SSO
- RBAC
- AWS IAM
- Secrets Manager
- Parameter Store
- External Secrets
- ClamAV
- Python
- Go
- Java
- Spring Boot
- Streamlit
- React
- Ubuntu
- Amazon Linux
- CentOS
- Docker
Careers
Bunjang / DevSecOps Engineer
2025.11 ~ 현재- 번개장터 서비스 운영 및 고도화
- EKS Upgrade 진행: Kubernetes 1.32 이상
- Terraform 모듈화 및 AWS 인프라 프로비저닝
- Grafana, Datadog Dashboards 구성
- ClamAV 서버 백신 PoC 및 도입
- Packer 도입 및 Golden Image 생성 자동화
- 사내 장애대응 AI Agent 개발 및 도입
- Security Group Outbound Rule 최적화
- AWS 인증 방식 전환: Access Key 제거
Warepoint / Technical Architect
2024.12 ~ 2025.10- Samsung Galaxy Chatting Plus (RCS) 서비스 운영
- AWS Infra 구축 및 운영, Terraform 기반 IaC 적용
- EKS Cluster 운영 및 업그레이드
- 서비스 장애 대응 및 근본 원인 분석(RCA) 가이드 작성
- GitHub Actions Matrix Strategy 도입으로 Multi-Architecture Container Image Build 시간 50% 이상 단축
- Apache Superset 구축, PoC, 운영
- Keycloak SSO + RBAC 적용: Grafana, Argo CD, Apache Superset
- InfluxDB(TSDB) 마이그레이션: Amazon Linux 2 → Ubuntu, EoS 대응
- Open-source Software 버전 업그레이드: Grafana, Prometheus, Thanos, External Secrets
Open-source Contributions
불필요한 리소스 생성을 제어할 수 있도록 dcgmExporter.enabled, neuronMonitor.enabled Flag 추가
README 내 깨진 Documentation Link 19개 수정. v1.35.0 Release New Contributors 항목 등재
Projects
KubeRCA
2025.11 ~ 현재AI 기반 Kubernetes 장애 분석 및 RCA 자동화 플랫폼
- AI Agent 기반 Kubernetes 장애 분석 및 근본 원인(Root Cause) 자동 추론
- Dashboard 기반 Alert / Incident History 관리 기능 제공
- Chaos Mesh 기반 장애 시나리오 주입 및 검증 환경 구성
- Prometheus / Tempo / Grafana 기반 Metric · Trace 통합 관측
- Istio Service Mesh 환경에서 트래픽 / 정책 데이터 활용
- Python
- Strands Agents
- Kubernetes
- Istio
- Prometheus
- Tempo
- Grafana
- Chaos Mesh
Home Sweet Home
2025.04청년 주택청약 알리미 Web App · Students @ AI - Seoul Hackathon Winner
- Streamlit 기반 사용자 Frontend UI 개발
- Bedrock Knowledge Base 기반 특정 청약 정보의 대화형 조회 구현
- 로그 모니터링 기반 트러블슈팅
- Streamlit
- AWS Bedrock
- Knowledge Base
Remember Me
2024.11 ~ 2024.12서버리스(AWS Lambda) 기반 영단어 암기 Web App
- Terraform(HCP Terraform) 기반 Cloud Infra IaC
- Lambda CI/CD Pipeline 구축
- CloudWatch Logs Subscription Filters + ELK Stack 기반 Lambda Logs 중앙화
- AWS Budgets, WAF Rule Event Slack Alarm 연동
- Secrets Manager, Parameter Store 기반 시크릿 및 환경변수 관리
- AWS Lambda
- Terraform
- ELK Stack
- WAF
- Secrets Manager
Weasel
2024.07 ~ 2024.08EKS / Bedrock 기반 문제 풀이 Web App
- Team Lead 및 Cloud Infra 설계, 구축, 운영
- Terraform(HCP Terraform) 기반 Cloud Infra IaC
- Jenkins / Argo CD 기반 Spring Boot Application CI/CD Pipeline 구축
- EKS Autoscaling: Karpenter, HPA 적용
- IRSA 기반 Pod 단위 IAM 권한 제어
- Spot Instance, NAT Instance, VPC CNI maxPods 튜닝을 통한 비용 최적화
- Prometheus, Grafana 기반 EKS 모니터링 구성
- Spring Boot
- React
- EKS
- RDS(MySQL)
- Terraform
- Jenkins
- Argo CD
- Karpenter
- Prometheus
- Grafana
- Bedrock (Claude 3.5)
Amazon Photo Query
2024.01 ~ 2024.03AI 기반 사진 앨범 서비스 (MSA · 3-Tier Architecture)
- AWS 클라우드 상에서 MSA, 3-Tier Architecture 기반 구축 및 배포
- Cloud Architecture 설계, AWS 인프라 구축 및 운영
- CI/CD Pipeline 구축, ERD 구축 및 운영
- EKS 모니터링 및 비용 추적
- 이미지 CRUD, 북마크, 태그 기능 개발 및 배포
- S3, DynamoDB Public Access 차단 이후 Access Deny 문제를 IRSA 적용으로 해결
- 이미지 리사이징 Lambda 분리, Global Accelerator 도입, Goroutine 병렬 처리로 이미지 업로드 API 응답 시간을 5분 이상에서 1분 미만으로 단축
- Go
- EKS
- ECR
- RDS(MySQL)
- DynamoDB
- DocumentDB
- Karpenter
- Jenkins
- Argo CD
- Prometheus
- Grafana
- Terraform
- SNS / SQS
Personal Projects
수동/반복 작업의 편의성을 높이기 위해 CLI Tool과 Web App을 직접 개발하고 운영하고 있습니다.
SSH Config 파일의 설정을 기반으로 동작하는 서버 접근 관리 Tool
AWS CLI 사용에 적용되는 Default Profile 전환 Tool
Kubernetes Cluster Monitoring CLI Tool
AWS 리소스를 수집 및 정리해 Excel / JSON으로 내보내는 Tool
정규식 패턴으로 기존 로그를 제외하고 신규 패턴 로그만 추출하는 Tool
이미지 확장자 변환, 리사이즈, 압축을 제공하는 Web App
Route53 가중치 vs 실제 DNS 응답 분포 실시간 비교 및 전파 추적 CLI
crane 기반 외부 레지스트리 → Private ECR 미러링 CLI (병렬 / 플랫폼 선택)
EKS 토큰 캐싱으로 kubectl 응답 지연 제거
Git bare repo 기반 worktree 일괄 관리 CLI
OpenAPI / Swagger 기반 GET endpoint 자동 수집 후 고정 TPS 부하 도구
AWS 도메인 패턴으로 연결된 리소스를 한 번에 추적
GitHub / Bitbucket PR 페이지를 CLI에서 바로 열기
kube-pick, kubeconfig-cleaner / merger, kubectx-kubens shell 함수 모음
Certifications
Education
중원대학교 / 컴퓨터공학과 학사
2018.02 ~ 2023.08- Sorting Algorithm 성능 측정 및 비교분석, 지도교수: 백승훈
- J-Smart, 교수역량진단시스템 사업 참여, 학생대표
- 데이터베이스 강의 보조 활동
- GPA: 4.40 / 4.5, 수석 졸업
Training & Study
Cilium 공식 문서 핸즈온 스터디 1기 / CloudNet@
2025.07 ~ 2025.08Cloud Native 네트워킹 심화 스터디
- eBPF, Cilium 기반 Kubernetes DataPath 이해 및 L3 / L4 / L7 Network Policy 설계
- Routing Mode: Encapsulation(VXLAN / GENEVE) vs Native Routing 구조 및 Trade-off 비교
- Cluster Mesh: Multi-Cluster Service Discovery, 통신, Identity 이해
- Service Mesh 연계: Ingress / Gateway API + Envoy 기반 TLS, L7 Traffic 처리
- Hubble 활용: Flow, Service Map, DNS / HTTP 가시성 기반 Policy Miss 및 차단 Traffic Troubleshooting
AWS Cloud School 1기 / 한국전파진흥협회
2023.08 ~ 2024.03Cloud & DevOps 교육과정
- Network, Linux, Docker, Kubernetes, Jenkins, Argo CD, AWS 학습
- 교육과정 내 공지 게시판 개발
- AI & Cloud 기반 앨범 서비스 Photo Query 팀 프로젝트 참여: Kubernetes 운영, Go Backend 개발
Rising Camp Plus 백엔드과정 1기 / 소프트스퀘어드
2023.07 ~ 2023.09Java Backend 교육과정
- Java, Spring Boot, JPA, MySQL, Git 학습
- Spring Boot 기반 채용사이트 개발 팀 프로젝트 참여
Awards
- Fastfive x AWS Frugality Fest GameDay - Winner 2025.04
- Students @ AI - Seoul Hackathon - Winner 2025.04
- AWS PS GameDay (GenAI) - 5th Place 2024.08
- AWS x RAPA DevOps Jam - Runner-up, 2nd Place 2023.12
Activities
- SpeakerAWS KRUG 마곡 소모임 - EKS Pod Identity로 더 간편하게 Kubernetes 서비스 권한 관리하기 2026.04
- SpeakerRAPA x AWS Cloud School 커리어 세션 - AWS Cloud School 그리고 그 다음 이야기 2026.01
- SpeakerCloud Native Korea Community Day 2025 - ArgoCD와 함께하는 Multi-Cluster 운영 2025.09
- Dive 2025 Global Data Hackathon, 부산항만공사 2025.08
- Mentor / StaffAWS Cloud School 8기 - Amazon Working Backwards 2025.06
- Staff2025 경기창고 개회식 2025.05
- Staff2024 충남대학교 커스텀 GPT 프롬프톤 2024.08
- Mentor / Staff서울디지텍고등학교 - Amazon Working Backwards 2024.08
- Mentor / Staff부산일과학고 AWS Cloud 실습 및 활용 2024.07
- AWS PS GameDay (GenAI) 참가 2024.07
- Speaker제2회 AWS 강의실 온라인 세미나 - MicroK8s Cluster 구축하기 2024.06
- AWS Summit Seoul 2024 참여 2024.05
- AWS Student Community Day 2024 참여 2024.04
- Wanted Backend Challenge - AWS를 활용한 시스템 아키텍처 참여 2024.03
- Advanced Architecting on AWS 수료 2023.12
- DevOps Engineering on AWS 수료 2023.12
- Developing on AWS 수료 2023.12
- AWS Well-Architected Best Practices 수료 2023.11
- AWS Community Day 2023 참여 2023.10
- AWS Security Essentials 수료 2023.10
- AWS Cloud Practitioner Essentials 수료 2023.10