About

About

Taeji Kim profile photo

Taeji Kim

SRE / DevSecOps Engineer

AWS, Kubernetes, IaC, CI/CD, Observability, Security 영역을 함께 다루며 운영 가능한 플랫폼과 반복 가능한 인프라를 만드는 데 집중합니다. 장애 대응과 RCA, 자동화, 비용 최적화, 인증/인가 체계 개선 경험을 기반으로 서비스 신뢰성과 운영 효율을 높이는 일을 지향합니다.

Profile

Cloud Native 환경에서 운영, 배포, 보안, 관측 가능성을 연결해 서비스 신뢰성을 개선하는 엔지니어입니다. 현재는 번개장터에서 서비스 운영 및 고도화를 담당하며, EKS Upgrade, Terraform 모듈화, AWS 인프라 프로비저닝, Grafana / Datadog Dashboard, Packer 기반 Golden Image 자동화, 사내 장애대응 AI Agent, 백신 PoC, AWS 인증 방식 전환 등 운영 플랫폼의 안정성과 보안성을 개선하고 있습니다.

Platform Operations
AWS Infra, EKS Upgrade, Terraform IaC, Packer, Golden Image
Reliability
Incident Response, RCA Guide, Grafana, Datadog, AI Agent
Security & Automation
Access Key Removal, Security Group, ClamAV, RBAC, CI/CD

Skill Set

Cloud / Infra
  • AWS
  • EC2
  • EKS
  • ECS
  • ECR
  • RDS
  • VPC
  • Route 53
  • CloudFront
  • CloudWatch
  • Lambda
  • API Gateway
  • WAF
Kubernetes / Platform
  • Kubernetes
  • EKS
  • Helm
  • Karpenter
  • HPA
  • IRSA
  • Cilium
  • Hubble
  • Gateway API
  • Envoy
IaC / CI/CD
  • Terraform
  • HCP Terraform
  • Packer
  • Jenkins
  • GitHub Actions
  • Argo CD
Observability / Data
  • Prometheus
  • Grafana
  • Datadog
  • Thanos
  • ELK
  • CloudWatch Logs
  • InfluxDB
  • Apache Superset
Security / Identity
  • Keycloak
  • SSO
  • RBAC
  • AWS IAM
  • Secrets Manager
  • Parameter Store
  • External Secrets
  • ClamAV
Programming / App
  • Python
  • Go
  • Java
  • Spring Boot
  • Streamlit
  • React
OS / Runtime
  • Ubuntu
  • Amazon Linux
  • CentOS
  • Docker

Careers

  1. Bunjang / DevSecOps Engineer

    2025.11 ~ 현재
    • 번개장터 서비스 운영 및 고도화
    • EKS Upgrade 진행: Kubernetes 1.32 이상
    • Terraform 모듈화 및 AWS 인프라 프로비저닝
    • Grafana, Datadog Dashboards 구성
    • ClamAV 서버 백신 PoC 및 도입
    • Packer 도입 및 Golden Image 생성 자동화
    • 사내 장애대응 AI Agent 개발 및 도입
    • Security Group Outbound Rule 최적화
    • AWS 인증 방식 전환: Access Key 제거
  2. Warepoint / Technical Architect

    2024.12 ~ 2025.10
    • Samsung Galaxy Chatting Plus (RCS) 서비스 운영
    • AWS Infra 구축 및 운영, Terraform 기반 IaC 적용
    • EKS Cluster 운영 및 업그레이드
    • 서비스 장애 대응 및 근본 원인 분석(RCA) 가이드 작성
    • GitHub Actions Matrix Strategy 도입으로 Multi-Architecture Container Image Build 시간 50% 이상 단축
    • Apache Superset 구축, PoC, 운영
    • Keycloak SSO + RBAC 적용: Grafana, Argo CD, Apache Superset
    • InfluxDB(TSDB) 마이그레이션: Amazon Linux 2 → Ubuntu, EoS 대응
    • Open-source Software 버전 업그레이드: Grafana, Prometheus, Thanos, External Secrets

Open-source Contributions

Projects

KubeRCA

2025.11 ~ 현재

Project Lead · AI · Kubernetes · Observability

AI 기반 Kubernetes 장애 분석 및 RCA 자동화 플랫폼

  • AI Agent 기반 Kubernetes 장애 분석 및 근본 원인(Root Cause) 자동 추론
  • Dashboard 기반 Alert / Incident History 관리 기능 제공
  • Chaos Mesh 기반 장애 시나리오 주입 및 검증 환경 구성
  • Prometheus / Tempo / Grafana 기반 Metric · Trace 통합 관측
  • Istio Service Mesh 환경에서 트래픽 / 정책 데이터 활용
  • Python
  • Strands Agents
  • Kubernetes
  • Istio
  • Prometheus
  • Tempo
  • Grafana
  • Chaos Mesh

Home Sweet Home

2025.04

Infra · Frontend · Backend

청년 주택청약 알리미 Web App · Students @ AI - Seoul Hackathon Winner

  • Streamlit 기반 사용자 Frontend UI 개발
  • Bedrock Knowledge Base 기반 특정 청약 정보의 대화형 조회 구현
  • 로그 모니터링 기반 트러블슈팅
  • Streamlit
  • AWS Bedrock
  • Knowledge Base

Remember Me

2024.11 ~ 2024.12

Infra · DevOps Lead

서버리스(AWS Lambda) 기반 영단어 암기 Web App

  • Terraform(HCP Terraform) 기반 Cloud Infra IaC
  • Lambda CI/CD Pipeline 구축
  • CloudWatch Logs Subscription Filters + ELK Stack 기반 Lambda Logs 중앙화
  • AWS Budgets, WAF Rule Event Slack Alarm 연동
  • Secrets Manager, Parameter Store 기반 시크릿 및 환경변수 관리
  • AWS Lambda
  • Terraform
  • ELK Stack
  • WAF
  • Secrets Manager

Weasel

2024.07 ~ 2024.08

Project Lead · Infra Lead

EKS / Bedrock 기반 문제 풀이 Web App

  • Team Lead 및 Cloud Infra 설계, 구축, 운영
  • Terraform(HCP Terraform) 기반 Cloud Infra IaC
  • Jenkins / Argo CD 기반 Spring Boot Application CI/CD Pipeline 구축
  • EKS Autoscaling: Karpenter, HPA 적용
  • IRSA 기반 Pod 단위 IAM 권한 제어
  • Spot Instance, NAT Instance, VPC CNI maxPods 튜닝을 통한 비용 최적화
  • Prometheus, Grafana 기반 EKS 모니터링 구성
  • Spring Boot
  • React
  • EKS
  • RDS(MySQL)
  • Terraform
  • Jenkins
  • Argo CD
  • Karpenter
  • Prometheus
  • Grafana
  • Bedrock (Claude 3.5)

Amazon Photo Query

2024.01 ~ 2024.03

Cloud Architecture · Infra · Backend

AI 기반 사진 앨범 서비스 (MSA · 3-Tier Architecture)

  • AWS 클라우드 상에서 MSA, 3-Tier Architecture 기반 구축 및 배포
  • Cloud Architecture 설계, AWS 인프라 구축 및 운영
  • CI/CD Pipeline 구축, ERD 구축 및 운영
  • EKS 모니터링 및 비용 추적
  • 이미지 CRUD, 북마크, 태그 기능 개발 및 배포
  • S3, DynamoDB Public Access 차단 이후 Access Deny 문제를 IRSA 적용으로 해결
  • 이미지 리사이징 Lambda 분리, Global Accelerator 도입, Goroutine 병렬 처리로 이미지 업로드 API 응답 시간을 5분 이상에서 1분 미만으로 단축
  • Go
  • EKS
  • ECR
  • RDS(MySQL)
  • DynamoDB
  • DocumentDB
  • Karpenter
  • Jenkins
  • Argo CD
  • Prometheus
  • Grafana
  • Terraform
  • SNS / SQS

Personal Projects

수동/반복 작업의 편의성을 높이기 위해 CLI Tool과 Web App을 직접 개발하고 운영하고 있습니다.

Certifications

Terraform Associate (003) HashiCorp · 2025.07
AWS DevOps Engineer - Professional AWS · 2024.12
CKA: Certified Kubernetes Administrator CNCF · 2024.07
AWS Solutions Architect - Associate AWS · 2024.02
정보처리기사 한국산업인력공단 · 2023.09
AWS Cloud Practitioner AWS · 2023.05

Education

  1. 중원대학교 / 컴퓨터공학과 학사

    2018.02 ~ 2023.08
    • Sorting Algorithm 성능 측정 및 비교분석, 지도교수: 백승훈
    • J-Smart, 교수역량진단시스템 사업 참여, 학생대표
    • 데이터베이스 강의 보조 활동
    • GPA: 4.40 / 4.5, 수석 졸업

Training & Study

  1. Cilium 공식 문서 핸즈온 스터디 1기 / CloudNet@

    2025.07 ~ 2025.08

    Cloud Native 네트워킹 심화 스터디

    • eBPF, Cilium 기반 Kubernetes DataPath 이해 및 L3 / L4 / L7 Network Policy 설계
    • Routing Mode: Encapsulation(VXLAN / GENEVE) vs Native Routing 구조 및 Trade-off 비교
    • Cluster Mesh: Multi-Cluster Service Discovery, 통신, Identity 이해
    • Service Mesh 연계: Ingress / Gateway API + Envoy 기반 TLS, L7 Traffic 처리
    • Hubble 활용: Flow, Service Map, DNS / HTTP 가시성 기반 Policy Miss 및 차단 Traffic Troubleshooting
  2. AWS Cloud School 1기 / 한국전파진흥협회

    2023.08 ~ 2024.03

    Cloud & DevOps 교육과정

    • Network, Linux, Docker, Kubernetes, Jenkins, Argo CD, AWS 학습
    • 교육과정 내 공지 게시판 개발
    • AI & Cloud 기반 앨범 서비스 Photo Query 팀 프로젝트 참여: Kubernetes 운영, Go Backend 개발
  3. Rising Camp Plus 백엔드과정 1기 / 소프트스퀘어드

    2023.07 ~ 2023.09

    Java Backend 교육과정

    • Java, Spring Boot, JPA, MySQL, Git 학습
    • Spring Boot 기반 채용사이트 개발 팀 프로젝트 참여

Awards

  • Fastfive x AWS Frugality Fest GameDay - Winner 2025.04
  • Students @ AI - Seoul Hackathon - Winner 2025.04
  • AWS PS GameDay (GenAI) - 5th Place 2024.08
  • AWS x RAPA DevOps Jam - Runner-up, 2nd Place 2023.12

Activities

  • SpeakerAWS KRUG 마곡 소모임 - EKS Pod Identity로 더 간편하게 Kubernetes 서비스 권한 관리하기 2026.04
  • SpeakerRAPA x AWS Cloud School 커리어 세션 - AWS Cloud School 그리고 그 다음 이야기 2026.01
  • SpeakerCloud Native Korea Community Day 2025 - ArgoCD와 함께하는 Multi-Cluster 운영 2025.09
  • Dive 2025 Global Data Hackathon, 부산항만공사 2025.08
  • Mentor / StaffAWS Cloud School 8기 - Amazon Working Backwards 2025.06
  • Staff2025 경기창고 개회식 2025.05
  • Staff2024 충남대학교 커스텀 GPT 프롬프톤 2024.08
  • Mentor / Staff서울디지텍고등학교 - Amazon Working Backwards 2024.08
  • Mentor / Staff부산일과학고 AWS Cloud 실습 및 활용 2024.07
  • AWS PS GameDay (GenAI) 참가 2024.07
  • Speaker제2회 AWS 강의실 온라인 세미나 - MicroK8s Cluster 구축하기 2024.06
  • AWS Summit Seoul 2024 참여 2024.05
  • AWS Student Community Day 2024 참여 2024.04
  • Wanted Backend Challenge - AWS를 활용한 시스템 아키텍처 참여 2024.03
  • Advanced Architecting on AWS 수료 2023.12
  • DevOps Engineering on AWS 수료 2023.12
  • Developing on AWS 수료 2023.12
  • AWS Well-Architected Best Practices 수료 2023.11
  • AWS Community Day 2023 참여 2023.10
  • AWS Security Essentials 수료 2023.10
  • AWS Cloud Practitioner Essentials 수료 2023.10