Chuyển tới nội dung

XÂY DỰNG HỆ THỐNG HYBRID CLOUD DR & GITOPS

Mục tiêu: Lab thực chiến: Kết hợp AWS EKS, K8s On-Premise và GitOps Flow

1. TỔNG QUAN DỰ ÁN

Bối cảnh: Công ty “Perfectkey” yêu cầu xây dựng một hệ thống triển khai ứng dụng (CI/CD) đảm bảo tính sẵn sàng cao (High Availability) và khả năng phục hồi sau thảm họa (Disaster Recovery).

Thách thức chính:

  • Hệ thống chính (Primary) chạy trên Cloud (AWS EKS) để phục vụ khách hàng toàn cầu với tốc độ cao.
  • Hệ thống dự phòng (DR Site) chạy tại văn phòng (On-Premise) để đề phòng trường hợp Cloud bị sập (Region Outage) hoặc đứt cáp quang biển.
  • Yêu cầu đặc biệt: Code nguồn phải được bảo mật nội bộ. Chỉ phiên bản Release mới được đẩy ra Public Cloud.

2. YÊU CẦU KỸ THUẬT (REQUIREMENTS)

Học viên cần hoàn thành các hạng mục sau:

A. Hạ tầng (Infrastructure Setup)

🏢 On-Premise (DR Site)

  • Dựng cụm K8s Local.
  • Dựng bộ công cụ Core: JenkinsGitLabHarbor.
  • Thiết lập Cloudflare Tunnel để:
    • Public DR App: dr.diendo.com.vn -> Trỏ về Nginx Ingress Local.
    • (Optional) Kết nối ArgoCD Cloud về GitLab Local.

☁️ Cloud (Primary Site)

  • Dựng AWS EKS (Production).
  • Tạo AWS ECR (Registry).
  • Tạo GitHub Repo (Public/Private) để chứa Config cho Production.

B. Quy trình CI/CD (Pipeline Workflow)

Sơ đồ luồng CI/CD từ Local lên Cloud

Viết Jenkinsfile thực hiện luồng công việc sau:

  1. Giai đoạn Phát triển (Local Phase):
    • Dev push code vào GitLab.
    • Jenkins build Docker Image -> Push vào Harbor.
    • Jenkins update manifest trên GitLab -> ArgoCD Local sync về K8s Local.
    • Mục tiêu: Dev và QC test nội bộ tốc độ cao.
  2. Giai đoạn Kiểm duyệt (Quality Gate):
    • Pipeline dừng lại, chờ QC bấm nút “Approve”.
  3. Giai đoạn Release (Promotion Phase):
    • Jenkins đẩy Image từ Local lên AWS ECR.
    • Jenkins đẩy Config (file values-prod.yaml) lên GitHub.
    • ArgoCD Cloud sync từ GitHub -> Deploy lên EKS.
    • ArgoCD Local sync từ GitLab -> Deploy lên K8s Local (Namespace prod-dr) để làm Backup nóng.

C. Kịch bản DR (Disaster Recovery Test)

  1. Truy cập Web chính (app.tonytechlab.com) đang chạy trên AWS.
  2. Giả lập sự cố: Tắt cụm EKS (hoặc scale về 0).
  3. Failover: Vào Cloudflare DNS, chuyển traffic trỏ về Tunnel (DR Site).
  4. Kết quả: Web vẫn hoạt động bình thường (chạy từ máy Local).

3. Thực hiên

A. Cài đăt hạ tầng (Infrastruture)

On-Premise

  • Cài đặt cụm k8s (xem tại đây)

Đây là phần gợi ý để học viên tự tư duy, không cầm tay chỉ việc.

💡 Gợi ý 1: Chiến lược “Dual Push” trong Jenkins

  • Vấn đề: Làm sao để đẩy image lên cả Harbor và ECR trong cùng 1 pipeline?
  • Hint:
    • Dùng docker tag để tạo 2 cái tên cho cùng 1 ID ảnh:- harbor.local/myapp:v1– 123456.dkr.ecr...amazonaws.com/myapp:v1
    • Dùng docker login lần lượt vào Harbor và ECR để push.
    • Mẹo: Có thể dùng công cụ skopeo để copy ảnh giữa các registry.

🔑 Gợi ý 2: Đồng bộ Git (GitLab -> GitHub)

  • Vấn đề: Làm sao Jenkins (Local) có quyền ghi vào GitHub (Cloud)?
  • Hint: Tạo Personal Access Token (PAT) trên GitHub -> Lưu vào Jenkins Credentials -> Dùng lệnh git push có kèm token.

🔄 Gợi ý 3: Cấu hình ArgoCD “Chia đôi”

  • ArgoCD Local: Trỏ source về GitLab.
  • ArgoCD Cloud: Trỏ source về GitHub.
  • Lý do: Để khi Local mất mạng, Cloud vẫn sống nhờ GitHub.
Liên hệ