Chuyển tới nội dung

MCP, Agent, Agentic AI, RAG

1. Model Context Protocol (MCP) – Giao thức kết nối an toàn

MCP là một tiêu chuẩn giao thức mã nguồn mở do Anthropic khởi xướng, đóng vai trò là “ngôn ngữ chung” giúp các mô hình AI tương tác với dữ liệu và công cụ cục bộ một cách tiêu chuẩn hóa.

  • Kiến trúc Client-Server: MCP vận hành qua ba thành phần: MCP Hosts (ứng dụng như Claude Desktop, Cursor), MCP Clients (bộ điều phối đóng gói yêu cầu), và MCP Servers (chương trình chạy trên máy cục bộ quản lý tài nguyên).
  • Hai trụ cột sức mạnh: MCP cho phép AI Kéo ngữ cảnh (truy xuất dữ liệu thời gian thực từ CRM, tệp tin) và Thực thi hành động (tạo bản nháp email, sửa đổi tệp tin trực tiếp).
  • Khung bảo mật 3 lớp: Để đảm bảo an toàn, MCP thiết lập ranh giới nghiêm ngặt: Lớp 1 (Resources) chỉ định dữ liệu AI được đọc; Lớp 2 (Tools) giới hạn các lệnh thực thi; Lớp 3 (Human-in-the-loop) yêu cầu con người phê duyệt trực tiếp mọi hành động quan trọng.
  • Giá trị cốt lõi: MCP xóa bỏ khoảng cách giữa tư duy và thực thi, giúp AI từ một chatbot thụ động trở thành một thành viên chủ động trong hệ thống.

2. AI Agent – “Diễn viên” chuyên nghiệp

AI Agent (Tác tử AI) là một thực thể AI có khả năng tự thực hiện nhiều bước để hoàn thành nhiệm vụ thay vì chỉ trả lời câu hỏi đơn thuần.

  • Tư duy “Diễn viên”: AI Agent được ví như một diễn viên cần System Prompt làm kịch bản (biết mình là ai), Rule làm quy tắc đóng phim (biết việc được phép/cấm kỵ), và Context làm bối cảnh cảnh quay (biết tình huống đang diễn ra).
  • Vai trò điều phối: Agent đóng vai trò là “bộ não” điều phối, chịu trách nhiệm lập kế hoạch, sử dụng công cụ và giải quyết các xung đột logic trong quy trình phát triển phần mềm.

3. Agentic AI (Agentic Workflow) – Tư duy tự động hóa chuỗi hành động

Agentic Workflow đại diện cho bước tiến từ chatbot thụ động sang các đặc vụ chủ động có khả năng tự vận hành.

  • Vòng lặp hành động (The Agentic Loop): Quy trình gồm 4 bước khép kín: Plan (Lập kế hoạch chi tiết) -> Tool Use (Tự chọn công cụ như đọc file, gọi API) -> Action & Observe (Thực thi và quan sát phản hồi hệ thống) -> Evaluate & Correct (Đánh giá và tự sửa lỗi).
  • Khả năng tự chữa lành (Self-healing): Khác với chatbot truyền thống dễ bị mắc kẹt khi gặp lỗi, Agentic AI có khả năng tự nhận định mục tiêu và tự sửa sai nếu mã nguồn không chạy hoặc kiểm thử thất bại.
  • Sự dịch chuyển vai trò: Trong quy trình này, con người chuyển từ “thợ code” sang Kiến trúc sư điều phối, tập trung vào việc thiết kế quy trình và phê duyệt kế hoạch.

4. Retrieval-Augmented Generation (RAG) – Bộ nhớ ngữ cảnh

RAG là công nghệ giúp AI truy xuất kiến thức từ các nguồn dữ liệu nội bộ để đưa ra câu trả lời chính xác, vượt qua giới hạn về thời gian huấn luyện và dữ liệu riêng tư.

  • Khắc phục ảo giác: Bằng cách bơm bối cảnh chính xác từ hàng vạn file mã nguồn nội bộ, RAG ngăn chặn hiện tượng AI “ảo giác” (tự bịa thông tin).
  • Quy trình kỹ thuật:
    1. Chunking: Chia nhỏ tài liệu thô thành các đoạn (chunks) theo ngữ nghĩa (Semantic Chunking) để máy dễ tiêu hóa.
    2. Embedding & Vector Database: Mã hóa văn bản thành các vector số và lưu trữ trong cơ sở dữ liệu chuyên dụng để tìm kiếm siêu tốc dựa trên ý nghĩa.
    3. Retrieval: Tìm kiếm các đoạn dữ liệu tương đồng với câu hỏi người dùng nhất (Cosine Similarity) để làm ngữ cảnh trả lời.
  • RAG trong Codebase: Đóng vai trò là cầu nối thời gian thực giữa AI và toàn bộ cấu trúc dự án, đảm bảo mã nguồn sinh ra luôn ăn khớp 100% với hệ thống hiện tại.

Khi kết hợp RAG (Bộ nhớ), Agent (Tư duy)MCP (Quyền năng thực thi), chúng ta tạo ra một Hệ thống AI tự trị có khả năng triển khai phần mềm từ đầu đến cuối một cách kỷ luật và chính xác.

Liên hệ