Kiến trúc Agent: Từ Reflex đơn giản đến Learning Agent phức tạp

Để hiểu rõ AI Agent thực sự là gì, ta cần bắt đầu từ cấu trúc nền tảng của nó. Một AI Agent không phải là một khối hộp đen kỳ diệu, mà là một hệ thống được thiết kế theo các kiến trúc khác nhau, mỗi loại phù hợp với bài toán và môi trường cụ thể. Việc nắm rõ các kiến trúc này giúp bạn lựa chọn đúng giải pháp khi xây dựng hoặc triển khai AI Agent trong doanh nghiệp hoặc dự án của mình.
Reflex Agent: Phản ứng nhanh, logic đơn giản
Kiến trúc đơn giản nhất là Reflex Agent (agent phản xạ). Nó hoạt động theo nguyên tắc trực tiếp: nhận input từ môi trường → áp dụng quy tắc if-then → tạo output. Không có bộ nhớ, không có lịch sử, chỉ có phản ứng tức thời.
Ví dụ thực tế dễ thấy nhất là một thermostat thông minh: nếu nhiệt độ phòng dưới 20°C thì bật lò sưởi, nếu trên 25°C thì bật quạt mát. Trong lĩnh vực kinh doanh Việt Nam, nhiều hệ thống chatbot đơn giản vẫn áp dụng mô hình này—người dùng gửi tin nhắn, hệ thống khớp với danh sách câu hỏi đã định sẵn và trả lời theo template. Tốc độ xử lý nhanh, chi phí thấp, nhưng khả năng xử lý tình huống phức tạp hạn chế.
Pseudocode đơn giản của Reflex Agent:
function REFLEX_AGENT(percept): rules ← [danh sách các quy tắc if-then] for each rule in rules: if rule.condition(percept) == true: return rule.action return default_action Model-Based Reflex Agent: Có bộ nhớ, hiểu bối cảnh
Bước tiến kế tiếp là Model-Based Reflex Agent. Agent này không chỉ phản ứng với input hiện tại, mà còn duy trì một "model" (mô hình nội tại) về trạng thái thế giới. Nó kết hợp thông tin quá khứ với dữ liệu hiện tại để ra quyết định thông minh hơn.
Hình ảnh thực tế: một hệ thống quản lý kho tự động. Thay vì chỉ kiểm tra mức tồn kho tại thời điểm hiện tại, agent này ghi nhớ lịch sử bán hàng, xu hướng mua, và dự báo nhu cầu trong tương lai. Nó dự đoán "tuần tới khách hàng B sẽ cần 50 sản phẩm X", nên đặt hàng từ nhà cung cấp ngay bây giờ.
Các ứng dụng tự động hóa kinh doanh ở Việt Nam bắt đầu áp dụng kiến trúc này—hệ thống ERP dùng AI để tối ưu hóa quy trình, có khả năng "nhớ" các giao dịch quá khứ và điều chỉnh hành động theo các thay đổi môi trường.
Goal-Based Agent: Hoạch định chiến lược
Bước tiến thứ ba là Goal-Based Agent. Agent này không chỉ phản ứng hoặc nhớ, mà nó có một mục tiêu rõ ràng và lên kế hoạch để đạt được nó. Nó "suy nghĩ" trước khi hành động, tìm chuỗi hành động tối ưu dẫn đến mục tiêu.
Trong lĩnh vực giao logistics, một Goal-Based Agent có thể được lập trình với mục tiêu: "Giao 100 đơn hàng với chi phí nhiên liệu thấp nhất trong vòng 8 giờ". Agent sẽ tính toán, lên lộ trình tối ưu, điều phối các tài xế, và thích ứng khi có trở ngại giao thông.
Utility-Based Agent & Learning Agent: Thích ứng, học hỏi
Ở mức độ cao hơn, Utility-Based Agent đánh giá các hành động dựa trên một "hàm tiện ích"—thứ đo lường độ tốt của mỗi quyết định. Khi có nhiều mục tiêu xung đột, agent này có thể cân bằng lợi ích.
Cuối cùng, Learning Agent là kiến trúc phức tạp nhất. Nó không chỉ có bộ nhớ, kế hoạch, và hàm tiện ích, mà nó còn "học" từ kinh nghiệm. Thông qua reinforcement learning, supervised learning, hoặc các kỹ thuật machine learning khác, agent này cải thiện hiệu suất theo thời gian.
Các hệ thống AI Agent hiện đại như chatbot được cấp điện bởi Large Language Model thường kết hợp nhiều kiến trúc này. Chúng duy trì "bộ nhớ" (context window), lên kế hoạch (chain-of-thought), và có khả năng học từ tương tác với người dùng.
Lựa chọn kiến trúc phù hợp: Từ lý thuyết đến thực hành
Khi bạn xây dựng một AI Agent, câu hỏi đầu tiên không phải là "dùng công nghệ nào?" mà là "bài toán của tôi cần loại agent nào?". Một ứng dụng quản lý hóa đơn điện tử có thể chỉ cần Reflex Agent. Một hệ thống tối ưu hóa sản xuất cần Model-Based hoặc Goal-Based Agent. Một platform gợi ý sản phẩm cho khách hàng lại cần Learning Agent có khả năng cải thiện liên tục.
Hiểu rõ các kiến trúc này cho phép bạn thiết kế hệ thống hiệu quả hơn, tránh over-engineering, và lựa chọn công cụ phù hợp với khả năng và ngân sách của tổ chức.
Khả năng cốt lõi: Cách Agent nhận thức, suy luận và thực thi hành động

Một AI agent không phải là một hộp đen thần kỳ. Nó là một hệ thống được thiết kế để hoạt động theo ba quy trình liên tiếp: nhận thức môi trường, suy luận để đưa ra quyết định, và thực thi hành động để đạt mục tiêu. Để hiểu rõ cách agent hoạt động trong thực tế, chúng ta cần bóc tách từng thành phần này.
Nhận thức: Agent "nhìn" môi trường như thế nào
Bước đầu tiên của bất kỳ agent nào là nhận thức dữ liệu từ môi trường. Đây không chỉ là việc nhận thông tin đầu vào—đó là việc hiểu và diễn giải những gì đang xảy ra.
Hãy lấy ví dụ thực tế: một chatbot hỗ trợ khách hàng tại một công ty thương mại điện tử Việt Nam. Agent này nhận thức môi trường qua:
- Đầu vào trực tiếp: Tin nhắn từ khách hàng—"Tôi muốn đổi đơn hàng này, mã đơn là #12345".
- Ngữ cảnh lịch sử: Dữ liệu về khách hàng này—lịch mua hàng, các vấn đề trước đây, mức độ khách thân thiết.
- Trạng thái hệ thống: Tình trạng kho, chính sách đổi trả hiện tại, tình trạng đơn hàng.
Khả năng nhận thức của agent phụ thuộc vào chất lượng dữ liệu và cách nó được cấu trúc. Nếu agent chỉ nhận được tin nhắn người dùng mà không có ngữ cảnh khách hàng hoặc trạng thái đơn hàng, nó sẽ có "tầm nhìn" hạn chế và dễ đưa ra quyết định sai.
Quy trình này gọi là perception loop—một vòng lặp liên tục nơi agent cập nhật hiểu biết của mình về thế giới. Với các hệ thống sử dụng Large Language Models (LLM), perception không chỉ là nhận dữ liệu thô, mà là việc nhận diện mẫu, ngữ pháp, ý định và cảm xúc trong dữ liệu đó.
Suy luận: Từ dữ liệu đến quyết định
Sau khi nhận thức, agent phải suy luận để quyết định hành động tiếp theo. Đây là "bộ não" của agent—nơi dữ liệu được chuyển đổi thành hành động.
Suy luận trong agent hoạt động theo nhiều cách khác nhau tùy vào kiến trúc của nó:
1. Suy luận dựa trên quy tắc (Rule-based reasoning): Agent sử dụng các quy tắc if-then có sẵn. Ví dụ: "Nếu thời gian đặt hàng