Khám phá ROMA của Sentient Khi nhìn vào bảng xếp hạng của @SentientAGI, tôi thấy chất lượng bài viết cũng rất quan trọng. Vì vậy, tôi sẽ viết về ROMA, mà tôi nghĩ là có công nghệ cao nhất tại Sentient. 1. ROMA không phải là một mô hình AI. - ROMA chính xác là một Multi-agent, tức là một khung làm việc mà nhiều AI agent hoạt động theo cách phân cấp và đệ quy, tham khảo giá trị của từng agent để đưa ra câu trả lời có độ tin cậy và độ chính xác cao nhất. Khi xem Readme trên GitHub, bạn có thể thấy mối quan hệ cơ bản của các mã nguồn, và chúng ta thường sử dụng API key của các mô hình AI như GPT, Gemini. 2. Vậy điểm mấu chốt là gì? - Chính là sự phân chia vai trò của bốn yếu tố: Atomizer, Executor, Planner, Aggregator. Khi một nhiệm vụ được giao, nó sẽ quyết định xử lý một cách đơn lẻ hay nhiều cách (Atomizer), sau đó quyết định cách giải quyết (Planner), thực hiện theo kế hoạch (Executor) và cuối cùng tổng hợp lại (Aggregator) để trả về câu trả lời. Ngoài ra, có thể chọn thêm bước xác minh (Verifier) để kiểm tra câu trả lời. 3. Chỉ sử dụng một mô hình thôi sao? - Không phải. Nếu tham khảo mã Quickstart, bạn sẽ thấy rằng tất cả các mô hình đều được chỉ định riêng biệt, ngoại trừ Executor (ví dụ: gpt-4o-mini, gemini-2.5-flash). Như vậy, không phải chỉ một mô hình mà là nhiều mô hình được sử dụng để đưa ra câu trả lời tốt nhất. 4. Câu trả lời có luôn giống nhau không? - Cũng không phải. Kết quả thực thi cho một nhiệm vụ của mỗi mô hình AI là khác nhau và phụ thuộc vào cách điều chỉnh các tham số, tức là cách fine-tuning. Ví dụ, tham số Temperature là một trong những tham số điển hình có giá trị từ 0-2, trong đó càng gần 0 thì câu trả lời càng nhất quán, còn càng gần 2 thì mỗi lần thực hiện sẽ cho ra các câu trả lời khác nhau. Cuối cùng, cách người dùng thiết lập điều này sẽ tạo ra sự khác biệt lớn về hiệu suất. Gần đây, tôi tình cờ có cơ hội phát triển AI agent và trong quá trình đó, tôi đã học được nhiều điều khi chạy AI, và giờ nhìn vào mã GitHub, tôi cảm thấy có thể viết ra những gì mình đã học được :)