探討 Sentient ROMA 在 @SentientAGI 的排行榜上,我發現文章的質量似乎也相當重要。因此,我想寫寫我認為在 Sentient 中技術實力最強的 ROMA。 1. ROMA 不是 AI 模型。 - ROMA 精確來說是 Multi-agent,即多個 AI 代理層次性、遞歸性地參考各代理的值,從而引導出最可信、準確的答案的框架。在 GitHub 的 Readme 中,通常可以看到這些代碼的基本有機關係,我們常見的 AI 模型如 GPT、Gemini 等的 API 金鑰會被輸入來使用。 2. 那麼核心是什麼? - 就是 Atomizer、Executor、Planner、Aggregator 四種角色分工。當有任務時,決定是用一個還是多個來處理(Atomizer),然後決定如何解決(Planner),接著按照計劃執行(Executor),最後再進行匯總(Aggregator)以返回答案。此外,還可以選擇通過驗證者(Verifier)來驗證答案的步驟作為選項。 3. 只使用一個模型嗎? - 不是的。參考 Quickstart 代碼可以看到,除了 Executor,其他都明確指定了各自的模型。(例如:gpt-4o-mini,gemini-2.5-flash)這樣看來,並不是使用一個模型,而是使用多個模型來得出最佳答案。 4. 答案會一直相同嗎? - 這也不是。每個 AI 模型對於同一任務的執行結果都不同,並且如何調整參數,即如何進行微調,也會有所不同。例如,最具代表性的 Temperature 參數範圍是 0-2,越接近 0 的話,答案越一致;越接近 2 的話,每次執行會給出不同的答案。最終,使用者如何設置這些參數將會對性能產生很大的影響。 最近我偶然有機會開發 AI 代理,當時不斷運行 AI 進行學習的內容,現在看 GitHub 代碼似乎有些眉目了,所以寫下來了:)