Cách tốt nhất để kiểm tra end-to-end các giao diện người dùng dựa trên chat (LLM) nơi mà các phản hồi có thể tương tác là gì?