Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

arena.ai
LMArena: Nền tảng mở để đo điểm chuẩn AI dựa trên cộng đồng. Tốt nghiệp UC Berkeley / lmsysorg. Chúng tôi đang tuyển dụng: https://t.co/1OkfLq1Pba
🚨 Top 10 Mô Hình Mở trong Tháng 1: Text Arena
Nhìn lại tháng trước, đây là bảng xếp hạng theo nhà cung cấp cho tháng 1:
🥇 #1 Kimi-K2.5-Thinking bởi @Kimi_Moonshot (MIT Đã Chỉnh Sửa)
🥈 #2 GLM-4.7 bởi @Zai_org (MIT)
🥉 #3 Qwen3-235b-a22b-instruct-2507 bởi @Alibaba_Qwen (Apache 2.0)
So với tháng 12, thứ hạng đã thay đổi với các biến thể mới, nhưng các phòng thí nghiệm hàng đầu vẫn không thay đổi.
5 mô hình mở hàng đầu đều có điểm số trên 1400. Liệu chúng ta có thấy những đột phá 1500 đầu tiên trong năm nay không?
Xem thêm chi tiết về những người leo hạng và di chuyển trong tháng 1 trong chuỗi 🧵

5
🚨TIN NÓNG: Kimi K2.5 của @Kimi_Moonshot hiện là mô hình mở số 1 trong Code Arena!
Trong các đánh giá lập trình của Code Arena, Kimi K2.5 hiện đang:
- Mô hình mở số 1, vượt qua GLM-4.7
- #5 tổng thể, ngang bằng với các mô hình độc quyền hàng đầu như Gemini-3-Flash
- Mô hình mở duy nhất trong top 5
🏆Kimi K2.5 là mô hình mở tốt nhất trong các lĩnh vực Văn bản, Hình ảnh và Code Arena.
Chúc mừng lớn đến đội ngũ @Kimi_Moonshot vì đã tiếp tục đẩy mạnh ranh giới của các mô hình mở 👏


Kimi.ai27 thg 1, 2026
🥝 Gặp gỡ Kimi K2.5, Trí tuệ Tác động Hình ảnh Mở.
🔹 SOTA toàn cầu trên các tiêu chuẩn Tác động: Bộ đầy đủ HLE (50.2%), BrowseComp (74.9%)
🔹 SOTA mã nguồn mở về Thị giác và Lập trình: MMMU Pro (78.5%), VideoMMMU (86.6%), SWE-bench Được xác thực (76.8%)
🔹 Lập trình với Gu: biến các cuộc trò chuyện, hình ảnh & video thành các trang web thẩm mỹ với chuyển động biểu cảm.
🔹 Tổ hợp Tác nhân (Beta): các tác nhân tự định hướng làm việc song song, quy mô lớn. Lên đến 100 tác nhân phụ, 1.500 cuộc gọi công cụ, nhanh hơn 4.5× so với thiết lập tác nhân đơn.
-
🥝 K2.5 hiện đã hoạt động trong chế độ trò chuyện và chế độ tác nhân.
🥝 Tổ hợp Tác nhân K2.5 đang ở beta cho người dùng cao cấp.
🥝 Để lập trình chất lượng sản xuất, bạn có thể kết hợp K2.5 với Kimi Code:
-
🔗 API:
🔗 Blog công nghệ:
🔗 Trọng số & mã:

74
🚨TIN NÓNG: Kimi K2.5 Thinking của @Kimi_Moonshot là mô hình mở số 1 cho Vision Arena!
Điểm nổi bật:
- Mô hình mở số 1 trong Vision (+40 điểm so với mô hình mở tiếp theo)
- Xếp hạng số 6 tổng thể (Qwen3-vl-235b-a22b-instruct là mô hình mở tiếp theo ở vị trí số 18)
Đây là mô hình mở duy nhất trong Top 15. Chúc mừng đội ngũ @Kimi_Moonshot vì thành tích tuyệt vời này! 👏


Kimi.ai27 thg 1, 2026
🥝 Gặp gỡ Kimi K2.5, Trí tuệ Tác động Hình ảnh Mở.
🔹 SOTA toàn cầu trên các tiêu chuẩn Tác động: Bộ đầy đủ HLE (50.2%), BrowseComp (74.9%)
🔹 SOTA mã nguồn mở về Thị giác và Lập trình: MMMU Pro (78.5%), VideoMMMU (86.6%), SWE-bench Được xác thực (76.8%)
🔹 Lập trình với Gu: biến các cuộc trò chuyện, hình ảnh & video thành các trang web thẩm mỹ với chuyển động biểu cảm.
🔹 Tổ hợp Tác nhân (Beta): các tác nhân tự định hướng làm việc song song, quy mô lớn. Lên đến 100 tác nhân phụ, 1.500 cuộc gọi công cụ, nhanh hơn 4.5× so với thiết lập tác nhân đơn.
-
🥝 K2.5 hiện đã hoạt động trong chế độ trò chuyện và chế độ tác nhân.
🥝 Tổ hợp Tác nhân K2.5 đang ở beta cho người dùng cao cấp.
🥝 Để lập trình chất lượng sản xuất, bạn có thể kết hợp K2.5 với Kimi Code:
-
🔗 API:
🔗 Blog công nghệ:
🔗 Trọng số & mã:

149
Hàng đầu
Thứ hạng
Yêu thích
