1./ Tổng quan và phân tích.
CVE-2025-23319, CVE-2025-23320 và CVE-2025-23334là các lỗ hổng bảo mật ảnh hưởng đến NVIDIA’s Triton Inference Server (cả Linux và Windows). Việc khai thác thành công có thể cho phép kẻ tấn công từ xa, không xác thực có thể chiếm quyền điều khiển server, thực thi mã từ xa.
***Triton
Triton được thiết kế như một máy chủ suy luận AI đa năng, có khả năng triển khai các mô hình từ hầu hết các framework AI phổ biến (như PyTorch, TensorFlow, v.v.). Nó đạt được tính linh hoạt này thông qua hệ thống module backend, trong đó mỗi backend đảm nhận việc thực thi các mô hình thuộc framework tương ứng. Khi có yêu cầu suy luận (inference request) đối với một mô hình cụ thể, Triton sẽ tự động định tuyến yêu cầu đến backend phù hợp để xử lý.
- Backend Python của Triton có lõi được viết bằng C++, chịu trách nhiệm tiếp nhận và xử lý các yêu cầu suy luận dành cho mô hình viết bằng Python. Khi có một yêu cầu được gửi đến, thành phần C++ này sẽ giao tiếp với một tiến trình con riêng biệt (“stub”), chịu trách nhiệm nạp và thực thi mã mô hình.
- Để đảm bảo trao đổi dữ liệu hiệu quả giữa logic C++ chính và tiến trình stub, backend sử dụng một cơ chế IPC tiên tiến, phục vụ cả cho quá trình suy luận và các thao tác nội bộ. Cơ chế IPC này được xây dựng dựa trên named shared memory thông qua /dev/shm, tạo ra các khu vực bộ nhớ có thể truy cập bằng một đường dẫn hệ thống duy nhất.
- Mặc dù thiết kế này cho phép truyền dữ liệu tốc độ cao giữa các tiến trình, nó cũng đồng thời tạo ra một điểm phụ thuộc bảo mật quan trọng: tính bảo mật và riêng tư của tên các vùng nhớ chia sẻ. Nếu tên các vùng nhớ này bị lộ hoặc kiểm soát không chặt chẽ, kẻ tấn công có thể lợi dụng để can thiệp vào quá trình suy luận hoặc thao túng dữ liệu mô hình, từ đó mở ra các khả năng khai thác nghiêm trọng.
***Tóm tắt các lỗ hổng
- CVE-2025-23319 (CVSS: 8.1) – Lỗ hổng trong backend Python, nơi kẻ tấn công có thể gây ra lỗi ghi vượt giới hạn bộ nhớ (out-of-bounds write) bằng cách gửi một yêu cầu độc hại.
- CVE-2025-23320 (CVSS: 7.5) – Lỗ hổng trong backend Python, cho phép kẻ tấn công vượt quá giới hạn bộ nhớ chia sẻ (shared memory limit) bằng cách gửi một yêu cầu có kích thước cực lớn.
- CVE-2025-23334 (CVSS: 5.9) – Lỗ hổng trong backend Python, nơi kẻ tấn công có thể gây ra lỗi đọc vượt giới hạn bộ nhớ (out-of-bounds read) bằng cách gửi một yêu cầu được thiết kế đặc biệt.
***Điều kiện khai thác:
- Máy chủ NVIDIA’s Triton Inference sử dụng Python làm backend, và có phiên bản bị ảnh hưởng.
2./ Khuyến nghị và chi tiết các bản cập nhật
***Khuyến nghị giảm thiểu rủi ro
- Để giảm thiểu ảnh hưởng bởi lỗ hổng bảo mật người dùng nên cập nhật lên phiên bản theo bảng dưới đây để bảo vệ khỏi lỗ hổng này.
STT | Tên lỗ hổng | Phiên bản ảnh hưởng | Phiên bản cần nâng cấp |
1 | CVE-2025-23319
CVE-2025-23320 CVE-2025-23334 |
All versions prior to 25.07 | >= 25.07 |
***Một số nguồn tham khảo: