Multiple Security Vulnerability in NVIDIA Triton

1./ Tổng quan và phân tích.

CVE-2025-23319, CVE-2025-23320 và CVE-2025-23334là các lỗ hổng bảo mật ảnh hưởng đến NVIDIA’s Triton Inference Server (cả Linux và Windows). Việc khai thác thành công có thể cho phép kẻ tấn công từ xa, không xác thực có thể chiếm quyền điều khiển server, thực thi mã từ xa.

***Triton

Triton được thiết kế như một máy chủ suy luận AI đa năng, có khả năng triển khai các mô hình từ hầu hết các framework AI phổ biến (như PyTorch, TensorFlow, v.v.). Nó đạt được tính linh hoạt này thông qua hệ thống module backend, trong đó mỗi backend đảm nhận việc thực thi các mô hình thuộc framework tương ứng. Khi có yêu cầu suy luận (inference request) đối với một mô hình cụ thể, Triton sẽ tự động định tuyến yêu cầu đến backend phù hợp để xử lý.

Backend Python của Triton có lõi được viết bằng C++, chịu trách nhiệm tiếp nhận và xử lý các yêu cầu suy luận dành cho mô hình viết bằng Python. Khi có một yêu cầu được gửi đến, thành phần C++ này sẽ giao tiếp với một tiến trình con riêng biệt (“stub”), chịu trách nhiệm nạp và thực thi mã mô hình.
Để đảm bảo trao đổi dữ liệu hiệu quả giữa logic C++ chính và tiến trình stub, backend sử dụng một cơ chế IPC tiên tiến, phục vụ cả cho quá trình suy luận và các thao tác nội bộ. Cơ chế IPC này được xây dựng dựa trên named shared memory thông qua /dev/shm, tạo ra các khu vực bộ nhớ có thể truy cập bằng một đường dẫn hệ thống duy nhất.
Mặc dù thiết kế này cho phép truyền dữ liệu tốc độ cao giữa các tiến trình, nó cũng đồng thời tạo ra một điểm phụ thuộc bảo mật quan trọng: tính bảo mật và riêng tư của tên các vùng nhớ chia sẻ. Nếu tên các vùng nhớ này bị lộ hoặc kiểm soát không chặt chẽ, kẻ tấn công có thể lợi dụng để can thiệp vào quá trình suy luận hoặc thao túng dữ liệu mô hình, từ đó mở ra các khả năng khai thác nghiêm trọng.

***Tóm tắt các lỗ hổng

CVE-2025-23319 (CVSS: 8.1) – Lỗ hổng trong backend Python, nơi kẻ tấn công có thể gây ra lỗi ghi vượt giới hạn bộ nhớ (out-of-bounds write) bằng cách gửi một yêu cầu độc hại.
CVE-2025-23320 (CVSS: 7.5) – Lỗ hổng trong backend Python, cho phép kẻ tấn công vượt quá giới hạn bộ nhớ chia sẻ (shared memory limit) bằng cách gửi một yêu cầu có kích thước cực lớn.
CVE-2025-23334 (CVSS: 5.9) – Lỗ hổng trong backend Python, nơi kẻ tấn công có thể gây ra lỗi đọc vượt giới hạn bộ nhớ (out-of-bounds read) bằng cách gửi một yêu cầu được thiết kế đặc biệt.

***Điều kiện khai thác:

Máy chủ NVIDIA’s Triton Inference sử dụng Python làm backend, và có phiên bản bị ảnh hưởng.

2./ Khuyến nghị và chi tiết các bản cập nhật

***Khuyến nghị giảm thiểu rủi ro

Để giảm thiểu ảnh hưởng bởi lỗ hổng bảo mật người dùng nên cập nhật lên phiên bản theo bảng dưới đây để bảo vệ khỏi lỗ hổng này.

STT

Tên lỗ hổng

Phiên bản ảnh hưởng

Phiên bản cần nâng cấp

CVE-2025-23319

CVE-2025-23320

CVE-2025-23334

All versions prior to 25.07

>= 25.07

***Một số nguồn tham khảo:

Cyber Security Team – CMC Telecom.

Multiple Security Vulnerability in NVIDIA Triton

1./ Tổng quan và phân tích.

2./ Khuyến nghị và chi tiết các bản cập nhật

Giang Dao Van

A New Security Vulnerability in NestJs: CVE-2025-54782

OpenAI với tính năng “Share Chat” trên ChatGPT

Related Posts:

Multiple vulnerabilities in PHP

Dark Angels Ransomware Analysis

Vmware ESXi Ransomware – Tác động, phòng thủ

Leave a reply: Cancel Reply

About Me

Recent Posts

Cyber Threat Intelligence – Threat Actor Shinyhunter

A New Security Vulnerability in Redis: CVE-2025-49844

Cảnh báo chiến dịch tấn công chuỗi cung ứng của các gói npm

Supply chain attack leaks secrets on github: s1ngularity

Multiple Security Vulnerability in NVIDIA Triton

1./ Tổng quan và phân tích.

2./ Khuyến nghị và chi tiết các bản cập nhật

Post Navigation

Related Posts:

Leave a reply: Cancel Reply

Sliding Sidebar

About Me

Social Profiles

Recent Posts