Bộ lọc tên riêng trong ChatGPT: Khi "David Mayer" khiến AI "đứng hình"
ChatGPT của OpenAI không chỉ đơn thuần là một mô hình ngôn ngữ AI với giao diện đẹp mắt. Nó là một hệ thống phức tạp gồm nhiều mô hình AI và bộ lọc nội dung, được thiết kế để đảm bảo đầu ra không gây tranh cãi hoặc rắc rối pháp lý cho OpenAI khi chatbot đôi khi tạo ra thông tin sai lệch, thậm chí gây hại về con người.
Gần đây, một số tên riêng như "David Mayer", "Jonathan Zittrain" và "Jonathan Turley" đã được phát hiện là có thể khiến ChatGPT ngừng hoạt động. Hiện tượng này xảy ra khi người dùng đề cập đến những tên này trong bất kỳ ngữ cảnh nào, và nó xuất phát từ một bộ lọc được tích hợp cứng, ngăn chặn đầu ra của mô hình AI trước khi trả về cho người dùng.
Khi được hỏi về những cái tên này, ChatGPT thường trả lời "Tôi không thể tạo phản hồi" hoặc "Đã xảy ra lỗi khi tạo phản hồi" trước khi kết thúc phiên trò chuyện. Điều thú vị là những tên này không ảnh hưởng đến đầu ra khi sử dụng API của OpenAI hoặc trong OpenAI Playground (trang web dành cho nhà phát triển).
Việc chặn này được cho là xuất phát từ các khiếu nại về xu hướng bịa đặt thông tin của ChatGPT khi thiếu dữ liệu về một người. Ví dụ, trường hợp của thị trưởng Úc Brian Hood, người đã dọa kiện OpenAI vì ChatGPT sai sự thật về việc ông bị bỏ tù vì tội hối lộ. OpenAI sau đó đã phải lọc thông tin sai lệch này.
Tuy nhiên, việc sử dụng bộ lọc cứng cũng tiềm ẩn nhiều vấn đề. Nó có thể khiến người dùng gặp khó khăn, tạo cơ hội cho các cuộc tấn công mạng và hạn chế tính hữu ích của hệ thống. Ví dụ, một kỹ sư đã phát hiện ra cách tấn công bằng cách chèn tên "David Mayer" vào hình ảnh. Khi ChatGPT nhìn thấy hình ảnh, nó sẽ dừng hoạt động.
Việc lọc tên riêng cũng gây bất tiện cho những người trùng tên với các tên trong danh sách bị chặn. Họ sẽ gặp khó khăn khi sử dụng ChatGPT. Ví dụ, một giáo viên muốn ChatGPT hỗ trợ sắp xếp danh sách lớp học có học sinh tên David Mayer sẽ không thể thực hiện được.
Vẫn còn quá sớm để đánh giá toàn diện về công nghệ AI trợ lý, mô hình ngôn ngữ lớn và chatbot. Việc sử dụng chúng mở ra nhiều cơ hội nhưng cũng tiềm ẩn nhiều lỗ hổng đang được khám phá hàng ngày. Cách OpenAI giải quyết những vấn đề này vẫn là một câu hỏi mở.