Mô hình AI lấy cảm hứng từ não bộ trẻ em học ngôn ngữ thông qua tương tác thực tế

Bài viết khám phá một mô hình AI mới được phát triển tại Viện Khoa học và Công nghệ Okinawa, mô phỏng cách trẻ sơ sinh học ngôn ngữ thông qua tương tác vật lý. Mô hình này, được tích hợp vào một cánh tay robot, đã thể hiện khả năng học hỏi khái niệm đằng sau các từ ngữ và tổng hợp kiến thức để thực hiện các hành động chưa từng được học trước đây.
Các mô hình ngôn ngữ lớn hiện nay, mặc dù có khả năng trò chuyện ấn tượng, vẫn thiếu sự hiểu biết thực sự về ngôn ngữ. Chúng xử lý dữ liệu từ thế giới thực nhưng không trực tiếp tương tác với nó. Con người, ngược lại, liên kết ngôn ngữ với trải nghiệm thực tế.
Nhằm khắc phục hạn chế này, các nhà nghiên cứu tại Viện Khoa học và Công nghệ Okinawa đã phát triển một mô hình AI lấy cảm hứng từ não bộ, bao gồm nhiều mạng nơ-ron. Mô hình này được tích hợp vào một cánh tay robot đơn giản với camera RGB, hoạt động trong một không gian làm việc gồm các khối màu sắc khác nhau. Nhiệm vụ của robot là thao tác các khối này theo các lệnh đơn giản như "di chuyển đỏ sang trái", "di chuyển xanh sang phải" hoặc "đặt đỏ lên xanh".
Điểm đặc biệt của nghiên cứu này nằm ở cách tiếp cận học tập. Lấy cảm hứng từ cách trẻ em học ngôn ngữ thông qua tiếp xúc và tương tác với môi trường, nhóm nghiên cứu đã huấn luyện AI trong môi trường robot thực tế. Robot có thể cầm nắm, di chuyển các vật thể, từ đó học cách suy nghĩ và lập kế hoạch hành động bằng ngôn ngữ.
Mô hình AI này được xây dựng dựa trên nguyên lý năng lượng tự do, giả thuyết cho rằng não bộ liên tục đưa ra dự đoán về thế giới dựa trên các mô hình nội tại và cập nhật các dự đoán này dựa trên thông tin cảm giác. Nhóm nghiên cứu đã sử dụng bốn mạng nơ-ron liên kết chặt chẽ để xử lý dữ liệu hình ảnh, thông tin vị trí của robot, ngôn ngữ và liên kết giữa chúng.
Kết quả đáng chú ý là AI đã thể hiện khả năng tổng hợp kiến thức. Sau khi học được mối liên hệ giữa các lệnh và hành động, nó có thể khái quát hóa kiến thức đó để thực hiện các lệnh chưa từng được học trước đây. Ví dụ, sau khi học cách di chuyển vật thể sang trái hoặc phải, nó có thể kết hợp các từ để thực hiện hành động "đặt khối xanh lên khối đỏ" mà không cần được huấn luyện cụ thể.
Mặc dù đạt được những kết quả khả quan, mô hình vẫn còn một số hạn chế như không gian làm việc hạn chế, từ vựng đơn giản và cần học một lượng lớn các kết hợp từ và hành động trước khi có thể khái quát hóa. Tuy nhiên, nhóm nghiên cứu tin rằng những hạn chế này có thể được khắc phục bằng cách tăng cường sức mạnh tính toán và mở rộng mô hình sang robot hình người phức tạp hơn trong môi trường thực tế.
Nghiên cứu này mở ra hướng đi mới trong việc phát triển AI có khả năng hiểu và sử dụng ngôn ngữ một cách tự nhiên hơn, tương tự như con người. Việc kết hợp giữa học máy và robot học hứa hẹn sẽ mang lại những bước tiến đột phá trong lĩnh vực trí tuệ nhân tạo.