Trí tuệ nhân tạo đọc hiểu tốt hơn con người
CLAUDE FOUQUET (LesEchos, 21/01/2018)
Học trò vượt qua thầy? Rất nhiều khả năng là như vậy. Trong khi các hệ thống trợ giúp thông minh ngày càng chiếm vị trí quan trọng, và gây nên những lo ngại, hai hệ thống trí tuệ nhân tạo (AI) của Alibaba và Microsoft vừa làm tốt hơn con người trong bài kiểm tra đọc hiểu của trường Đại học Stanford.
Bài kiểm tra này, có tên là SQuAD (Stanford Question Answering Dataset), gần như vô danh với công chúng, nhưng đã trở thành đối tượng không thể thiếu đối với các đại gia công nghệ muốn phát triển các hệ thống AI.
Nó dựa trên 100 000 câu hỏi tạo ra từ hơn 500 bài báo với các chủ đề rất đa dạng từ Wikipedia. Bài kiểm tra cho phép xác định liệu một hệ thống AI có thể đọc một lượng lớn thông tin và đưa ra câu trả lời chính xác cho các câu hỏi khác nhau như “ Đế chế của Gengis Khan có tên là gì ?”, “số nguyên tử (Z) của oxi bằng bao nhiêu?”, “điều gì khiến cho một vật rơi?”, hay “cho biết cửa hiệu lớn đầu tiên trên thế giới”.
Hệ thống AI của Alibaba là hệ thống đầu tiên vượt qua con người trong vấn đề đọc hiểu. Hệ thống Alibaba thắng sát nút với 82.440 điểm (trên 100), trong khi con người đạt 82.304. Hệ thống của Microsoft cao hơn một chút với 82.605 điểm, nhưng đạt được sau một ngày.
Hai công ty này, vượt xa các đối thủ lớn khác (như Samsung hạng 14, Tencent hạng 15, và Facebook hạng 16), nhanh chóng đề cập đến các lợi ích từ hệ thống này trong tương lai. Trong một thông báo, Alibaba cho biết sẽ trang bị công nghệ này cho người dùng trong thời gian ngắn sắp đến.
Trong khi đó, Microsoft nhấn mạnh trên blog rằng đây là cột mốc quan trọng giúp các công cụ tìm kiếm như Bing, hay hệ thống trợ giúp như Cortana, tương tác với con người và cung cấp thông tin một cách tự nhiên hơn.
Tuy nhiên, con người vẫn còn một lợi thế nhỏ trong bài đọc hiểu. Bài kiểm tra của Stanford không chỉ tính tỉ lệ câu trả lời đúng. Nó còn cho biết mức độ phù hợp giữa câu trả lời đúng và câu trả lời của hệ thống AI hay của con người. Khi đó, con người cho kết quả tốt hơn với 91.221%, so với 88.607 của Alibaba và 88.493 của Microsoft.
San lấp cách biệt 2.5% này là thách thức tiếp theo của các hệ thống AI.