Công ty trí tuệ nhân tạo (AI) Anthropic đang đi đầu trong một nỗ lực đầy tham vọng nhằm xây dựng các tiêu chuẩn đánh giá toàn diện hơn cho trí tuệ nhân tạo. Sáng kiến này hứa hẹn sẽ mang lại những lợi ích thiết thực cho toàn ngành, thúc đẩy sự phát triển an toàn và đáng tin cậy của AI.
Vấn đề hiện tại của AI là thiếu các tiêu chuẩn đánh giá chính xác. Các bài kiểm tra hiện có thường không phản ánh thực tế cách con người sử dụng AI. Thậm chí, một số tiêu chuẩn cũ kỹ còn không còn phù hợp để đánh giá các thế hệ AI tân tiến ngày nay, đặc biệt là các mô hình sinh thành.
Anthropic đề xuất xây dựng các tiêu chuẩn đánh giá mới, tập trung vào an ninh AI và tác động của AI đến xã hội. Chương trình của họ sẽ tài trợ cho các tổ chức bên thứ ba phát triển các công cụ, phương pháp và cơ sở hạ tầng cần thiết để tạo ra những bài kiểm tra khắt khe hơn.
Cụ thể, Anthropic kêu gọi xây dựng các bài kiểm tra đánh giá khả năng của AI trong việc thực hiện các nhiệm vụ như tấn công mạng, "cải tiến" vũ khí hủy diệt hàng loạt (ví dụ: vũ khí hạt nhân) và thao túng, lừa dối con người (chẳng hạn như thông qua video deepfake hoặc thông tin sai lệch).
Ngoài ra, Anthropic còn mong muốn chương trình mới của họ hỗ trợ nghiên cứu về các tiêu chuẩn đánh giá và các tác vụ "tận-tận" (end-to-end) nhằm thăm dò tiềm năng của AI trong việc hỗ trợ nghiên cứu khoa học, giao tiếp đa ngôn ngữ, giảm thiểu thiên kiến và tự kiểm duyệt nội dung độc hại.
Để đạt được những mục tiêu này, Anthropic dự định xây dựng các nền tảng mới cho phép các chuyên gia chủ đề phát triển các bài đánh giá của riêng họ và tiến hành các thử nghiệm quy mô lớn với sự tham gia của "hàng nghìn" người dùng.
Chương trình này xứng đáng được hoan nghênh vì nó đặt nền tảng cho sự phát triển an toàn và đáng tin cậy của AI. Tuy nhiên, một số chuyên gia cũng bày tỏ lo ngại về việc liệu Anthropic có hoàn toàn minh bạch và trung lập trong việc xây dựng các tiêu chuẩn đánh giá này hay không, bởi vì lợi ích thương mại của họ trong cuộc đua trí tuệ nhân tạo.
Bất chấp những nghi ngại, sáng kiến của Anthropic vẫn là một bước tiến đáng kể trong việc xây dựng một tương lai nơi đánh giá AI toàn diện trở thành tiêu chuẩn của ngành.