Các rủi ro nghiêm trọng có thể phát sinh từ việc lợi dụng sai mục đích hoặc các vấn đề không mong muốn liên quan đến kiểm soát AI, đặc biệt là khi liên quan đến sự phù hợp với ý định của con người. Những vấn đề này phần nào xuất phát từ việc các năng lực này chưa được hiểu rõ hoàn toàn [...] Có tiềm năng gây ra thiệt hại nghiêm trọng, thậm chí thảm khốc, dù là cố ý hay vô ý, xuất phát từ các năng lực quan trọng nhất của các mô hình AI này.
- Tuyên bố Bletchley, được ký kết bởi 28 quốc gia, bao gồm tất cả các quốc gia dẫn đầu về trí tuệ nhân tạo (AI) và Liên minh Châu Âu (EU), năm 2023
Trí tuệ nhân tạo có tiềm năng cách mạng hóa nhiều khía cạnh của xã hội, từ y tế đến giao thông vận tải và nghiên cứu khoa học. Qua các chương trước, bạn đã thấy khả năng của AI trong việc đánh bại các nhà vô địch thế giới trong trò chơi Go, tạo ra hình ảnh chân thực từ mô tả văn bản, và thậm chí phát hiện ra các loại kháng sinh mới. Tuy nhiên, những phát triển này cũng đặt ra những thách thức và rủi ro đáng kể, bao gồm việc mất việc làm, xâm phạm quyền riêng tư, và tiềm năng hệ thống AI có thể mắc sai lầm nghiêm trọng hoặc bị lợi dụng sai mục đích (xem Chương 2 về Rủi ro để biết chi tiết đầy đủ). Nghiên cứu an toàn AI kỹ thuật là cần thiết để đảm bảo AI hoạt động đáng tin cậy và phù hợp với giá trị con người, đặc biệt khi nó trở nên có năng lực và tự chủ hơn. Mặc dù nghiên cứu kỹ thuật là cần thiết, nhưng nó không đủ để giải quyết toàn bộ phổ thách thức do các hệ thống AI tiên tiến gây ra.
Phạm vi quản trị AI rất rộng, vì vậy chương này sẽ tập trung chủ yếu vào các rủi ro quy mô lớn liên quan đến AI tiên tiến. Nhắc lại, AI tiên tiến là các mô hình có khả năng cao có thể sở hữu các năng lực nguy hiểm đủ để gây ra rủi ro nghiêm trọng cho an toàn công cộng (Anderljung et al., 2023). Mặc dù trong lịch sử gần đây, nhiều tiến bộ tối tân nhất được thúc đẩy bởi các mô hình ngôn ngữ lớn (LLMs) hoặc mô hình nền tảng, thuật ngữ "AI tiên tiến" không giới hạn chỉ các loại mô hình này. Chúng ta sẽ xem xét tại sao quản trị là cần thiết, cách nó bổ sung cho các nỗ lực an toàn AI kỹ thuật, và những thách thức và cơ hội chính trong lĩnh vực đang phát triển nhanh chóng này. Chúng ta sẽ tập trung vào quản trị các ứng dụng AI thương mại và dân sự, vì quản trị AI quân sự liên quan đến một tập hợp các vấn đề riêng biệt nằm ngoài phạm vi của chương này.

Phân loại các mô hình AI theo mức độ tiềm ẩn gây hại và tính tổng quát. Chúng ta tập trung vào các mô hình AI tiên tiến (Chính phủ Anh, 2023).