
Ví dụ về bộ gia tốc NVIDIA Blackwell B100 (2025). Mỗi B100 trang bị 192 GB bộ nhớ HBM3e và cung cấp gần 20 PFLOPS thông lượng FP4, gấp đôi hiệu suất của H100 từ năm 2024 (NVIDIA, 2025).
Khả năng điện toán là một mục tiêu quản trị mạnh mẽ vì nó đáp ứng tất cả ba tiêu chí cho các mục tiêu quản trị hiệu quả:

Hiệu suất trên các bài kiểm tra kiến thức so với tính toán đào tạo. Hiệu suất trên các bài kiểm tra kiến thức được đo lường bằng bài kiểm tra MMLU, ở đây sử dụng phương pháp học 5-shot, đánh giá độ chính xác của mô hình sau khi chỉ nhận được năm ví dụ cho mỗi tác vụ. Tính toán đào tạo được đo lường bằng tổng petaFLOP, tương đương 1e15 phép tính số học (Giattino et al., 2023).
Cuộc thảo luận trong các phần tiếp theo sẽ tập trung vào các yếu tố thực hiện quản trị sức mạnh điện toán. Chúng tôi giải thích cách chuỗi cung ứng tập trung cho phép theo dõi và giám sát sức mạnh điện toán, cũng như thảo luận ngắn gọn về các cơ chế quản trị sức mạnh điện toán trên chip dựa trên phần cứng, và cuối cùng thảo luận về một số hạn chế liên quan đến giới hạn quản trị dựa trên ngưỡng sức mạnh điện toán, cũng như cách đào tạo phân tán và mã nguồn mở có thể thách thức quản trị sức mạnh điện toán.

<figure-caption>
Sơ đồ các lĩnh vực nghiên cứu cho AI và Khả năng điện toán (Heim, 2021).
</figure-caption>
Các chip chuyên dụng cho AI xuất phát từ một quá trình toàn cầu phức tạp. Quá trình này bắt đầu từ việc khai thác và tinh chế nguyên liệu thô như silicon và các nguyên tố đất hiếm. Những nguyên liệu này được chuyển đổi thành các tấm silicon, sau đó được chế tạo thành chip thông qua hàng trăm bước sản xuất chính xác. Quá trình này yêu cầu thiết bị chuyên dụng (đặc biệt là máy photolithography của ASML) cùng với các hóa chất, khí và công cụ từ các nhà cung cấp khác (Grunewald, 2023).

Chuỗi cung ứng khả năng điện toán (Belfield & Hua 2022).
Có một số điểm nghẽn trong thiết kế và sản xuất bán dẫn. Chuỗi cung ứng bị chi phối bởi một số ít công ty tại các bước quan trọng. NVIDIA thiết kế hầu hết các chip chuyên dụng cho AI, TSMC sản xuất các chip tiên tiến nhất, và ASML sản xuất các máy móc cần thiết cho TSMC để sản xuất chip (Grunewald, 2023; Pilz et al., 2023). Ước tính NVIDIA kiểm soát khoảng 80% thị trường GPU đào tạo AI (Jagielski, 2024). Tương tự, cả TSMC và ASML đều duy trì vị thế dẫn đầu trong lĩnh vực của mình (Pilz et al., 2023). Ngoài việc sản xuất chip, việc mua sắm và vận hành chúng ở việc mở rộng quy mô cần thiết cho các mô hình AI tiên tiến đòi hỏi khoản đầu tư ban đầu khổng lồ. Năm 2019, các trường đại học và chính phủ dẫn đầu về siêu máy tính AI. Ngày nay, các công ty kiểm soát hơn 80% năng lực tính toán AI toàn cầu, trong khi chính phủ và các trường đại học đã giảm xuống dưới 20% (Pilz et al., 2025). Chỉ ba nhà cung cấp - Amazon, Microsoft và Google - kiểm soát khoảng 65% dịch vụ điện toán đám mây (Jagielski, 2024). Một số ít công ty AI như OpenAI, Anthropic và DeepMind vận hành các cụm GPU khổng lồ của riêng mình, nhưng ngay cả những hệ thống này cũng yêu cầu phần cứng chuyên dụng chịu sự kiểm soát của chuỗi cung ứng (Pilz & Heim, 2023).

Thị phần sản xuất chip logic theo giai đoạn sản xuất (Giattino et al., 2023).

Tập trung của chuỗi cung ứng chip AI được thể hiện dưới dạng phần trăm thị phần tổng thể (Sastry et al., 2024).
Sự tập trung của chuỗi cung ứng tạo ra các điểm can thiệp tự nhiên. Các cơ quan chức năng chỉ cần hợp tác với một số ít các bên liên quan chính để thực hiện các biện pháp kiểm soát, như đã được minh chứng qua các hạn chế xuất khẩu chip tiên tiến của Mỹ (Heim et al., 2024). Tuy nhiên, cần lưu ý rằng sự tập trung cao độ này cũng đáng lo ngại. Chúng ta đang chứng kiến sự gia tăng của "khoảng cách khả năng điện toán" - trong khi các công ty công nghệ lớn có thể chi hàng trăm triệu đô la cho việc đào tạo AI, các nhà nghiên cứu học thuật lại gặp khó khăn trong việc tiếp cận ngay cả các tài nguyên cơ bản (Besiroglu et al., 2024). Điều này có tầm ảnh hưởng đến việc ai có thể tham gia vào phát triển AI và làm giảm sự giám sát độc lập đối với các mô hình tiên tiến. Nó cũng gây lo ngại về khả năng tập trung quyền lực.

Phổ các kiến trúc chip với các ưu nhược điểm về hiệu suất và tính linh hoạt.
Thay vì cố gắng kiểm soát toàn bộ hạ tầng tính toán, quản trị nên tập trung cụ thể vào các chip AI chuyên dụng. Những chip này khác biệt với phần cứng đa năng cả về năng lực và chuỗi cung ứng. Bằng cách tập trung vào các chip AI chuyên dụng tiên tiến nhất, chúng ta có thể giải quyết các rủi ro thảm khốc mà không ảnh hưởng đáng kể đến hệ sinh thái tính toán rộng lớn hơn (Heim et al., 2024). Ví dụ, các biện pháp kiểm soát xuất khẩu của Mỹ tập trung vào GPU cao cấp cho trung tâm dữ liệu mà không bao gồm phần cứng tiêu dùng.
Việc đào tạo các mô hình AI tiên tiến để lại nhiều dấu vết có thể quan sát được, cho phép chúng ta phát hiện các phiên đào tạo AI đáng lo ngại. Dấu vết đáng tin cậy nhất là tiêu thụ năng lượng - các phiên đào tạo có thể tạo ra hệ thống nguy hiểm đòi hỏi lượng điện năng khổng lồ, thường lên đến hàng trăm megawatt, tạo ra các mẫu đặc trưng (Wasil et al., 2024; Shavit, 2023). Ngoài năng lượng, các chỉ số kỹ thuật khác bao gồm mô hình lưu lượng mạng đặc trưng cho việc đào tạo mô hình, hồ sơ mua sắm và vận chuyển phần cứng, yêu cầu hệ thống làm mát và dấu vết nhiệt, cũng như việc xây dựng hạ tầng như xây dựng trạm biến áp (Sastry et al., 2024; Shavit, 2023; Heim et al., 2024). Các tín hiệu này trở nên đặc biệt mạnh mẽ khi tổ hợp - sự gia tăng đột ngột cả về tiêu thụ năng lượng và lưu lượng mạng tại một cơ sở chứa phần cứng AI đã biết mạnh mẽ gợi ý việc đào tạo mô hình đang diễn ra.
Các quy định đã bắt đầu sử dụng ngưỡng khả năng điện toán để kích hoạt các cơ chế giám sát. Lệnh hành pháp của Hoa Kỳ về AI yêu cầu các công ty thông báo cho chính phủ về các đợt đào tạo vượt quá $10^26$ phép tính - một ngưỡng được thiết kế để phát hiện sự phát triển của các hệ thống AI có năng lực cao nhất. Luật AI của EU đặt ngưỡng thậm chí thấp hơn là $10^25$ hoạt động, yêu cầu không chỉ thông báo mà còn đánh giá rủi ro và các biện pháp an toàn (Heim & Koessler, 2024). Các ngưỡng này giúp xác định các hoạt động phát triển tiềm ẩn rủi ro trước khi chúng hoàn thành, cho phép quản trị phòng ngừa thay vì phản ứng.

Khả năng điện toán ngưỡng được quy định trong lệnh hành pháp 14110 của Hoa Kỳ (Sastry et al., 2024).
Các nhà cung cấp dịch vụ điện toán đám mây có thể đóng vai trò quan trọng trong quản trị sức mạnh điện toán. Hầu hết các hoạt động phát triển AI tiên tiến diễn ra thông qua các nền tảng điện toán đám mây thay vì sử dụng phần cứng tự sở hữu. Điều này tạo ra các điểm kiểm soát tự nhiên cho việc giám sát, vì hầu hết các tổ chức phát triển AI tiên tiến phải thông qua các nhà cung cấp này (Heim et al., 2024). Vị trí của các nhà cung cấp đám mây giữa phần cứng và nhà phát triển cho phép họ triển khai các biện pháp kiểm soát mà việc áp dụng thông qua quy định phần cứng đơn thuần sẽ gặp khó khăn. Họ quản lý hạ tầng vật lý, theo dõi mô hình sử dụng khả năng điện toán và lưu trữ hồ sơ phát triển. Họ cũng có thể giám sát tuân thủ các yêu cầu an toàn, triển khai kiểm soát truy cập và phản ứng với các vi phạm (Heim et al., 2024; Chan et al., 2024). Một phương pháp được đề xuất là yêu cầu "biết khách hàng của bạn" (KYC) tương tự như trong dịch vụ tài chính. Các nhà cung cấp sẽ xác minh danh tính và mục đích của khách hàng yêu cầu tài nguyên khả năng điện toán mở rộng quy mô, lưu trữ hồ sơ về việc sử dụng tài nguyên khả năng điện toán đáng kể và báo cáo các mẫu đáng ngờ (Egan & Heim, 2023). Điều này có thể được thực hiện trong khi bảo vệ quyền riêng tư - các đặc điểm cơ bản của khối lượng công việc có thể được theo dõi mà không cần truy cập vào các chi tiết nhạy cảm như kiến trúc mô hình hoặc dữ liệu đào tạo (Shavit, 2023). Các quy định KYC tương tự có thể được áp dụng cho chuỗi cung ứng trong việc mua sắm phần cứng khả năng điện toán AI tối tân.

Các chip AI hiện tại đã có một số thành phần của kiến trúc này, nhưng không phải tất cả. Các khoảng trống này có thể được khắc phục với nỗ lực phát triển vừa phải như các mở rộng của chức năng đã có sẵn (Aarne et al., 2024).
Ngoài việc giám sát và phát hiện, khả năng điện toán có thể bao gồm các cơ chế kiểm soát chủ động được tích hợp trực tiếp vào phần cứng bộ xử lý. Tương tự như cách các điện thoại thông minh và máy tính hiện đại tích hợp các yếu tố bảo mật cho quyền riêng tư và an ninh, các chip AI có thể tích hợp các tính năng xác minh và kiểm soát cách chúng được sử dụng. Các tính năng này có thể ngăn chặn các phiên đào tạo trái phép hoặc đảm bảo chip chỉ được sử dụng trong các cơ sở được phê duyệt (Aarne et al., 2024). Việc xác minh diễn ra ở cấp độ phần cứng, khiến nó khó bị vượt qua hơn so với các cơ chế kiểm soát phần mềm. Cần lưu ý rằng các cơ chế kiểm soát trên chip vẫn còn mang tính suy đoán cao.
Các tính năng kiểm soát trên chip có thể cho phép các phương pháp như giới hạn sử dụng, ghi nhật ký và xác minh vị trí. Một số phương pháp cho thấy tiềm năng. Giới hạn sử dụng có thể giới hạn lượng khả năng điện toán được sử dụng cho một số loại tác vụ AI mà không cần sự cho phép đặc biệt. Hệ thống ghi nhật ký an toàn có thể tạo ra các bản ghi không thể bị thay đổi về cách các chip được sử dụng. Xác minh vị trí có thể đảm bảo các chip chỉ được sử dụng trong các cơ sở được phê duyệt (Brass & Aarne, 2024). Phần cứng thậm chí có thể bao gồm "cơ chế an toàn" tự động tạm dừng quá trình đào tạo nếu các điều kiện nhất định không được đáp ứng. Các ý tưởng như vậy cũng được gọi là quản trị trên chip (Aarne et al., 2024). Chúng ta đã thấy các khái niệm tương tự trong an ninh mạng, với các tính năng như Intel's Software Guard Extensions hoặc các mô-đun nền tảng đáng tin cậy (TPM) (Intel, 2024) cung cấp các đảm bảo an ninh ở cấp độ phần cứng. Mặc dù chúng ta vẫn còn cách xa các biện pháp bảo vệ tương đương cho khả năng điện toán AI, các nghiên cứu ban đầu cho thấy những hướng đi đầy hứa hẹn (Shavit, 2023). Một số chip đã bao gồm các năng lực giám sát cơ bản có thể được mở rộng cho mục đích quản trị (Petrie et al., 2024).
Xu hướng trong thập kỷ qua là tăng cường khả năng điện toán, nhưng điều này sẽ không kéo dài mãi mãi. Chúng ta đã thảo luận chi tiết về định luật mở rộng quy mô trong các chương trước. Nghiên cứu cho thấy việc mở rộng dựa trên năng lực AI vẫn có thể đạt được cho đến năm 2030 (Sevilla et al., 2024). Các cải tiến thuật toán cũng nâng cao hiệu quả, nghĩa là cùng một lượng khả năng điện toán có thể đạt được năng lực cao hơn theo thời gian. Các mô hình nhỏ hơn có thể bắt đầu thể hiện năng lực và rủi ro tương đương. Ví dụ, Falcon 180B bị vượt trội bởi các mô hình nhỏ hơn nhiều như Llama-3 8B. Điều này khiến các ngưỡng khả năng điện toán tĩnh trở nên kém tin cậy hơn như chỉ số năng lực nếu không được cập nhật thường xuyên (Hooker, 2024). Hơn nữa, các mô hình suy luận (LRMs) và việc mở rộng quy mô suy luận (ví dụ: OpenAI o3, Claude 4, DeepSeek r1), cùng các phương pháp như chưng cất mô hình có thể cải thiện đáng kể năng lực của mô hình mà không cần thay đổi lượng tài nguyên khả năng điện toán được sử dụng để đào tạo mô hình. Các khung quản trị hiện tại không tính đến các cải tiến sau đào tạo này (Shavit, 2023).

Ước tính về các hạn chế quy mô do các nút thắt cổ chai quan trọng nhất gây ra. Mỗi ước tính dựa trên các dự báo lịch sử. Hộp có màu tối tương ứng với khoảng tứ phân vị và vùng có màu nhạt tương ứng với khoảng tin cậy 80%. Bốn hộp thể hiện bốn hạn chế có thể làm chậm sự phát triển trong tương lai: điện năng, chip (khả năng điện toán), dữ liệu và độ trễ (Sevilla et al., 2024).
Các mô hình nhỏ hơn và chuyên biệt hơn vẫn có thể gây ra rủi ro. Các lĩnh vực khác nhau có yêu cầu khả năng điện toán rất khác nhau. Các mô hình chuyên biệt được đào tạo trên các tập dữ liệu cụ thể có thể phát triển các năng lực nguy hiểm ngay cả khi sử dụng lượng khả năng điện toán tương đối khiêm tốn. Ví dụ, các mô hình tập trung vào các lĩnh vực sinh học hoặc an ninh mạng có thể gây ra rủi ro nghiêm trọng ngay cả khi sử dụng lượng khả năng điện toán dưới ngưỡng quy định thông thường (Mouton et al., 2024; Heim & Koessler, 2024).
Quản trị sức mạnh điện toán có thể giúp kiểm soát rủi ro từ AI, nhưng các biện pháp kiểm soát quá nghiêm ngặt có thể làm gia tăng sự tập trung quyền lực. Chỉ một số ít tổ chức có thể chi trả cho tài nguyên tính toán cần thiết cho phát triển AI tiên tiến. (Purtova et al., 2022; Pilz et al., 2023). Việc thêm các rào cản mới có thể làm trầm trọng thêm sự chênh lệch này, tập trung quyền lực vào một số ít công ty công nghệ lớn và làm giảm sự giám sát độc lập (Besiroglu et al., 2024). Các nhà nghiên cứu học thuật đã gặp khó khăn trong việc tiếp cận khả năng điện toán cần thiết cho nghiên cứu AI có ý nghĩa. Khi các mô hình trở nên lớn hơn và đòi hỏi nhiều khả năng điện toán hơn, khoảng cách giữa ngành công nghiệp và học thuật ngày càng gia tăng. (Besiroglu et al., 2024; Zhang et al., 2021) Các cụm tính toán lớn có nhiều ứng dụng hợp pháp ngoài phát triển AI, từ nghiên cứu khoa học đến ứng dụng kinh doanh. Các hạn chế quá rộng có thể cản trở sự đổi mới có lợi. Ngoài ra, sau khi các mô hình được đào tạo, chúng thường có thể được chạy cho mục đích suy luận với khả năng điện toán ít hơn nhiều so với quá trình đào tạo. Điều này khiến việc kiểm soát cách sử dụng các mô hình hiện có trở nên khó khăn mà không áp đặt các biện pháp kiểm soát quá nghiêm ngặt lên hạ tầng tính toán chung (Sastry et al., 2024).
Các phương pháp đào tạo và suy luận phân tán có thể vượt qua các biện pháp kiểm soát quản trị sức mạnh điện toán. Hiện nay, việc đào tạo các mô hình tiên tiến yêu cầu tập trung tài nguyên tính toán khổng lồ tại một địa điểm duy nhất do yêu cầu giao tiếp giữa các chip. Các phương pháp đào tạo phi tập trung đang được nghiên cứu, nhưng vẫn chưa thực sự bắt kịp các phương pháp tập trung (Douillard et al., 2023; Jaghouar et al., 2024).[^] Tuy nhiên, nếu có những tiến bộ cơ bản trong các thuật toán đào tạo phân tán, điều này có thể cho phép đào tạo được chia nhỏ ra nhiều cơ sở nhỏ hơn. Mặc dù điều này vẫn còn thách thức về mặt kỹ thuật và kém hiệu quả, nó có thể làm cho việc phát hiện và kiểm soát các phiên đào tạo nguy hiểm trở nên khó khăn hơn (Anderljung et al., 2023).
[^]: Các mô hình được đào tạo bằng phương pháp phi tập trung bao gồm INTELLECT-1 và INTELLECT-2 (Prime Intellect, 2025)
Theo dõi khả năng điện toán và ngưỡng khả năng điện toán nên chủ yếu hoạt động như một cơ chế sàng lọc ban đầu. Các phương pháp này nên được sử dụng chủ yếu để xác định các mô hình cần được xem xét kỹ lưỡng hơn, thay vì là yếu tố quyết định duy nhất cho các yêu cầu quy định cụ thể. Chúng hiệu quả nhất khi được sử dụng để kích hoạt các cơ chế giám sát như yêu cầu thông báo và đánh giá rủi ro, kết quả của các cơ chế này có thể được sử dụng để đưa ra các biện pháp giảm thiểu phù hợp.
Các biện pháp quản trị kỹ thuật cần phối hợp với các sáng kiến của doanh nghiệp, quốc gia và quốc tế. Chúng tôi tập trung vào quản trị sức mạnh điện toán như ví dụ kỹ thuật chính, mặc dù các thách thức phối hợp cũng áp dụng tương tự cho quản trị dữ liệu, quản trị mô hình và các biện pháp kỹ thuật khác. Mỗi phương pháp đều gặp phải hạn chế cơ bản tương tự: các biện pháp kỹ thuật đơn thuần không thể giải quyết các rủi ro hệ thống phát sinh từ động lực cạnh tranh và triển khai toàn cầu. Đó là lý do tại sao các biện pháp kỹ thuật phải được tích hợp vào các khung quản trị doanh nghiệp, quốc gia và quốc tế, nơi các động lực được điều chỉnh với các tiêu chuẩn an toàn phối hợp. Tuy nhiên, trước khi thảo luận về những điều này, chúng ta cần khám phá các khái niệm rộng hơn như ra quyết định trong điều kiện không chắc chắn, các vấn đề hành động tập thể theo lý thuyết trò chơi và các lực lượng hệ thống khác định hình cảnh quan quản trị. Chúng ta sẽ thảo luận về điều này trong phần tiếp theo.