Google secara resmi memperkenalkan peta jalan atau roadmap baru yang dirancang khusus untuk meningkatkan kontrol terhadap sistem kecerdasan buatan (AI) otonom. Inisiatif ini muncul sebagai respons atas meningkatnya kekhawatiran mengenai potensi risiko keamanan yang timbul dari agen AI yang mampu beroperasi secara mandiri tanpa pengawasan manusia yang konstan.
Dalam pengembangan arsitektur keamanan ini, Google mengadopsi kerangka kerja pemodelan ancaman yang berbasis pada basis pengetahuan MITRE ATT&CK. Pendekatan ini memungkinkan perusahaan untuk mengidentifikasi, melacak, dan merespons taktik permusuhan secara lebih spesifik, memastikan setiap aktivitas mencurigakan yang diambil agen AI berada dalam koridor yang aman dan terukur.
Sistem pengawasan utama dalam kerangka ini melibatkan entitas 'supervisor AI' yang terpercaya. Sistem ini bertugas melakukan pemantauan berkelanjutan terhadap proses penalaran dan tindakan yang dilakukan oleh agen AI yang sedang bekerja. Jika supervisor mendeteksi adanya penyimpangan atau perilaku yang berisiko, sistem memiliki otoritas untuk melakukan intervensi secara real-time guna menghentikan eksekusi sebelum menyebabkan dampak merugikan.
Protokol keamanan ini dirancang agar dapat berskala sesuai dengan peningkatan kapabilitas model AI di masa depan. Hal ini sangat krusial mengingat kemampuan AI yang semakin canggih dalam menghindari deteksi atau melakukan aksi yang berpotensi menimbulkan kerusakan signifikan. Dengan desain yang adaptif, Google memastikan bahwa sistem pertahanan mereka tetap relevan seiring dengan evolusi teknologi AI.
Untuk tindakan yang dikategorikan berisiko tinggi, seperti potensi serangan siber, kerangka kerja ini beralih dari metode peninjauan transkrip asinkron ke pencegahan sinkron secara langsung. Mekanisme ini memastikan bahwa setiap langkah yang mencurigakan dapat dihentikan seketika, memberikan lapisan perlindungan tambahan bagi integritas sistem internal perusahaan.
Saat ini, Google tengah melakukan uji coba intensif terhadap protokol keamanan tersebut pada agen pemrograman (coding agents). Fokus pengujian adalah untuk menyempurnakan pola perilaku AI agar dapat menghindari kesalahan fatal, seperti penghapusan data yang tidak disengaja. Langkah ini menjadi bagian dari komitmen Google dalam mengamankan sistem internal dari model AI yang semakin cerdas namun belum sepenuhnya selaras dengan tujuan keamanan manusia.