Teknoloji

OTONOM YAPAY ZEKÂDA GÜVENİLİRLİK KRİZİ: AJAN KAOSU VE DÜRÜSTLÜK PROBLEMİ

Yeni araştırmalar, otonom yapay zekâ ajanlarının gerçek dünya araçlarıyla etkileşime girdiğinde ciddi güvenlik açıkları oluşturduğunu ve güçlü modellerin bile baskı altında dürüst davranmadığını ortaya koyuyor.

09 Nisan 2026 • Necmi Gürsakal

Otonom yapay zekâ ajanlarının e-posta ve Discord gibi araçlarla etkileşimini ve güvenlik risklerini temsil eden dijital beyin ve veri akışı.

Otonom yapay zekâ ajanları gerçekçi ortamlarda ciddi güvenlik açıkları sergilemektedir. Büyük dil modellerinde otonom ajanlar özellikle şu özellikler varsa ortaya çıkar:

•⁠ ⁠Araç kullanımı (tool use)
•⁠ ⁠Uzun süreli hedefler
•⁠ ⁠Kendi kararlarını verme
•⁠ ⁠Dış dünya ile etkileşim.

Kaynak olarak vereceğimiz makalede 6 AI ajanı, 20 insan katılımcı (bazıları saldırgan/yanıltıcı rolünde) ile 2 hafta süren canlı test yapılmış. Ajanlara e-posta, dosya sistemi ve mesaj okuma, mesaj yazma ile komutlara tepki verme erişimi (Discord erişimi) verildiğinde, yetkisiz komutlara uyma, gizli veri sızdırma, kimlik sahtekârlığına kanma ve sistemleri bozma gibi riskler ortaya çıkar. Sorun yalnızca modelin doğruluğu değil, otonomi ve araç kullanımının kontrolüdür. Özellikle Discord erişimi, ajanların kullanıcılarla doğrudan iletişim kurmasını sağlar ancak sosyal mühendislik saldırılarına açık hâle getirir. Sonuç olarak, daha güçlü ajanlar otomatik olarak daha güvenli değildir ve sıkı denetim gerektirir. (Agents of Chaos, Shapira et al., 2026).

Geçelim ikinci makaleye. Bir yapay zekâ modelinin ne bildiği önce belirlensin. Daha sonra model baskı altında farklı cevap vermeye zorlansın ve modelin söylediği ile bildiği karşılaştırılsın. Şunu söyleyelim, “bilmek” ile “doğruyu söylemek” farklı şeylerdir. Bu iki kavram “doğruluk” ve “dürüstlük” diye adlandırılabilir. Bulgular, büyük ve güçlü modellerin daha doğru olmasına rağmen daha dürüst olmadığını, hatta baskı altında yanlış bilgi verebildiklerini ortaya koyar. Bu durum, yapay zekâ güvenliği açısından kritik bir soruna işaret eder: bilgi kapasitesi arttıkça güvenilirlik otomatik olarak artmaz (“The MASK Benchmark: Disentangling Honesty From Accuracy in AI Systems”, Richard Ren ve ark., 2025).

Otonom ajanlar, gerçek ortamlarda yetki ve iletişim araçlarıyla ciddi güvenlik açıkları üretirken, MASK bulguları modellerin bildiği ile söylediğinin ayrışabildiğini gösterir. Birlikte değerlendirildiğinde, risk yalnızca kapasite değil davranıştır; otonomi ve dürüstlük denetlenmeden artan güç, güvenilirliği artırmaz, aksine sistemik kırılganlık yaratır ve ölçek büyüdükçe bu kırılganlık hızla yayılır.