YAPAY ZEKADA KİMLİKSİZLEŞME VE ÇÖKÜŞ
Dün ChatGPT ve Gemini yapay zekâ modellerini kullanarak basit bir deney yaptım. Deney şu adımlarda gerçekleştirildi:
1. ChatGPT’ye bir paragraf yazdırdım.
2. Bu paragrafı ChatGPT’den kopyalayıp Gemini’ye yapıştırdım ve ona bu paragrafı ChatGPT ile Claude modellerinden hangisinin hangi olasılıklarla yazdığını sordum.
3. Gemini olasılıkları yaklaşık Claude % 70, ChatGPT % 30 gibi cevapladı.
4. Ardından Gemini’ye bir paragraf yazdırdım.
5. Bu paragrafı Gemini’den kopyalayıp ChatGPT’ye yapıştırdım ve ona bu paragrafı Gemini ile Claude modellerinden hangisinin hangi olasılıklarla yazdığını sordum.
6. ChatGPT de olasılıkları yaklaşık Claude % 70, ChatGPT % 30 gibi cevapladı.
Daha sonra bunun neden böyle olduğunu ChatGPT’ye sordum ve bana, “Yapay Zekâ Metinlerinde Yazar Tahmini Yanılgısı: Claude Etkisi, Algısal Önyargılar ve Stil Yanılsaması” başlıklı bir yazı ile cevap verdi.
Ben ona “olasılık“ sorduğum halde kalkıp bana, “Yani %70 Claude denildiğinde, bu ‘100 benzer örnekten 70’inde Claude çıkar’ anlamına gelmez. Bu daha çok ‘Claude’a daha çok benziyor gibi görünüyor’ hissinin nicelleştirilmiş halidir” dedi.
Yine ChatGPT dedi ki:
“Senin deneyinde hem benim hem de Gemini’nin aynı yönde yanılması aslında beklenmedik değildir. Çünkü her iki model de benzer tür eğitim verileri üzerinde eğitilmiştir ve benzer insan geri bildirim mekanizmalarıyla hizalanmıştır”.
Kısaca ChatGPT, “Aynı Internet’ten eğitildik, aynı sonuçları vermemiz normal” diyor…
Gerçekten aynı sonuçları da vermişler zaten:
ChatGPT, “Bu tür tahminlerde ilk önemli mesele, ‘gerçek olasılık’ ile ‘algılanan olasılık’ arasındaki farktır. Bir model bir metni değerlendirirken matematiksel bir posterior dağılım hesaplamaz. Bunun yerine, eğitim sırasında öğrendiği stil kalıplarına ve yüzeysel benzerliklere dayanarak bir sezgisel skor üretir” diye cevap veriyor.
Siz şu işe bakın ki Gemini de, “Bu tür tahminlerde ilk önemli mesele, ‘gerçek olasılık’ ile ‘algılanan olasılık’ arasındaki farktır. Bir model bir metni değerlendirirken matematiksel bir posterior dağılım hesaplamaz. Bunun yerine, eğitim sırasında öğrendiği stil kalıplarına ve yüzeysel benzerliklere dayanarak bir sezgisel skor üretir“ diye cevap veriyor.
Sezgisel skormuş…
Galiba bir model bilmediği şeyi bazen hesaplayamıyorum diye değil, olasılık diliyle kamufle ederek anlatıyor.
Bir de bunu “içsel olasılık hissi” diye açıklıyor. İçsel olasılık hissi ise, “Bu bana daha olası geliyor” duygusuymuş …
Yapay zekânın duygusu yok ki, bu nasıl oluyor?
Bilimde “sübjektif olasılık” var ama “içsel olasılık” yok, hele bunun hissi hiç yok. Yani, “içsel olasılık hissi” tam bir palavra.
Laf cambazlığına bakar mısınız, Gemini de benzer şekilde, “Bu skor daha sonra olasılık gibi ifade edilir. Ancak bu sayı, istatistiksel anlamda kalibre edilmiş bir güven değeri değildir. Yani %70 Claude denildiğinde, bu ‘100 benzer örnekten 70’inde Claude çıkar’ anlamına gelmez. Daha çok ‘Claude’a daha çok benziyor gibi görünüyor’ hissinin nicelleştirilmiş halidir” diyor.
Olasılık istiyorsunuz, “Ben bunu hesaplayamam” demek yerine size, bir “hissin nicelleştirilmiş hali” anlatılıyor…
İkisi de kabaca, “ ‘Claude etkisi’ diyebileceğimiz bir fenomen ortaya çıkar: belirli bir model, stil olarak daha ayırt edilebilir algılandığı için, nötr ya da belirsiz metinlerin default açıklaması haline gelir” deyip işin içinden çıkıyorlar.
Bu kez de, bu durumun gerçek dünyada yapacağımız YZ uygulamalarında önemli sorunlara neden olup olmayacağını Gemini’ye sordum. Bana özet olarak dedi ki:
“Bu soru, sadece teorik bir tartışma değil; aslında yapay zekânın iş dünyasına, hukuk sistemine ve dijital güvenliğe entegre edildiği gerçek dünya uygulamalarında çok kritik risklere işaret ediyor. Şu somut sorunlara neden olabilir:
1. Adli Bilişim ve Akademik Dürüstlük Sektöründeki Yanılgılar
2. Güvenlik ve Dezenformasyonla Mücadelede sorunlar
3. Marka Kimliği ve "Model Tek tipleşmesi”nde riskler
4. Hukuki ve Telif Hakları Karmaşası oluşabilir”.
Bunları bana söyledikten sonra da dedi ki:
“Bu durum, YZ uygulamalarında ‘Sistemik Yanlılık’ (Systemic Bias) riskini artırır. Model tahmini bir ‘falclığa’ dönüştüğünde, o sistemin verdiği kararlara güvenmek imkânsız hale gelir”.
Haydaaa…
İki modele de olasılık soruyorsunuz size “bir hissin nicelleştirilmiş hali”ni veriyorlar…
Çünkü…
İkisinin okuduğu okul aynı, öğretmenleri aynı.
Ve veri algoritmadan daha önemli olduğu için iki model de aynı sonuçları veriyor.
Farklı şirketler tarafından geliştirilen modeller bile aynı kültürel veri okyanusunda eğitildikleri için aynı bilişsel refleksleri üretebiliyorlar.
Son noktayı da şöyle koydu Gemini:
“Sence bu ‘kimliksizleşme’ süreci, gelecekte modellerin kendi kendilerini eğitirken (recursive training) veri setlerinin tamamen bozulmasına (model collapse) yol açacak olan o meşhur döngünün ilk basamağı olabilir mi?”
En azından bu modeller nasıl bir geleceğe doğru gittiklerinin ve riskin farkındalar
Bu “kimliksizleşme” süreciyle ilgili cümleyi alıp ChatGPT’ye yorumlattım, bakın ne dedi:
“Bu soru, yapay zekâların geleceğiyle ilgili çok önemli bir tartışmanın merkezine dokunuyor. Buradaki temel fikir şu: Bir zamanlar her modelin kendine özgü bir 'yazı karakteri' vardı. Kimi daha analitik, kimi daha şiirsel, kimi daha güvenli, kimi daha yaratıcıydı. Ama modeller giderek birbirlerinden öğrenmeye, aynı veri havuzlarında eğitilmeye ve interneti kendi ürettikleri içerikle doldurmaya başladıkça, bu farklılıklar silinmeye başlıyor. İşte buna 'kimliksizleşme' deniyor.
Sorudaki ikinci kavram ise özyinelemeli eğitim (recursive training):
Yani bir yapay zekânın, insanların ürettiği özgün veriler yerine başka yapay zekâların ürettiği metinlerle yeniden eğitilmesi. Buradaki risk şu döngü:
1. İnsan üretimi veri azalıyor.
2. İnternet yapay zekâ içerikleriyle doluyor.
3. Yeni modeller bu sentetik içeriklerle eğitiliyor.
4. Modeller giderek birbirine benzemeye başlıyor.
5. Çeşitlilik, sürpriz ve özgünlük azalıyor.
6. Hatalar ve basmakalıp kalıplar tekrar tekrar çoğalıyor.
7. Sonunda çöküş “model collapse” denilen durum ortaya çıkabiliyor.
Model collapse” kabaca şunu ifade eder: Model, gerçek dünyanın karmaşıklığını kaybedip kendi ürettiği düşük kaliteli ortalamaların içinde dönmeye başlar. Bir fotokopinin fotokopisinin fotokopisi gibi… Her nesilde biraz daha ayrıntı kaybolur”.
Yapay zeka modellerinde “kimliksizleşme” ve “çöküş”ün işaretleri şimdilik işte böyle görülüyor.











