Yapay zekayı değerlendiren yüzlerce testte hata tespit edildi

Bilim insanları, yapay zekanın güvenliğini ölçmek için kullanılan 445 testin büyük bölümünde geçerliliği zedeleyen hatalar bulunduğunu belirledi.

Ahmet Dinç

Editör

05.11.2025 - 11:40 Yayınlanma

05.11.2025 - 11:42 Güncelleme

4 Gösterim

1 Dk Okunma Süresi

Yapay zekayı değerlendiren yüzlerce testte hata tespit edildi

Moore Yasası sona eriyor, bilgisayarların geleceği şekilleniyor

İçeriği Görüntüle

İngiltere Yapay Zeka Güvenlik Enstitüsü öncülüğünde yürütülen uluslararası araştırmada, yapay zekanın güvenliği ve etkinliğini ölçmek için kullanılan yüzlerce testin hatalı olduğu ortaya çıktı.

Çalışma, bu testlerin sonuçlarının güvenilirliği konusunda ciddi soru işaretleri yarattı.

Stanford, Berkeley ve Oxford üniversitelerinin de aralarında bulunduğu 14 kurumdan 29 bilim insanının katıldığı araştırma, “Önemli Olanı Ölçmek: Büyük Dil Modeli Kıyaslamalarında Yapı Geçerliği” başlığıyla yayımlandı.

Ekip, yapay zekanın alt dallarından “doğal dil işleme” ve “makine öğrenimi” alanlarında yapılan 445 farklı değerlendirme testini inceledi.

TESTLERİN ÇOĞU GEÇERSİZLİK RİSKİ TAŞIYOR

Analiz sonucunda testlerin büyük çoğunluğunda, sonuçların güvenilirliğini zedeleyebilecek yapısal kusurlar bulundu. Araştırmacılar, mevcut testlerin çoğunun “ölçmek istedikleri şeyi gerçekten ölçemediğini” tespit etti.

Çalışmanın baş yazarı, Oxford İnternet Enstitüsünden Andrew Bean, bu testlerin büyük teknoloji şirketlerinin piyasaya sürdüğü yapay zeka modellerini değerlendirmede temel araç olarak kullanıldığını söyledi.

Tüi̇k 2025 Yapay Zeka Karnesi Türkiye’de Dijital Sıçrama

“GÜVENİLİR ÖLÇÜM SİSTEMLERİ OLUŞTURULMALI” ÇAĞRISI

Bean, yapay zekanın gelişimini doğru şekilde takip edebilmek için ortak tanımlar ve güvenilir ölçüm yöntemlerinin geliştirilmesi gerektiğini vurguladı. Mevcut durumda farklı laboratuvar ve şirketlerin farklı test standartları kullanmasının, modellerin gerçek ilerlemesini objektif biçimde değerlendirmeyi zorlaştırdığı belirtildi.

Araştırma, yapay zekanın güvenliği konusundaki denetim mekanizmalarının yeniden ele alınması gerektiğini ortaya koydu.

Kaynak: AA

Editörün Seçtiği

Kütahya’da ehliyetsiz sürücüler çarpıştı

Editörün Seçtiği

Kütahyalı otobüs şoförünün cenazesi defnedildi

Editörün Seçtiği

Kütahya’da Hak-İş’ten Başkan Kahveci’ye çağrı

Editör Hakkında

Ahmet Dinç

Yorumlar

Süper Lig Puan Durumu

Süper Lig

#	Takım	O	P
1	Galatasaray	20	49
2	Fenerbahçe	20	46
3	Trabzonspor	20	42
4	Göztepe	20	39
5	Beşiktaş	20	36
6	Başakşehir	20	30
7	Samsunspor	20	30
8	Gaziantep FK	20	25
9	Kocaelispor	20	24
10	Alanyaspor	20	22

Detaylar için tıklayın

Süper Lig Fikstür

7 Şubat, Cumartesi
Fatih Karagümrük - Antalyaspor
14:30
Samsunspor - Trabzonspor
20:00

8 Şubat, Pazar
Eyüpspor - Başakşehir
14:30
Konyaspor - Göztepe
17:00
Rizespor - Galatasaray
17:00
Beşiktaş - Alanyaspor
20:00

9 Şubat, Pazartesi
Kayserispor - Kocaelispor
17:00
Fenerbahçe - Gençlerbirliği
20:00
Gaziantep FK - Kasımpaşa
20:00

Yapay zekayı değerlendiren yüzlerce testte hata tespit edildi

Bilim insanları, yapay zekanın güvenliğini ölçmek için kullanılan 445 testin büyük bölümünde geçerliliği zedeleyen hatalar bulunduğunu belirledi.

TESTLERİN ÇOĞU GEÇERSİZLİK RİSKİ TAŞIYOR

“GÜVENİLİR ÖLÇÜM SİSTEMLERİ OLUŞTURULMALI” ÇAĞRISI

Eski çalışandan Google’a yapay zeka suçlaması

15 Yaş altına sosyal medya kısıtlaması geliyor

Sağlıkta yapay zeka kullanımına dikkat uyarısı

WhatsApp’a yüksek güvenlikli mod geldi: Katı Hesap Ayarları nasıl aktif edilir?

Sony’den PlayStation 4 kullanıcılarına uyarı

Microsoft'un piyasa değeri 360 milyar dolar eridi