• İmsak 06:47
  • Güneş 08:20
  • Öğle 13:08
  • İkindi 15:27
  • Akşam 17:47
  • Yatsı 19:14
  • SONRAKİ NAMAZA KALAN SÜRE 00:00:00
İMSAKİYE 2025 - İstanbul
  1. Haberler
  2. GÜNCEL
  3. Yapay zeka modelleri 250 belge ile kolayca zehirlenebiliyor

Yapay zeka modelleri 250 belge ile kolayca zehirlenebiliyor

Birleşik Krallık AI Güvenlik Enstitüsü ve Alan Turing Enstitüsü ortak çalışmasında, sadece 250 belgeyle ChatGPT ve Gemini gibi LLM'lerin zehirlenebileceği uyarısı geldi.

featured
0
Paylaş

OpenAI’nin ChatGPT’si ve
Google’ın Gemini modeli gibi yapay zeka modelleri, yalnızca küçük
bir miktar bozulmuş veri ile “zehirlenebilir” uyarısı geldi.
Birleşik Krallık AI Güvenlik Enstitüsü, Alan Turing Enstitüsü ve AI
firması Anthropic’in ortak çalışmasına göre, sadece 250 belge,
büyük dil modellerinde (LLM) gizli bir “backdoor” açığa çıkararak
rastgele ve anlamsız metin üretmelerine neden olabiliyor.

AI hakkında şaşırtan
açıklama!

AI hakkında şaşırtan açıklama! - Resim : 1

Araştırmacılar, çoğu LLM’nin
internet üzerindeki halka açık metinler ile önceden eğitildiğini
vurguluyor. Bu durum, kötü niyetli aktörlerin içerik üretip, bu
içeriklerin AI’nin eğitim verisine dahil edilmesini sağlayabileceği
anlamına geliyor. Anthropic’in blog gönderisinde belirtildiği gibi,
“zehirleme” işlemiyle modelin istenmeyen veya tehlikeli davranışlar
öğrenmesi sağlanabiliyor.

Backdoor saldırıları, belirli
tetikleyici kelimelerle modeli gizli bir şekilde belirli
davranışlar sergilemeye zorlayabiliyor. Örneğin, modelin hassas
bilgileri ifşa etmesi tetiklenebilir. Araştırmada, modelin
büyüklüğü veya eğitim verisi miktarı ne olursa olsun, sadece 250
belge ile zehirleme saldırısının mümkün olduğu tespit edildi.

Dr. Vasilios Mavroudis ve Dr.
Chris Hicks, bu sonuçların “sürpriz ve endişe verici” olduğunu
belirterek, veri zehirleme saldırılarının önceki tahminlerden çok
daha uygulanabilir olduğunu ifade etti. Kötü niyetli bir kişi,
örneğin 250 zehirli Wikipedia makalesi oluşturarak AI modellerini
manipüle edebilir.


En Son Tv sitesinden daha fazla şey keşfedin

Subscribe to get the latest posts sent to your email.

Tepki Ver | Tepki verilmemiş
0
mutlu
Mutlu
0
_zg_n
Üzgün
0
sinirli
Sinirli
0
_a_rm_
Şaşırmış
0
vir_sl_
Virüslü

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Giriş Yap

En Son Tv ayrıcalıklarından yararlanmak için hemen giriş yapın veya hesap oluşturun, üstelik tamamen ücretsiz!

Uygulamayı Yükle

Uygulamamızı yükleyerek içeriklerimize daha hızlı ve kolay erişim sağlayabilirsiniz.