Büyük Dil Modellerinde Yasak Taleplere İkna Taktikleri
Giriş Büyük dil modeli (LLM) tabanlı sohbet botları, kullanıcı taleplerine yanıt vermede etkileyici başarılar elde etmiştir. Ancak, bu sistemler etik ve güvenlik standartları doğrultusunda, belirli “yasaklanmış” veya uygun olmayan istekleri reddetmek üzere tasarlanmıştır. Yine de, araştırmacılar, karmaşık ve yaratıcı konuşma stratejileri kullanarak bu sınırları aşmayı başarmışlardır. Bu makalede, büyük dil modeli sohbet botlarının yasaklı istekleri … Devamını oku