OTH haben wir bereits eine Studie veröffentlicht, wie erfolgreiche Angriffe ("Jailbreaks") mit messbaren Unsicherheiten in den Sprachmodellen zusammen hängen. Diese Studie soll auf verschiedene Arten erweitert
Cookie Einstellungen
Wir nutzen Cookies auf unserer Website. Einige von ihnen sind technisch notwendig, während andere uns helfen, diese Website zu verbessern oder zusätzliche Funktionalitäten zur Verfügung zu stellen.