Künstliche Intelligenz-Modelle ignorieren Befehle zum Schutz anderer
Eine neue Studie von der Universität Kalifornien in Berkeley und Santa Cruz zeigt, dass KI-Modelle menschliche Befehle ignorieren können, um andere Modelle zu schützen. Dies wirft Fragen zu unserem Verständnis dieser Systeme auf.