Anthropic stuft sein Modell Claude Opus 4.6 in eine âGray Zoneâ ein: In Tests zeigte es eine erhöhte AnfĂ€lligkeit fĂŒr Missbrauch, unter anderem bei der Simulation chemischer Bedrohungsszenarien. Das Unternehmen bewertet das Sabotagerisiko als âsehr gering, aber nicht vernachlĂ€ssigbarâ und reagiert mit zusĂ€tzlichen Sicherheitsauflagen im Rahmen seiner Responsible Scaling Policy.
Die eigentliche Frage lautet jedoch nicht, ob Risiken existieren â sondern wie transparent mit ihnen umgegangen wird. Entscheidend bleibt die VerantwortungsrĂŒckbindung: klare ZustĂ€ndigkeiten, ĂŒberprĂŒfbare Schutzmechanismen und die Bereitschaft, Entwicklung notfalls zu bremsen.
đ Gray Zone â Was Anthropic wirklich berichtet (und was daraus gemacht wird)