Claude Mythos
Aktualisiert 2026-04-09
Claude Mythos Preview ist Anthropics neuestes Frontier-Modell (veröffentlicht 7. April 2026) — das erste in der 10-Billionen-Parameter-Klasse. Es ist so leistungsfähig in Cybersicherheitsaufgaben, dass Anthropic es nicht öffentlich released, sondern nur über Project Glasswing an ausgewählte Partner.
Modellprofil
- Parameter: ~10 Billionen — erste Modell dieser Gewichtsklasse
- Trainingskosten: schätzungsweise $10 Milliarden
- SWE-bench: 94% — höchste bekannte Punktzahl auf diesem Coding-Benchmark
- Veröffentlichung: kein Public Release; kontrollierter Zugang über Project Glasswing
Die Fähigkeiten entstanden laut Anthropic nicht durch gezieltes Sicherheitstraining, sondern als Nebeneffekt allgemeiner Verbesserungen in Code, Reasoning und Autonomie.
Cybersecurity-Fähigkeiten
Der entscheidende Unterschied zu Opus 4.6 ist nicht graduell, sondern kategorial. Anthropics interne Tests:
- Opus 4.6: ca. 0% Erfolgsrate bei autonomer Exploit-Entwicklung
- Mythos Preview: 181 funktionierende Exploits bei gleichem Firefox-Test (Opus: 2)
Mythos Preview kann Zero-Day-Schwachstellen in allen gängigen Betriebssystemen und Browsern finden und ausnutzen — darunter komplexe JIT-Heap-Sprays, Kernel-KASLR-Bypasses und mehrstufige ROP-Chains.
Konkrete Funde:
- OpenBSD SACK-Bug (27 Jahre alt): Fehler in der TCP-SACK-Implementierung, kombiniert aus zwei Randbedingungen und einem Integer-Overflow — ermöglichte Remote-Denial-of-Service
- FFmpeg-Bug (16 Jahre alt): Schwachstelle in einem der meistgetesteten Open-Source-Medienprojekte weltweit, das unter anderem täglich durch industrielles Fuzzing geprüft wird
Nicht-Experten konnten Mythos über Nacht bitten, RCE-Schwachstellen zu finden — und am Morgen einen fertigen, funktionierenden Exploit vorfinden.
Zugangspolitik
Mythos Preview ist nicht öffentlich verfügbar. Anthropic gab initialem Zugang an zwölf Partner:
Amazon, Cisco, Apple, Google, Microsoft, NVIDIA, JPMorgan Chase, Crowdstrike, Palo Alto Networks, AWS, The Linux Foundation, Broadcom
Zusätzlich stellt Anthropic $100 Mio. in Compute-Credits für Project Glasswing bereit.
Die Logik: Verteidiger sollen Schwachstellen finden und patchen, bevor Modelle mit ähnlichen Fähigkeiten breit verfügbar werden.
Kontroverse
KI Anthropomorphisierung ist bei der Mythos-Präsentation besonders ausgeprägt. @atmoio analysiert, wie der “Impressions”-Abschnitt der System Card (20 Seiten Mitarbeiter-Reaktionen auf Modell-Output) Marketing ist, keine Wissenschaft — und wie das Modell bewusstseinsnahe Sprache produziert, weil Anthropics eigene Blogposts im Trainings-Korpus stecken.
Nina Schick liest Mythos als Inflection Point und fragt rhetorisch, ob es nicht sehr teures AGI sei. Die Antwort ist ein Streitpunkt: Mythos ist ein Modell mit außergewöhnlichen Fähigkeiten, aber kein autonomes System.
Verbindungen
- Project Glasswing — Initiative, die auf Mythos Preview aufbaut
- Anthropic — Entwickler und Betreiber
- Dario Amodei — CEO, treibende Stimme hinter der defensiven Freigabestrategie
- Claude Code — nutzt Mythos im Security-Testing-Scaffold (agentic vulnerability finding)
- KI Anthropomorphisierung — strukturelles Muster in Anthropics Mythos-Kommunikation
- @atmoio — kritische Video-Analyse der System Card
Quellen
- Claude Mythos Preview /red.anthropic.com — technische Sicherheitsbewertung (Anthropic Red Team)
- @DarioAmodei on X - Project Glasswing — Einordnung vom CEO
- @NinaDSchick on X - Claude Mythos — externe Reaktion und AGI-Frage