Apertus: ein neues Sprachmodell für die Schweiz
Die Schweiz steigt ins Rennen der grossen Sprachmodelle ein. Unter dem Namen Apertus veröffentlichen ETH Zürich, EPFL und das Schweizer Supercomputing Centre (CSCS) das erste vollständig offene, mehrsprachige LLM des Landes. Eine Analyse.
Von Reto Vogt
Apertus ist lateinisch für «offen» und es ist ein Name der erstaunt, weil er nicht darauf hindeutet, dass das neue KI-Sprachmodell aus der Schweiz stammt. Das sei Absicht, hiess es an der Pressekonferenz Ende August. Man wolle den globalen Markt damit adressieren. Passend gewählt ist der Name dennoch. Ich möchte kurz erklären, warum:
Hinter Apertus stehen die ETH und die EPFL sowie das nationale Supercomputer Center (CSCS). Das besondere am Schweizer KI-Modell ist, dass der gesamte Entwicklungsprozess offengelegt wird: Architektur, Code, Trainingsdaten und vieles mehr ist frei zugänglich. Veröffentlicht wird Apertus unter Apache-2.0-Lizenz, was die Nutzung für Forschung und Lehre, aber auch für kommerzielle Zwecke erlaubt. Einfach gesagt: Alle, die können und wollen, dürfen mit Apertus einen eigenen Chatbot bauen und verkaufen.
Der Hauptunterschied zu den grossen Sprachmodellen wie ChatGPT, Gemini oder Claude der Konzerne OpenAI, Google und Anthropic ist damit offensichtlich: Während diese auf Geheimniskrämerei setzen und weder Trainingsdaten noch Algorithmen offenlegen, setzt Apertus auf Transparenz und Offenheit als Grundprinzipien.
Zahlen und Fakten
Den Angaben der Initiaten zufolge gelten folgende Kennzahlen für Apertus:
- Grösse: Zwei kostenlos verfügbare Varianten, ein Modell mit 8 Milliarden Parametern (läuft auf Laptops) und eines mit 70 Milliarden Parametern (für Rechenzentren). Parameter sind interne Einstellungen, die die Antworten bestimmen.
- Training: 15 Billionen Token (einzelne Wörter und Textbausteine), Daten aus über 1000 Sprachen
- Sprachvielfalt: 40 Prozent der Daten sind nicht Englisch, darunter auch Schweizerdeutsch und Rätoromanisch, dominant ist aber Russisch
- Infrastruktur: Training auf der neuen Supercomputing-Plattform Alps in Lugano, mit über 10 Millionen GPU-Stunden, was 40% der Alps-Kapazität entspricht
- Offene Daten: Nur öffentlich zugängliche Quellen, respektiert Opt-out-Signale von Websites (auch rückwirkend) und entfernt persönliche Daten sowie unerwünschte Inhalte
Kein Chatbot, sondern Infrastruktur
Apertus ist kein fertiger Chatbot. Die ETH und EPFL stellen keine Endnutzeroberfläche zur Verfügung. Stattdessen ist das Modell ein Baustein für Entwickler, Forscher und Unternehmen. Das Modell soll als Grundlage für Experimente und Innovationen dienen, nicht als fertiges Produkt.
Die Verbreitung läuft über mehrere Kanäle, bestätigt sind die ersten drei. Weitere Anwendungsmöglichkeiten sind offen (und werden kommen).
- Hugging Face: Download des Rohmodells
- Swisscom: Cloud-Zugang über die eigene Swiss AI Plattform, beispielsweise während der Swiss {ai} Weeks vom 1. September bis 5. Oktober 2025 (was danach passiert, ist offen)
- Public AI: die Non-Profit-Organisation stellt eine grafische Oberfläche für interessierte Laien bereit
- Weitere Unternehmen und Organisationen, die auf eigene Faust Anwendungen anbieten, die auf Apertus basieren
Warum die Schweiz das macht
Die Motivation scheint klar: digitale Souveränität. Europa und die Schweiz sind in der KI-Entwicklung bislang stark von US-Konzernen abhängig. Mit Apertus will man zeigen, dass auch hierzulande leistungsfähige Modelle trainiert werden können. Und zwar auf eine Weise, die den eigenen Werten entspricht: Offenheit, Rechtskonformität, Multilingualität.
Gleichzeitig ist es auch ein Signal an die Politik und Industrie: Wenn KI die nächste Schlüsseltechnologie ist, darf man sich nicht allein auf Big Tech verlassen. Ohne eigene Infrastruktur gäbe es kein Apertus – wobei «eigen» nicht wörtlich genommen werden darf. Ausgerüstet wurde das CSCS mit US-Hardware von Nvidia (GPUs) und HPE (Supercomputing-Infrastruktur).
Stärken von Apertus
- Transparenz: Alle Daten, Rezepte und Zwischenschritte öffentlich. Das ermöglicht (theoretisch) echte Überprüfbarkeit. Theoretisch, weil das einiges an Know-how voraussetzt.
- Multilingualität: Der starke Fokus auf nicht-englische Sprachen gefällt. Für kleinere Sprachregionen ist das ein grosser Mehrwert. Wie gut das in der Praxis mit beispielsweise Romanisch funktioniert, muss sich zeigen.
- Rechtskonformität: Das Versprechen – saubere Datenbasis, Beachtung von Opt-out-Signalen und urheberrechtlichen Vorgaben – ist viel wert.
Schwächen und offene Fragen
- Ressourcen: Die Nutzung von 40% der Supercomputer-Kapazität für ein einzelnes Projekt ist eine enorme Bindung von Ressourcen. Wie nachhaltig ist das?
- Adoption: Ob Apertus ausserhalb der Schweiz wirklich genutzt wird, bleibt abzuwarten. Open-Source allein garantiert keine grosse Community. Und auch für die Nutzung hierzulande braucht es erst Anwendungen, sonst bleibt Apertus in der Nische.
- Kein Endnutzerfokus: Ohne eigene Chatoberfläche fehlt der breite „Wow-Effekt“. Das Modell bleibt vorerst ein Expertenthema.
Vergleich mit der Konkurrenz
- OpenAI/Anthropic/Gemini: Deutlich grösser und leistungsfähiger, aber komplett geschlossen und intransparent.
- Meta: Mit LLaMA 3 bietet der US-Konzern zwar ein Modell mit frei verfügbaren Parametern, legt aber weder Trainingsdaten noch Code offen. Die Lizenz ist restriktiv, weshalb LLaMA nicht als echtes Open-Source-Modell gilt.
- Mistral: Der französische Konzern veröffentlicht ebenfalls Modelle mit frei zugänglichen Parametern, teils unter Apache-Lizenz. Damit ist das der direkteste Konkurrent von Apertus.
- Deepseek: Das chinesische Modell ist zwar unter Open-Source-Lizenz veröffentlicht, aber ohne Offenlegung von Trainingsdaten und -methoden.
Fazit: Guter Start, aber (noch) nicht mehr
Apertus wird ChatGPT 5 und andere Cloud-Modelle nicht vom Thron stossen. Das muss es aber auch nicht. Seine Bedeutung liegt woanders: Nämlich in der Demonstration, dass «KI» auch anders gebaut werden kann. Offen, regelkonform, mehrsprachig.
Ob daraus ein Ökosystem entsteht, Spitzenforschung betrieben oder auch nur ein Franken Umsatz erzielt wird, hängt nun davon ab, ob und wie Unternehmen und Organisationen das Angebot annehmen. Mit Apertus hat der Forschungsstandort Schweiz ein richtiges, wichtiges und sichtbares Zeichen gesetzt. Was sich daraus entwickelt, entscheiden andere.