Vergleiche
Open-Source-LLMs im Vergleich
Fünf offene LLM-Familien (Open Weight), einheitlich auf denselben sieben Kriterien bewertet – mit Quellen-Link und Datum je Eintrag, damit du die Angaben selbst nachprüfen kannst. Diese Kategorie richtet sich an Entwickler und technische Entscheider, die eine eigene Anwendung auf einem Modell aufbauen wollen – nicht an Endnutzer einer fertigen Chat-App (dafür siehe unsere Kategorie „AI-Chat-Assistenten"). Oben an der Tabelle kannst du zwischen Privatkunden- und Geschäftskunden-Perspektive wechseln. Am Ende findest du Szenario-Empfehlungen statt eines einzelnen „Siegers": Welches Modell passt, hängt von deiner konkreten Situation ab.
Ein Vergleich offener LLM-Familien stellt Modelle wie Llama, Mistral, DeepSeek, Qwen und Gemma anhand einheitlicher Kriterien gegenüber – von Lizenzfreiheit über Hardware-Anforderungen bis Ökosystem-Unterstützung, für Entwickler und technische Entscheider, die eigene Anwendungen auf einem Modell aufbauen wollen.
Wie wir bewerten →Letzter Datenreview: 05.07.2026, 18:00 Uhr
| Tool | Preis | Preis-Leistung | Lizenz & Nutzungsfreiheit | Leistung & Kontextfenster | Hardware-Anforderungen & Hosting-Aufwand | Ökosystem & Tooling | Multimodalität | Community & Enterprise-Support | Ideal für | Details |
|---|---|---|---|---|---|---|---|---|---|---|
Llama Meta | Gewichte kostenlos · API-Hosting ca. 0,08–2,19 $/Mio. Token je nach Anbieter/Modellgröße | 3 von 5 | 2 von 5 | 3 von 5 | 2 von 5 | 3 von 5 | 2 von 5 | 4 von 5 | Wer ein bereits etabliertes, breit gehostetes Modell für ein einmaliges Projekt sucht +1 | |
Mistral Mistral AI | Gewichte kostenlos · La Plateforme API ab ca. 2 $/Mio. Input-Token (Large 3) | 4 von 5 | 3 von 5 | 4 von 5 | 4 von 5 | 5 von 5 | 3 von 5 | 5 von 5 | Wer auf gewöhnlicher Hardware experimentieren will +1 | |
DeepSeek DeepSeek | Gewichte kostenlos (MIT) · Eigene API ab 0,14 $/Mio. Input-Token (V4-Flash) | 5 von 5 | 5 von 5 | 4 von 5 | 3 von 5 | 3 von 5 | 2 von 5 | 3 von 5 | Preisbewusste Entwickler mit eigenem Hosting +1 | |
Qwen Alibaba | Gewichte kostenlos (Apache 2.0) · DashScope API mit zeitlich begrenztem Freikontingent | 4 von 5 | 5 von 5 | 3 von 5 | 4 von 5 | 5 von 5 | 5 von 5 | 3 von 5 | Wer ein möglichst vielseitiges, uneingeschränkt lizenziertes Modell sucht +1 | |
Gemma | Gewichte kostenlos (Apache 2.0 ab Gemma 4) · API ab ca. 0,14 $/Mio. Input-Token | 4 von 5 | 4 von 5 | 4 von 5 | 5 von 5 | 5 von 5 | 4 von 5 | 4 von 5 | Einsteiger, die auf gewöhnlicher oder sogar mobiler Hardware experimentieren wollen +1 | |
Welches Tool passt zu dir?
Maximale Kosteneffizienz beim Self-Hosting
DeepSeek
Günstigste API-Preise und vollständig freizügige MIT-Lizenz im Vergleich.
Multimodale Anwendungen (Bild, Audio, Video)
Qwen
Breiteste Multimodalität aller fünf Modellfamilien inklusive Echtzeit-Sprachausgabe.
Läuft auch auf schwacher oder mobiler Hardware
Gemma
Kleinste Modellgröße läuft quantisiert bereits mit rund 1 GB.
Das Wichtigste in Kürze
- Mistral ist die erste Wahl bei strikter EU-Datenhoheit – eigene Rechenzentren in Frankreich, Partnerschaften mit europäischen Cloud-Anbietern (Scaleway/OVHcloud).
- DeepSeek bietet die günstigsten API-Preise und eine vollständig freizügige MIT-Lizenz – die kosteneffizienteste Option im Vergleich.
- Gemma läuft bereits quantisiert mit rund 1 GB und eignet sich damit auch für schwache oder mobile Hardware.
- Qwen bietet die breiteste Multimodalität (Bild, Audio, Video, Echtzeit-Sprachausgabe) unter den fünf Modellfamilien.
- Diese Kategorie richtet sich an Entwickler, die eigene Anwendungen bauen – wer eine fertige Chat-App sucht, findet die passendere Kategorie unter „AI-Chat-Assistenten".
→ Eigene Anwendung darauf aufbauen lassen: Custom Applications
Häufige Fragen
Was ist der Unterschied zwischen offenen (Open-Weight) und geschlossenen LLMs?
Offene LLMs wie Llama, Mistral oder DeepSeek stellen ihre Modell-Gewichte öffentlich zum Download bereit – du kannst sie selbst hosten und anpassen. Geschlossene LLMs wie GPT oder Claude sind nur über eine API des Anbieters nutzbar, ohne Zugriff auf die Modell-Gewichte selbst.
Welches Open-Source-LLM eignet sich am besten für EU-Datenhoheit?
Mistral AI betreibt eigene Rechenzentren in Frankreich und arbeitet mit europäischen Cloud-Anbietern wie Scaleway und OVHcloud zusammen – die stärkste Option im Vergleich für Unternehmen mit strikten EU-Datenhoheits-Anforderungen.
Welches Open-Source-LLM ist am günstigsten?
DeepSeek bietet die günstigsten API-Preise unter den fünf verglichenen Modellfamilien, kombiniert mit einer vollständig freizügigen MIT-Lizenz ohne Nutzungsbeschränkungen.
Brauche ich eine teure GPU, um ein offenes LLM selbst zu hosten?
Das hängt vom Modell und der Größe ab. Gemma ist als kleinste Modellfamilie im Vergleich bereits quantisiert mit rund 1 GB VRAM lauffähig, größere Llama- oder Mistral-Varianten brauchen deutlich mehr Hardware-Ressourcen – siehe die Kriterien-Spalte „Hardware-Anforderungen" in der Tabelle.