Vergleiche

Open-Source-LLMs im Vergleich

Fünf offene LLM-Familien (Open Weight), einheitlich auf denselben sieben Kriterien bewertet – mit Quellen-Link und Datum je Eintrag, damit du die Angaben selbst nachprüfen kannst. Diese Kategorie richtet sich an Entwickler und technische Entscheider, die eine eigene Anwendung auf einem Modell aufbauen wollen – nicht an Endnutzer einer fertigen Chat-App (dafür siehe unsere Kategorie „AI-Chat-Assistenten"). Oben an der Tabelle kannst du zwischen Privatkunden- und Geschäftskunden-Perspektive wechseln. Am Ende findest du Szenario-Empfehlungen statt eines einzelnen „Siegers": Welches Modell passt, hängt von deiner konkreten Situation ab.

Ein Vergleich offener LLM-Familien stellt Modelle wie Llama, Mistral, DeepSeek, Qwen und Gemma anhand einheitlicher Kriterien gegenüber – von Lizenzfreiheit über Hardware-Anforderungen bis Ökosystem-Unterstützung, für Entwickler und technische Entscheider, die eigene Anwendungen auf einem Modell aufbauen wollen.

Wie wir bewerten →

Ansicht für

Die Scores bleiben gleich – nur Stärken, Schwächen und Einordnung passen sich der Perspektive an.

Letzter Datenreview: 05.07.2026, 18:00 Uhr

Tool	Preis	Preis-Leistung	Lizenz & Nutzungsfreiheit	Leistung & Kontextfenster	Hardware-Anforderungen & Hosting-Aufwand	Ökosystem & Tooling	Multimodalität	Community & Enterprise-Support	Ideal für
Llama Meta	Gewichte kostenlos · API-Hosting ca. 0,08–2,19 $/Mio. Token je nach Anbieter/Modellgröße	3 von 5	2 von 5	3 von 5	2 von 5	3 von 5	2 von 5	4 von 5	Wer ein bereits etabliertes, breit gehostetes Modell für ein einmaliges Projekt sucht +1

Mistral Mistral AI	Gewichte kostenlos · La Plateforme API ab ca. 2 $/Mio. Input-Token (Large 3)	4 von 5	3 von 5	4 von 5	4 von 5	5 von 5	3 von 5	5 von 5	Wer auf gewöhnlicher Hardware experimentieren will +1

DeepSeek DeepSeek	Gewichte kostenlos (MIT) · Eigene API ab 0,14 $/Mio. Input-Token (V4-Flash)	5 von 5	5 von 5	4 von 5	3 von 5	3 von 5	2 von 5	3 von 5	Preisbewusste Entwickler mit eigenem Hosting +1

Qwen Alibaba	Gewichte kostenlos (Apache 2.0) · DashScope API mit zeitlich begrenztem Freikontingent	4 von 5	5 von 5	3 von 5	4 von 5	5 von 5	5 von 5	3 von 5	Wer ein möglichst vielseitiges, uneingeschränkt lizenziertes Modell sucht +1

Gemma Google	Gewichte kostenlos (Apache 2.0 ab Gemma 4) · API ab ca. 0,14 $/Mio. Input-Token	4 von 5	4 von 5	4 von 5	5 von 5	5 von 5	4 von 5	4 von 5	Einsteiger, die auf gewöhnlicher oder sogar mobiler Hardware experimentieren wollen +1

Welches Tool passt zu dir?

Maximale Kosteneffizienz beim Self-Hosting

DeepSeek

Günstigste API-Preise und vollständig freizügige MIT-Lizenz im Vergleich.

Multimodale Anwendungen (Bild, Audio, Video)

Qwen

Breiteste Multimodalität aller fünf Modellfamilien inklusive Echtzeit-Sprachausgabe.

Läuft auch auf schwacher oder mobiler Hardware

Gemma

Kleinste Modellgröße läuft quantisiert bereits mit rund 1 GB.

Das Wichtigste in Kürze

Mistral ist die erste Wahl bei strikter EU-Datenhoheit – eigene Rechenzentren in Frankreich, Partnerschaften mit europäischen Cloud-Anbietern (Scaleway/OVHcloud).
DeepSeek bietet die günstigsten API-Preise und eine vollständig freizügige MIT-Lizenz – die kosteneffizienteste Option im Vergleich.
Gemma läuft bereits quantisiert mit rund 1 GB und eignet sich damit auch für schwache oder mobile Hardware.
Qwen bietet die breiteste Multimodalität (Bild, Audio, Video, Echtzeit-Sprachausgabe) unter den fünf Modellfamilien.
Diese Kategorie richtet sich an Entwickler, die eigene Anwendungen bauen – wer eine fertige Chat-App sucht, findet die passendere Kategorie unter „AI-Chat-Assistenten".

→ Eigene Anwendung darauf aufbauen lassen: Custom Applications

Häufige Fragen

Was ist der Unterschied zwischen offenen (Open-Weight) und geschlossenen LLMs?

Offene LLMs wie Llama, Mistral oder DeepSeek stellen ihre Modell-Gewichte öffentlich zum Download bereit – du kannst sie selbst hosten und anpassen. Geschlossene LLMs wie GPT oder Claude sind nur über eine API des Anbieters nutzbar, ohne Zugriff auf die Modell-Gewichte selbst.

Welches Open-Source-LLM eignet sich am besten für EU-Datenhoheit?

Mistral AI betreibt eigene Rechenzentren in Frankreich und arbeitet mit europäischen Cloud-Anbietern wie Scaleway und OVHcloud zusammen – die stärkste Option im Vergleich für Unternehmen mit strikten EU-Datenhoheits-Anforderungen.

Welches Open-Source-LLM ist am günstigsten?

DeepSeek bietet die günstigsten API-Preise unter den fünf verglichenen Modellfamilien, kombiniert mit einer vollständig freizügigen MIT-Lizenz ohne Nutzungsbeschränkungen.

Brauche ich eine teure GPU, um ein offenes LLM selbst zu hosten?

Das hängt vom Modell und der Größe ab. Gemma ist als kleinste Modellfamilie im Vergleich bereits quantisiert mit rund 1 GB VRAM lauffähig, größere Llama- oder Mistral-Varianten brauchen deutlich mehr Hardware-Ressourcen – siehe die Kriterien-Spalte „Hardware-Anforderungen" in der Tabelle.