Was läuft lokal wirklich gut, was stößt an Grenzen, und was kostet es in Geld, Speicher und Zeit? Modelle und Hardware 2026 verständlich erklärt, mit einem Rechner, in dem du zwei Maschinen an meinen echten Läufen vergleichst.
Serie
Local LLM
Lokale Sprachmodelle, Hardware und die Begriffe dahinter. Verständlich erklärt, Schritt für Schritt.
-
Teil 1 von 3 LLMs Lokal: alles zu Hardware, KI-Modellen und Funktionsweise
-
Teil 2 von 3 Wie eine lokale KI wirklich aufgebaut ist: Serving-Engine, Agent, Workspace
Modell, Serving-Engine, Agent, Workspace, headless: Was sind die Teile einer lokalen KI, und wie reden sie miteinander? Verständlich erklärt mit Diagramm, plus eine Anleitung, wie man einen NVIDIA Spark headless aufsetzt.
-
Teil 3 von 3 Glossar: Lokale LLMs verständlich erklärt
Die wichtigsten Begriffe rund um lokale LLMs verständlich erklärt: Token, Quantisierung, KV-Cache, Speicherbandbreite, Kontextfenster und mehr.