Serie

Local LLM

Lokale Sprachmodelle, Hardware und die Begriffe dahinter. Verständlich erklärt, Schritt für Schritt.

Teil 1 LLMs Lokal: alles zu Hardware, KI-Modellen und Funktionsweise
Was läuft lokal wirklich gut, was stößt an Grenzen, und was kostet es in Geld, Speicher und Zeit? Modelle und Hardware 2026 verständlich erklärt, mit einem Rechner, in dem du zwei Maschinen an meinen echten Läufen vergleichst.

15. Juni 2026 · 14 Min Lesezeit Lokale KI · LLMs
Teil 2 Wie eine lokale KI wirklich aufgebaut ist: Serving-Engine, Agent, Workspace
Modell, Serving-Engine, Agent, Workspace, headless: Was sind die Teile einer lokalen KI, und wie reden sie miteinander? Verständlich erklärt mit Diagramm, plus eine Anleitung, wie man einen NVIDIA Spark headless aufsetzt.

16. Juni 2026 · Erklärstück Lokale KI · Stack
Extra Glossar: Lokale LLMs verständlich erklärt
Die wichtigsten Begriffe rund um lokale LLMs verständlich erklärt: Token, Quantisierung, KV-Cache, Speicherbandbreite, Kontextfenster und mehr.

Juni 2026 · Glossar Lokale KI · Glossar