Lokale KI – Teil 3: Lokale Agenten & Pipelines
Lokale KI Teil 3: Agenten mit Tool-Use, RAG mit ChromaDB, Pipelines verketten und mehrere Modelle orchestrieren — vollständig on-prem, DSGVO-konform, mit Python-Code-Beispielen.
Praxis-Artikel zu KI-Integration, DevOps-Pipelines, Self-Hosting, Fullstack-Entwicklung und Cloud-Infrastruktur — direkt aus laufenden Freelance-Projekten, keine Hype-Tutorials.
Lokale KI Teil 3: Agenten mit Tool-Use, RAG mit ChromaDB, Pipelines verketten und mehrere Modelle orchestrieren — vollständig on-prem, DSGVO-konform, mit Python-Code-Beispielen.
Bilder mit Stable Diffusion & Flux, Sprache mit Whisper transkribieren, TTS mit Piper & Coqui — Teil 2 zeigt, wie multimodale KI-Generierung vollständig lokal funktioniert.
Ollama ermöglicht es, LLMs wie Llama, Mistral oder Qwen vollständig lokal zu betreiben — datenschutzkonform, kostenfrei und offline. Teil 1 zeigt Installation, Modellauswahl und API-Anbindung.
KI-Pair-Programming in der Praxis: CLAUDE.md, Wissensgraphen, der richtige Arbeitsloop und was KI gut kann — und wo du aufpassen musst. Abschluss der Reihe.
Wie du KI-Workflows mit Skills, MCP-Tool-Anbindungen und parallelen Subagenten skalierst — inkl. CLAUDE.md-Konfiguration, Modellwahl und konkreten Code-Beispielen.
Erste Schritte mit KI-Tools als Entwickler: Claude Code einrichten, IDE-Plugins konfigurieren, effektives Prompting lernen und die häufigsten Anfänger-Fehler vermeiden. Teil 1 von 3.
Chatbots waren gestern. 2026 planen KI-Agenten Termine, beantworten E-Mails, erstellen Angebote und fassen bei Kunden nach — auch am Telefon. Was das für einen kleinen Betrieb realistisch bedeutet, wo es sich lohnt und wo nicht.
AGI nächstes Jahr oder alles eine Blase? Beides hat 2026 prominente Fürsprecher. Statt zu raten, extrapoliere ich die härtesten verfügbaren Daten — METR-Task-Horizonte, Epoch-Compute-Trends, Investitionszahlen — und wage fünf konkrete Wetten für 2031.
Zwischen „KI rottet die Menschheit aus" und „alles nur Hype" liegt die langweilige Wahrheit: Die gefährlichste KI 2026 ist nicht Skynet, sondern ein Voice-Clone am Telefon und ein Agent mit zu vielen Rechten. Eine nüchterne Bestandsaufnahme — mit Belegen für beide Seiten.
Massenarbeitslosigkeit durch KI? Die ehrliche Antwort aus Studien von Stanford, Yale, IAB und ifo: keine Verdrängungswelle im Gesamtmarkt — aber ein realer, messbarer Effekt am unteren Ende der Karriereleiter. Wer betroffen ist, wer nicht, und was das für Deutschland bedeutet.
pgvector vs. Qdrant/Pinecone/Weaviate: konkrete Performance-Zahlen, Index-Empfehlungen (IVFFlat vs HNSW), Skalierungsgrenzen und Migration-Pfade. Plus warum die meisten Projekte mit pgvector bestens fahren.
Wie man KI-Features in Unternehmens-Software baut, ohne in DSGVO- oder EU-AI-Act-Fallen zu laufen. Konkrete Optionen für EU-gehostete LLMs, On-Premise-Setups mit Llama 3.3, PII-Redaktion und das Vertragsrecht (AVV) für Provider-Verträge.
Wie man produktionsreife LLM-Features in bestehende Anwendungen integriert, ohne in der OpenAI-Rechnung zu ertrinken: Architektur für RAG-Pipelines, Multi-Provider-Routing, semantisches Caching und konkrete Zahlen aus der Praxis.