Lokale KI – Teil 3: Lokale Agenten & Pipelines
Lokale KI Teil 3: Agenten mit Tool-Use, RAG mit ChromaDB, Pipelines verketten und mehrere Modelle orchestrieren — vollständig on-prem, DSGVO-konform, mit Python-Code-Beispielen.
Praxis-Artikel zu KI-Integration, DevOps-Pipelines, Self-Hosting, Fullstack-Entwicklung und Cloud-Infrastruktur — direkt aus laufenden Freelance-Projekten, keine Hype-Tutorials.
Lokale KI Teil 3: Agenten mit Tool-Use, RAG mit ChromaDB, Pipelines verketten und mehrere Modelle orchestrieren — vollständig on-prem, DSGVO-konform, mit Python-Code-Beispielen.
Ollama ermöglicht es, LLMs wie Llama, Mistral oder Qwen vollständig lokal zu betreiben — datenschutzkonform, kostenfrei und offline. Teil 1 zeigt Installation, Modellauswahl und API-Anbindung.
Wie man KI-Features in Unternehmens-Software baut, ohne in DSGVO- oder EU-AI-Act-Fallen zu laufen. Konkrete Optionen für EU-gehostete LLMs, On-Premise-Setups mit Llama 3.3, PII-Redaktion und das Vertragsrecht (AVV) für Provider-Verträge.
Wie man produktionsreife LLM-Features in bestehende Anwendungen integriert, ohne in der OpenAI-Rechnung zu ertrinken: Architektur für RAG-Pipelines, Multi-Provider-Routing, semantisches Caching und konkrete Zahlen aus der Praxis.