Lokale KI – Teil 3: Lokale Agenten & Pipelines
Lokale KI Teil 3: Agenten mit Tool-Use, RAG mit ChromaDB, Pipelines verketten und mehrere Modelle orchestrieren — vollständig on-prem, DSGVO-konform, mit Python-Code-Beispielen.
Praxis-Artikel zu KI-Integration, DevOps-Pipelines, Self-Hosting, Fullstack-Entwicklung und Cloud-Infrastruktur — direkt aus laufenden Freelance-Projekten, keine Hype-Tutorials.
Lokale KI Teil 3: Agenten mit Tool-Use, RAG mit ChromaDB, Pipelines verketten und mehrere Modelle orchestrieren — vollständig on-prem, DSGVO-konform, mit Python-Code-Beispielen.
pgvector vs. Qdrant/Pinecone/Weaviate: konkrete Performance-Zahlen, Index-Empfehlungen (IVFFlat vs HNSW), Skalierungsgrenzen und Migration-Pfade. Plus warum die meisten Projekte mit pgvector bestens fahren.
Wie man produktionsreife LLM-Features in bestehende Anwendungen integriert, ohne in der OpenAI-Rechnung zu ertrinken: Architektur für RAG-Pipelines, Multi-Provider-Routing, semantisches Caching und konkrete Zahlen aus der Praxis.