Notes & Insights

Blog

Praxis-Artikel zu KI-Integration, DevOps-Pipelines, Self-Hosting, Fullstack-Entwicklung und Cloud-Infrastruktur — direkt aus laufenden Freelance-Projekten, keine Hype-Tutorials.

RSS-Feed25 Artikel gesamt

Filter aktiv:RAG3 TrefferFilter entfernen

KI / AI16. Juni 20268 minReihe · Teil 3
Lokale KI – Teil 3: Lokale Agenten & Pipelines
Lokale KI Teil 3: Agenten mit Tool-Use, RAG mit ChromaDB, Pipelines verketten und mehrere Modelle orchestrieren — vollständig on-prem, DSGVO-konform, mit Python-Code-Beispielen.
Artikel lesen
Lokale KI RAG Ollama Python Datenschutz LLM KI-Agenten
KI / AI19. Mai 202610 min
pgvector als RAG-Backbone — wann es reicht und wann du eine dedizierte Vector-DB brauchst
pgvector vs. Qdrant/Pinecone/Weaviate: konkrete Performance-Zahlen, Index-Empfehlungen (IVFFlat vs HNSW), Skalierungsgrenzen und Migration-Pfade. Plus warum die meisten Projekte mit pgvector bestens fahren.
Artikel lesen
pgvector RAG Postgres Embeddings Vector-Search
KI / AI19. Mai 202611 min
LLM-Integration in Bestandssysteme — RAG, Caching & Kostenkontrolle
Wie man produktionsreife LLM-Features in bestehende Anwendungen integriert, ohne in der OpenAI-Rechnung zu ertrinken: Architektur für RAG-Pipelines, Multi-Provider-Routing, semantisches Caching und konkrete Zahlen aus der Praxis.
Artikel lesen
KI LLM RAG OpenAI Anthropic

Lokale KI – Teil 3: Lokale Agenten & Pipelines

pgvector als RAG-Backbone — wann es reicht und wann du eine dedizierte Vector-DB brauchst

LLM-Integration in Bestandssysteme — RAG, Caching & Kostenkontrolle