AI Knowledge Platform
In BearbeitungModulare, cloud-native AI-Wissensplattform auf AWS für semantische Suche und quellenbasierte Antwortgenerierung über strukturierte und unstrukturierte Dokumente — wiederverwendbare Grundlage für mehrere AI-Anwendungen (RAG-Demo, Technology Radar, Regulatory Monitoring).
Technologien
Problem
Unternehmen benötigen ein kosteneffizientes AI-System, das verschiedene Dokumentenformate verarbeitet, kontextbezogene Antworten mit transparenter Quellenangabe liefert und von einer öffentlichen Demo bis zur privaten Wissensverwaltung skaliert — ohne Vendor-Lock-in bei LLM-Anbietern.
Ansatz
Mehrschichtige Architektur mit getrennten Ingestion-, Processing-, Storage-, Retrieval- und LLM-Schichten. PostgreSQL + pgvector (HNSW-Index) für Vektorspeicherung, SHA-256-Deduplizierung um unnötige Re-Embeddings zu vermeiden, abstrahierte LLM-Provider (OpenAI/Anthropic) für Anbieterunabhängigkeit. Kostenkontrollen als First-Class-Anforderung eingebaut.
Ergebnis
Wiederverwendbare Plattformbibliothek mit FastAPI-Endpunkten, CLI, 18 Unit-Tests (Tag 1), striktem Typ-Checking (mypy) und vollständiger lokaler Entwicklungsumgebung via Docker Compose. Phase 1 Scaffolding abgeschlossen.
Learnings
Python-Paketnamen dürfen keine Stdlib-Module überschatten (platform → aiplatform); Alembic benötigt synchrone Treiber (psycopg2), FastAPI asynchrone (asyncpg) — zwei separate Connection Strings lösen das; HNSW-Index in pgvector braucht keine Trainingsphase; Kostenkontrollen müssen früh in die Kerninfrastruktur eingebaut werden.
Relevanz
Zeigt vollständiges Data-Pipeline-Denken (Ingestion → Preprocessing → Vektorspeicherung → Retrieval → LLM-Antwortgenerierung), praktische AWS-Kostensteuerung und die Fähigkeit, eine wiederverwendbare, mehrschichtige AI-Plattform von Grund auf zu entwerfen.