← Zurück zu Projekten

AI Knowledge Platform

In Bearbeitung

Modulare, cloud-native AI-Wissensplattform auf AWS für semantische Suche und quellenbasierte Antwortgenerierung über strukturierte und unstrukturierte Dokumente — wiederverwendbare Grundlage für mehrere AI-Anwendungen (RAG-Demo, Technology Radar, Regulatory Monitoring).

Technologien

PythonFastAPIPostgreSQLpgvectorOpenAI APIAnthropic ClaudeAWS S3SQLAlchemyAlembicDockerGitHub Actions

Problem

Unternehmen benötigen ein kosteneffizientes AI-System, das verschiedene Dokumentenformate verarbeitet, kontextbezogene Antworten mit transparenter Quellenangabe liefert und von einer öffentlichen Demo bis zur privaten Wissensverwaltung skaliert — ohne Vendor-Lock-in bei LLM-Anbietern.

Ansatz

Mehrschichtige Architektur mit getrennten Ingestion-, Processing-, Storage-, Retrieval- und LLM-Schichten. PostgreSQL + pgvector (HNSW-Index) für Vektorspeicherung, SHA-256-Deduplizierung um unnötige Re-Embeddings zu vermeiden, abstrahierte LLM-Provider (OpenAI/Anthropic) für Anbieterunabhängigkeit. Kostenkontrollen als First-Class-Anforderung eingebaut.

Ergebnis

Wiederverwendbare Plattformbibliothek mit FastAPI-Endpunkten, CLI, 18 Unit-Tests (Tag 1), striktem Typ-Checking (mypy) und vollständiger lokaler Entwicklungsumgebung via Docker Compose. Phase 1 Scaffolding abgeschlossen.

Learnings

Python-Paketnamen dürfen keine Stdlib-Module überschatten (platform → aiplatform); Alembic benötigt synchrone Treiber (psycopg2), FastAPI asynchrone (asyncpg) — zwei separate Connection Strings lösen das; HNSW-Index in pgvector braucht keine Trainingsphase; Kostenkontrollen müssen früh in die Kerninfrastruktur eingebaut werden.

Relevanz

Zeigt vollständiges Data-Pipeline-Denken (Ingestion → Preprocessing → Vektorspeicherung → Retrieval → LLM-Antwortgenerierung), praktische AWS-Kostensteuerung und die Fähigkeit, eine wiederverwendbare, mehrschichtige AI-Plattform von Grund auf zu entwerfen.