← Zurück zu Projekten

Irish Hospital Healthcare Analytics

Abgeschlossen

Analyse-Plattform, die Patientenbewertungen irischer Krankenhäuser aus Google Places und SerpAPI mit staatlichen Wartelisten-Daten (NTPF) zusammenführt, Sentiment-Analysen durchführt und in interaktiven Dashboards visualisiert.

Technologien

Apache AirflowAWS S3PostgreSQLPythonApache SparkVADER NLPMetabaseDockerGoogle Places APISerpAPI

Problem

Patientenfeedback war über mehrere Quellen verteilt, ohne einheitlichen Überblick über Zufriedenheitstrends, Wartezeiten oder wiederkehrende Beschwerden über irische Krankenhausgruppen hinweg.

Ansatz

Multi-Source-Ingestion-DAGs in Apache Airflow mit S3-backed XCom, PostgreSQL-Staging über Temp-Tables und eine entkoppelte NLP-Pipeline (VADER Sentiment), die unabhängig von der Ingestion-Pipeline läuft.

Ergebnis

Einheitliche Analyse-Plattform mit Sentiment-Trends, Review-Counts über Zeit und Top-Keywords nach Sentiment pro Krankenhaus.

Learnings

S3-backed XCom ist essenziell für große Payloads; Hash-basierte IDs ermöglichen sichere Re-Runs; API-Antwort-Schemas sind instabil — defensive Parsing-Chains verwenden; Ingestion von Transformation trennen für unabhängige Iteration.

Relevanz

Zeigt End-to-End Data Engineering, NLP-Anreicherung, Multi-API-Integration, Cloud-Storage-Muster und produktionsreife Airflow-Architektur.