Verteidigung der Masterarbeit von Henrik Bongertmann

Am 21. November um 14:00 Uhr verteidigt Henrik Bongertmann seine Masterarbeit zum Thema „Anwendung von Large-Language-Models zur Strukturierung und Integration heterogener Daten in relationale Datenbanksysteme“ in Raum 242 (Konrad-Zuse-Haus). Die Verteidigung wird hybrid stattfinden, für die Einwahldaten melden Sie sich bitte vorab bei benjamin.nastuni-rostockde. Henrik ist Masterstudent im Studiengang Wirtschaftsinformatik und wurde von Benjamin Nast, Leon Griesch (beide Lehrstuhl Wirtschaftsinformatik) und Henry Rotzoll (DVZ) betreut.

Kurzfassung

In dieser Arbeit wurde ein Proof-of-Concept entwickelt, um das Potenzial von Large-Language-Models (LLMs) zur automatisierten Strukturierung heterogener Daten zu untersuchen. Im Rahmen einer Fallstudie wurde ein LLM-basierter ETL-Prozess implementiert, bei dem über 5.000 unstrukturierte Dokumente unter Verwendung eines Open-Source-LLMs in eine relationale Datenbank überführt werden konnten. Die Ergebnisse zeigen, dass durch gezielte Optimierungen wie Prompt-Engineering, Nachbearbeitungspipelines und Korrekturschleifen eine hohe Erfolgsrate bei der Datenstrukturierung erreicht werden kann. Die vorliegende Arbeit diskutiert die Limitationen des verwendeten Ansatzes, insbesondere in Hinblick auf die Modellauswahl und die Generalisierbarkeit der Ergebnisse. Darüber hinaus werden Empfehlungen für zukünftige Anwendungsfälle gegeben, in denen LLMs zur Verarbeitung unstrukturierter Daten eingesetzt werden können. Die Ergebnisse der Fallstudie bieten eine wertvolle Grundlage für den weiteren Einsatz von LLMs in ETL-Prozessen sowie für zukünftige Forschung im Bereich der LLM-basierten Datenstrukturierung.


Zurück zu allen Meldungen