Tag der guten Daten, 10.02.2026
"Wo sind die Daten?" - "Where's the data?"
Veranstaltungsort: SR 62.31 (Hauptbibliothek, 3. OG, Universitätsplatz 3a, 8010 Graz)
In der International Love Data Week, in der dieses Jahr die Frage “Where's the data?” diskutiert werden soll, wird es an der Universität Graz eine ganztägige Veranstaltung zu diesem Thema geben. Am Vormittag wird der Umgang mit Daten in diversen Vorträgen im Mittelpunkt stehen. Katharina Zeppezauer-Wachauer und Christian Steiner werden die Vortragsreihe am Vormittag eröffnen und über Verantwortung, Wartbarkeit und Langzeitdenken am Beispiel eines DH Urgesteins - der Mittelhochdeutschen Begriffsdatenbank - sprechen. Dabei stellen sie KI-gestützte Arbeitsmethoden vor, zeigen auf, dass KI Forschung zwar unterstützen kann, Forschungspersonal aber nie ersetzen wird und stellen fest, dass offene, menschenlesbare Standards wie XML durchaus kein Rückschritt sind, sondern der Schlüssel für digitale Zukunftsfähigkeit.
Dieser Teil der Veranstaltung wird auch per Livestream übertragen.
Am Nachmittag findet ein Workshop mit dem Titel “Forschungsdaten zur Verfügung stellen / Forschungsdaten nachnutzen” statt, in dem nach einer Reihe von Impulsvorträgen an einer Handreichung zu diesem Thema gearbeitet wird.
Der Workshop findet nur in Präsenz statt und die Teilnehmerzahl ist beschränkt.
Programm, 10.02.2026
Veranstaltungsort: SR 62.31 (Hauptbibliothek, 3. OG, Universitätsplatz 3a, 8010 Graz)
8:30 - 8:50 - Registrierung, Anmeldung, Kaffee
8:50 - 9:00 - Willkommen, Grußworte
9:00 - 10:00 - Die Daten sind nicht weg! Sie sind nur woanders. - Über Verantwortung, Wartbarkeit und Langzeitdenken am Beispiel eines DH Urgesteins
Keynote von Mag. Dr.phil. Katharina Zeppezauer-Wachauer; Mag.phil. Christian Steiner, MA
Die Mittelhochdeutsche Begriffsdatenbank (MHDBDB) existiert seit 1972 und gehört zu den ältesten Digital-Humanities-Projekten weltweit. In über fünf Jahrzehnten durchlief sie Lochkarten, relationale Datenbanken und einen RDF-Triplestore mit 6 Milliarden Triples – nur um schließlich wieder bei XML zu landen.
Dieser Vortrag erzählt keine Erfolgsgeschichte. Er erzählt, wie man seine eigenen Daten verliert, ohne sie zu löschen: in immer komplexeren Strukturen, die nur noch Maschinen verstehen. Er zeigt, was passiert, wenn technologische Euphorie auf institutionelle Realitäten trifft – fehlende Dauerstellen, knappe Budgets, Wissen, das mit befristeten Verträgen geht. Und er zeigt einen Ausweg: Die Migration zu TEI-XML als menschenlesbarem Standard, unterstützt durch KI-gestützte Workflows (Promptotyping). Wir vertrauen dem LLM nicht. Wir benutzen es – für Reverse Engineering, Strukturtransformation und Validierung. Das Ergebnis: Eine Migration, die vor drei Jahren sechsstellige Budgets erfordert hätte, in Monaten und mit wenigen tausend Euro.
Wir teilen drei Lessons Learned: Dass Frontier-LLMs Migrationen möglich machen, die zuvor unbezahlbar waren. Dass KI skaliert, aber Personal nicht ersetzt – und dieses Personal unbefristete Verträge braucht. Und dass offene, menschenlesbare Standards wie TEI-XML keine Rückschritte sind, sondern Überlebensversicherungen.
Bio-Notes:
Katharina Zeppezauer-Wachauer ist Senior Scientist an der Universität Salzburg. Sie ist seit 2010 Teil des Teams der Mittelhochdeutschen Begriffsdatenbank (MHDBDB) und koordiniert das Projekt seit 2016. Ihre Forschungsschwerpunkte liegen in der Korpuslinguistik, der computergestützten Textsemantik sowie in der Anwendung von KI und Large Language Models auf historische Korpora, mit besonderem Fokus auf semantische Modellierung, narrative Strukturen und FAIR-Datenpraktiken. Sie promovierte in Germanistik an der Universität Graz mit einer Spezialisierung in Digital Humanities und ist Sprecherin der Universität Salzburg im österreichischen Infrastrukturkonsortium CLARIAH-AT.
Christian Steiner absolvierte Master-Studien in Übersetzen und Digital Humanities an der Universität Graz, wo er seit 2012 am Institut für Digitale Geisteswissenschaften tätig war. Er ist Gründer und CEO von Digital Humanities Craft OG, einem IT-Research-Unternehmen in enger Kooperation mit der Universität Graz. Er lehrt an mehreren Universitäten in Europa. Sein Schwerpunkt liegt auf generativer KI – insbesondere Coding Agents sowie Prompt und Context Engineering – und Webprogrammierung. Er bringt umfassende Erfahrung in Datenmodellierung und -verarbeitung mit, von Geisteswissenschaften bis Naturwissenschaften.
10:00 - 10:20 - Pause
10:20 - 11:30 - Vorträge
Sind das überhaupt Daten? Was Performancetest und Metadaten aus den Digital Skills Austria Studien über digitale Kompetenz verraten
MMag. Manuela Grünangerl (Universität Salzburg)
Die Messung von Kompetenzen stellt aus methodischer Sicht eine besondere Herausforderung dar – insbesondere in Onlineumfragen. Kompetenzen sind schwer direkt beobachtbar und lassen sich nur bedingt über reine Selbstauskünfte erfassen. Dies gilt in besonderem Maße für digitale Kompetenzen, die situativ, kontextabhängig und handlungsbezogen sind. Vor diesem Hintergrund stellt sich nicht nur die Frage, wie digitale Kompetenzen gemessen werden können, sondern grundsätzlicher auch: Was sind in solchen Erhebungen eigentlich die Daten? Und wie gehen wir als Forscher:innen mit Antwort- bzw. Handlungsverweigerung um?
Der Vortrag greift diese Frage anhand der Digital Skills Austria Studie auf, in der digitale Kompetenzen mithilfe einer 13- (bzw. 30-)stufigen problemorientierten Performancetestung seit 2023 bereits dreimal in einer Online-Befragung in der österreichischen Onlinebevölkerung erhoben wurden. Die Teilnehmenden mussten alltagsnahe digitale Probleme lösen, wobei verschiedene Lösungswege – Wissen, Anwendung von Skills, Ausprobieren oder eine gezielte Online-Recherche – gleichermaßen als kompetentes Handeln gewertet wurden. Bereits diese Form der Messung verschiebt den Fokus weg von klassischen Befragungsdaten hin zu beobachtbaren Handlungsresultaten.
Darüber hinaus erzeugt eine solche Online-Performancetestung eine Vielzahl von Para- und Metadaten, etwa Bearbeitungszeiten, Antwortmuster, Abbrüche oder Formen der Antwortvermeidung. Diese Daten sind nicht bloß ein Nebenprodukt der Erhebung, sondern eröffnen eine zusätzliche analytische Ebene. Der Vortrag zeigt, wie die systematische Auswertung dieser Para- und Metadaten zentrale Einsichten in Datenqualität, Testengagement und mögliche Messverzerrungen ermöglicht. Insbesondere extremes Antwortverhalten wie Speeding, Straightlining oder vollständige Vermeidung von Aufgaben lassen sich dadurch identifizieren und dessen Effekte auf die Messergebnisse analysieren.
Der Vortrag argumentiert, dass die Kombination aus Performancetestung und Para- bzw. Metadaten eine besonders fruchtbare methodische Perspektive für die Kompetenzforschung darstellt. Sie erweitert den Datenbegriff über klassische Antwortdaten hinaus und macht sichtbar bzw. stellt zur Diskussion, dass gerade im Prozess des Antwortens – im Zögern, Überspringen oder schnellen Klicken – zentrale Informationen liegen. Der Vortrag versteht sich somit als Anstoß die Leitfrage der Love Data Week – Wo sind die Daten? – auf ungewohnte Art und Weise zu diskutieren: Die Daten sind oft nicht nur in den Antworten, sondern im Antwortverhalten selbst verborgen.
Bio-Note:
MMag. Manuela Grünangerl ist Senior Lecturer am Fachbereich Kommunikationswissenschaft der Paris-Lodron-Universität Salzburg und spezialisiert sich in der Lehre auf die sozialwissenschaftliche Methodenausbildung. Ihre Lehr- und Forschungsschwerpunkte liegen dabei insbesondere auf empirischer Sozialforschung, digitaler Kompetenzentwicklung sowie Fragen gesellschaftlichen Wandels. Neben ihrer Tätigkeit an der Universität ist sie auch in der Erwachsenenbildung aktiv und engagiert sich in wissenschaftlichen Projekten und Publikationen zur Kommunikations- und Medienforschung.
Lizenzierung von Forschungsdaten am Beispiel von AUSSDA - Austrian Social Sciences Data Archive
Mag.phil. Dr.rer.soc.oec. Otto Bodi-Fernandez (Universität Graz, Institut für Soziologie)
AUSSDA – The Austrian Social Science Data Archive – unterstützt Forschende bei der nachhaltigen Archivierung, Dokumentation und Nachnutzung sozialwissenschaftlicher Forschungsdaten. Eine zentrale Leitlinie ist dabei die Förderung von Open Science unter gleichzeitiger Einhaltung der rechtlichen Rahmenbedingungen, insbesondere des Datenschutzrechts. Der Vortrag gibt einen Einblick in die Rolle von Lizenzen in der Forschungsdatenarchivierung und ordnet diese in die FAIR-Prinzipien ein, insbesondere in Bezug auf das „R“ (Reusable). Anhand des AUSSDA Lizenzmodells wird erläutert unter welchen Bedingungen anonymisierte Daten als Open Data bereitgestellt werden können und welche Bedeutung Creative-Commons-Lizenzen – insbesondere CC BY - für eine offene, nicht zweckgebundene Nachnutzung haben. Demgegenüber stehen datenschutzrechtliche Anforderungen bei personenbezogenen bzw. pseudonymisierten Daten. Da diese nicht zweckoffen weitergegeben werden dürfen, setzt AUSSDA hier auf die sogenannte Scientific Use Lizenz (SUF), die die Nachnutzung auf wissenschaftliche Zwecke beschränkt. Ergänzt wird das Lizenzsystem durch Zugriffskategorien und eine institutionelle Access Policy, die gemeinsam den rechtssicheren Zugang zu Forschungsdaten regeln. Anhand konkreter Beispiele aus dem AUSSDA-Repositorium zeigt der Vortrag, wie Offenheit, Nachnutzbarkeit und Datenschutz in der Praxis in ein ausgewogenes Verhältnis gebracht werden können – mit dem Grundsatz: so offen wie möglich, so geschlossen wie nötig.
Bio-Note:
Otto Bodi-Fernandez arbeitet am Zentrum für Sozialforschung als Grazer Kontaktstelle für die AUSSDA. Er ist im Bereich Forschungsdatenmanagement tätig und unterrichtet empirische Methoden am Institut für Soziologie. Seine Forschungsinteressen umfassen Kindheits- und Jugendstudien sowie Bildungsungleichheit.
11:30-11:50 - Pause
11:50 - 13:00 - Vorträge
Data Love @ MedUni Graz: HDRH-Tools für FAIRes, sicheres Forschungsdatenmanagement
Mag.Dr.rer.nat. Andrea Groselj-Strele (Medizinische Universität Graz, Core Facility Computational Bioanalytics)
Der Health Data Research Hub (HDRH) der Medizinischen Universität Graz schafft mit einer sicheren Datenumgebung und standardisierten Schnittstellen die Basis für Datenexzellenz über den gesamten Forschungsdatenlebenszyklus - von der Studienplanung und der Erstellung eines Datenmanagementplans bis zur Langzeitspeicherung und Wiederverwendung der Daten in einer sicheren Analyseumgebung. Vorgestellt wird das integrierte Service- und Forschungsdatenmanagement-Tool-Ökosystem der Med Uni Graz sowie der HPC-Cluster MedBioNode für Daten- und Bildanalyse. Anhand der IT-Architekturlandschaft wird beispielsweise gezeigt, wie Bilddaten inklusive Metadaten in OMERO verwaltet und annotiert, mit klinischen Daten verknüpft und über die Python-API am MedBioNode-Cluster prozessiert werden können. Für Omics-Daten werden automatisierte, regelbasierte Importprozesse mit iRODS und Watchdog-Mechanismen skizziert, die kontinuierliche Datenübernahmen unterstützen. Durch die Indizierung der Metadaten werden die gespeicherten Daten und Bilder performant durchsuchbar gemacht und so die Sekundärnutzung nach den FAIR-Prinzipien erleichtert.
Bio-Note:
Andrea Groselj-Strele leitet die Core Facility Computational Bioanalytics am Zentrum für Medizinische Forschung der Medizinischen Universität Graz und ist dort für die methodische Unterstützung in der bioinformatischen und biostatistischen Datenanalyse verantwortlich. Ihre Arbeitsschwerpunkte liegen in der computergestützten Auswertung komplexer biomedizinischer Datensätze sowie im Aufbau und Betrieb forschungsunterstützender Infrastruktur, zusätzlich ist sie als Lektorin im Bereich Biostatistik an der FH JOANNEUM tätig.
Struktur statt Datensilos: Ein übertragbares Modell für heterogene (psychologische) Forschungsdaten
Mag. Dr.rer.nat. Karl Koschutnig (Universität Graz)
Forschungsdaten in der Psychologie und angrenzenden Disziplinen sind häufig heterogen: Fragebögen, physiologische Messungen oder leistungsdiagnostische Tests entstehen in unterschiedlichen Formaten und mit individuellen Projektstrukturen. Diese Vielfalt erschwert Validierung, Analyse und Nachnutzung – insbesondere über Projekt- und Institutionsgrenzen hinweg.
Der Vortrag stellt PRISM (Psychological Research Information & Structure Model) vor, ein offenes Strukturmodell zur Organisation von heterogenen Forschungsdaten. PRISM definiert einheitliche Konventionen für Datenablage, Metadaten und Validierung und ermöglicht eine reproduzierbare Aufbereitung für statistische Analysen. Der zugrundeliegende Workflow ist offen dokumentiert und auf GitHub verfügbar.
PRISM wird als funktionierendes Praxisbeispiel präsentiert, das bewusst nicht als Insellösung konzipiert ist. Im Fokus steht die Frage, wie sich grundlegende Strukturprinzipien auf andere Forschungsdomänen übertragen lassen und wie offene Modelle zur besseren Auffindbarkeit, Prüfbarkeit und Weiterverwendung von Forschungsdaten beitragen können.
Bio-Note:
Dr. Karl Koschutnig ist Neuropsychologe und Leiter des MRT-Labors Graz. Er war zuvor in der klinischen Abteilung für Neuroradiologie der LKH Graz tätig und ist auf funktionelle und strukturelle MRT-Verarbeitung sowie Diffusionstensorbildgebung spezialisiert. Mit 58 Publikationen, einem h-Index von 28 und über 3.000 Zitaten ist er ein Experte auf dem Gebiet der Neurobildgebung.
13:00-14:00 - Mittagspause
14:00-17:15 - Forschungsdaten zur Verfügung stellen / Forschungsdaten nachnutzen
Workshopleitung: Otto Bodi-Fernandez, Helmut W. Klug, Dimitri Prandner
Die Bemühungen der nationalen und internationalen Fördergeber und Forschungsinstitutionen rund um das Thema Forschungsdaten haben einen driftigen Grund: Man will die aktive Nachnutzung von Forschungsdaten vorantreiben. Die Gründe dafür sind vielfältig, häufig werden genannt die Steigerung der Effizienz im Forschungsprozess durch Vermeidung redundanter Datenerhebungen, die Erhöhung von Transparenz und Reproduzierbarkeit wissenschaftlicher Ergebnisse sowie die Ermöglichung neuer Forschungsfragen durch die Kombination und Sekundärauswertung vorhandener Datensätze.
Aber wo sind diese Daten eigentlich? Die Entwicklungen rund um das Thema Forschungsdaten der letzten Jahre sprechen eine deutliche Sprache: Die 2014 erarbeiteten und 2016 publizierten FAIR-Prinzipien machen klare Ansagen in Bezug auf die Veröffentlichung von Forschungsdaten, indem sie anregen, dass Daten für die jeweiligen Forschungs-Communities leicht auffindbar sind, eine technisch offene und barrierefreie Zugänglichkeit gewährleistet ist, die Daten in unterschiedlichen Kontexten weiterverarbeitet werden können und eindeutig geregelt ist, unter welchen rechtlichen Bedingungen sie verwendet werden dürfen. Die Gründe, Daten nicht zu veröffentlichen, bleiben dabei vergleichsweise überschaubar und betreffen vor allem rechtliche, ethische oder sicherheitsrelevante Einschränkungen. Ein zentrales Kriterium der FAIR-Prinzipien ist die vollständige Maschinenlesbarkeit zumindest der Metadaten, um automatisierte Workflows, Verknüpfungen und Auffindbarkeit in verteilten Infrastrukturen zu ermöglichen.
Mit dem Datenmanagementplan wurde Forscher:innen und Projektmanager:innen ein althergebrachtes, aber im Kontext von Forschungsdaten neu gerahmtes Projektmanagement-Tool an die Hand gegeben, das bei der Erreichung dieses Ziels maßgeblich unterstützen kann – von der Planung der Datenerhebung über die Dokumentation bis hin zu Speicherung, Archivierung und Publikation. Ob diese übergeordneten Pläne oder die konkrete Nützlichkeit des Tools bei allen Akteuren bereits ausreichend angekommen sind, bleibt offen und ist zu diskutieren.
Im geplanten Workshop soll nach einer Runde an Impulsvorträgen, in denen die Besonderheiten von Forschungsdaten aus möglichst unterschiedlichen Disziplinen vorgestellt werden, gemeinsam an einer praxisorientierten Handreichung für Forschende gearbeitet werden. Die aktuelle Arbeitshypothese, die im Zuge des Workshops durchaus geändert oder angepasst werden kann, ist die Ausarbeitung einer Checkliste für Personen, die Daten veröffentlichen, und Personen, die Daten nachnutzen wollen – die Anforderungen beider Gruppen decken sich weitgehend, unterscheiden sich jedoch in der Perspektive: Während Produzierende vor allem an strukturierter Dokumentation, geeigneten Lizenzen und nachhaltigen Repositorien interessiert sind, fokussieren Nachnutzende stärker auf Verständlichkeit, Kontextinformationen und klare Nutzungsbedingungen.
Impulsvorträge zu Besonderheiten von Forschungsdaten aus unterschiedlichen Forschungsbereichen
- Thomas Rauter: Forschungsdaten an der medizinischen Universität
- Elisabeth Steiner: Forschungsdaten in den Geisteswissenschaften
- Claire Jean-Quartier: Forschungsdaten an der Technischen Universität
- Otto Bodi-Fernandez: Forschungsdaten in den Sozialwissenschaften