Best Practices

 

Anna M. Claus, M. Sc. RWTH

Portraitaufnahme von Anna M. Claus Axel Jusseit

Anna M. Claus forscht zum Thema Interdisziplinarität und interdisziplinäre Kompetenzen. Ihre Daten aus Befragungen und Verhaltensbeobachtungen verwaltet und dokumentiert sie mit Hilfe von myPsychData, einer Webanwendung, die vom Leibniz-Zentrum für Psychologische Information und Dokumentation, kurz ZPID, bereitgestellt wird. Die Anwendung hilft ihr, die Daten übersichtlich zu organisieren und standardisiert zu dokumentieren. Eine Herausforderung in Ihrer Forschung ist der Umgang mit personenbezogenen Daten.

 

Der Mehrwert des Forschungsdatenmanagements ist für mich in erster Linie ein besserer Überblick über meine eigenen Daten und deren Struktur.

Anna M. Claus

 

Hintergrund

In meiner Forschung beschäftige ich mich mit Interdisziplinarität, zum Beispiel mit der Frage, welche Kompetenzen einer Person erfolgreiche interdisziplinäre Zusammenarbeit in Teams unterstützen können. Interdisziplinäre Zusammenarbeit verspricht kreative Lösungen für große Herausforderungen und Fragestellungen, wobei diese Art der Teamarbeit selbst eine Herausforderung sein kann.

Methodisch setze ich unterschiedliche Verfahren ein wie Befragungen oder Verhaltensbeobachtungen in Assessment Centern. Während Befragungen durch standardisierte Fragebögen (meist online) direkt quantitative Ergebnisse liefern, werden die Verhaltensbeobachtungen durch verschiedene Beobachter nach einem vorgegebenen Schema bewertet.

Um den Überblick über verschiedene Datensätze und die darin eingesetzten Instrumente zu behalten habe ich zunächst in Textdateien Dokumentationen erstellt. Inzwischen nutze ich myPsychData, da hier sowohl Informationen zum Gesamtdatensatz (wann wurden die Daten erhoben, wie wurde die Stichprobe rekrutiert et cetera) als auch zu einzelnen Variablen (Wortlaut der Frage, aus welchem standardisierten Fragebogen entnommen, wurde das Item angepasst et cetera) in einem Codebuch zusammenhalten kann. Das Tool ermöglicht mir, die Dokumentation über eine einheitliche Oberfläche zu erstellen und in einem standardisierten Format zu exportieren, so dass ich das Codebuch auch mit anderen Tools verwenden kann. Das Codebuch enthält alle Informationen über die einzelnen Items wie den genauen Wortlaut der Frage, die Codierung der Antworten und evtl. Urheberrechte an den Items. In der Psychologie sind Fragebögen häufig urheberrechtlich geschützt, so dass die Fragen nicht in Veröffentlichungen genannt, sondern die Fragebögen nur zitiert werden können.

Fast alle meine Daten sind personenbezogen. Das bedeutet, dass ich bereits vor Beginn der Datenerhebung planen muss, was ich später mit den Daten machen möchte, da ich dazu das Einverständnis der Probanden einholen muss. Probanden haben ein Anrecht darauf, zu wissen, wie ich die Daten verarbeiten, speichern, mit wem ich die Daten gegebenenfalls teilen oder ob ich sie sogar veröffentlichen werde, wie es manche Geldgeber mittlerweile fordern.

Für viele Forschungsdatenrepositorien, wie etwa ZPID oder GESIS ist eine korrekte Einverständniserklärung der Probanden eine notwendige Voraussetzung, um Daten zu veröffentlichen.

Ein kritischer Punkt ist auch die Anonymisierung der Daten, insbesondere, wenn es darum gehen sollte, die Daten einmal bei einem Forschungsdatenrepositiorium zu veröffentlichen. Häufig genügt es nicht, Merkmale wie Name, Alter oder Wohnort zu verbergen, da aus Kontextinformationen auf die Identität einzelner Probanden geschlossen werden könnte. Die Daten müssen sorgfältig geprüft und gegebenenfalls weitere Informationen unkenntlich gemacht werden.

Der Mehrwert des Forschungsdatenmanagements ist für mich in erster Linie ein besserer Überblick über meine eigenen Daten und deren Struktur. Häufig ist es so, dass es eine Weile dauert, bis ich zur Auswertung der Daten komme oder dass ich im Rahmen eines Review-Prozesses nach mehreren Monaten noch einmal an einen Datensatz gehe. Dabei ist es wirklich hilfreich, wenn man vorher dokumentiert hat, welches Kürzel wofür steht und welche Information wo zu finden ist. Die Veröffentlichung von Daten ist aktuell in erster Linie eine Forderung von Geldgebern.