Tag 1 (5. Mai 2021): FDM-Kompetenzen – Forschungsdaten an den Max-Planck-Instituten
13:30–13:40 | Dr. Yves Vincent Grossmann und Michael Franke (Max Planck Digital Library): Begrüßung und Einführung |
13:40–14:10 | Prof. Dr. York Sure-Vetter (Nationale Forschungsdateninfrastruktur e.V.): Die Nationale Forschungsdateninfrastruktur (NFDI): Stand und Perspektiven Video (MPG-IP-Range) |
14:10–14:25 | Diskussion |
14:25–14:30 | Pause |
14:30–14:50 | Bettina Mann, Dr. Hatem Elliesie und Dr. Larissa Vetters (Max-Planck-Institut für ethnologische Forschung): Herausforderungen an FDM aus der Perspektive der qualitativen Sozialforschung Nach einer kurzen Kontextbeschreibung durch die Forschungskoordinatorin des Instituts werden anhand zweier laufender Forschungsprojekte rechtliche, technische und fachwissenschaftliche Herausforderungen skizziert. Auf dieser Grundlage werden Ideen zu Vernetzungs-, Informations- und Schulungsbedarf formuliert. Folien (MPG-IP-Range) |
14:50–15:05 | Josefine Blunk (Max-Planck-Institut für Bildungsforschung): Nach dem Workshop ist vor dem Workshop – Erfahrungsbericht zur Durchführung einer FDM-bezogenen Veranstaltungsreihe am Max-Planck-Institut für Bildungsforschung Um relevante FDM-Praktiken stärker in den Fokus der Wissenschaftler*innen zu rücken, hat die 2018 am MPIB gegründete AG Forschungsdatenmanagement 2019 eine Veranstaltungsreihe initiiert. Regelmäßig lädt sie nationale und internationale Expert*innen für Vorträge und Workshops ein. In diesem Kurzvortrag teilt das MPIB seine bisher gesammelten Erfahrungen, vom Akquirieren von geeigneten Redner*innen über Werbestrategien bis hin zur Durchführung und Nachbereitung von Veranstaltungen. Folien (MPG-IP-Range) |
15:05–15:35 | Diskussion |
15:35–15:45 | Pause |
15:45–16:00 | Irina Arndt (Max Planck Digital Library): SoLi für FDM-Projekte – Fördertopf und Proposals: Wie die Software-Grundversorgung hilfreich für FDM-Projekte sein kann Seit 2018 gibt es die Software-Grundversorgung in der MPG und einen Fördertopf für Software-Entwicklungsprojekte. Erfahren Sie, wie Sie beide Optionen nutzen können, um Software rund ums Forschungsdatenmanagement zu beschaffen, selbst weiter zu entwickeln oder weiter entwickeln zu lassen. Folien (MPG-IP-Range) |
16:00–16:10 | Diskussion |
16:10–16:25 | Dr. Alexander Schlemmer, Dr. Henrik tom Wörden, Prof. Dr. Ulrich Parlitz und Prof. Dr. Stefan Luther (Max-Planck-Institut für Dynamik und Selbstorganisation und IndiScale GmbH): Heterogene wissenschaftliche Dateistrukturen FAIR gestalten: Eine flexible, robuste Open-Source-Lösung mit dem CaosDB Crawler In diesem Vortrag präsentieren wir die grundlegenden Konzepte des CaosDB-Crawlers und zeigen, wie diese in wissenschaftliche Use-Cases eingebettet werden können. Die Verknüpfung zwischen dem Forschungsdatenmanagement und den Datenquellen, die sich beispielsweise auf einem Dateisystem befinden, wird durch den CaosDB-Crawler ermöglicht und fortlaufend synchronisiert. Diese Vorgehensweise bietet eine robuste und flexible Lösung, um viele verschiedene Datenstrukturen und Dateiformate in das Forschungsdatenmanagementsystem einzubinden. Folien (MPG-IP-Range) |
16:25–16:40 | Diskussion |
16:40–16:50 | Pause |
16:50–18:00 | Podiumsdiskussion mit – Prof. Dr. Kurt Kremer (Max-Planck-Institut für Polymerforschung) – Dr. Johann-Mattis List (Max-Planck-Institut für Menschheitsgeschichte) – Sandra Martin (Max-Planck-Institut für Kognitions- und Neurowissenschaften) – Prof. Dr. Markus Reichstein (Max-Planck-Institut für Biogeochemie) |
Tag 2 (6. Mai 2021): FDM-Kompetenzen – Forschungsdaten verarbeiten
9:00–9:05 | Dr. Yves Vincent Grossmann und Michael Franke (Max Planck Digital Library): Willkommen zu Tag 2 |
9:05–9:25 | Dr. Johannes Zierenberg (Max-Planck-Institut für Dynamik und Selbstorganisation): Die Rolle von GitHub zum Management der Forschungsdaten unserer Covid-19-Modellierungen Im Frühjahr 2020 haben wir mathematische Modelle entwickelt um vergangene Covid-19-Fallzahlen zu beschreiben und deren Verlauf, unter Berücksichtigung verschiedener Szenarien, in die nahe Zukunft zu interpolieren. Um unsere Ergebnisse schnell mit der weltweiten Forschungsgemeinschaft zu teilen, haben wir unsere Modelle und Forschungsdaten frühzeitig auf GitHub zur Verfügung gestellt. Ich werde von unserer positiven Erfahrung berichten. Folien (MPG-IP-Range) und Video (MPG-IP-Range) |
9:25–9:35 | Diskussion |
9:35–9:55 | Michael E. Rose PhD (Max-Planck-Institut für Innovation und Wettbewerb): Daten über die Wissenschaft: Publikationen, Patente, Unternehmensregister, und noch einiges mehr Unsere Abteilung (Innovation & Entrepreneurship Research) arbeitet ausschließlich zu Wissenschaft, Erfindungen und jungen Unternehmen. Wir führen etwa 40 TB an internen und externen Daten zu Publikationen, Patenten und Unternehmensinformationen. In diesem Vortrag berichte ich, wie wir das effizient verwalten. Folien (MPG-IP-Range) und Video (MPG-IP-Range) |
9:55–10:05 | Diskussion |
10:05–10:15 | Kurzes Online-Tutorial zu pybliometrics mit Michael E. Rose PhD Online-Tutorial für pybliometrics (MPG-IP-Range) |
10:15–10:25 | Pause |
10:25–10:45 | Christoph Rzymski, Robert Forkel und Dr. Johann-Mattis List (Max-Planck-Institut für Menschheitsgeschichte): Forschungsdaten als organische Systeme? Der konventionelle Lebenszyklus von Forschungsdaten sieht Daten an ihrem Endpunkt vor allem als Ausgangspunkt für die Generierung und Erhebung neuer Daten. Tatsächlich sehen wir eine Reihe von Vorteilen in der Konzeptualisierung von Forschungsdaten als organische, sich stets entwickelnde Systeme. In einer „Best Practice-Präsentation“ zu diesem Thema wollen wir zeigen, welche Möglichkeiten und Vorteile, aber auch welche potenziellen Probleme aus dieser Sichtweise entstehen können. Folien (MPG-IP-Range) und Video (MPG-IP-Range) |
10:45–11:05 | Dr. Kristina Starkloff (Max-Planck-Archiv Berlin): Archivieren von Anfang an denken! Das Interesse an erhobenen Forschungsdaten kann über den geplanten Rahmen, sogar über die Interessen der eigenen Disziplin hinausreichen. Exemplarisch seien Daten zu später ausgestorbenen Tieren, vergangenen Himmelskonstellationen oder Beobachtungen zu wiederkehrenden gesellschaftlichen Ereignissen genannt. Elementare Voraussetzung ist, dass die Informationen lesbar bleiben, Zugangsrechte geklärt und sie in ihren Kontext einzuordnen sind. Archivierung bildet hierfür eine wichtige Voraussetzung. Folien (MPG-IP-Range) und Video (MPG-IP-Range) |
11:05-11:15 | Dr. Raphael Ritz (MPCDF): Neues von der MPCDF Die Max Planck Computing and Data Facility bietet Dienstleistungen für alle Max-Planck-Institute an. Darunter fallen unter anderem das Datenmanagement für Big-Data-Projekte, der Betrieb eines zentralen Hochleistungsrechners und die Bereitstellung einer modernen Dateninfrastruktur einschließlich Langzeitarchivierung. Schwerpunkt des Vortrags werden aktuelle Entwicklungen im Bereich Datenanalyse und Datenmanagement sein. Folien (MPG-IP-Range) und Video (MPG-IP-Range) |
11:15–11:55 | Diskussion |
11:55–12:00 | Pause |
12:00–12:25 | Dr. Holger Dinkel (Max-Planck-Institut für biologische Kybernetik): SoftwareCarpentry: Extrakurrikuläre Weiterbildung für den Forscher von heute Moderne Wissenschaft benötigt heutzutage Computer im selben Maße wie Teleskope oder Reagenzgläser. Leider wird noch immer an den meisten Universitäten unzureichend und ineffektiv der Umgang mit digitalen Tools vermittelt. Dass es auch anders geht beweist Software-Carpentry seit 1997: In tausenden Kursen auf der ganzen Welt wurde Wissenschaftlern Konzepte für die effektivere Nutzung von Computern in der Forschung beigebracht. Diese Trainings haben nachweislich einen unmittelbaren Einfluss auf die Produktivität der TeilnehmerInnen gehabt. Folien (MPG-IP-Range) |
12:25–12:35 | Diskussion |
12:35–12:50 | Dr. Matthias Hölzl (Max-Planck-Institut für Plasmaphysik): Anforderungen an das Datenmanagement bezüglich des MHD-Code JOREK zur Simulation großskaliger Instabilitäten in Fusionsplasmen Simulations-Codes mit ihren internationalen Communities haben vielfältige Anforderungen an FDM: Zusammenführen großer Datenmengen von Rechnern weltweit, Archivierung, Zugänglichkeit für Zweitnutzung, Dokumentation für Reproduzierbarkeit, Datenweitergabe an einzelne Personen oder öffentliche Bereitstellung, etc. Hr. Hölzl stelle den nicht-linearen MHD-Code JOREK und seine Anwendungen vor und geht auf die aktuelle Strategie beim FDM und insbesondere die bisher ungeklärten Punkte ein. Folien (MPG-IP-Range) und Video (MPG-IP-Range) |
12:50–13:00 | Diskussion |
13:00–13:05 | Resümee der 1. Tageshälfte |
13:05–14:00 | Mittagspause |
14:00–14:25 | Dr. Carsten Fortmann-Grote (Max-Planck-Institut für Evolutionsbiologie) und Prof. Dr. Hans Fangohr (Max-Planck-Institut für Struktur und Dynamik der Materie): Reproducible Science with Jupyter The Jupyter notebook format enables seamless coexistence of computer program code, documentation, and execution, as well as interactive visualization and discussion of results in one document and provides a user-friendly work environment. We will give an overview of the Jupyter ecosystem of tools and services and discuss how Jupyter enhances reproducibility in data intensive research. Slides und Video |
14:25–15:05 | Online-Tutorial zu Data Visualization with Jupyter mit Dr. Carsten Fortmann-Grote und Prof. Dr. Hans Fangohr The presentation is followed by a hands-on tutorial for interested participants. We first give a basic introduction into the Jupyter notebook format and instruct how to use it in a data analysis setting. We then work through a small data analysis workflow with covid case number forecast with bayesian inference from Johannes Zierenberg talk in the morning. This consists of loading the data into the notebook, data cleanup, and exploratory data analysis with interactive visualisations. Online-Tutorial-Datei |
15:05–15:20 | Diskussion |
15:20–15:30 | Dr. Yves Vincent Grossmann und Michael Franke (Max Planck Digital Library): Zusammenfassungen und Aussichten |