Fang jung an, um wissenschaftliche Reproduzierbarkeit zu lehren

Fang jung an, um wissenschaftliche Reproduzierbarkeit zu lehren
Fang jung an, um wissenschaftliche Reproduzierbarkeit zu lehren
Anonim

Die Fähigkeit, ein Experiment und seine Ergebnisse zu duplizieren, ist ein zentraler Grundsatz der wissenschaftlichen Methode, aber neuere Forschungen haben gezeigt, dass eine alarmierende Anzahl von Peer-Review-Artikeln nicht reproduzierbar sind.

Ein Team von Mathematik- und Statistikprofessoren hat einen Weg vorgeschlagen, um eine Wurzel dieses Problems anzugehen, indem es angehenden Wissenschaftlern Reproduzierbarkeit beibringt und Software verwendet, die das Konzept eher logisch als umständlich erscheinen lässt.

Forscher des Smith College, der Duke University und des Amherst College untersuchten, wie Statistikstudenten auf einen Lehrplan reagierten, der auf die Reproduzierbarkeit ausgerichtet war.Ihre Arbeit wird in einem Artikel beschrieben, der am 25. Februar in der Zeitschrift Technological Innovations in Statistics Education veröffentlicht wurde.

Im Jahr 2013 widmete die bekannte wissenschaftliche Fachzeitschrift Nature nach mehreren Widerrufsskandalen und Studien, die Reproduzierbarkeitsraten von nur 10 Prozent für Peer-Review-Artikel zeigten, eine Sonderausgabe den Bedenken hinsichtlich der Nichtreproduzierbarkeit.

Die Herausgeber von Nature kündigten Maßnahmen zur Lösung des Problems auf ihren eigenen Seiten an und ermutigten die Wissenschaftsgemeinschaft und Geldgeber, ihre Aufmerksamkeit auf eine bessere Ausbildung junger Wissenschaftler zu richten.

"Zu wenige Biologen erh alten eine angemessene Ausbildung in Statistik und anderen quantitativen Aspekten ihres Fachs", schrieben die Herausgeber. "Die Betreuung junger Wissenschaftler in Sachen Strenge und Transparenz ist bestenfalls uneinheitlich."

Die Autoren der vorliegenden Studie suchten daher in ihren eigenen Klassenzimmern nach Möglichkeiten, die Idee der Reproduzierbarkeit zu integrieren.

"Das Reproduzieren einer wissenschaftlichen Studie besteht normalerweise aus zwei Komponenten: dem Reproduzieren des Experiments und dem Reproduzieren der Analyse", sagte Ben Baumer, Visiting Assistant Professor für Mathematik und Statistik am Smith College. "Letzteres wollten wir als Statistiklehrer unseren Schülern vermitteln."

Die Maxime der Grundschule, „deine Arbeit zu zeigen“, gilt in der durchschnittlichen Statistik-Einführungsklasse nicht, sagte Mine Cetinkaya-Rundel, Assistenzprofessorin für die Praxis in der Duke-Statistikabteilung. In einem typischen Arbeitsablauf führt ein Statistikstudent auf Hochschulniveau die Datenanalyse in einem Softwarepaket durch, überträgt die Ergebnisse jedoch in etwas, das sich besser für Präsentationen eignet, wie Microsoft Word oder Microsoft PowerPoint.

Obwohl Standard, trennt dieser Arbeitsablauf die Rohdaten und Analysen von den Endergebnissen, was es den Schülern erschwert, ihre Schritte zurückzuverfolgen. Der Prozess kann zu Fehlern führen, und in vielen Fällen, schreiben die Autoren, „ermöglicht und ermutigt das Copy-and-Paste-Paradigma die selektive Berichterstattung."

"Normalerweise enthält ein Datenanalysebericht, selbst ein veröffentlichtes Papier, den Code nicht", sagte Cetinkaya-Rundel. "Aber auf der Einführungsebene, wo die Schüler zum ersten Mal mit diesem Arbeitsablauf konfrontiert werden, hilft es, sowohl die Endergebnisse als auch den Code, der zu ihrer Generierung verwendet wurde, intakt zu h alten."

Geben Sie R Markdown ein, ein Statistikpaket, das sich nahtlos in die Programmiersprache R integrieren lässt. Das Team entschied sich für R Markdown wegen seiner Benutzerfreundlichkeit – die Schüler müssten keine neue Computersyntax lernen – und weil es das Rohe kombiniert Daten, Berechnung und schriftliche Analyse in einem HTML-Dokument. Die Forscher hofften, dass eine einzige HTML-Datei den Schülern ein umfassendes Verständnis der Aufgaben vermitteln und das Lernen und Benoten erleichtern würde.

Im Rahmen der Studie wurde R Markdown im Schuljahr 2012-2013 417 Statistikstudenten (272 von der Duke University, 145 vom Smith College) vorgestellt. Die Kursleiter betonten die Lektion der Reproduzierbarkeit in jedem Kurs und befragten 70 Studenten zu ihren Erfahrungen mit der Verwendung von R Markdown für Hausaufgaben.

Die Umfrage, die einmal zu Beginn und einmal am Ende des Semesters durchgeführt wurde, zeigte eine allmähliche Zunahme der Studentenpräferenz für R Markdown. Der Prozentsatz der Befragten, die angaben, dass sie R Markdown zunächst als frustrierend empfanden, aber schließlich den Dreh raus hatten, stieg von 51 auf 75 Prozent. Die Studenten zogen es der Alternative bei weitem vor, wobei 70 Prozent überhaupt nicht zustimmten, dass sie lieber die Copy-and-Paste-Methode verwenden würden.

Das Forschungsteam stellte außerdem fest, dass selbst dann, wenn Schüler keine Computererfahrung hatten oder eine negative Einstellung gegenüber R Markdown zum Ausdruck brachten, ihre Noten nicht darunter zu leiden schienen. Zukünftige Umfragen werden gezieltere Fragen dazu stellen, wie viel von der Lektion über Reproduzierbarkeit die Schüler aus den geänderten Lehrplänen aufnehmen.

Da die Nutzung und Analyse von Big Data immer ausgefeilter wird, schreibt das Team, wird die Fähigkeit von Forschern, Schritte zurückzuverfolgen und die gleichen statistischen Ergebnisse zu erzielen, nur noch an Bedeutung gewinnen.

Andere Autoren der Veröffentlichung waren Andrew Bray und Linda Loi vom Smith College und Nicholas Horton vom Amherst College.

Diese Forschung wurde teilweise vom Projekt MOSAIC und der National Science Foundation (Grant DUE-0920350) unterstützt.

Beliebtes Thema