Abstract | Uvod: U slučajevima javnozdravstvene krize poput trenutne pandemije bolesti COVID-19 bilo bi važno da autori biomedicinskih istraživanja učine svoje neobrađene podatke (engl. raw data) javno dostupnima javnosti te time omoguće transparentnost, ponovljivost i provođenje novih istraživanja s postojećim podacima. Dijeljenje podataka (engl. data sharing) iz istraživanja odražava praksu kojom se neobrađeni podaci prikupljeni u određenom istraživačkom projektu stavljaju na raspolaganje drugima kako bi se validirali ili koristili u nove istraživačke svrhe.
Cilj: Analizirati izjave o dijeljenju podataka i stvarno dijeljenje podataka u člancima o COVID-19 objavljenim na preprint poslužiteljima medRxiv i bioRxiv.
Metode: Analizirani su preprint članci objavljeni na preprint poslužiteljima bioRxiv i medRxiv na temu SARS-CoV-2 i COVID-19 u razdoblju od 19. siječnja 2020. do 30. ožujka 2020. godine. Izdvojene su izjave o dijeljenju podataka, analizirana su odstupanja između izjava o dijeljenju podataka na mrežnoj stranici članka u odjeljku „Podaci/Kod“ i unutar rukopisa te se pokušalo pronaći neobrađene podatke kada su autori naveli da su dostupni. Svi dopisni autori kod kojih nije bilo izjave o dijeljenju podataka/koda, kod kojih su podaci dostupni na zahtjev ili neobrađeni podaci nisu bili pronađeni, anketirani su putem e-poruke.
Rezultati: Analizirano je 897 preprint članaka. Od toga je 699 (78%) članaka na mrežnoj stranici preprint poslužitelja sadržavalo odjeljak Podaci/Kod. U 234 (26%) preprint članaka, izjava o dijeljenju podataka/koda bila je pronađena unutar rukopisa. Za 283 preprint članaka kod kojih su autori izvijestili da su podaci dostupni, pronađeni su neobrađeni podaci/kod u 133 (47%) od 283 preprint članaka. Autori su najčešće naveli da su podaci dostupni na GitHub-u ili na drugoj jasno navedenoj mrežnoj stranici, na (razuman) zahtjev, unutar rukopisa ili u dodatnim podacima.
Zaključak: Četvrtina preprint članaka sadržavala je izjavu o dijeljenju podataka unutar rukopisa, a 15% autora je u vrijeme objavljivanja rukopisa javno dijelilo neobrađene podatke unutar rukopisa ili drugdje na internetu. Svi preprint poslužitelji trebaju zahtijevati od autora da dostave izjave o dijeljenju podataka koje će biti uključene na mrežnoj stranici preprint članka i unutar rukopisa. Potrebna je edukacija istraživača o tome što dijeljenje podataka doista znači. |
Abstract (english) | Data sharing in articles about COVID-19 published in preprint servers medRxiv and bioRxiv: a cross-sectional study
Background: In a public health emergency, it would be important that authors of biomedical studies make their raw data publicly available and thus enable transparency, reproducibility, and the conduct of new studies with existing data. Data sharing from research reflects the practice in which data collected in a specific research project are made available to others for validation or to use the data for new research purposes.
Aim: To analyze the content of data sharing statements and actual sharing of raw data in preprint articles about COVID-19.
Methods: We analyzed preprint articles on SARS-CoV-2 and COVID-19 published on medRxiv and bioRxiv from January 19, 2020, to March 30, 2020. We extracted data sharing statements, analyzed discrepancies between data sharing statements on the web page in the section „Data/Code“ of an article and within the manuscript, and tried to locate raw data when authors indicated they were available. We sent an email to all corresponding authors that did not have a data/code sharing statement, or where data is available on request, or raw data were not found.
Results: We analyzed 897 preprint articles. There were 699 (78%) articles with Data/Code field present on the web site of a preprint server. In 234 (26%) preprints, data/code sharing statement was reported within the manuscript. For 283 preprints that reported that data were accessible, we found raw data/code for 133 (47%) of those 283 preprints. Most commonly, authors indicated that data were available on GitHub or another clearly specified web location, on (reasonable) request, in the manuscript or its supplementary files.
Conclusion: A quarter of preprint articles included a data sharing statement within their manuscript, and even fewer shared their raw data publicly, either in the manuscript or elsewhere online, at the time of publication. All preprint servers should require authors to provide data sharing statements that will be included both on the website and in the manuscript. In addition, education of researchers about what data sharing really means would be needed. |