
Image by Bernard Goldbach, from Flickr
Digitaaliset arkistonhoitajat työskentelevät julkisen datan säilyttämiseksi katoamiselta
Jo yli 30 vuoden ajan Internet Archive’s Wayback Machine on säilyttänyt hallituksen verkkosivustoja ja tutkimukselle välttämättömiä tietojoukkoja, kuten Spectrum:n uudessa raportissa yksityiskohtaisesti kuvataan.
Kiire? Tässä ovat nopeat faktat:
- Wayback Machine ylläpitää olennaista hallituksen dataa, joka toimii elintärkeänä materiaalina tieteelliselle ja insinööritieteelliselle tutkimukselle.
- Trumpin toisen presidenttikauden aikana yli 8 000 hallituksen verkkosivua ja tietokantaa katosi julkiselta saatavuudelta.
- Harvardin yliopiston Library Innovation Lab onnistui säilyttämään 311 000 tietojoukkoa, jotka kuuluivat Data.gov-kokoelmaan.
Nämä tiedot, jotka tulevat virastoilta kuten NASA ja National Science Foundation, tarjoavat olennaista dataa tiedemiehille ja insinööreille. Jos ne katoavat, tutkimuksen pätevyys ja historiallinen tarkkuus ovat vaarassa, kuten Spectrum on huomauttanut.
Hallituksen tietojen poistaminen ei ole uusi ilmiö. 9/11-iskujen jälkeen Bushin hallinto poisti turvallisuussyistä miljoonia tavuja tietoa. Obama otti erilaisen lähestymistavan ja avasi vuonna 2009 Data.gov -sivuston yleisön saataville, kertoo Spectrum.
Trumpin ensimmäisellä kaudella Ympäristötiedon ja -hallinnon aloitteen tutkijat havaitsivat, että jotkut hallituksen verkkosivut olivat saavuttamattomissa, ja viittaukset ”ilmastonmuutokseen” oli pyyhitty pois useilta sivuilta, sanoo Spectrum.
Trumpin toisen kauden aikana datan säilyttämiseen liittyvät huolenaiheet ovat kärjistyneet. Helmikuussa The New York Times raportoi, että yli 8 000 hallituksen verkkosivua ja tietokantaa oli otettu pois käytöstä.
Jotkut näistä ovat sittemmin palanneet, mutta Grist havaitsi muutoksia, mukaan lukien termien kuten ”ilmastonmuutos” ja ”puhdas energia” poistaminen. Helmikuun 11. päivä seurasi oikeudellisia haasteita, ja liittovaltion tuomari määräsi tietyt CDC:n ja FDA:n tietokannat palautettavaksi, kuten Spectrum raportoi.
Tämän menetyksen torjumiseksi digitaaliset arkistonhoitajat ovat ryhtyneet toimiin. Harvard Law Schoolin Library Innovation Lab on kopioinut Data.gov:n koko 16-teratavun arkiston, joka sisältää yli 311 000 tietoaineistoa. He käyttävät automatisoituja kyselyjä API:en kautta pitääkseen sen päivitettyinä päivittäin.
Arkistonhoitajat pelaavat elintärkeää roolia tiedon suojelemisessa säilyttämällä historiallisia tietoja tuleville sukupolville. Elintärkeän tiedon menetys heidän poissaolonsa seurauksena johtaisi julkisten tietueiden uudelleenkirjoittamiseen, mikä rajoittaisi tulevia tutkimusmahdollisuuksia.
Jätä kommentti
Peruuta