Dakle, želite objaviti otvorene podatke? Čestitamo, to je izvrsna vijest! Evo i nekoliko korisnih savjeta kako bi proces tekao što lakše i učinkovitije.

Image and video hosting by TinyPic

Ciljevi

Zbog čega biste trebali objaviti otvorene podatke? Korištenje otvorenih metoda dijeljenja podataka mogu povećati internu učinkovitost Vaše organizacije. Ukoliko ste upoznati s načinom objavljivanja, pohranjivanja i upotrebe podataka, mnogo je lakše predložiti dobre izvore drugim odjelima, a tim je odjelima olakšana upotreba istih. Imati širu publiku znači imati veću kreativnost i talente uključene u razumijevanje tih podataka. Najzanimljivije upotrebe mogu biti i najneočekivanije – poput istraživanja s unakrsnim referencama ili vizualizacije projekata koji zaokupljuju pažnju javnosti.

Koristite otvorene formate

Imati širu publiku znači i prilagoditi se načinu na koji oni koriste podatke. Vi možda koristite određeni operativni sustav i softver, čak imate i licencu za isti; međutim, mnogi nemaju, a softveri mogu biti toliko skupi da se kupnja jednostavno ne isplati. Kakva korist od besplatnih podataka ako je potrebno platiti nekoliko tisuća dolara kako bi se dokumenti mogli otvoriti?

Srećom, postoje brojni jednostavni formati otvorenog tipa, podržani kako od strane komercijalnih i besplatnih proizvoda, tako i od strane raznih operativnih sustava.

Tekst

Izbjegavajte objavljivanje tekstova u Word formatu. Postoji mnogo verzija koje su nekompatibilne, a postoje i brojni problemi s otvaranjem ako se radi o proizvodu druge kompanije (koja nije Microsoft).

Objavljivanje teksta u PDF formatu je u redu. Ipak, zapamtite da su neke navodne prednosti PDF-a samo mit: vrlo je lako urediti bilo koji PDF dokument, stoga su dokumenti u tom formatu jednako podložni mijenjanju i uređivanju kao i u bilo kojem drugom formatu.

Ako je Vaš tekst minimalno stiliziran, koristite neki jednostavan format: primjerice, .txt format je najjednostavniji i lako čitljiv u bilo kojem sustavu.

Tablice

Nikada ne objavljujte tablične prikaze podataka u PDF formatu.

Gotovo je nemoguće čitati takve podatke na računalu, a potencijalni korisnici su ih stoga primorani ručno raščlanjivati, odnosno prepisivati.

Najbolji format za objavljivanje tabličnih prikaza podataka je CSV (Comma-separated values), jedna od opcija za izvoz Microsoft Excel dokumenata.

Geografski podaci

Postoje različiti formati za objavljivanje geoprostornih podataka, ovisno o tome radi li se o vektorskim ili rasterskim podacima. Isto tako, za podatke različitih veličina bolji su određeni formati.

Za vektorske podatke manjih veličina, koristite GeoJSON ili KML.

To su jednostavni, općeprihvaćeni standardi. Zapamtite- takvi formati zahtijevaju geografske koordinate u WGS84 obliku koji je jednostavniji za korisnike, stoga, napravite potrebne preinake prije objave. Ako imate osjetljive, precizne podatke, omogućite pristup originalnoj verziji, kao i WGS84 verziji kako bi se olakšalo korištenje.

Veće vektorske podatke objavite kao Shapefiles.

Solidan i jednostavan format za objavljivanje rasterskih podataka je GeoTIFF.

To je otvoreni standard koji omogućava široku upotrebu. Za veće rasterske skupine podataka i negeografske podatke, dobar i široko podržan izbor je i NetCDF.

Neki Esri tipovi podataka poput File GDB i .zlas namjerno su šifrirani i podržavaju ih samo skupi Esri programi, stoga se ne preporučuje koristiti ih za distribuciju otvorenih podataka. Isto tako, GeoPDF se ne preporuča jer nije u široj upotrebi i ima zakonska ograničenja.

Koristite otvorene licence

Definiranje licence ključno je za bilo kakvu distribuciju: bez jasno određenih uvjeta korištenja, korisnici nikad nisu sigurni kod korištenja podataka. Koju ćete licencu odabrati ovisi o više faktora: Ako su podaci rezultat rada nekog zaposlenika javnog tijela, dio su javne domene, stoga je to jedini izbor. Isto tako, u Hrvatskoj se zakoni i druge vladine odredbe ne mogu zaštititi autorskim pravima. Ako Vaši podaci ne spadaju u niti jednu od te dvije kategorije, vrlo vjerojatno imate autorska prava; drugim riječima, o Vama ovisi koja prava ćete ustupiti, a koja zadržati. Ako niste zaposlenik tijela javne vlasti, najslobodniji izbor bio bi registrirati podatke pod CC0, otvorenu licencu s uvjetima javne domene. Tako se odričete većine prava, poput prava na imenovanje autora ili zabranu komercijalne upotrebe, no korisnici će tako izbjeći mnoge pravne nedoumice i mnogo vjerojatnije će se služiti podacima.

Čak i ako ste zaposlenik tijela javne vlade, registriranje svojih podataka pod CC0 izvan Hrvatske, kao i naglašavanje da se radi o javnoj domeni unutar zemlje svakako će razjasniti nedoumice i povećati upotrebu podataka u svijetu. Ovo je vrlo jednostavan korak, kao što se može vidjeti kod Ministarstva zdravstva i socijalne skrbi.

Ako želite uvjetovati navođenje autora, možete se poslužiti ODC-BY licencom, koja dopušta korištenje podataka pod uvjetom da je naveden izvor.

Postoji još jedna licenca sa share-alike svojstvom – to znači da objavljena kombinacija Vaših i tuđih podataka mora nositi istu licencu koju imaju i Vaši, originalni podaci. I dok to donekle sprječava zloupotrebu tuđih podataka, isto tako onemogućava spajanje Vaših i tuđih podataka ako su pod različitim licencama. Stoga se share-alike licence, poput ODBL, ne preporučuju za nove projekte. Objavljivanje Jednom kad ste u posjedu otvorenih podataka, vrijeme je da ih objavite!

Najbolje je ne komplicirati: nije potrebno kreirati internetski portal ili server: jedino što Vam treba je download stranica. Ako nemate veliku količinu podataka, objavite ih i postavite poveznicu u već postojećem CMS-u (sustavu za upravljanje sadržajem).

Najbitniji element svake strategije objavljivanja podataka su URL-ovi. Kako bi osigurali pristup podacima u svako doba, držite se pravila da URL poveznice budu lako pamtljive i pouzdane, te da se ne mijenjaju kroz vrijeme.

Mnogim je organizacijama važno da je distribucija otvorenih podataka pouzdana i jeftina, a potreba za financiranjem jedne takve stranice bi uvelike otežala stvari. Lak način da se izbjegnu slični problemi je korištenje već postojećih usluga, poput AmazonaS3 koji se bavi skidanjem i pohranom podataka.

Treba li Vam API pristup (aplikacijsko programsko sučelje)? Napravite ga ako imate:

  • ljudske resurse, vrijeme i izvor prihoda kako bi ga mogli financirati jednom kada pridobijete korisnike;
  • toliku količinu podataka koju je nemoguće skinuti odjednom, te ako postoje određeni kriteriji za podjelu podataka u „ladice“ kako bi korisnici mogli filtrirati rezultate.

U suprotnom, bilo bi bolje da objavite podatke kao obične download dokumente kako bi izbjegli komplikacije i odgovornosti API-ja.

Reklamiranje

Objavili ste podatke – čestitamo! Omogućavate nove i izvanredne načine razmišljanja. No, kako zainteresirati ljude i potaknuti ih na korištenje tih podataka?

Komunicirajte s korisnicima. Objava podataka početak je komunikacije s korisnicima. Objavite e-mail adresu na koju vas korisnici mogu kontaktirati, slati upite i informirati o korištenju Vaših podataka. Mailing lista, forum ili popis najčešćih pitanja i problema, korak su prema međusobnoj suradnji korisnika.

Pronađite kolege i razgovarajte. Sada kad radite „na otvorenom“, uvidjet ćete da se mnogi bave sličnim poslom i imaju slične baze podataka. Razgovarajte s njima, povežite se i saznajte kako možete učiti jedni od drugih.

Pokažite kako su Vaši podaci super: stvorite analizu ili vizualni prikaz podataka koji vodi do Vaše stranice. Spomenite ga preko mreža koje obično koristite i gdje se druže analitičari, poput Twittera i GitHuba.

Pogledajte koliko zvjezdica mogu imati vaši podaci, više na Algoritam ocjenjivanja otvorenih podataka.

Kratki vodič za otvorene podatke (izvorno: Simple Open Data) je otvoreni projekt zajednice, više na stranci projekta.

Hvala volonterima ekspertne skupine Programiraj za Hrvatsku za prijevod (A.D.), lekturu i jezičnu redakturu (M.S.).