//
du leser...
Arkiv i eForvaltning, arkivdanning, Arkivmeldinga, big data, e-forvaltning, elektronisk arkiv, lenka data, Noark5, opne data, PSI-direktivet

Big Data eller No Data

God jul og godt nytt SAMDOK-år.

Året 2013 går mot slutten. SAMDOK er Riksarkivaren si oppfølging av stortingsmelding nr. 7 (2012–2013) – om arkiv.  I  SAMDOK-programmet er no 3 strategiske samarbeidsgrupper i gang med viktig arbeid retta mot  arkiv i e-forvaltning, mot kommunale arkiv og mot privatarkiv.  Sentrale aktørar på arkivfeltet sit no samla rundt same bordet og diskuterer felles oppgåver, felles prioriteringar og felles løysingar.  Utfordringane er mange, men muligheitene er fleire. Det er alltid dei konkrete resultata som tel til slutt. Det er dei SAMDOK-arbeidet skal målast på. Utan konkrete og nyttige resultat vert arbeidet utan verdi.

Resultat gjennom samarbeid og dialog trur eg er vegen å gå.  Samarbeidet med aktørar utanfor den tradisjonelle arkivsektoren må og styrkast. I dag er arkiv data. Arkiv er ikkje lenger papir. Dei fleste arkivfaglege prinsipp står seg. Men mange oppgåver krev på heilt anna vis ei brei vifte av kompetanse, breitt samarbeid, felles infrastruktur med meir  for å kunna løysast på ein god måte.

Offentleg sektor – ein gigantisk datafabrikk

Offentleg sektor (stat, fylke og kommune) brukar årleg enorme summar på å produsera data forvaltninga treng i dagleg arbeid. Kor mykje data skapar offentleg sektor gjennom eit år? Kva slags data? Kva verdi har dei? Kva med felles bruk, gjenbruk og ny bruk? Vert dei nytta godt nok? Eg har aldri sett gode tal på noko av dette.

For å koma litt nærare inn på ein flik av saka gjekk eg inn på postlistene for eit par-tre kommunar. Eg ville sjå kor høgt det løpande saksnummeret for 2013 var kome.  Det indikerer svært grovt kor mange nye saker som kommunane har oppretta i 2013 og registrert inn i felles saksregister.  Grovt sett ser det ut til at det vert skapt og registrert minst 0,5 sak per innbyggjar. Ein kommune med 5000 innbyggjarar vil produsera og skapa ca 2500 saker gjennom eitt år og registrera dei i felles sak/arkivsystem.

Eg vil understreka at dette er svært enkel empiri. Men det vil gje ca 50.000 saker per år i kommunane Sogn og Fjordane og ca 2.5 millionar saker samla for alle kommunar i Norge på eit år. For ein 10-årsbolk talar me om 25 millionar saker med tilhøyrande dokument frå kommunal sektor. Reknar me ca 4 dokument per sak vil det gje ca 100 millionar dokument over 10 år  berre i kommunal sektor. Legg me til saker i fylkeskommunar og i statleg forvaltning vil talet verta svært mykje høgare.  I dette luftige reknestykket har me ikkje teke med ulike fagsystem. Likevel, me får eit inntrykk av Big Data og kva som er arkivoppgåver anno 2014.

Big Data eller No Data?   

Noark er ei forkorting for Norsk arkivstandard. Noark vart utarbeidd som ein kravspesifikasjon for elektroniske journalsystem i statsforvaltninga i 1984. Den etablerte seg raskt som de facto standard. Standarden vart utvikla vidare med nye rapporter i 1987 (Noark-2) og 1994 (Noark-3) og i dag er det Noark 5 som gjeld.

Dei eldste databasane med saksregister og journalar stammar frå denne tida. Det er 30 år sidan. Likevel er svært lite av slike viktige data sikra for framtida. Mykje  data ligg framleis i gamle, avslutta system. Dette må bli ei hovudoppgåve framover. Målet må vera å sikra alle data av verdi frå denne bolken på ein god måte i ein felles struktur og i eit felles tenestegrensesnitt.  Noark-standarden gir Norge eit unikt utgangspunkt. I ikkje alt for fjern framtid bør det vera mogeleg for brukarar å søkja i alle saker og dokument frå offentleg forvaltning frå ca 1985 og fram til nær samtid gjennom ei felles søketeneste.  Sjølvsagt må retningsliner for innsyn og tilgang liggja til grunn.  Kor mange 100 millionar saker og dokument som vil liggja i ein slik base veit ingen i dag. Me talar om Big Data.  Men det hastar å styrka dette arbeidet. Alternativet til Big Data kan vera No Data.  Det må koma på plass ein felles infrastruktur for denne oppgåva. Dette er ikkje ei arkivoppgåve, men del av kritisk felles infrastruktur som heile offentleg sektor må samarbeida om å etablera og drifta.

Løpande integrasjon mellom arkivdanning, depot og opne data.

Mange aktørar i offentleg forvaltning byter i desse tider ut gamle system.  System som berre har dekka deler av verksemdene sitt arbeid skal i bytast ut med fellessystem for heile verksemda. Stockholm by med 40.000 tilsette skal byta ut gamle løysingar med eitt felles system sak/arkivsystem for heile forvaltninga. Slik døme er det mange av i Norge og. Kommunar slår seg saman og vil etablera felles løysingar og felles drift.

I denne prosessen er det viktig å tenkja heilskap og samhandling. Det vil spara store summar, fjerna dyre tidstjuvar og gje grunnlag for innovasjon og nye tenester.

Public Sector Informasjon (PSI) har fått meir og meir merksemd dei siste åra. Det er to grunnar til det. Den eine er at med betre samhandling og gjenbruk av felles data kan offentleg sektor spara store summar.  Den andre er at det har vist seg at data som er samla inn til eit føremål, kan ha stor verdi i andre samanhengar og gjerne kopla saman med andre data. Difor er det eit politisk mål med opne data som kan brukast av andre i nye samanhengar.  I EU er det stort fokus på  PSI-data som grunnlag for næringsutvikling og ny verdiskaping. Verdien av opne PSI-data i EU er vurdert til ca 140 milliardar Euro årleg. I USA er dette talet relativt sett endå høgre.  Ein grunn til det kan vera at ein der har lenger tradisjonen med opne data frå offentleg sektor, mellom anna kartdata.

Sider av same sak

Gode digitale tenester til innbyggjarane,  god infrastruktur  for bevaring og tilgang til data og lett tilgang til PSI-data for ny næringsutvikling er i høgste grad  sider av same sak.  Det er dette heilskaplege perspektivet som bør liggja til grunn for arbeidet framover. Det er og dette heilskaplege perspektivet som best støttar opp under det som er vedteken politikk og strategi. Det må ikkje finnast svake ledd i denne verdikjeda.

Det beste dømet me har i dag når det gjeld samkøyring av data frå fleire offentlege organ er Offentlig elektronisk postjournal (www.oep.no). Her kan media, forvaltninga og folk flest gjennom eitt register og ei søketeneste få innsyn i den statlege forvaltninga. Her litt det fleire millionar postar. I ein eldre versjon av dette, (http://www.difi.no/artikkel/2012/02/historiske-journalposter-paa-nett) ligg det ca 8.6 millionar postar. Det er Noark-standarden som har gjort dette mogeleg. Norge har hausta lovord for dette arbeidet. Riksarkivar  Ivar Fonnes presenterte saman med Difi OEP på ein stor internasjonal konferanse i London i haust. Tema var Open Government. Innsyn og demokrati.  OEP-samarbeidet viser ein veg.  Me treng eit utvida samarbeid mellom alle i offentleg sektor. Me treng felles ansvar for infrastruktur og tenestebygging som dekkjer alle fasar i livsløpet til data frå offentleg sektor.

Data vert skapt, data vert delt, data vert sikkert lagra og data vert tilgjengeleg som opne og lenka data for andre i nye samanhengar. Alt skjer i same felles nasjonale infrastruktur. Dit må me. I det store biletet er kostnaden liten og gevinstane svært store. Nye løysingar som datamodellar basert på RDF bør prøvast ut. Semantisk teknologi er lovande når ein skal integrera og kopla saman data. Etter kvart bør og sentrale standardar som Noark-standarden støtta ei semantisk tilnærming til desse oppgåvene. Å utvikla ein RDF-basert versjon av Noark5 kan vera ein stad å byrja. Eldre Noark-versjonar bør kunna mappast mot denne og gje enklare integrering av data skapt etter ulike Noark-versjonar. Dette opnar nye og spanande perspektiv i arbeidet med å ta vare på og dela data frå offentleg sektor.

Aktuelle nettstader.

http://www.regjeringen.no/nb/dep/fad/dok/nouer/2013/nou-2013-2/9/4/1.html?id=711081

http://www.regjeringen.no/nb/dep/fad/dok/nouer/2013/nou-2013-2/9/4/1.html?id=711081

http://www.difi.no/artikkel/2012/05/ny-veileder-hvordan-gjore-offentlige-data-tilgjengelige

http://www.digi.no/924264/aapne-data-har-utrolig-verdi

http://iktnytt.no/bigdata-bigmoney/

http://www.brreg.no/nyheter/2013/01/mer_apne_data.html

 

.

Diskusjon

En kommentar om “Big Data eller No Data

  1. For kjapt å få både gamle og nye Noark-systemer til å gi ønskelige data hadde det ikke vært så dumt om Riksarkivet reverserte beslutningen sin om at Noark 4-systemer ikke kan avlevere etter Noark 5. Også gamle Noark 3 og Koark-systemer har datainnhold som kunne ha foret en Noark 5-strøm (systemene hadde utvidelser som Noark først tok inn i Noark 4).

    Skrevet av Ragnar Sturtzel | 07/01/2014, 08:40

Legg igjen en kommentar

Fyll inn i feltene under, eller klikk på et ikon for å logge inn:

WordPress.com-logo

Du kommenterer med bruk av din WordPress.com konto. Logg ut / Endre )

Twitter-bilde

Du kommenterer med bruk av din Twitter konto. Logg ut / Endre )

Facebookbilde

Du kommenterer med bruk av din Facebook konto. Logg ut / Endre )

Google+-bilde

Du kommenterer med bruk av din Google+ konto. Logg ut / Endre )

Kobler til %s

%d bloggere like this: