Kerstin Forsberg – informationsarkitekt på AstraZeneca

Tim Berners-Lee föreslog en skala om fem stjärnor för länkad öppna dataKerstin träffade jag på ett möte hos en leverantör av dokument- och processhantering, vid namn Barium. De tyckte “vi kunde ha nytta av att träffas”, och ja, jag är beredd att hålla med. Åtminstone jag och mina kollegor på landstinget har haft nytta av det.

Redan där och då, en solig vårdag bredvid Grönsakstorget, gav Kerstin sin syn på hur dokumenthantering egentligen borde fungera. Bort med innehållscontainrar, som Word-filer, in med mer formulärhanterad dokument- och kunskapshantering. Mer metadata, mer meningsfull metadata. Inför vokabulär (ordlistor) som stöd så man uppnår bättre ordning än de nyckelord folk lojt fyller i utan att veta till vilken nytta.

Hon satte ord på mycket av det jag tänkt på länge, något som gnagt mig, att det är ett fundamentalt fel inbyggt i många informationssystem.

Det handlar om informationsarkitektur, och särskilt länkade data, och det är vad Kerstin jobbar med (och vissa av oss andra strävar mot).

Så, Kerstin, vem är du och vad är det du gör?

– En som alltid vill lära mej mera (Lifetime Learner står det i min Linkedin-profil). Jag jobbar på AstraZeneca som Informatics Analyst med att förbättra användningen av information i läkemedelsutvecklingen. Jag är aktiv inom ett nätverk i Sverige för att sprida användningen av semantiska standarder och länkade data-principer.

Varför är länkade data viktigt?

– För 25 år sedan såg vi starten på hur webb 1.0 tekniken förändrade vårt sätt att sprida information. De senaste 10 åren har webb 2.0 gett oss nya sätt att samarbeta. Nu ser vi hur webb 3.0 ger oss nya möjligheter att länka samman data och ge data sammanhang och betydelse (semantik).

Vilka är dina viktigaste arbetsuppgifter, vad kan man inte fuska med?

  1. Få med krav på öppna och länkade data när man utvärderar system och bygger nya lösningar. Användargränssnitt och datagränsnsnitt (APIer) är båda viktiga.
  2. Successivt ersätta databas-interna nycklar och lokala identifierare med globala och bestående identifierare. Identifierare för data, dokument, forskare, organisationer, instrument – allting. Som forskare så har jag en sådan identifierare: http://orcid.org/0000-0002-1491-0940 via Open Researcher and Contributor ID (ORCID) och författaren August Strindberg har fått identifieraren http://www.wikidata.org/wiki/Q7724 i wikidata (mera om detta senare).

Hur ser det ut generellt i Sverige – är vi bra på det du gör?

– Vi har saknat ett systematiskt arbete och har mycket att lära av t.ex. Storbritannien när det gäller öppna data och från Holland och Tyskland när det forskningsgrupper som arbetar med länkade data. Men det finns spännande individer i Sverige: Pernilla Näsfors (@pernillan) som jobbar med SIDA och Världsbanken, Peter Krantz (@peterkz_swe) på Kungliga Bibliteket, Erik Borälv (@erikboralv) på Vinnova. Och så gör Andreas Krohn (@andreaskrohn) och hans kollegor på Nordic APIs ett viktigt jobb. Och entreprenörer som Hannes Ebner och Matthias Palmér som startat MetaSolution (@MetaSolutionsAB) baserat på deras forskning om länkade data på KTH.

Har du exempel på nyttiga användningsfall där informationsarkitektur gjort stor skillnad?

– Inom läkemedelsforskningen så är Open PHACTS (Open Pharmacological Space), ett av projekten inom det stora EU-programmet Innovative Medicines Initiative (IMI), ett lyckat exempel. Jag pratade om det på ett webinarium som Vinnova anordnade förra våren. Och på ett kommande så kallat meetup i Göteborg 28 april så kommer min kollega på AstraZeneca, Ola Engqvist, att prata om detta.

Något särskilt på webben just nu som du tycker är spännande?

  1. Hela öppna data trenden. Jag tror företag inom kort kommer att starta data.bolag.se parallellt med sina www.bolag.se, på samma sätt som det finns data.riksdagen.se och data.vinnova.se.
  2. Schema.org som är Google, Bing (Microsoft), Yahoo gemensamma projekt för att “förbättra uppmärkningen av sidor som beskriver ‘saker'” (“Improve markup of pages that describe things”).
  3. JSON-LD Utvecklar-favorit data strukturer med länkning av data.
  4. Wikidata som är den gemensamma data-“ryggraden” bakom Wikipedia för t.ex. födelsedata, personidentifikation och kopplingar mellan olika språkversioner av Wikipedia. Ett exempel är att födelse och dödsdatum för August Strindberg numera tillhandahålls gemensamt från Wikidata via identifieraren www.wikidata.org/wiki/Q7724 till wikipedia sidor på olika språk.

Var kan folk hitta mer information om dig och det du gör?

– Jag bloggar och twittrar en del om detta: @kerfors på Twitter och kerfors.blogspot.se

Tack för det. Jag kan väl medge att utan Kerstins återkommande inspel, och gästspel, hade det i alla fall inte blivit något eget kapitel om informationsarkitektur i Webbstrategi för Alla.