Van Rijn naar Donau

29-01-2010 | Marco Streefkerk

Afgelopen week was ik bij een bijeenkomst van Europeana in Berlijn. Onderwerp van gesprek: het Europeana Data Model (EDM).  Op tafel lag versie 4 waarvan hieronder een uitwerking is te zien.

Europeana Data Model

Europeana Data Model

In twee dagen van presentaties, demonstraties en discussies moesten we komen tot versie 5 die als basis voor de belangrijkste toegang voor Europees Erfgoed voor de komende jaren moet dienen. De doelstelling vanuit de EU daarbij is geen kleintje: de zoekdienst moet beter zijn dan datgene wat de Europese burger nu in de meeste gevallen zal gebruiken: een internet zoekmachine zoals Google.

De introductie van het EDM markeert de overgang tussen versie 1 (verwacht dit najaar) en versie 2 van Europeana die medio 2011 is gepland. De projectorganisatie vernoemt de versies naar Europese rivieren: van de Rijn naar de Donau. Nu is dit geografisch geen hele grote afstand en ligt er een kanaal als directe verbinding, binnen Europeana is toch wel sprake van een enorme stap.

Tot op heden was de aanpak gericht op de grootste gemeenschappelijke deler tussen de beschrijvingen van al die diverse collecties uit al die landen. De Rijn-versie werkt met de Europeana Semantic Elements: in de kern Dublin Core met wat aanvullende velden.

Voor de Donau is gezocht naar een gemeenschappelijk model van een dusdanig hoog abstractieniveau dat het voor alle onderdelen van het erfgoed bruikbaar is. Het model is geïnspireerd door bestaande datamodellen (zoals CIDOC-CRM) en opgezet als een ontologie. Daarnaast moet EDM aansluiten bij het Semantische Web en Linked Data. Vanuit mijn verleden in de wetenschappelijke bibliotheek ben ik persoonlijk zeer nieuwsgierig naar het gebruik van (onderdelen van) OAI-ORE.

Ik vind de aandacht voor datamodellering goed. Ook voor DE BASIS hebben we gedacht aan een ontologie om het erfgoed als gemeenschappelijke onderwerp te beschrijven.  Probleem daarbij is: als je overeenstemming bereikt op een dergelijk hoog abstractieniveau als een ontologie (wat al lastig genoeg is), moet het nog werkend gemaakt worden in de praktijk. Vanuit de ervaringen met bijvoorbeeld CIDOC-CRM is enige scepsis logisch. Maar met een positieve insteek kan je ook zeggen dat met de opkomst van het semantisch web ontologieën een come-back maken.

Feit is wel dat Europeana een zeer ambitieuze planning hanteert. Er is weinig ruimte voor het opdoen van ervaringen met het huidige model (op basis van ESE).  Ervaring die zeer nuttig kan zijn bij het in de praktijk brengen van het nieuwe model (EDM) op het diverse erfgoed. Tijdens de bijeenkomst deze week werden wel al voorbeelden getoond, naast de onvermijdelijke Mona Lisa, van hoe beschrijvingen van boeken, kranten en video als eigenschappen, waarden en relaties in het theoretische model passen.  Vervolg bijeenkomsten voor de afzonderlijke domeinen moeten de (on)mogelijkheden verder in kaart brengen. Hoe zit het bijvoorbeeld met archieven (EAD), AV-collecties (Frbr) en archeologie en monumenten (GIS)?

Een ander vraagstuk waar in Berlijn nog nauwelijks aandacht aan kon worden besteed is in hoeverre het model in staat is om de gevraagde functionele specificaties te leveren. Daar zijn immers al lijvige documenten aan gewijd. Bij het realiseren daarvan moet de Donau-versie daadwerkelijk een grote verbetering voor de gebruikers leveren. Als Europeana daarbij teleurstelt is er het risico dat de politiek in Brussel haar enthousiasme voor de Europese erfgoedsite verliest en de geldkraan dichtdraait.

Heikel punt daarin blijft de meertaligheid. Domme zoekmachines zoals Google lijken steeds beter in staat om over taalgrenzen heen te werken, ook natuurlijk omdat ze het Engels als de facto standaard hanteren. Uniforme betekenis en intelligentie bieden voor de zes kerntalen van de EU, zoals van Europeana wordt verwacht, plus het respecteren van de (historische) taalcultuur van de verschillende erfgoedcollecties vormt een uitdaging waarvoor een oplossing nog niet in zicht is. Vanuit de aanwezigen in Berlijn kwam het verzoek om proefdata vrij beschikbaar te maken zodat onderzoekers wereldwijd zich op dit vraagstuk kunnen storten.

Na twee dagen Berlijn is mijn eigen conclusie dat Europeana voor een enorme uitdaging staat. Het project vormt een katalysator voor iedereen die overtuigd is van het belang van samenwerking en openheid bij het realiseren van een belangrijke maatschappelijke rol voor erfgoed in de digitale wereld. Een kritische maar tegelijk actieve en constructieve houding van dataproviders, de collectiebeheerders, ook in Nederland is essentieel voor het succes van Europeana. DEN zal daarbij waar mogelijk ondersteunen en aanjagen.

Tags ,

Tim Berners Lee “unlocks” data.gov.uk

21-01-2010 | Annelies van Nispen

“Unlocking innovation” staat er groot op de homepage van data.gov.uk.

Data.gov.uk laat zien wat openbare bronnen, semantisch webtechnologie en samenwerking kunnen bewerkstelligen. Overheidsdata is openbare informatie die op een gemakkelijke manier toegankelijk moet zijn voor de burger. In de VS en het Verenigd Koninkrijk wordt daar ook werk van gemaakt. Minister-president Gordon Brown huurde o.a. Tim Berners-Lee in om te adviseren.

Op dit moment zijn 2500 datasets in RDF beschikbaar. Met deze data kunnen geïnteresseerden aan de slag om deze doorzoekbaar te maken op nieuwe manieren. De website is vanaf september online en er hebben ongeveer 2400 ontwikkelaars zich geregistreerd die hebben geparticipeerd in het mogelijk maken van deze website.
Er staan nu tien applicaties online die gebruik maken van de datafeeds. Dit is het begin. Iedereen die wil, kan een applicatie maken en de beste worden toegevoegd. Maar ook als je niet kunt programmeren, kun je je ideeën achterlaten en wellicht worden ze opgepakt en gerealiseerd.

Een aardig voorbeeld en een mix van Web 2.0 en het semantisch web is de website FillThatHole, een website die locatiedata gebruikt van het Office for National Statistics en mensen de mogelijkheid geeft om potholes – gaten en kuilen in de weg – en ander wegongemak te rapporteren.

Tags ,

Samenwerking Google en UNESCO maakt werelderfgoedlijst virtueel toegankelijk

14-01-2010 | Janneke Grooten

UNESCO en Google zijn een samenwerking aangegaan om de plekken die op de Werelderfgoedlijst staan virtueel toegankelijk te maken.

Op het moment zijn 19 van de 890 plekken toegankelijk via Google Street View. De overige 871 plekken worden in de komende periode nog via Google Earth en Google Maps toegankelijk gemaakt.

Bekijk een filmpje over dit project, inclusief beelden van de Kinderdijk, één van de Nederlandse bijdragen aan de Werelderfgoedlijst:

YouTube Preview Image

Tags ,

Grote ambities KB (zonder Google?)

12-01-2010 | Robert Gillesse

Uw verslaggever schrijft een paar dagen terug nog over het Franse megamassadigitaliseringsplan of hij wordt meedogenloos door de Hollandse werkelijkheid ingehaald. De KB heeft namelijk in haar beleidsplan 2010-2013 bekendgemaakt al haar boeken en tijdschriften vanaf 1470 te digitaliseren. Citaat: “Wij digitaliseren alle Nederlandse boeken, kranten en tijdschriften vanaf 1470.” En: “in 2013 is 10% van alle Nederlandse boeken, kranten en tijdschriften gedigitaliseerd (60 miljoen pagina’s door de KB, 13 miljoen pagina’s door derden).”

De laatste zinsnede – “13 miljoen pagina’s door derden” – is natuurlijk erg interessant. Van wie zijn al deze pagina’s en worden die dan op één platform (portal?) ontsloten? Ja, als ik het goed begrijp. De ambitie in het KB beleidsplan om te komen tot een nationale informatie-infrastructuur waarin “iedereen integraal [kan] zoeken in het gehele papieren en digitale bezit van de Nederlandse wetenschappelijke en openbare bibliotheken” is misschien wel minstens zo opvallend als het massadigitaliseringsplan. In 2013 zou een gebruiker alle digitale content in de Digitale Bibliotheek Nederland moeten kunnen doorzoeken en – al dan niet tegen betaling – kunnen raadplegen. Daarbij wordt er ook buiten de bibliotheeksector gekeken aangezien er gesprekken gaande zijn met het Nederlands Instituut voor Beeld en Geluid en het Rijksmuseum. Kortom, veelbelovende en schitterende vergezichten!

De grote niet-genoemde in het beleidsplan is Google (nu vooruit: één keer). Kan de KB dit megaproject helemaal af met “wat” extra geld van de overheid? In mijn eerdere blog over de Franse digitaliseringsplannen citeerde ik reeds de vijf, zeer lezenswaardige, aanbevelingen van Nick Poole (Collections Trust). Nummer 2 van zijn aanbevelingen: “Work with media providers (including, yes, Google) with existing market share”. Ook hier is het erg interessant om te zien welke kant het de komende jaren op zal gaan: gaat de KB de “Franse weg” bewandelen en Google “negeren” of zal er uiteindelijk toch met de Grote Informatie Gigant worden samengewerkt?

Lees vooral het hele beleidsplan voor verdere andere spannende plannen en prachtige vooruitzichten: nationale bibliotheekpas, verregaande e-depot plannen, digitaliseren-on-demand, auteursrechten, wat-al-niet. Ter afsluiting verwijs ik u graag naar een IP interview met KB-directeur Bas Savanije over de achtergronden van het plan.

Tags ,

Tabletten versus e-lezers?

11-01-2010 | Robert Gillesse

Apple dreigt er al mee en nu heeft HP ze de loef afgestoken: de introductie van een “tablet”. Dat wil zeggen een handzaam apparaatje dat behalve als elektriek leesboekje ook kan dienen als filmvertoner en internetbrowser. Want dat is natuurlijk wel het zwakke punt van de huidige e-readers: het is een relatief duur single-purpose (alleen lezen) apparaat. Vraag is natuurlijk wel of een tablet net zo prettig zal lezen als een e-reader.

Blogger Uitgever 2.0 (sterk aanbevolen wanneer u geïnteresseerd bent in e-lezen) noemt reeds een tablet – de Adam van Notion Ink – die kan wisselen tussen kleurenweergave met achtergrondlicht en grijswaardenweergave die gebruik maakt van omgevingslicht en daarmee de ogen minder vermoeid.

Kortom, waar zitten we over 5 jaar mee in de trein, met één handig betaalbaar multimedia apparaatje (film, lezen, muziek, internet, wat al niet), of nog steeds met drie, vier verschillende kostbare gadgets?

Tags

Numerisation massive

07-01-2010 | Robert Gillesse

In Le Monde is het recordbedrag genoemd van het Franse, door Sarkozy aangekondigde, digitaliseringsplan dat Google’s opmars moet stuiten: 750 miljoen euro. Het gaat daarbij niet alleen om digitalisering van boeken, maar ook om de numérisation van audio-visuele en museum objecten. Een aantal grote instituten zijn uitgenodigd deel te nemen: Bibliothèque nationale de France (BNF) voor de boeken, het Centre national du cinéma et de l’image animée (CNC) voor films, het Institut national de l’audiovisuel (INA) voor de de radio en televisie en tenslotte een aantal grote musea (onder andere het Louvre, Orsay en Centre Pompidou).

De aankondiging, in augustus 2009, van de BNF dat het met de reguliere overheidsbudgetten nooit zou lukken de boekencollecties compleet te digitaliseren en daarom ging onderhandelen met Google, lijkt haar vruchten te hebben afgeworpen. Sarkozy heeft, volgens Le Monde, de BNF verboden nog verder te onderhandelen met Google. De BNF hoopt 140 millioen uit het totale fonds los te peuteren.

Opvallend is verder in dit artikel is dat Nederland wordt genoemd (“les Pays-Bas de 90 millions juste pour l’audiovisuel”, of wel Beelden voor de Toekomst, dat in werkelijkheid 154 miljoen heeft ontvangen) en dat Bruno Racine, directeur van de BNF, verwacht dat door dit megaproject de kloof in Europeana tussen Franse digitale bronnen en de rest van het benedenmaats presterende Europese erfgoedveld enkel groter zal worden (nu al zou 50% van alle boeken in Europeana uit Gallica komen, de digitale boekenverzameling van de BNF).

Tenslotte een hartverwarmend pleidooi van Nick Poole, werkzaam bij het Britse Collections Trust, om dit enorme bedrag wijs te besteden. Zijn vijf aanbevelingen (“pleas-from-the-heart”) wil ik u niet onthouden:

  1. Don’t pay for content without paying for the infrastructure to make use of and preserve it
  2. Work with media providers (including, yes, Google) with existing market share
  3. Allow people to use public funds to pay for rights clearance and licenses
  4. Require people to clear content for maximal use including aggregation and open sharing/use
  5. Let people spend the money to care for their Digital collections the way they do their physical ones

Tags , ,

Usability is als koken

22-12-2009 | Jeroen van der Vliet

Mooie analogie van usability goeroe Jakob Nielsen:

Usability is like cooking: everybody needs the results, anybody can do it reasonably well with a bit of training, and yet it takes a master to produce a gourmet outcome.

Wie dus nog om een kerstkadootje verlegen zit, koop eens een usability kookboek!

Tags

Het wiel van DRM opnieuw uitgevonden?

22-12-2009 | Jeroen van der Vliet

Met DRM of Digital Rights Management ging de muziekindustrie de strijd aan tegen het illegaal muziek downloaden en delen. Zonder succes. Naar het er naar uitziet lijkt nu de uitgeverswereld DRM te gaan omarmen om het illegaal verspreiden van e-books in te dammen. Volgens Bright kunnen de uitgevers beter leren van de ervaringen van de muziekindustrie in plaats van het wiel nodeloos opnieuw uitvinden ten koste van de e-bookgebruiker.

Tags ,

Video compressie

22-12-2009 | Jeroen van der Vliet

Op eens lijkt web video overal om ons heen, maar wie ooit zelf “iets op film heeft vastgelegd” weet hoe groot digitale videobestanden kunnen zijn. Hoe kan dat toch over het web worden verspreid? Dankzij compressie. Ars Technica zet de meest gebruikt video compressie-formaten overzichtelijk op een rij.

Tags

Het e-archief: noodzaak tot samenwerken of samenvoegen?

22-12-2009 | Robert Gillesse

Op 15 december jongsleden was ondergetekende te gast op het Noord-Hollands archief te Haarlem om de studiedag ‘Verbeter samen de (digitale) dienstverlening’ (georganiseerd door de archievenbranchevereniging BRAIN) bij te wonen. Van al het lovenswaardige en belangwekkende dat op die dag voorbij kwam (zie uitgebreid verslag), wil ik op deze plaats slechts één opvallende observatie optekenen.

In de context van een werkgroepsessie over kennis van ICT in het archievenveld deed Daan Hertogs, directeur van het Stadsarchief Breda namelijk een opvallende uitspraak. De werkgroepsessie had als specifiek onderwerp de in 2009 door Research voor Beleid (in opdracht van Erfgoed Nederland) uitgevoerde Kwalitatieve Monitor ICT-deskundigheid. In de monitor zijn onder andere de behoeften op ICT gebied van archieven geïnventariseerd. Een belangrijke wens van de archieven bestaat er uit dat ICT kennis beter toegankelijk is en dat er vraagbaak bestaat waar men terecht kan met vragen op dit gebied. Natuurlijk wees ik er als bevlogen DEN medewerker op dat de DEN website (ICT-register, DE BASIS en de themadossiers) in ieder geval deels aan deze wens tegemoet kan komen.

De heer Hertogs gaf echter aan dat het probleem veel verder strekt dan gebrekkig kennismanagement. De overgang van een papieren naar een digitaal (e-)archief is dermate groot dat de kleinere archieven, hoeveel stukken er ook worden gelezen en hoeveel kennis er ook wordt bijgespijkerd en eventueel ingehuurd, het niet zullen gaan bolwerken. Zijn voorspelling was dat er van de 150 archiefinstellingen nu, er in 10 jaar nog slechts 30 zullen overblijven.

Waar bestaan die uitdagingen van een e-archief nu eigenlijk uit? Een poging tot inventarisatie:

  • Het meedenken over, en faciliteren van de archivering van de e-overheid;
  • In samenhang daarmee, de inrichting van een e-depot die naadloos aansluit bij de informatiestromen van de e-overheid én die van het archief zelf;
  • De digitalisering en duurzame digitale ontsluiting van (een selectie van) de eigen collecties;
  • Het inrichten van toegankelijke, attractieve en interactieve webdiensten voor verschillende doelgroepen die, zo nodig, op hoger aggregatieniveau ook toegankelijk zijn;
  • Het ontwikkelen van beleid op alle bovenstaande gebieden.

De mogelijkheid dat dit alles in kleinere archieven kan worden uitgevoerd lijkt niet erg waarschijnlijk. De vraag die daar op volgt: moeten er dus alleen grote archiefeenheden overblijven of zijn er andere oplossingen denkbaar? Een aantal mogelijke scenario’s:

  • Het (deels) onderbrengen van het e-archief op een hoger (regionaal, provinciaal of anderszins) niveau waarbij het fysieke archief nog slechts fungeert als een “front office”
  • Het onderbrengen van het e-archief bij de e-overheid (lees gemeente, provincie, anderszins) waarbij het archief alleen nog een archiefinspectie rol vervult
  • Het onderbrengen van het e-archief bij de e-overheid (lees gemeente, provincie, anderszins) waarbij de desbetreffende overheid zelf de archiefinspectie inhuurt

Bij deze scenario’s dringt zich eigenlijk nog een veel wezenlijker vraag op. Is er in het zicht van digitale informatievoorziening van de overheid nog wel een separate organisatie als een archief nodig? Wanneer overheden zelf kunnen voldoen aan hun archiefverplichting en daar op worden gecontroleerd door onafhankelijke inspecteurs (in dienst stad, provincie, rijk?) wat is dan nog de rol van het archief? Het beheren en ontsluiten van de eigen papieren en eventueel gedigitaliseerde historische collecties (op zich natuurlijk een heel waardevolle taak)? Is het idee van de fysieke overdracht van het statische en/of semi-statisch archief naar het archief nog wel het model van de toekomst? Zal het archiveren van de toekomst niet simpelweg een extra taak zijn van de ICT-afdeling?

Dit laatste is, voor archieven, misschien een al te somber scenario. Rens Frommé, de organisator van de BRAIN studiedag, schetste op het slot van de dag een gloedvol beeld van een intensief samenwerkend archiefveld waarin de (kleinere) archiefinstellingen wel degelijk een rol van betekenis zouden kunnen blijven spelen. Hoe het ook zij, in ieder geval duidelijk is, dat de rol van archieven in de toekomst een andere zal zijn en dat die rol zal moeten worden bevochten.

Tags ,