Miljoenen voor digitaliseren oude kranten?
Planet:
(...) In totaal zijn vijf projecten voorgedragen voor een subsidie van in totaal 100 miljoen euro. Het krantenproject is ingediend door de Koninklijke Bibliotheek en beoogt de historische collectie van Nederlandse kranten die zijn verschenen tussen 1618 en 1995 te digitaliseren. (...)
Waar ken ik dat project ook al weer van?
(...) Astrid Verheusen (Koninklijke Bibliotheek) ging in op digitale duurzaamheid en dan met name de kosten voor de opslag en transformatie van de steeds grotere hoeveelheid digitale bestanden. Ik ben even kwijt wat die kosten nu per giga- of terrabyte zouden zijn over 5 jaar maar ik weet wel dat ik me daarover verbaasde. Waarom? Omdat Google en andere services om dit moment al gratis mailboxen van 1Gb beschikbaar stellen aan gebruikers. Kosten voor dataopslag nemen af en zijn volgens mij geen issue meer in de toekomst. Met de toenemende snelheid van internet is ook de opvraagsnelheid van digitale bestanden (via Google of andere services) geen probleem meer. (...)
Het is werkelijk ongelofelijk dat dit soort bedragen op deze manier wordt verkwanseld omdat men domweg niet op de hoogte is van de ontwikkelingen in de markt. Of zie ik het nu helemaal verkeerd?
Gepost in:
12 Reacties
johan kosters
Door deze uitsnede uit het nieuwsvericht te nemen zet je mensen misschien op verkeerde been. Krantenkopperij. De gaat om de totale subsidie, je meldt nergens hoeveel de aangevraagde subsidie is voor het project van KB. Waar in overigens wel benieuwd naar ben. Zo bijzonder is het project nu ook weer niet en lijkt me dat de Oce, Xerox, Canon best sponser willen zijn. Tenslotte heeft Oce het grootste digitale krantenprint netwerk ter wereld....
geplaatst op 08-12-2005 om 07:17 uur
Marco Derksen, Upstream
De titel is 'miljoenen voor digitaliseren oude kranten' en er zijn vijf projecten voorgedragen voor een subsidie van in totaal 100 miljoen euro. Ik kom dan al snel aan een gemiddelde subsidie van 20 miljoen euro per project.
geplaatst op 08-12-2005 om 08:22 uur
Onno
Leuk project toch? Uniek plan om eeuwen vol nieuws te digitaliseren, lijkt me een goede investering, mits het ook online beschibaar wordt gemaakt.
geplaatst op 08-12-2005 om 11:03 uur
Marco Derksen, Upstream
Iniatief is inderdaad prima! Vraag is alleen, is daar een subsidie voor nodig van miljoenen euro's? En als dat zo is, dan hoop ik inderdaad dat het ook publiekelijk beschikbaar wordt gesteld. Vraag is dan alleen, wat vinden de uitgevers van dagbladen hiervan?
geplaatst op 08-12-2005 om 11:09 uur
Marc van der Chijs
Een subsidie lijkt me erg overdreven, dit kan toch best via de vrije markt gedaan worden lijkt me. Digitaliseren kan in lage lonen landen gebeuren of wellicht zelfs deels geautomatiseerd worden, dus kost weinig. Daarna of voor een lage fee de informatie ter beschikking stellen (abonnement of bedrag per pagina), of het deels of geheel met advertenties aanbieden. Google is al bezig met het digitaliseren van hele bibliotheken en doet dat ook zonder subsidie. Zoals Marco al aangeeft, de overheid is weer eens totaal niet op de hoogte van wat er in de markt gebeurt.
geplaatst op 08-12-2005 om 11:50 uur
Anders Floor, Connexxion
Ik heb in 1998 gewerkt voor een bedrijf dat archiefmateriaal op microfilm zet en daarbij onder andere materiaal van de KB verwerkt. Ik heb niet de indruk dat de kosten van opslagmedia nou zo'n grote rol spelen. Het geld zal eerder zitten in het daadwerkelijk scannen (en dat gebeurt nauwgezet en met een zeer grondige kwaliteitscontrole), in data-processing (beelden omgezet naar tekst, geïndexeerd etc) en een ontwikkeling van een systeem om de gegevens te ontsluiten.
Het lijkt me niet raadzaam om oude, fragiele kranten naar een tropisch klimaat te verschepen, en automatisering bij het scannen/filmen van archiefmateriaal is in Nederland al op grote schaal doorgevoerd. Wel zal het scannen voor een deel mensenwerk blijven, ook weer gezien het fragiele materiaal.
Marc, een business model is zinloos. Alleen wat verdwaalde onderzoekers en historici hebben interesse in oude kranten. Een advertentiemodel zal nauwelijks iets opleveren en een betaalmodel is een sigaar uit eigen doos, omdat de meeste geïnteresseerden waarschijnlijk in dienst zullen zijn van de overheid (universiteiten). Zie ook een artikel van Netkwesties: Telegraaf als enige met hele archief online:
geplaatst op 08-12-2005 om 14:45 uur
Karel Kolb
In 2002 liet de Groene Amsterdammer het bedrijf ZyLAB haar archief (1877 tot 1940) digitaliseren en online zetten. Kosten 45.000 euro. VSB Fonds en Prins Bernhard Cultuurfonds betaalden mee. Een interessant interview waarin zowel de Groene als ZyLAB aan het woord komen vind je hier (PDF). Auteur is Janin Wensink, scherp interviewer, en sinds 3 jaar mijn lieve vrouw. :-)
geplaatst op 08-12-2005 om 15:47 uur
Anders Floor, Connexxion
Interessant. Hierbj moet opgemerkt moet worden dat de KB bij haar huidige historische krantenarchief ook al gebruik van de technologie van ZyLAB (zie colofon). Wat betreft de kosten zal het daar dus niet aan liggen lijkt me.
geplaatst op 08-12-2005 om 16:31 uur
Roy
"Misschien als we ons ooit vervelen," zegt Jelle Buizer
hehehe, als de kranten nog even zo eigenwijs op de oude voet doorgaan is de kans vrij groot dat ze zich in 2007-2008 vervelen :)
geplaatst op 08-12-2005 om 16:44 uur
Anders Floor, Connexxion
Ook zijn er verschillende kwaliteitsniveaus mogelijk. Neem de demo die ZyLAB online heeft staan, en bekijk bijvoorbeeld dit document (gewoon doorklikken bij "registreren"). Een document met haarscherpe letters, geen bijzondere lettertypes of wat dan ook. Maar bekijk dan hoe het wordt geïnterpreteerd: er staat een gigantische berg OCR-fouten in. Zo'n niveau is wellicht aanvaardbaar voor een budget-project van de Groene Amsterdammer, maar de KB stelt wellicht andere eisen.
Ik weet zelf hoe ik in een team zat waarbij we de ingescande tekst pagina na pagina moesten aflopen. Het OCR-programma gaf aan over welke karakters het twijfels had (veel voorkomende vergissingen zijn bijvoorbeeld: een c verwisseld met een e, het cijfer 1 in plaats van de letter l en vice versa, 9 vs g, 8 vs B, superscript 1 vs een apostrophe etc) en die moesten handmatig worden verbeterd. Wil je een goed doorzoekbaar archief hebben, dan kan dat noodzakelijk zijn. Bij veel van dat soort interpretaties komt bovendien talenkennis bij kijken, dus uitbesteden aan lage lonenlanden waar ze geen Nederlands spreken is bij dat kwaliteitsniveau geen optie.
Als dat inderdaad het geval is bij de KB kun je je afvragen of zo'n kwaliteitsniveau een must is. Aangezien het gaat om nationaal erfgoed zou ik persoonlijk zeggen van wel. Je hebt weinig aan een archief als de helft van de tekst - oude letters zijn nog een stuk lastiger te interpreteren dan het voorbeeld met strakke letters zoals hierboven genoemd - foutief geïndexeerd is.
geplaatst op 08-12-2005 om 16:50 uur
Karel Kolb
Wat dat betreft ben ik benieuwd naar de kwaliteit die Google Print straks gaat bieden. Kan me zo voorstellen dat die Amerikaanse universiteiten ook tjokvol ouwe meuk staan.
Volgens mij stijgen de kosten van digitalisering exponentieel als er meer zoekmogelijkheden door opdrachtgever geëist worden. Anders volstaat een simpel plaatje van elke pagina. Een PDF mét zoekfunctie is al weer iets geavanceerder, dus duurder. Zelf heb ik jarenlang de vacatures van diverse Wolters Kluwer titels via OCR zitten scannen, corrigeren en vervolgens online geplaatst. Goh, wat een leuke tijd was dat, die opstartfase van het zelfstandig ondernemerschap.
geplaatst op 08-12-2005 om 17:00 uur
Marco Derksen, Upstream
Nederlands Dagblad:
(...) De Koninklijke Bibliotheek in Den Haag krijgt 12,5 miljoen euro overheidssubsidie. Daarmee worden alle landelijke kranten die verschenen zijn tussen 1618 en 1995 via een website toegankelijk gemaakt. (...)
Karel, wellicht een leuke klus voor jou? ;-)
geplaatst op 03-08-2006 om 09:21 uur
Plaats een reactie