PDF en XML: twee standaarden Digitalisering van elk denkbaar origineel Restauratie-Atelier Helmond B.V. tTAF www.stafpeople.nl PICTURA IMAGINIS toekomst bij overheid en non-profit I 25 voor restauratie en conservering van papier, leer en perkament boeken in leer en perkament charters en zegels prenten en tekeningen kaarten en affiches massaconservering vrijblijvende offertes vacuüm-vriesdrogen ondersteuning bij calamiteiten 24 uur bereikbaar bij brand- en waterschade 06-575.896.31 Panovenweq 40. 5708 HR HELMOND (NL) Tel: 0492 - 55.39.90 Fax: 0492 - 55.24.42 digitaal procédé database als vervanging van de ladenkast P£,©p(J= E-mail: info@restauratie-atelierhelmond.nl Internet: www.restauratie-atelierhelmond.nl giasdia Doek prent aquarel foto affiche schilderij gravure prent handschriften postzegel 'Jaggjte®*- verzameling glasne^^"9*5^ boek aquarel jtÉÊÊ munt productfe^' postzegel yr Ml glasdia bc &Slvo\\f& de hoefsmid 13 - 1851 PZ Heiloo - tel: 072 53 20 444 - fax: 072 53 20 400 - e-mail: info@pictura-imaginis.com DIGITALISERING VAN BEELDARCHIEVEN BV Het zoeken, tevoorschijn halen en bekijken van beelden of teksten in archieven is vaak een tijdrovende operatie. We willen snel en doeltreffend over de gevraagde informatie beschikken en dan ook nog het liefst vanaf de plek waar het ons het beste uitkomt. Wij van Pictura Imaginis hebben een digitaal procédé ontwikkeld waardoor dat mogelijk wordt. Een modern geconserveerd archief is een kostbaar bezit. Niet alleen voor diegenen die er dagelijkse verantwoordelijk heid voor dragen. Veel verschillende doelgroepen moeten er óók hun voordeel mee kunnen doen. De door Pictura Imaginis vervaardigde database van ieder gedigitaliseerd archief ver hoogt de toegankelijkheid voor alle gebruikers enorm. Zoeken is eenvoudiger, gaat veel sneller en het oproepen van gevonden informatie is opeens een peulenschil. Digitale beelden ziet u 4x groter in topkwaliteit op uw scherm dan het origineel. advisering, implementatie en trajectbegeleiding publicatieprojecten (internet, drukwerk) database toepassingen Staf People is een flexibele organisatie van kritische specialisten ep bet gebied van detachering, werving en selectie, interim-management intercollegiale doorlening. Staf People doet zaken met overheid en non-profitorganisaties in heel Nederland op het gebied van P&O. Communicatie en Documentaire Informatievoorziening. Staf People vindt voor jou de juiste baan. Het gaat ons daarbij niet alleen om wat je kunt, maar ook om watje wilt. Staf People houdt rekening met persoonlijke wensen op het gebied van werkomgeving, reistijd, opleidings- en groeimogelijkheden. De juiste persoon op de juiste plaats, daar gaat het ons om. Neem contact op met één van de adviseurs, dan weet je wat Staf People voor jou kan betekenen. STAF PEOPLE BV is een onderdeel van Sargas BV personeelszaken@stafpeople.nl Staf People Zaandam Tel: 075 750 1910 Staf People Assen Tel: 0592 318 999 Door Rienk Jonker* Het Portable Document Format (PDF) en de extensible Markup Language (XML) zijn stan daarden die genoemd worden in de Regeling geordende en toegankelijke staat archiefbe scheiden. Reden genoeg om kort op beide in te gaan en overeenkomsten en verschillen uit te leggen. Concepten als structuur, inhoud en presentatie spelen bij beide standaarden een belangrijke rol. Het begrip structuur is te vertalen naar het ons bekende archivistische begrip redactionele vorm, de manier waarop de formele kenmerken van een document zijn gerangschikt. De inhoud hoeft geen uit leg. De presentatie is te vertalen naar het archivistische begrip uiterlijke vorm, de ver schijningsvorm van een archiefstuk. Het begrip bestandsformaat slaat op de manier waarop gegevens zijn opgeslagen op een gegevensdrager. Dit slaat bijvoorbeeld ook op de gebruikte tekenset. De meeste be standsformaten zijn conform een bepaalde standaard. Soms de facto door het vele gebruik, soms omdat instituten als de International Organization for Standar dization (ISO) erachter staan. PDF is een bestandsformaat, waarvan de rechten liggen bij de firma ADOBE. Kenmerk van dit formaat is dat structuur, inhoud en presentatie van een document onlosmakelijk als een geheel met elkaar zijn verbonden. Als middel voor publicatie en uitwisseling is PDF zeer geschikt. Het grote voordeel is dat het bestandsformaat wijd verbreid is. Een van de nadelen is dat het geen open standaard is. De gebruikers zijn voor de ontwikkeling van PDF afhankelijk van de eigenaar. Voor het maken van PDF- bestanden zijn com merciële producten nodig. In de wereld van de 'open source software' zijn wel zogenaamde pro gramma's beschikbaar waarmee documenten vanuit elk willekeurig formaat op relatief eenvoudige wijze zijn 'af te drukken' naar PDF. Voor het reproduceren is de gratis 'reader' Acrobat Reader, ook een product van ADOBE, beschikbaar. Hoewel documenten door het gebruik van PDF gefixeerd lijken, zijn ze toch relatief eenvou- Structuur Een PDF-bestand dig te muteren. Beveiliging is een zwak punt. XML is geen be standsformaat maar een open standaard, vastgesteld door het W3 consortium. XML bestaat uit een aantal talen waarmee documenten kunnen wor den beschreven en waarmee ze kunnen wor den gepresenteerd. XML wordt gebruikt voor gestandaardiseerde gegevensuitwisse ling en conversies en is ook zeer geschikt voor duurzame bewaring. Een XML-document bestaat grofweg uit drie bestanden, te weten: - een XML-schema (voorheen een Docu ment Type Definition; DTD), - het eigenlijke document met de inhoud en - een XSL-document. In XML-schema wordt de structuur van het document vastgelegd. Hierin krijgen de ver schillende elementen een betekenisvolle naam in de vorm van tags. Het schema bevat de afspraken over de elementen die in een bepaald document thuishoren. Afspraken kunnen gaan over de naamge ving, het al dan niet verplicht stellen van een element, het aangeven of bepaalde ele menten meer dan een keer in een document kunnen voorkomen enzovoorts. In een schema kan ook aangegeven worden of een element extra kenmerken krijgt die bijvoor beeld te gebruiken zijn bij zoekacties. Een organisatie kan XML-schema's heel goed gebruiken voor het vastleggen van de vorm vereisten voor bijvoorbeeld besluiten, brie ven en vergunningen. Binnen ons eigen vakgebied is de Encoded Archival Description (EAD) een voorbeeld van een DTD voor toegangen op archieven. De inhoud van het document komt in een bestand waarbij de tags, de structuurelemen ten uit het XML-schema, de inhoudsele menten omsluiten. Voor de presentatie, de verschijningsvorm, is XSL (Extensible Stylesheet Language) beschikbaar. Deze taal bevat de instructies voor de opmaak. De opmaakinstructies betreffen zaken als lettertype, lettergewicht, kleur en plaatsing van de elementen. Dit is een techniek die ook bij HTLM-pagina's wordt toegepast. Met XSL kan de inhoud uitgevoerd worden naar het beeldscherm en naar bestanden in formaten als PDF, HTML DTD of Schema Stylesheet Zorgt voor presentatie Beschrijft Meerdere Inhoud documenten <d 1 op grond van een DTD .d of Schema zijn mogelijk Formaat ISO/IEC 10646 Een XML-document en SGML. Uitvoer naar databases of rechtstreeks afdruk ken op papier beho ren ook tot de moge lijkheden. Een XSL- document is zeer geschikt om er de huisstijl van een organisatie in op te nemen. Het bestandsformaat van alle soorten XML- bestanden is de aan Unicode gelijkwaardige ISO/IEC 10646-standaard. Deze standaard is een tekenset die niet afhankelijk is van één of meer software leveranciers. Omdat het bestandsformaat behoorlijk stabiel is, zijn garanties voor duurzaamheid aanwezig. Verder is het aardige van XML dat veel instelbaar is, mits het maar voldoet aan de algemene XML-syntax. Dit kan ook direct een behoorlijk nadeel zijn. Om XML doel treffend en doelmatig te kunnen gebruiken, kan voor toepassing het beste een soort tra ject van systeemontwikkeling doorlopen worden, waarbij onderdelen als voorberei ding, analyse voor mogelijk gebruik, imple mentatie en onderhoud goed geregeld moe ten zijn. Bij voorkeur moet de dagelijkse gebruiker niet merken dat XML wordt toege past. De gebruiker moet bij wijze van spre ken nog steeds met de hem vertrouwde tekstverwerker zijn documenten kunnen (op)maken. Opslag en/of eventueel (latere) migratie kan op de achtergrond worden uit gevoerd. Het gebrek aan ingebouwde beveiliging is een ander nadeel, maar dat viel ook op bij PDF. De integriteit en de authenticiteit van een document zullen bij beide standaarden gere geld moeten worden via een stelsel van auto risaties, controles en eventueel encryptie. Rienk Jonker is werkzaam bij de Groninger Archieven. Op het internet PDF http://www.adobe.com Een voorbeeld van een 'open source' pro gramma voor het maken van PDF-bestanden is Ghostscript http://www.cs.wisc.edu/~ghost XML http://www.WT.org/xml Een aardige Nederlandstalige uitleg over XML door Bert Bos: 'XML in ïo punten eigenlijk...)' http://www.WT.org/XML/i9Qq/XML-in-io- points Encoded Archival Description (EAD) http://www.loc.gov/ead/ oktober 2002 archievenblad I

Periodiekviewer Koninklijke Vereniging van Archivarissen

Archievenblad | 2002 | | pagina 12