PDF en XML:
twee standaarden
Digitalisering van elk denkbaar origineel
Restauratie-Atelier
Helmond B.V.
tTAF
www.stafpeople.nl
PICTURA IMAGINIS
toekomst bij overheid en non-profit
I 25
voor restauratie en conservering van
papier, leer en perkament
boeken in leer en perkament
charters en zegels
prenten en tekeningen
kaarten en affiches
massaconservering
vrijblijvende offertes
vacuüm-vriesdrogen
ondersteuning bij calamiteiten
24 uur bereikbaar bij brand- en waterschade
06-575.896.31
Panovenweq 40. 5708 HR HELMOND (NL)
Tel: 0492 - 55.39.90 Fax: 0492 - 55.24.42
digitaal procédé
database als vervanging van de ladenkast
P£,©p(J=
E-mail: info@restauratie-atelierhelmond.nl
Internet: www.restauratie-atelierhelmond.nl
giasdia Doek prent aquarel foto
affiche schilderij gravure prent
handschriften postzegel 'Jaggjte®*-
verzameling glasne^^"9*5^
boek aquarel jtÉÊÊ
munt productfe^'
postzegel yr Ml
glasdia bc
&Slvo\\f&
de hoefsmid 13 - 1851 PZ Heiloo - tel: 072 53 20 444 - fax: 072 53 20 400 - e-mail: info@pictura-imaginis.com
DIGITALISERING VAN BEELDARCHIEVEN BV
Het zoeken, tevoorschijn halen en bekijken van beelden of
teksten in archieven is vaak een tijdrovende operatie.
We willen snel en doeltreffend over de gevraagde informatie
beschikken en dan ook nog het liefst vanaf de plek waar het ons
het beste uitkomt. Wij van Pictura Imaginis hebben een digitaal
procédé ontwikkeld waardoor dat mogelijk wordt.
Een modern geconserveerd archief is een kostbaar bezit.
Niet alleen voor diegenen die er dagelijkse verantwoordelijk
heid voor dragen. Veel verschillende doelgroepen moeten er
óók hun voordeel mee kunnen doen. De door Pictura Imaginis
vervaardigde database van ieder gedigitaliseerd archief ver
hoogt de toegankelijkheid voor alle gebruikers enorm.
Zoeken is eenvoudiger, gaat veel sneller en het oproepen van
gevonden informatie is opeens een peulenschil.
Digitale beelden ziet u 4x groter in topkwaliteit op uw scherm
dan het origineel.
advisering, implementatie en trajectbegeleiding
publicatieprojecten (internet, drukwerk)
database toepassingen
Staf People is een flexibele organisatie van kritische specialisten ep bet gebied van
detachering, werving en selectie, interim-management intercollegiale doorlening.
Staf People doet zaken met overheid en non-profitorganisaties in heel Nederland op
het gebied van P&O. Communicatie en Documentaire Informatievoorziening.
Staf People vindt voor jou de juiste baan. Het gaat ons daarbij niet alleen om wat je
kunt, maar ook om watje wilt. Staf People houdt rekening met persoonlijke wensen
op het gebied van werkomgeving, reistijd, opleidings- en groeimogelijkheden. De
juiste persoon op de juiste plaats, daar gaat het ons om. Neem contact op met één
van de adviseurs, dan weet je wat Staf People voor jou kan betekenen.
STAF PEOPLE BV is een onderdeel van Sargas BV
personeelszaken@stafpeople.nl
Staf People Zaandam
Tel: 075 750 1910
Staf People Assen
Tel: 0592 318 999
Door Rienk Jonker*
Het Portable Document Format (PDF) en de
extensible Markup Language (XML) zijn stan
daarden die genoemd worden in de Regeling
geordende en toegankelijke staat archiefbe
scheiden. Reden genoeg om kort op beide in te
gaan en overeenkomsten en verschillen uit te
leggen.
Concepten als structuur, inhoud en
presentatie spelen bij beide standaarden een
belangrijke rol. Het begrip structuur is te
vertalen naar het ons bekende archivistische
begrip redactionele vorm, de manier waarop
de formele kenmerken van een document
zijn gerangschikt. De inhoud hoeft geen uit
leg. De presentatie is te vertalen naar het
archivistische begrip uiterlijke vorm, de ver
schijningsvorm van een archiefstuk. Het
begrip bestandsformaat slaat op de manier
waarop gegevens zijn opgeslagen op een
gegevensdrager. Dit slaat bijvoorbeeld ook
op de gebruikte tekenset. De meeste be
standsformaten zijn conform een bepaalde
standaard. Soms de facto door het vele
gebruik, soms omdat instituten als de
International Organization for Standar
dization (ISO) erachter staan.
PDF is een bestandsformaat, waarvan de
rechten liggen bij de firma ADOBE.
Kenmerk van dit formaat is dat structuur,
inhoud en presentatie van een document
onlosmakelijk als een geheel met elkaar zijn
verbonden. Als middel voor publicatie en
uitwisseling is PDF zeer geschikt. Het grote
voordeel is dat het bestandsformaat wijd
verbreid is. Een van de nadelen is dat het
geen open standaard
is. De gebruikers zijn
voor de ontwikkeling
van PDF afhankelijk
van de eigenaar. Voor
het maken van PDF-
bestanden zijn com
merciële producten
nodig. In de wereld
van de 'open source
software' zijn wel
zogenaamde pro
gramma's beschikbaar
waarmee documenten vanuit elk willekeurig
formaat op relatief eenvoudige wijze zijn 'af
te drukken' naar PDF. Voor het reproduceren
is de gratis 'reader' Acrobat Reader, ook een
product van ADOBE, beschikbaar. Hoewel
documenten door het gebruik van PDF
gefixeerd lijken, zijn ze toch relatief eenvou-
Structuur
Een PDF-bestand
dig te muteren.
Beveiliging is een
zwak punt.
XML is geen be
standsformaat maar
een open standaard, vastgesteld door het W3
consortium. XML bestaat uit een aantal
talen waarmee documenten kunnen wor
den beschreven en waarmee ze kunnen wor
den gepresenteerd. XML wordt gebruikt
voor gestandaardiseerde gegevensuitwisse
ling en conversies en is ook zeer geschikt
voor duurzame bewaring.
Een XML-document bestaat grofweg uit drie
bestanden, te weten:
- een XML-schema (voorheen een Docu
ment Type Definition; DTD),
- het eigenlijke document met de inhoud
en
- een XSL-document.
In XML-schema wordt de structuur van het
document vastgelegd. Hierin krijgen de ver
schillende elementen een betekenisvolle
naam in de vorm van tags. Het schema
bevat de afspraken over de elementen die in
een bepaald document thuishoren.
Afspraken kunnen gaan over de naamge
ving, het al dan niet verplicht stellen van
een element, het aangeven of bepaalde ele
menten meer dan een keer in een document
kunnen voorkomen enzovoorts. In een
schema kan ook aangegeven worden of een
element extra kenmerken krijgt die bijvoor
beeld te gebruiken zijn bij zoekacties. Een
organisatie kan XML-schema's heel goed
gebruiken voor het vastleggen van de vorm
vereisten voor bijvoorbeeld besluiten, brie
ven en vergunningen. Binnen ons eigen
vakgebied is de Encoded Archival
Description (EAD) een voorbeeld van een
DTD voor toegangen op archieven.
De inhoud van het document komt in een
bestand waarbij de tags, de structuurelemen
ten uit het XML-schema, de inhoudsele
menten omsluiten.
Voor de presentatie, de verschijningsvorm,
is XSL (Extensible Stylesheet Language)
beschikbaar. Deze taal bevat de instructies
voor de opmaak. De opmaakinstructies
betreffen zaken als lettertype, lettergewicht,
kleur en plaatsing van de elementen. Dit is
een techniek die ook bij HTLM-pagina's
wordt toegepast. Met XSL kan de inhoud
uitgevoerd worden naar het beeldscherm en
naar bestanden in formaten als PDF, HTML
DTD of Schema Stylesheet
Zorgt voor presentatie
Beschrijft
Meerdere
Inhoud
documenten
<d 1
op grond
van een DTD
.d
of Schema
zijn mogelijk
Formaat ISO/IEC 10646
Een XML-document
en SGML. Uitvoer
naar databases of
rechtstreeks afdruk
ken op papier beho
ren ook tot de moge
lijkheden. Een XSL-
document is zeer geschikt om er de huisstijl
van een organisatie in op te nemen.
Het bestandsformaat van alle soorten XML-
bestanden is de aan Unicode gelijkwaardige
ISO/IEC 10646-standaard. Deze standaard is
een tekenset die niet afhankelijk is van één
of meer software leveranciers. Omdat het
bestandsformaat behoorlijk stabiel is, zijn
garanties voor duurzaamheid aanwezig.
Verder is het aardige van XML dat veel
instelbaar is, mits het maar voldoet aan de
algemene XML-syntax. Dit kan ook direct
een behoorlijk nadeel zijn. Om XML doel
treffend en doelmatig te kunnen gebruiken,
kan voor toepassing het beste een soort tra
ject van systeemontwikkeling doorlopen
worden, waarbij onderdelen als voorberei
ding, analyse voor mogelijk gebruik, imple
mentatie en onderhoud goed geregeld moe
ten zijn. Bij voorkeur moet de dagelijkse
gebruiker niet merken dat XML wordt toege
past. De gebruiker moet bij wijze van spre
ken nog steeds met de hem vertrouwde
tekstverwerker zijn documenten kunnen
(op)maken. Opslag en/of eventueel (latere)
migratie kan op de achtergrond worden uit
gevoerd.
Het gebrek aan ingebouwde beveiliging is een
ander nadeel, maar dat viel ook op bij PDF.
De integriteit en de authenticiteit van een
document zullen bij beide standaarden gere
geld moeten worden via een stelsel van auto
risaties, controles en eventueel encryptie.
Rienk Jonker is werkzaam bij de Groninger Archieven.
Op het internet
PDF
http://www.adobe.com
Een voorbeeld van een 'open source' pro
gramma voor het maken van
PDF-bestanden is Ghostscript
http://www.cs.wisc.edu/~ghost
XML
http://www.WT.org/xml
Een aardige Nederlandstalige uitleg over
XML door Bert Bos:
'XML in ïo punten eigenlijk...)'
http://www.WT.org/XML/i9Qq/XML-in-io-
points
Encoded Archival Description (EAD)
http://www.loc.gov/ead/
oktober 2002 archievenblad I