DBC logo
Mere om metadata
**********************
Hvad er
metadata?

Metadata er egentlig ikke noget nyt. Inden for edb er det et velkendt begreb, og i relation til det bibliografiske område kender vi det også, selvom det normalt kaldes noget andet.
Metadata er data om data. Det betyder, at noget så velkendt som en ganske almindelig katalogisering faktisk er metadata.
Når termen i dag optræder i bibliografisk sammenhæng, refereres der som oftest til data, der bruges til at identificere, beskrive og lokalisere netbårne dokumenter - også kaldet internetressourcer eller -kilder.

Hvorfor bruge
metadata?

I dag foregår søgning på Internettet typisk som fritekst søgning. Det vil sige, at søgeordene kan optræde hvorsomhelst i teksten.

Søger man på "H. C. Andersen", får man som resultat både dokumenter af H. C. Andersen og om H. C. Andersen; på alle sprog, og alle typer dokumenter - lige fra faglige afhandlinger til hobbysider og varekataloger. Og søger man på "brede" udtryk, får man nemt titusinde resultater. Og godbidderne ligger måske som resultat nummer 517...

Løsningen på problemet er at begynde at bruge de metoder, bibliotekerne har udviklet gennem hundrede år til at genfinde information i store mængder data (læs: bøger).

Det vil være en uoverkommelig opgave at katalogisere hele Internettet, men det vil være overkommeligt for forfatteren af det enkelte dokument, at tilføje oplysninger (metadata) om forfatter, emneord m.m. i forfatterens eget dokument.
...samt tilmelde dokumentet til en database, der kan udnytte informationer til at lave nogle mere nøjagtige søgninger.

HTML og
metadata

HTML (version 3.2) understøtter i sin formatspecifikation metadata i via <META> elementet. Det har følgende format: <META HTTP-EQUIV=header_field NAME="navn" CONTENT="værdien af NAME / HTTP-EQUIV feltet">

HTTP-EQUIV feltet er ikke interessant i denne sammenhæng (det er det man bruger til f.eks. automatisk viderestilling). NAME feltet, derimod, kan bruges til definere en type metadata, og CONTENT definerer værdien af feltet. For eksempel:
<META NAME="keywords" CONTENT="metadata, Dublin Core, Indoreg Projekt">

Værdien af <META> elementet bliver ikke vist brugeren, men kan læses af søgeværktøjer på nettet. Alta Vista, for eksempel, indexerer "description" og "keywords" metadata i sin søgemaskine.
Desværre er der ingen standarder for, hvordan metadata skal udformes; men Dublin Core er et af de bedste bud på hvordan det skal gøres.

Hvad er
Dublin Core?

Helt centralt i overvejelserne om et format, der er specielt egnet til håndtering af netbårne dokumenter, står The Dublin Core Metadata Element Set. Beskrivelse af indholdet i Dublin Cores enkelte elementer kan se i Dublin Core Metadata Element Set: Reference Description (sidst ændret: 15. Januar, 1997)

Der er på internationalt plan flere projekter i gang, der beskæftiger sig med implementering af The Dublin Core Element Set. Fra dansk side er et af de mest interessante vel nok Det nordiske Metadataprojekt.

**********************

Jørgen Nielsen (jgn@dbc.dk)  & Susanne Thorborg (st@dbc.dk)  21/7 1997