Gemeenschappelijke Thesaurus Audiovisuele Archieven

Wat is de GTAA?
Het Nederlands Instituut voor Beeld en Geluid heeft samen met enkele andere Nederlandse organisaties die audiovisueel cultureel erfgoed beheren - waaronder het Filmmuseum, het huidige EYE - de Gemeenschappelijke Thesaurus voor Audiovisuele Archieven (GTAA) ontwikkeld. De GTAA wordt gebruikt voor het doeltreffend karakteriseren van de inhoud van audiovisueel materiaal uit het archief met labels afkomstig uit een gecontroleerde en gestructureerde lijst van termen, een thesaurus. De thesaurus wordt bij Beeld en Geluid voornamelijk ingezet in het handmatige beschrijvingsproces, maar ook meer en meer bij automatische annotatietechnieken. Met behulp van linked data principes kunnen daarnaast verbanden worden gelegd tussen de eigen collectie en andere databronnen. Telkens fungeert de GTAA hierbij als kapstok en verbindingsmiddel.

Wat is een thesaurus?
Een thesaurus is een gecontroleerde woordenschat met onderlinge semantische relaties en verwijzingen tussen de termen, waardoor het zoeken in de catalogus gerichter en eenvoudiger kan plaatsvinden. Deze relaties tussen de termen zijn hiërarchisch of associatief van aard. Ze geven antwoord op vragen als: welke termen worden gebruikt die ruimer of juist specifieker het gewenste onderwerp aanduiden; op welke termen kan ik zoeken die met het onderwerp te maken hebben? Daarnaast wordt met behulp van de thesaurus voorzien in het vraagstuk van synoniemen, quasi-synoniemen, spellingvarianten en homoniemen.

Wat voor soort thesaurus is de GTAA?
De GTAA is een ‘meer-assige’ thesaurus, de termen (concepten) zijn ingedeeld in meerdere categorieën of assen, ook wel concept schema's genoemd. De categorieën van termen die voor het toegankelijk maken van het materiaal gebruikt worden, zijn:

Onderwerpen, of wel begrippen (bijv. zwemmen, daklozen, binnenvaartschepen, audiovisuele archieven). Een variant op de as Onderwerpen is in gebruik voor het beschrijven van materiaal op het niveau van shots en geluiden, de as Onderwerpen beeld-geluid.


Onderwerpen beeld-geluid bevat naast de begrippen uit de as Onderwerpen toegevoegde concepten voor specifiek beeld (shots en stockshots) en geluid. Voorbeelden: dorpsbeelden, blaffen, begroetingen, gapen, enz.


Genres en programmasoorten: deze termen geven een typering of aanduiding van de productie als geheel, ze verwijzen naar de vorm, het genre of het type programma (bijvoorbeeld: korte film, lifestyleprogramma, hoorspel, politieserie).


Persoonsnamen, dit zijn eigennamen van personen die als inhoudelijk element in een productie, of als Spreker, Cast-lid of Uitvoerende kunnen voorkomen. Ook komen hier de namen in voor van programmamakers en medewerkers aan de totstandkoming van audiovisuele producties. (Dit was voorheen de afzonderlijke as Makers).


Namen, eigennamen van o.a. organisaties, muziekensembles, bevolkingsgroepen, oorlogen, verdragen, feest(dag)en, prijzen, producten, en titels van o.a. tijdschriften, boeken,                    films, radio- en televisieprogramma’s (bijvoorbeeld: KLM, Hindoestanen, Kerstmis, Golfoorlog, De aanslag).


Geografische namen, namen van steden, dorpen, provincies, snelwegen, landen, etc.

Classificatie, dit is een rubrieksindeling bij de schema's Onderwerpen en Onderwerpen beeld-geluid, die het systematisch zoeken op onderwerpen, ook van shots en quotes, mogelijk maakt.


Wie onderhoudt de GTAA?
Beeld en Geluid beheert de GTAA en is verantwoordelijkheid voor het regelmatig aanpassen van de thesaurus aan de actualiteit en het beschikbaar maken voor externe partijen. Voor meer informatie over (het gebruik van) de GTAA kunt u contact opnemen met de afdeling Metadatabeheer van het Nederlands Instituut voor Beeld en Geluid.
Contactpersoon: Alma Wolthuis (mailto: metadatabeheer@beeldengeluid.nl)

Waar kan ik de GTAA vinden?
Sinds 2012 wordt de GTAA in een OpenSKOS repository opgeslagen en toegankelijk gemaakt. Sinds november 2012 is er een OpenSKOS editor beschikbaar, waarin gezocht kan worden naar termen. Neem contact op met de contactpersoon voor de GTAA om een account aan te vragen.

Waar kan ik de GTAA downloaden?
De GTAA is beschikbaar als SKOS in XML/RDF en kan met behulp van OAI-PMH geharvest worden vanaf de data provider.
Via de Open Knowledge Foundation kan een dump 
van de GTAA worden gedownload. Deze is echter reeds enige tijd niet geactualiseerd.

Wat is SKOS?
SKOS omvat de ontwikkeling van specificaties en normen voor het gebruik van kennis-organisatiesystemen (KOS), zoals thesauri, classificatieschema's, onderwerpregelsystemen en taxonomieën in het kader van het Semantic Web.

En wat is OpenSKOS?
OpenSKOS is een webapplicatie gebaseerd op SKOS, die door softwareleverancier Picturae in Heiloo is ontwikkeld ten behoeve van erfgoedorganisaties, met financiering vanuit het NWO-onderzoeksprogramma CATCHPlus.

Welke rechten gelden er voor de GTAA?
Beeld en Geluid stelt de GTAA beschikbaar aan derden onder de Open Database License (OdbL).

Wie maken (geheel of deels) gebruik van de GTAA? 
Erfgoedinstellingen: Nederlands Instituut voor Beeld en Geluid, Eye Filmmuseum, Nationaal Archief, Rijksdienst voor Cultureel Erfgoed, Naturalis.
Nederlandse Publieke Omroepen (NPO).
Projecten: CATCHPlus, Waisda, Woordentikkertje.
Universiteiten: Vrije Universiteit.

Afkortingen
GTAA      =    Gemeenschappelijke Thesaurus Audiovisuele Archieven
RDF =    Resource Description Framework
SKOS    =    Simple Knowledge Organization System (using Concepts)
ISO        =    
International Organization for Standardization
LOD     =    Linked Open Data
OAI-PMH =    OpenArchives Initiative Protocol for Metadata Harvesting