Auparavant, les URI portaient un suffixe différent selon le type de ressource décrite : #foaf:Person pour une personne, #foaf:Organization pour une organisation, #spatialThing pour un lieu, #frbr:Work pour une oeuvre. Désormais, les URI des entités ne sont plus différenciées en fonction de leur type mais portent un suffixe générique #about (au lieu de #foaf:Person, #foaf:Organization, #spatialThing, #frbr:Work).
Auparavant, les informations de la manifestation (titre, ISBN, nombre de pages, etc.) étaient portées par une URI sans suffixe. Les métadonnées de la notice elle-même (date de création de la notice, date de dernière modification) étaient portées par l'URI avec le même ark mais avec un suffixe #record. Le modèle de données a été harmonisé : l'URI avec un suffixe #about désigne l'entité de type frbr-rda:Manifestation, sur le modèle des autres entités. Désormais, les informations sur la manifestation sont rattachées à une URI avec un suffixe #about et les informations sur la notice elle-même sont rattachées à une URI non suffixée.
Les notices d'expression n'existent pas pour l'instant dans le catalogue, l'entité de type skos:Concept n'existe donc pas non plus pour les expressions. Seule existe une entité de type frbr-rda:Expression, qualifiée par le suffixe #Expression à la fin de l'URI non suffixée de la manifestation correspondante.
La commande DEFINE input:same-as "yes" placée en début de requête permet de garantir la pérennité des requêtes déjà formulées. Les entités liées par des relations d'équivalence owl:sameAs sont alors considérées comme identiques dans la base : le moteur de requête déduit que toutes les propriétés de l'une des ressources s'appliquent également à l'autre.
Parcourir les données pour l'oeuvre Le Corbeau d'Edgar Allan Poe
Consulter le schéma complet du modèle de données (nouvelle fenêtre) :
Le modèle de données de data.bnf.fr expérimente et adapte le modèle le modèle FRBR (fonctionnalités requises pour les notices bibliographiques)
élaboré par la fédération internationale des associations et institutions de bibliothèques, l’IFLA. Data.bnf.fr s’inscrit donc dans les évolutions récentes en matière de description bibliographique.
Ce modèle comprend trois groupes d'entités liées par des relations : les informations sur les documents, les personnes physiques ou morales, et les thèmes.
Source : Bénézet Joly, http://slideplayer.fr/slide/3213771/.
Le premier groupe du modèle FRBR décrit les différents aspects d’une production intellectuelle ou artistique, à travers quatre niveaux : l’œuvre, l’expression, la manifestation et l’item.
Le niveau de l'œuvre est celui de la création intellectuelle ou artistique, par exemple Le colonel Chabert d'Honoré de Balzac. Les unités documentaires « œuvres » sont créées à partir des notices d'autorité correspondantes de la BnF, présentes dans le Catalogue général de la BnF.
Le niveau de l’expression regroupe les différentes versions d’une seule œuvre telles que le texte original, une traduction, une adaptation ou encore une version abrégée. Les expressions ne sont pas visibles dans les pages HTML de data.bnf.fr, mais sont bien présentes dans le RDF correspondant.
Le niveau de la manifestation est celui de la matérialisation d'une expression, par exemple une édition des Misérables comme « Nouvelle impression illustrée. 1879-1882. Paris. E. Hugues ». Les manifestations d’une œuvre sont listées dans l’unité documentaire « œuvre » et regroupées dans la section « Vie et éditions de l’œuvre ».
Ce niveau correspond à la notice bibliographique dans le Catalogue général de la BnF ou, dans la base BnF archives et manuscrits, à un niveau de description identifié par une cote.
Le niveau de l'item est celui de l'exemplaire. Il est accessible par le lien vers la notice dans le Catalogue général de la BnF ou dans BnF archives et manuscrits, ou vers l'exemplaire numérisé dans la Bibliothèque numérique Gallica.
Notons que des relations de tout à partie peuvent exister entre :
o une œuvre et une autre œuvre
Par exemple, Le Père Goriot, d'Honoré de Balzac, est contenu dans Les Scènes de la vie privée du même auteur, et tous deux ont le
statut d'œuvre et sont dotés d’une page data.bnf fr.
o une manifestation et une autre manifestation
Par exemple, une édition particulière du Père Goriot est contenue dans la manifestation Etudes de mœurs, qui est une édition regroupant plusieurs textes de Balzac.
Une personne peut être auteur d'une œuvre (un lien existe alors entre la page « auteur » et la page « œuvre » correspondante) ou contributeur d'une expression (préfacier, traducteur, librettiste...). Cependant, le niveau de l'expression n’étant pas distinct de celui de la manifestation dans les pages HTML de data.bnf.fr. Les différents types de contribution par une personne sur une œuvre font l'objet d'un référentiel dans le format Intermarc adopté par la BnF ; ces référentiels enrichissent le RDF des pages.
Dans les données RDF, la relation entre un auteur et une ressource sera exprimée au niveau de l’œuvre si la personne est auteur de l’œuvre (auteur du texte original, compositeur, réalisateur) ; soit au niveau de l’expression si elle a produit une traduction, une interprétation (en musique), etc. La notion d’auteur exprimée au niveau de l’œuvre sera de toute façon répétée au niveau de l’expression.
Parmi les données exposées et récupérables, se trouvent les notices de sujets du thésaurus RAMEAU (Répertoire d'autorité-matière encyclopédique et alphabétique unifié) de la BnF. Elles ont été converties dans le langage RDF SKOS (Simple Knowledge Organisation), dans le cadre du projet européen TELplus. Ce référentiel est désormais maintenu à jour sur data.bnf.fr avec la base de données totale et actualisée de la BnF.
Les documents ayant pour sujet un concept RAMEAU sont listés dans la page « Thème » correspondante.
De plus, le site comprend des pages regroupant des études (œuvres et manifestations) au sujet d'une œuvre ou d'un auteur. Elles ne sont pas indexées par les moteurs de recherche et ne sont accessibles que depuis les pages « œuvres » ou « auteurs » correspondantes.
Ainsi, sur la page « Napoléon », on trouvera un lien vers une page regroupant les documents portant sur Napoléon, tels que Vie de Napoléon Buonaparte, 1827.
Les pages « dates » permettent de couvrir une période temporelle, comme une année (par exemple, la page de l’année 1789).
Ces pages rassemblent :
o les thèmes liés à cette période temporelle,
o les auteurs nés ou morts à la date en question,
o les organisations créées ou dont l’activité a cessé,
o les œuvres crées ou terminés, les spectacles représentés et les documents publiés pendant cette période.
Ces pages n’ont pas d’équivalence dans le catalogue.
Les pages « lieux » rassemblent les documents cartographiques au sujet d’un lieu.
Elles permettent également de retrouver :
o les auteurs qui y sont nés ou morts,
o les organisations qui y ont été créées,
o les périodiques ou documents qui y ont été publiés, les spectacles qui y ont été représentés, les enregistrements qui y ont été faits, ainsi que les batailles et traités qui y ont été signés.
Elles sont liées aux pages « thèmes » correspondantes qui rassemblent les documents au sujet de ce lieu.
Dans les pages « auteurs » et « œuvres », les manifestations d'un même auteur sont regroupées autour des œuvres par le lien à une notice d'autorité Titre Conventionnel (TIC), exprimé dans les notices bibliographiques d’origine.
Cependant, certaines manifestations non reliées restent orphelines. Afin d’améliorer la FRBRisation des données et par conséquent l’ergonomie de consultation pour les utilisateurs, il importe de réaliser des alignements de ces manifestations orphelines, c’est-à-dire des rapprochements automatiques de ces manifestations vers les œuvres correspondantes.
Exemples :
Notice bibliographique de la BnF
avec un lien à la notice autorité auteur « Jean de la Fontaine » et un lien vers la notice d’autorité titre « Les Fables ».
Notice bibliographique de la BnF
sans lien vers la notice d’autorité titre « La cigale et la fourmi » mais avec un lien vers la notice autorité auteur La Fontaine.
C’est pourquoi un alignement simple est d’ores et déjà mis en œuvre dans data.bnf.fr. Lorsqu’une manifestation est expressément liée, dans la notice bibliographique d’origine, à la notice d’autorité de l’auteur et que la chaîne de caractères du titre correspond exactement à celle de l’œuvre, la manifestation est automatiquement rattachée à l’œuvre.
Toutefois, à l’issue de cet alignement simple, de nombreuses manifestations restent encore orphelines. A terme, deux solutions sont possibles :
Les pages « auteurs », « œuvres » et « thèmes » sont ouvertes sur le Web, et accessibles directement par les internautes depuis les moteurs de recherche.
C'est pourquoi, outre les méthodes traditionnelles d'indexation de la page d'accueil, nous avons choisi d'embarquer deux types de données pour structurer les pages « auteurs », « œuvres » et « thèmes » :
Nous avons utilisé les éléments suivants, s'appliquant à toute la partie « body » du HTML :
itemtype=http://schema.org/Person
itemprop="description" itemprop="birthdate" itemprop="deathdate"
itemprop="nationality" itemprop="memberOf"
itemtype=http://schema.org/Book
itemprop="description" itemprop="inLanguage" itemprop="datePublished"
itemprop="genre"
itemtype= http://schema.org/Organization
itemprop="description" itemprop="image" itemprop="name" itemprop="url"
itemprop="members" itemprop="founding date" itemprop="founders"
Avec, pour les groupes, des sous-classes d'organisation :
itemscope itemtype=
http://schema.org/PerformingGroup
itemscope itemtype= http://schema.org/DanceGroup
itemscope itemtype=
http://schema.org/TheaterGroup
itemscope itemtype= http://schema.org/MusicGroup
C'est un vocabulaire très simple, mis en place pour encoder en RDFa quelques métadonnées qui seront récupérées lorsque l'utilisateur ajoutera la ressource à son profil Facebook. Dans le header de la page HTML, les métadonnées suivantes sont intégrées grâce à des balises META :
og: title (titre de la page)
og: description (description du contenu de la page)
og: type (type de ressource décrite : auteur et livre)
og: url (URL de la page)
og: image (URL de l’image illustrant la page)
og: author (pour les pages « Œuvres », le nom de l’auteur)
La réutilisation de vocabulaires existants a été privilégiée pour favoriser l'interopérabilité, en particulier :
rdf |
|
rdfs |
|
skos |
|
dcterms |
|
foaf |
|
RDAgroup2elements |
|
rdvocab |
Néanmoins, certaines propriétés et classes ne peuvent être exprimées que par une ontologie propre à la BnF : bnf-onto. Pour publier ses ontologies, la BnF a choisi un espace de nommage homogène de forme http://data.bnf.fr/ontology.
L’ontologie bnf-onto est déclarée à l’adresse suivante : http://data.bnf.fr/ontology/bnf-onto/.
Liste des propriétés :
Libellé de la propriété |
Définition |
URI |
cote |
Cote d’un document d’archives : numéro unique identifiant l’exemplaire matériel conservé dans les collections |
|
EAN |
Numéro d’identification EAN (european article numbering), code barre |
|
expositionVirtuelle |
URL d’une exposition virtuelle de la BnF |
|
firstYear |
Première date (année uniquement) d'une entité : année de naissance d'une personne, année de création d'une organisation, année de première publication d'une œuvre |
|
FRBNF |
Numéro de notice utilisé à la BnF. Il sert de base à la construction de l'identifiant ARK. |
|
isbn |
Utilisé pour déclarer le numéro international d’identification d’un libre (International standard book number) |
|
ISMN |
Numéro ISMN (International standard music number) utilisé pour la musique imprimé |
|
ouvrageJeunesse |
Edition d’un ouvrage destinée à un public jeune. Cette propriété permet de trier les éditions, qui ont souvent un contenu différent malgré un titre identique. |
|
code_role |
Code de fonction du rôle de la personne/organisation en
relation avec l’ouvrage décrit :
|
|
role |
Nom pour désigner le rôle des contributeurs. |
translation |
Lien à une édition traduite du périodique |
Les référentiels spécifiques de la BnF sont déclarés à l’adresse suivante : http://data.bnf.fr/vocabulary/.
Liste des vocabulaires :
Personnes |
Correspondance RDF |
Zones Intermarc (notices PEP) |
|
forme retenue |
skos:prefLabel @in_lang |
100, 400 |
|
autre forme |
skos:altLabel, foaf:familyName, foaf:givenName |
|
|
nationalité |
foaf:nationality |
008 position 12-13 |
|
langue |
RDAgroup2elements:languageOfThePerson |
008 position 14-16 |
|
sexe |
foaf:gender |
008 position 17 |
|
date de naissance |
RDAgroup2elements:dateOfBirth |
008 position 27-36 |
|
mort |
RDAgroup2elements:dateOfDeath |
008 position 37-46 |
|
lieu de naissance |
RDAgroup2elements:placeOfBirth |
603 $a |
|
lieu de mort |
RDAgroup2elements:placeOfDeath |
603 $b |
|
début d'activité |
RDAgroup2elements:periodOfActivityOfThePerson |
008 position 47-51 |
|
fin d'activité |
RDAgroup2elements:periodOfActivityOfThePerson |
008 position 52-55 |
|
sources (note sur les sources de la notice) |
skos:editorialNote |
610 |
|
résumé, note |
RDAgroup2elements:biographicalInformation |
600 |
|
domaines |
RDAgroup2elements:fieldOfActivityOfThePerson |
624 |
|
liens vers la ressource DBpedia |
owl:sameAs |
|
|
fonction de contributeur |
marcrel:[code de fontion de la bibliothèque du Congrès] |
|
|
vignette Gallica représentant l'auteur |
foaf:depiction |
|
|
Organisation |
Correspondance RDF |
Zones Intermarc (notices ORG) |
|
forme |
skos:prefLabel @in_lang |
100, 400 |
|
nationalité |
foaf:nationality |
008 position 12-13 |
|
langue |
RDAgroup2elements:languageOfThePerson |
008 position 14-16 |
|
date de début |
RDAgroup2Elements:dateAssociatedWithTheCorporateBody |
008 pos 27-36 |
|
date de fin |
RDAgroup2Elements:dateAssociatedWithTheCorporateBody |
008 pos 37-46 |
|
début activité |
dc:date |
008 pos 47-51 |
|
fin activité |
RDAgroup2elements:periodOfActivityOfTheCorporateBody |
008 pos 52-55 |
|
site internet |
foaf:homepage |
606 |
|
sources |
skos:editorialNote |
610 |
|
résumé, note |
RDAgroup2elements:corporateHistory |
600 |
|
domaine |
RDAgroup2elements:fieldOfActivityOfTheCorporateBody |
624 |
|
liens vers la ressource Dbpedia |
owl:sameAs |
|
|
Thèmes RAMEAU |
Correspondance RDF |
Zones Intermarc (notices RAM) |
|
titre original |
skos:prefLabel |
16X, 46X |
|
autre forme |
skos:altLabel |
16X, 46X |
|
origine (thésaurus Rameau) |
skos:inScheme |
|
|
source (note sur les sources de la notice) |
skos:editorialNote |
610, 612 |
|
note (note descriptive) |
skos:scopeNote |
600 |
|
termes plus larges |
skos:broader |
3XX, 5XX |
|
termes plus précis |
skos:narrower |
3XX, 5XX |
|
termes reliés |
skos:related |
3XX, 5XX |
|
alignement thésaurus extérieurs |
skos:closematch |
620 |
|
alignement thésaurus extérieurs |
skos:exactmatch |
|
|
Œuvre |
Correspondance RDF |
Zones Intermarc (notices TIC, TUT, TUM) |
|
forme (titre principal) |
dc:title, skos:prefLabel, rdfs:label @in_lang |
145, 415 |
|
autre forme |
skos:altLabel @in_lang |
|
|
langue |
dc:language |
008 position 14-16 |
|
date oeuvre |
dc:date |
008 position 27-36 |
|
source |
skos:editorialNote |
610 |
|
résumé, note |
dc:description |
600 |
|
domaine |
dc:subject |
624 |
|
lien vers la notice d'autorité du catalogue |
owl:sameAs |
|
|
contenu dans |
dc:isPartOf |
|
|
auteur principal |
dc:creator |
100, 101, 110 |
|
auteur secondaire |
dc:contributor, bnf-onto:[coderole] |
711, 702, 700, 701, 710, 712 |
|
auteur code libre |
dc:contributor, bnf-onto:[coderole] |
code libre, 321, 322 |
|
vignette Gallica de l'œuvre numérisée |
foaf:depiction |
|
|
Manifestation |
Correspondance RDF |
Zones Intermarc (notice bibliographiques) |
|
manifestation de l'œuvre |
rdarelationships:workManifested |
|
|
titre |
dc:title |
245 |
|
contient |
dc:hasPart |
|
|
édition (date d'édition) |
dc:date |
260 |
|
édition (lieu d'édition) |
rdvocab:placeOfPublication |
250 |
|
édition (nom de l'éditeur) |
rdvocab:publishersName |
260 |
|
description matérielle |
dc:description |
|
|
ISBN |
bnf-onto:ISBN |
20 |
|
type de document |
dc:type |
|
|
langue |
dc:language |
41 |
|
adaptation jeunesse |
bnf-onto:ouvrageJeunesse |
|
|
Expression |
Correspondance RDF |
|
|
rôle de contribution |
marcrel:[code de fonction de la Bibliothèque du Congrès] |
|
|
rôle de contribution (chiffre) |
bnf-onto:coderole |
sous-zone $4 |
|
rôle de contribution (valeur littérale) |
bnf-onto:role |
|
|
type de document |
dc:type |
|