DHW server
English Español bajar/down

TEI Resources in Spanish

Only Equis server

MASTER:
Manuscript Access through Standards for Electronic Records


Índice


MASTER: Una pequeña introducción


Traducido por Manuel Sánchez Quero
Biblioteca Virtual Miguel de Cervantes
Universidad de Alicante
España

Este documento pretende ofrecer a los expertos en la descripción de manuscritos, que quizá sepan poco de informática o de etiquetado, una sencilla introducción de las propuestas de los participantes de la Unión Europea que financian el proyecto MASTER, Manuscript Access through Standards for Electronic Records (en consorcio con el grupo de trabajo del Text Encoding Initiative para la descripción de manuscritos).

Al final de este documento, un lector debería:

  • Entender lo suficiente del etiquetado SGML (Standard Generalised Markup Language) para evaluar el estándar MASTER
  • Entender el esquema general del marcado ofrecido por el etiquetado MASTER: esto es, cómo sugiere que se debe estructurar la descripción de un manuscrito
  • Entender cómo el método ofrecido por este sistema difiere de los sistemas de base de datos característicos en los primeros intentos de definir estándares para el etiquetado electrónico de manuscritos
  • Apreciar las variedades de descripción que pueden realizarse de acuerdo a estas propuestas, which could be made according to these proposals, yendo desde registros de ‘primer nivel’ resumidos hasta registros completos muy extensos con diversos niveles de marcado
  • Conocer dónde encontrar más información sobre el etiquetado MASTER y dónde encontrar programas que ayuden a describir manuscritos de acuerdo al estándar MASTER

Historia de estas propuestas

Muchos estudiosos, que llevan trabajando en esto varias décadas, han hecho sugerencias acerca de la descripción electrónica de manuscritos y se han implementado muchos y muy diferentes sistemas informáticos (casi todos usando la tecnología de base de datos) para permitir la creación y recuperación de estas descripciones. Se pueden mencionar aquí las iniciativas del IRHT en los años 70 y del Censimento italiano a principios de los 90. Se puede encontrar un resumen de todos estos sistemas en el libro Bibliographic Access to Medieval and Renaissance Manuscripts: A Survey of Computerised Data Bases and Information Services, ed. Wesley Stevens, Primary Sources and Original Works, Volumen1, Números 3/4, 1991. Es una característica de estos sistemas que su objetivo era usar la tecnología informática para lograr precisión en la catalogación de un conjunto concreto de manuscritos y no crear un sistema genérico de catalogación apropiado para diferentes tipos de manuscritos y catálogos de manuscritos. En 1991 un congreos de LIBER comunicó una resolución de que se debía buscar un estándar para las descripciones de primer nivel, pero no fue posible encontrar recursos para llevarlo a cabo.

El crecimiento de internet y los avances en el trabajo con imágenes digitales de manuscritos dio un nuevo ímpetu a este trabajo a mediados de los 90. Quedó claro que era técnicamente factible un catálogo unitario en la red de manuscritos y que el trabajo con imágenes digitales podía ofrecer un acceso a los manuscritos de un modo jamás imaginado antes. Las descripciones electrónicas de los manuscritos, a las que se pueda acceder en un único sistema en la red, son vitales para la realizacíon de estos objetivos. Esto sólo se puede lograr por medio del acuerdo sobre las propias descripciones: cómo se deben estructurar y cómo se debe acceder a estas. No existía este acuerdo y varios proyectos buscaron lograrlo. Un suceso clave fue la financiación, por la fundación Mellon, de dos proyectos americanos interrelacionados concernientes a la descripción de manuscritos: el proyecto Electronic Access to Medieval Manuscripts (EAMMS) y Digital Scriptorium. Estos dos proyectos comenzaron en 1996 y juntaron a expertos americanos y europeos en sistemas informáticos y en catalogación de manuscritos. El inicio de estos do proyectos provocó que un grupo de estudiosos europeos crearan el equivalente europeo de estos proyectos americanos.

En un congreso en Studley Priory, cerca de Oxford, en Noviembre de 1996, se planeó lo que sería el proyecto MASTER (siglas de Manuscript Access through Standards for Electronic Records). Tras un largo proceso de negociación con la Unión Europea, MASTER comenzó (con la financiación del Fourth Framework Program) el 1 de enero de 1999. Los participantes financiadores de MASTER son la Royal Library, The Hague, la Biblioteca Nacional de la República Checa y L'Institut de recherche et d'histoire des textes de París. Los participantes no financiadores son la Biblioteca del Vaticano, la Biblioteca Británica, la Bodleian Library y la Biblioteca Ambrosiana. MASTER está muy ligado a EAMMS, y los representantes de EAMMS han estado presentes en todos los congresos de MASTER.

Las propuestas actuales están basadas en una metodología diferente a la de las implementaciones de los sistemas de bases de datos características de los métodos desarrollados en los años 80 y descritos en el libro de Stevens señalado arriba. En primer lugar, los diferentes sistemas de bases de datos desarrollados para describir y distribuir descripciones de manuscritos eran simplemente eso: de hecho, varios sistemas con muchos problemas relativos a la compatibilidad de datos entre sistemas y la vinculación de bases de datos concretas con específicas (y perecederas ) combinaciones de software y hardware. En segundo lugar, hay una clara duda sobre la eficacia de cualquier sistema de base de datos para la descripción de materiales como descripciones de manuscritos elaboradamente y de diversos modos estructuradas. Al comienzo del EAMMS y otros proyectos (desde 1996 en adelante) ha sugido una alternativa a la implementación de bases de datos de descripciones de manuscritos: la aplicación del etiquetado Standard Generalised Markup Language (SGML) a la tarea. Desde 1996, la aparición y creciente aceptación del Extensible Markup Language (XML) ha aportado más fuerza a esta alternativa. El trabajo del Text Encoding Initiative (TEI) desde 1988 había creado un conjunto de normas para el etiquetado de una muy amplia gama de materiales de humanidades. Estas normas se han sido ampliamente usadas en la comunidad intelectual, y fueron esenciales en la explosión de los textos electrónicos, lo que está rediseñando muchas áreas del trabajo intelectual.

Se llegó a una especie de consenso entre los estudiosos, archivistas y expertos informáticos involucrados en el EAMMS, Digital Scriptorium y los proyectos MASTER. Ese marcado SGML/XML, en lugar del sistema de bases de datos, ofrecía la vía más prometedora hacia un esquema para las descripciones electrónicas de manuscritos que añadiría las nuevas ventajas digitales de búsquedas y acceso a las potencialidades de la descripción tradicional y muy considerada por el ámbioto intelectual. Esto no significaría descartar totalmente el sistema de bases de datos: hay demasiados registros invertidos en estos sistemas, y algunos de los propios sistemas tienen esta virtud, para que esto sea deseable o posible. Por tanto, todos estos proyectos tienen un componente de base de datos, y EAMMS (que apuntaba desde el principio hacia ambas aproximaciones: la de base de datos y la de SGML/XML) ha tenido especialmente éxito en el diseño de un formato basado en MARC para las descripciones de manuscritos. Sin embargo, en cada extremo de la escala las posibilidades del etiquetado son recomendables. En un extremo: el etiquetado SGML/XML de registros con una estructura muy sencilla acompañados de imágenes del manuscrito se prestaría al montaje inmediato de la web. En el otro extremo: las descripciones más complejas de manuscritos podrían estar ubicadas en el etiquetado SGML/XML, sin alterar la descripción y sin compromiso de detalle intelectual. Del mismo modo, el desarrollo de de un formato de intercambio universal en SGML/XML podría permitir el pase de los muchos registros de manuscritos de las muchas bases de datos a un único formato más maleable.

Algunos otros factores contribuyeron a la elección de la implementación del TEI del SGML/XML, como base para las propuestas indicadas aquí. En primer lugar, estaba el éxito de la norma TEI en cuanto al enfoque de muchos de estos temas, que deberín ser resueltos en un esquema de descripciones electrónicas de manuscritos. Este esquema necesitarí establecer un etiquetado para las trascripciones de los textos de los manuscritos: el TEI ya había publicado normas para la trascripción de textos, y estas normas ya habían sido probadas. Se necesitaba un vocabulario para etiquetar diferentes tipos de divisiones textuales, par etiquetar los metadatos sobre la descripción, etc. El TEI ya había hecho gran parte de este trabajo. En segundo lugar, el sistema del grupo de trabajo del TEI ofrecía una forma probada de juntar expertos en diferentes disciplinas y expertos en el etiquetado, y de relacionar sus diversos conocimientos hacia un consenso que pudiera formar la base de un estándar ampliamente aceptado. En tercer lugar, un grupo de personas implicadas de forma activa en la creación de la norma TEI estaba muy interesado en los manuscritos medievales y por tanto se implicaron desde el principio en los proyectos indicados arriba.

Al congreso de Studley Priory que inauguró MASTER le siguieron reuniones del grupo EAMMS en la Hill Monastic Manuscript Library en diciembre de 1996 y un año más tarde, en noviembre de 1997, hubo otra reunión en la Universidad de Columbia. Esta congregó muchos de los participantes en proyectos EAMMS, Digital Scriptorium y MASTER así como otros expertos en manuscritos. Tras esta reunión, el grupo de trabajo del TEI estaba establecido, con Consuelo Dutschke y Ambrogio Piazzoni como presidentes. Este grupo se reunió por primera vez en julio de 1998. Las normas aquí descritas son el resultado de esta reunión y de una serie de reuniones en las que estaban miembros de EAMMS, MASTER y el grupo de trabajo del TEI: por ejemplo, en Nueva York en enero de 1999 (miembros del grupo de trabajo del TEI); en París en febrero de 1999 (el grupo MASTER); en Roma en marzo de 1999 (el grupo de trabajo del TEI). Entre estas reuniones, hubo enérgicas discusiones por correo electrónico entre las comunidades de EAMMS y MASTER que ayudaron a definir estas propuestas.

Un estándar se convierte en un estándar no como un mero esfuerzo intelectual por parte de los que lo diseñan, sino que debe ser aceptado y usado por la comunidad. Por esta razón, los que propusieron este estándar desean implicar el mayor número de gente posible en el desarrollo de estas propuestas. Anteriormente, los miembros y socios de EAMMS, Digital Scriptorium y MASTER incluyeron algunos de las bibliotecas de manuscritos más importantes y algunos de los estudiosos de manuscritos más respetados de Norteamérica y Europa. Un grupo experto e autónomo (el Dr. Ian Doyle, presidente de la Biblioteca de la Universidad de Durham, el Profesor Peter Gumbert, Leiden y el Dr. Gilbert Ouy, París) se ha reunido en dos ocasiones para considerar estas propuestas y muchos de sus comentarios se han incorporado al estándar. A través de este documento introductorio y de la documentación técnica completa, los proponentes desean que se discuta lo máximo posible sobre el estándar.


¿Qué es el SGML/XML?

Esta sección da una idea muy breve del SGML (Standard Generalised Markup Language), centrándose en las áreas más relevantes para estas propuestas. Si ya se está familiarizado con el SGML, se puede pasar a la siguiente sección. Esta sencilla descripción es también válida para el Extensible Markup Language, XML.

La unidad básica del SGML/XML es el elemento. Un elemento puede ser una cadena de texto rodeado por una etiqueta así:

<p>Esto es un p&aacute;rrafo</p>

        

Aquí, la etiqueta <p> indica que este es el comienzo de un elemento p y la etiqueta </p> indica que este es el final de un elemento p. El contenido del elemento p es el texto ‘Esto es un párrafo’.

Un documento SGML/XML puede consistir simplemente en una serie de elementos, uno tras otro:

<head>Esto es un encabezado</head>
<p>Esto es un párrafo</p>
<note>Esto es una nota</note>

Se puede comparar esto con un conjunto de campos de base de datos: del mismo modo que una base de datos puede poner esta información en campos llamados ‘head’, ‘p’ ‘note’, en el etiquetado SGML/XML se pone esta información en los elementos llamados <head>, <p>, <note>.

Sin embargo, el SGML/XML tiene seis rasgos que lo distinguen de los sistemas de bases de datos y lo hacen especialmente apropiado para codificar información tan rica y variada como las descripciones de manuscritos. En primer lugar, se pueden añadir atributos a los elementos y dar valores a estos atributos. Por ejemplo, se puede especificar que un párrafo va centrado del siguiente modo:

<p justification=centre>Esto es un párrafo centrado</p>

O que el párrafo tiene justificación izquierda:

<p justification=left>Esto es un párrafo justificado a la izquierda</p>

Se pueden combinar diferentes atributos y valores. Aquí, usamos el atributo n para indicar que este es el primer párrafo y el atributo justification para indicar que tiene justificación izquierda:

<p justification=left n=1>El primer párrafo justificado a la izquierda</p>

La habilidad para añadir información al etiquetado por medio de atributos y sus vales, individualmente o en combinación con otros, puede permitir la codificación de información muy compleja.

El segundo rasgo, que por el que conviene el SGML/XML a nuestros fines, es que permite que los elementos contengan otros elementos (o ‘anidarse’ entre ellos). Aquí, vamos a crear un elemento externo <chapter>, que contiene un <head> y una serie de <p> o elementos de párrafo:

<chapter>
   <head>Este es el encabezado del capítulo 1</head>
   <p>El primer párrafo</p>
   <p>El segundo párrafo</p>
</chapter>

O en lugar de <chapter> se puede usar el elemento genérico <div> (que marca cualquier tipo de división textual) y tiene un atributo type para indicar que es un capítulo:

<div type=chapter>
   <head>Este es el encabezado del capítulo 1</head>
   <p>El primer párrafoa/p>
   <p>El segundo párrafo</p>
</div>

El tercer rasgo distintivo del SGML/XML es que se puede usar una Document Type Definition (DTD) para comprobar que un documento contiene ciertos elementos, para especificar que estos elementos aparecen en un cierto orden y para definir qué elementos deben contener estos.

En el ejemplo anterior, podemos usar una DTD para forzar que cada elemento <div> tenga un atributo type y para forzar que cada elemento <div> contenga como minimo un elemento <head> seguido por al menos un elemento <p>. En las siguientes propuestas usamos una DTD que define una regla que dice que cada descripción de manuscrito debe contener un identificador para este. Por medio de este mecanismo, se puede crear una DTD para definir un estándar y asegurarse así de que los documentos conforman el estándar ‘parseándolos’ con la DTD.

El cuarto rasgo distintivo del SGML/XML es su uso de lo que se llama ‘referencias a entidades’ (‘entity references’). En resumen, una brief, an ‘referencia a entidad’ es un mecanismo para permitir la sustitución de una cadena de texto por otra. Por ejemplo: se puede definir una etidad llamada ‘eacute’. En lugar de ‘é’, se puede escribir la referencia a la entidad ‘&eacute;’ en un documento SGML/XML. La ventaja de esto es que se puede reemplazar la referencia a la entidad ‘&eacute;’ por el carácter que representa la é en cualquier sistema informático que se use para leer el documento. De este modo, este sistema se puede usar para asegurarse de que el texto se muestra correctamente en cualquier sistema informático que se utilice. De hecho, este esquema puede usarse para tratar con diferentes conjuntos de caracteres, diferentes sistemas de escritura y cualquier combinación de idiomas, caracteres y sistemas de escritura en un mismo documento.

El quinto rasgo del SGML/XML es resultado de su uso como un conjunto de caracteres básico para describir elementos, en combinación con el uso de referencias a entidades para representar aquellos caracteres que quedan fuera el conjunto de caracteres básico. El efecto de estos es hacer los documentos SGML/XML independientes de la plataforma (platform independent): esto es, asegurarse de que los documentos SGML/XML aparecerán exactamente del mismo modo independientemente del hardware y del software que se use. Un ejemplo concreto de esto es la world wide web: el ‘HTML’ (Hypertext Markup Language) usado en internet es una muestra de SGML/XML y emplea estas técnicas de SGML/XML para asegurarse de que los documentos HTML se ven y se comportan exactamente igual en un ordenador Macintosh o en uno Windows, y en Internet Explorer o en Netscape.

El último rasgo del SGML que se adapta a nuestro uso es que es un estándar internacional. Por tanto, está definido y mantenido por un comité de la International Standards Organisation como ISO 8879: 1986. Esta definición del SGML como un estándar internacional asegura la estabilidad y consistencia del SGML. Debido a que el SGML es un estándar internacional y a que es independiente del sistema usado (como se ha explicado arriba) los documentos etiquetados en SGML pueden considerarse un medio de archivo. Esto es obviamente atractivo en el contexto de las descripciones de manuscritos: los objetos descritos a menudo tienen siglos e incluso milenios, y se pueden esperar que las descripciones de estos sean útiles, al menos, durante décadas. (XML, a diferencia del SGML, todavía no es un estándar ISO).

A menudo se protesta que el SGML/XML es muy verboso: el ‘texto’ del documento se pierde entre un mar de etiquetas y que, por tanto, es difícil producir y entender el SGML/XML. Hay varias respuestas a esto. Primero, hay editores eficaces disponibles que ayudan en la producción de SGML/XML con varias técnicas (macros, conversión automática de OCR o de archivos mecanografiados, y similares). En segundo lugar, hay programas lectores y sistemas de visualización bien desarrollados que permiten al lector ver el texto sin todo el etiquetado SGML/XML y, de hecho, usan el SGML/XML (como debe usarse ) para crear realización atractivas y explarables del texto. La gran aceptación del etiquetado SGML/XML en el mundo comercial, gubernamental y académico significa que hay muchos sistemas de este tipo: tanto aplicaciones gratuitas como comerciales.

Se puede encontrar información sobre esto en http://www.oasis-open.org/cover/sgml-xml.html. Sin embargo, es cierto que la naturaleza abierta del SGML/XML implica que se puede necesitar una considerable adaptación del software para afinarla para una tarea determinada, como el marcado y lectura de descripciones electrónicas de manuscritos. Por tanto, varios de los grupos de trabajo de MASTER se dedicaron a preparar programas para llevar a cabo una implementación del estándar. En particular, los paraticipantes en MASTER prepararon una implementación del sencillo editor de textos de Windows NoteTab que permite un marcado eficiente de los registros de manuscritos.


Principios de diseño para estos propósitos

La gran ventaja obtenida por la unificación de muy diferentes conjuntos de datos en un único sistema, que permite el desarrollo de herramientas comunes eficientes para el creador de registros y la recuperación eficiente para el usuario de los registros, hace que el desarrollo de este estándar valga la pena. Por esto, se necesita un etiquetado estándar de los diferentes conjuntos de datos. Consecuentemente, un sistema estándar de etiquetado que permita la codificación de un conjunto de datos, en sólo una manera, y que no pueda usarse con los diferentes conjuntos de datos del mismo dominio intelectual, no es un estándar en absoluto. Sin embargo, un estándar que intente hacer todas las cosas para todos los conjuntos de datos puede acabar no sirviendo correctamente para ninguno de ellos, y por tanto no sería de nuevo un estándar.

Es la tensión entre estos extremos lo que hace el diseño de un estándar difícil. La solución del TEI, desde el principio, ha sido crear estándares que son ‘amplias iglesias’: que acomodarían en sí mismas muchos tipos diferentes de registros, desde los más simples a los más complejos. Este caso es particularmente convincente para las descripciones de manuscritos, donde cada país, cada dominio intelectual, incluso cada catalogador para cada proyecto de catalogación, ha desarrollado un estilo de catalogación diferente. Por tanto, hemos buscado, sobre todo, flexibilidad y perfección en estas propuestas. Flexibilidad: estas propuestas permiten, por un lado, crear sencillos recuentos de manuscritos que no contienen más que una lista de identificadores de manuscritos, a los que se les puede añadir unas pocas palabras descriptivas de cada manuscrito o una imagen del manuscrito. Por otro lado, las propuestas también apuntan a posibilitar las descripciones más altamente estructuradas, con un marcado estructural elaborado que diferencia los diferentes elementos de la descripción y que contiene completas transcripciones de los manuscritos y completos facsímiles digitales del manuscrito. La diferencia no es simplemente la longitud. En este modelo, una descripción extensa puede ser simplemente un identificador de manuscrito acompañado por una serie de párrafos sin estructurar (esto es: elementos de párrafo sin ningún etiquetado en su interior que diferencie su contenido); o una corta descripción podría estar altamente estructurada. Perfección: es inherente a este diseño que se podría empezar marcando un sencillo recuento de manuscritos y elaborar este marcado por medio de la adición progresiva de información. O se podría empezar importando información de una base de datos de manuscritos existente a párrafos sin estructurar, que pueden ser reformulados más tarde por otros trabajadores para distinguir fechas, lugares, procedencia o descripción.

Del mismo modo, estas propuestas no ofrecen definiciones rígidas de lo que puede constituir un registro "corto" o de "primer nivel", al contrario que en un registro "largo" o "completo". De hecho, estas propuestas Indeed, these proposals obligan a una cosa, y sólo a una cosa: que una descripción de manuscrito (<msDescription>) debe contener un identificador del manuscrito (<msIdentifier>). Más allá de esto, las propuestas no son obligatorias. Sugerimos que cuando evaluemos estas propuestas nos preguntemos, primero: ¿permiten hacer las descripciones de manuscritos que queremos hacer? Si la respuesta es "sí", entonces servirán; si la respuesta es "no", los creadores de las propuestas querrán saber dónde fallan. Sugerimos que nos preguntemos en segundo lugar: ¿los nombres de los elementos propuestos y la relación de los elementos entre ellos parece transparente, lógica y elegante? Hemos buscado en general una nomenclatura y una estructura clara del elemento descriptivo, apra que los expertos en manuscritos y los ususarios digan de inmediato "esto parece correcto". Si algo parece ilogico o nombrado incorrectamente y tenemos una sugerencia concreta de cómo podría mejorarse, nos gustaría oírla.

Un principio de diseño que surgió en las intensas discusiones sobre estas propuestas concernía a su arquitectura. ¿Debíamos apuntar hacia una arquitectura que permitiera al catalogador indicar casi cualquier cosa, en casi cualquier modo imaginable? ¿O debíamos apuntar hacia una prescripción más formal, que declare: si quieres decir algo sobre la encuadernación del manuscrito (por ejemplo) sólo puedes decirlo en un elemento <binding> dentro de un elmento <physDesc>. La ventaja de la primera aproximación es que permite que el catalogador tenga casi completa libertad; su peligro es que la heterogeneidad de descripciones puede estar a costa de una recuperación eficiente basada en el uso predicible de descriptores puestos de acuerdo: la primera justificación de los registros electrónicos en primer lugar. El inconveniente de la segunda propuesta es que el formalismo excesivamente rígido llevaría a la frustración entre los catalogadores, y (bastante rápidamente) un rechazo a adoptar el estándar.

La solución que surgió fue esta: haríamos ambos. Permitiríamos en diferentes puntos dentro de los párrafos descriptivos (<p>) elementos que permitirían al catalogador decir casi cualquier cosa que desee, pero en un modo relativamente informal y poco estructurado. Pero también ofreceríamos elementos formales y precisamente definidos para diferentes fenómenos identificables en los manuscritos. De este modo: un catalogador tiene la libertad de hablar de cualquier aspecto de la encuadernación del manuscrito, como su mantenimiento a lo largo de la historia o del contenido intelectual del manucrito, dentro de los elementos <p> proporcionados dentro de los elementos <history> y <msContents>. Pero si queremos hacer una declaración formalmente estructurada sobre la encuadernación (su material, su fecha) debemos hacerla en el elemento <binding> proporcionado dentro del elemento <physDesc>. La alternativa, para permitir que el etiquetador use el elemento <binding> en cualquier punto, podría llevar a que los catalogadores se sientan obligados a rodear cada referencia a la encuadernación con la etiqueta <binding>, independientemente del contexto o del contenido. Esto provocaría una superfluidad de esfuerzo que llevaría a muy diferentes tipos de información contenida en <binding> lo que convertiría el elemento en semánticamente mal definido y por tanto inútil.

El peligro de un estándar abierto, tal como está diseñado aquí, es que puede usarse inapropiadamente. No promovemos, por ejemplo, las descripciones de manuscritos que consisten en sólo un identificador y una extensa descripción en prosa sin distinciones formales por medio del marcado de fechas, origen, procedencia, etc. Sin embargo, el propio estándar no puede usarse para prescribir que las descripciones deben cumplir este o aquel modelo: sólo puede usarse para posibilitar los diferentes modelos.

Estas propuestas buscan crear un marco que pueda acomodar lo que conocemos de los estándares existentes y posibilitar (en su debido momento) una mayor precisón y una recuperación más eficiente y detallada en la catalogación. Es trabajo de los expertos recomendar cómo se debe aplicar el estándar en sus áreas. Las sugerencias empezarán este proceso, con la documentación que así sigue y que acompañará el estándar completo, pero será responsabilidad de cada uno de los usuarios del estándar llevarlo a la práctica.

Finalmente, dado que el trasfondo y los intereses de todos los participantes en los grupos dominantes implicados en la preparación de esas propuestas (EAMMS, Digital Scriptorium, MASTER y el grupo de trabajo del TEI) están en los manuscritos medivales de Europa occidental, estas propuestas han sido preparadas sólo con estos manuscritos en mente. Sin embargo, se pretende que estas, con el tiempo, se generalicen de algún modo hacia otros manuscritos de diferentes culturas, y agradecemos la reacción de los expertos en otras áreas de manuscritos.


La DTD de TEI/MASTER

Proponemos que se cree un nuevo elemento TEI, <msDescription>, y que cada elemento <msDescription> puede contener sólamente una descripción de un manuscrito. Un manuscrito compuesto se considera un único manuscrito, con los diferentes manuscritos que contiene tratados cada uno como elementos <msPart>, contenidos dentro del elemento <msDescription>.

Un <msDescription> puede contener los siguientes elementos:

  • <msIdentifier>: este contiene el identificador del manuscrito: dónde está y su exacta signatura topográfica u otro identificador. Este elemento es obligatorio.
  • <msHeading>: este puede usarse para dar información básica sobre el manuscrito, tal como puede aparecer en un catálogo resumido (por ejemplo: autor, título de la obra, fecha, lugar, idioma)
  • <msContents>: este contiene una descripción del contenido intelectual del manuscrito, bien como una serie de párrafos o estructurado con sub-elementos definidos.
  • <physDesc>: este contiene una descripción del aspecto físico del manuscrito, estructurado en subelementos definidos.
  • <history>: esto contiene la historia del manuscrito, estructurada en subelementos definidos.
  • <additional>: contiene información adicional relacionada con el manuscrito pero que no es parte de su descripción formal (p. ej.: bibliografía; disponibilidad de facsímiles o imágenes; información administrativa)
  • <msPart>: usado para manuscritos compuestos. Puede contener todos los elementos indicados arriba excepto <summary> (<summary> está pensado para describir sólo el manuscrito completo). Este elemento es necesario cuando tratamos con manuscritos compuestos.

Aquí hay un ejemplo de una relativamente simple descripción de un manuscrito:

Oxford, Corpus Christi College, MS 198 Geoffrey Chaucer The Canterbury Tales. c. 1400 Folios 1r-266v. The Canterbury Tales. A274-I290. Defective at beginning and end. Parchment, trimmed. 33.5 x 22.5 cm. Quires [14, 15, and 28] were disordered in the previous binding. They have been reordered and refoliated, with the old foliation being the uppermost. Two consecutive folios are numbered '64a' and '64' Written by the scribe identified by Doyle and Parkes as 'Hand d' Dated c. 1400 (personal communication, Malcolm Parkes). On fol. 146r is the name 'Burle' in drypoint, in the margin next to E1396. Cp came to the College as a bequest of William Fulman, according to a note on fol. 1r : 'Liber C.C.C.Oxon Ex dono Gulielmi Fulman A.M. hujus Collegii quondam socius.'

En un catálogo resumido, se puede etiquetar utilizando la MASTER DTD de este modo, declarando únicamente el lugar, la signatura topográfica y la siguiente información básica:

<msDescription>
   <msIdentifier n="1">
      <country reg="GB">Great Britain</country>
      <settlement>Oxford</settlement>
      <repository>Corpus Christi College</repository>
      <idNo>MS 198</idNo>
   </msIdentifier>
   <msHeading>
      <title>The Canterbury Tales</title>
      <author>Geoffrey Chaucer</author>
      <origPlace>?</origPlace>
      <origDate notBefore="1395" notAfter="1420">c. 1400</origDate>
      <textLang langKey="ENM">Middle English</textLang>
   </msHeading>
</msDescription>

Observe las posibilidades de búsquedas precisas que permite este etiquetado. Podríamos encontrar este manuscrito como fechado entre 1395 y 1420; como escrito en inglés medieval (con la clave de idioma "ENM"), y más.

O se podría etiquetar toda la información en la descripción de este modo:

<msDescription>
   <msIdentifier n="1">
      <country reg="GB">Great Britain</settlement>
      <settlement>Oxford</settlement>
      <repository>Corpus Christi College</repository>
      <idNo>MS 198</idNo>
   </msIdentifier>
   <msHeading>
      <title>The Canterbury Tales</title>
      <author>Geoffrey Chaucer</author>
      <origPlace>?</origPlace>
      <origDate notBefore="1395" notAfter="1420">c. 1400</origDate>
      <textLang langKey="ENM">Middle English</textLang>
   </msHeading>
   <msContents>
      <msItem n="1" defective="yes">
         <locus from="1" to="266">Folios 1r-266v</locus>
         <title type="uniform">The Canterbury Tales</title> 
         <bibl>
            <biblScope>A274-I290</biblScope>
         </bibl>
         <note>Defective at beginning and end</note>
      </msItem>
   </msContents>
   <physDesc> 
      <form>
         <p>Codex.</p>
      </form>
      <support>
         <p>Parchment, trimmed.</p>
      </support>
      <extent>266.
         <dimensions type="leaf" scope="all">
            <height>33.5</height>
            <width>22.5</width>
         </dimensions>
      </extent>
      <collation>
         <p>Quires [14, 15, and 28] were disordered in the previous binding. 
         They have been reordered and refoliated with the old foliation being 
         the uppermost. Two consecutive folios are numbered 64a' and '64'</p>
      </collation>
      <msWriting hands="1">
         <handDesc scribe="Hand D (Doyle/Parkes)" script="Anglicana" medium="ink" scope="sole">
            <p>Written by the scribe identified by Doyle and Parkes as 
            '<name type="person" role="scribe" key="DPhandD">Hand d</name>'</p>
         </handDesc>
      </msWriting>
   </physDesc>
   <history>
      <origin notBefore="1395" notAfter="1420" certainty="high" evidence="conjecture">
         <p>Dated c. 
            <origDate>1400</origDate>
         (personal communication, Malcolm Parkes).</p>
      </origin>
      <provenance>
         <p>On fol. 146r is the name 'Burle' in drypoint, in the margin next 
         to E1396.</p>
      </provenance>
      <acquisition>
         <p>Cp came to the College as a bequest of William Fulman, according to a 
         note on fol. 1r :
            <q>'Liber C.C.C. Oxon Ex dono Gulielmi Fulman A.M. hujus Collegii quondam
            socius.'</q>
         </p>
      </acquisition>
   </history> 
</msDescription>

En el apartadocustomized text-editor, preparado por los participantes de MASTER, aparece un recuento completo de cómo se pueden hacer estas descripciones, con una explicación de los elementos usados en estas descripciones.


Siguentes pasos…

El proyecto MASTER y sus participantes ha juntado varios recursos para hacer más fácil que los catalogadores aprendan cómo hacer descripciones de manuscritos de acuerdo al etiquetado que hemos desarrollado. La página de recursos del sitio MASTER da una descripción de estos recursos. Estos incluyen:





Versión original en inglés revisada el 14 de enero de 2001.


Subir / Up


Contact: DHWorkgroup