DHW server
English Español bajar/down

TEI Resources in Spanish

Only Equis server



TEI Básico

Un subconjunto muy, muy pequeño
del Esquema de Etiquetado TEI



C. M. Sperberg-McQueen

Document No. TEI U6
30 Aug 1994, rev. June 1995



Traducido por

Manuel Sánchez Quero

Biblioteca Virtual Miguel de Cervantes
Universidad de Alicante
España

Septiembre de 2001





Índice


     Se puede recuperar una versión en SGML de este documento en . Existe una versión HTML de este documento dividida en varios archivos (para una recuperación más rápida) en .

 



1 Prefacio

     
Mark Olsen
ARTFL Database
Universidad de Chicago
1050 E. 59th St.
Chicago, Illinois 60637


      Estimado Mark,

      Hace algunos meses, cuando el TEI publicó sus Normas, y viste las 1300 páginas y levantaste los tres kilos de las Guidelines for Electronic Text Encoding and Interchange (Normas para el Etiquetado e Intercambio de Textos Electrónicos), me escribiste, como recordarás, estas palabras: "Tus ladrillos han llegado hoy a mi mesa. ¿Hay una versión resumida? ¿Un TEI básico, sin el material opcional, únicamente el esquema de etiquetado TEI más básico?"

      Este es mi intento de proporcionarte lo que has pedido —pero sólo la mitad del esfuerzo fue para darte lo que pienso que realmente necesitas. La mitad que creo que no pides, aunque otra gente sí, es una especie de "Guía de bolsillo sobre TEI": una versión del esquema de etiquetado TEI que es suficientemente pequeña para ser entendida sin problemas, pero bastante grande para realizar un trabajo serio y bastante poderosa para satisfacer, en la mayoría de los casos, a la mayor parte de la gente en su trabajo de etiquetado de textos electrónicos. Lou y yo hemos hablado bastante sobre esto, y el "TEI de bolsillo" (también conocido como "TEI Lite") está ahora documentado en un pequeño artículo llamado .

      Sin embargo, tú no pedías un TEI Lite, tú pedías algo incluso más pequeño y reducido: me pediste separar el conjunto mínimo de etiquetas TEI, sin el cual es difícil imaginar crear ningún texto electrónico útil hoy en día. Eso es lo que he hecho en este documento.

      Ten en cuenta, sin embargo, que lo que tienes en las manos no es en absoluto un intento de crear un esquema de marcado práctico para el uso real de etiquetado de nuevos textos. Es una definición de un lenguaje de marcado infantil: el mínimo absoluto no es necesariamente un mínimo útil. En concreto, aunque este conjunto de etiquetas puede bastar para la traducción a formato TEI de textos ARTFL y otros datos preexistentes, creo que cuando comiences a crear textos electrónicos nuevos, te volverás loco para limitarte a los rasgos textuales indicados aquí y espero que, a pesar de tu conocida antipatía ante cualquier esquema racional de marcado de textos y a pesar de la gran cantidad de locura que tus amigos saben que tienes y aprecian, no harás una cosa tan estúpida.

      El conjunto de etiquetas definido aquí es suficiente para familiarizarte con él en media hora, conocerlo en una tarde más o menos y tenerlo superado en un día o una semana o dos. Y es un subconjunto nítido del esquema completo de etiquetado TEI, para que cuando superes este conjunto básico de etiquetas y empieces (como espero) a mirar el TEI Lite y el completo lenguaje de marcado TEI, ya tendrás un firme conocimiento de la base del etiquetado TEI y podrás fácilmente integrar las etiquetas adicionales al esqueleto mental que te habrás formado mientras asimilabas este esquema básico TEI. Para animarte, a ti y a otros lectores que comparten tu inclinación a la locura, a dirigirte hacia el esquema de marcado completo TEI, menciono regularmente en este artículo las etiquetas del encabezado TEI (TEI header) y el conjunto de etiquetas principal del TEI (TEI core tag set) que no se incluyen aquí, para que sepas lo que te estás perdiendo.

      Debo confesar que Lou se muestra escéptico ante la definición de este subconjunto básico del TEI. Como yo, piensa que no será útil para un etiquetado serio de información real, pero discrepa con mi idea de que será útil, sin embargo, para aquellos que se acercan al TEI por primera vez. Espero que sea útil: (a) para reducir el desorden para que se pueda ver claramente las líneas básicas del esquema TEI —las etiquetas incluidas aquí son aquellas que todos necesitan— y (b) para demostrar, por una reductio ad absurdum, cómo reduciendo un conjunto de etiquetas a este tamaño (casi el mismo que la primera versión del HTML) se fuerza a uno a omitir mucho material que puede ser útil en el etiquetado de cualquier texto y que es absolutamente esencial para tratar racionalmente con algunos textos. Lou piensa que estoy soñando; el tiempo dirá.

      Por tanto: aquí está el subconjunto básico del TEI que pedías —puedes leerlo de buena salud y puede probar que es útil para mostrarte cómo traducir la información que tienes a formato TEI y para extender el software que tienes para manejar la información TEI. (N.B. te lloverán críticas si introduces apoyo para este subconjunto y no para la DTD completa del TEI. Y más aún, merecerás cada maldición de las escrituras.) Utilízalo para marcar algunos sencillos ejercicios de etiquetado TEI en SGML. Unos ejercicios bastarán para convencerte de que necesitas un esquema mayor (p. ej. el esquema completo del TEI) para un etiquetado serio de textos con los que esperas trabaje cualquiera. Usa el TEI Lite en lugar del estándar TEI si crees que debes hacerlo, pero no te limites al esquelético conjunto de etiquetas (quizás debiera decir cadavérico) esbozado aquí. Ni tú estás tan loco.

      Saludos,

            Michael





2 Introducción

      Este documento describe un conjunto de etiquetas básico extraído de las Guidelines for Electronic Text Encoding and Interchange (Normas para el Etiquetado e Intercambio de Textos Electrónicos) publicadas en 1994 por la Text Encoding Initiative (TEI). Las etiquetas descritas han sido elegidas para servir como sencilla introducción al esquema de marcado completo descrito en las Normas; pueden bastar en algunos casos para la creación de sencillos textos electrónicos, pero trabajos serios necesitarán de una selección mayor de las etiquetas TEI. Se anima al lector a usar este documento como primera introducción al etiquetado TEI, y para progresar, tras leer este documento y usar su conjunto de etiquetas durante un tiempo, debe estudiar otra documentación TEI: o el documento llamado o el texto completo de las propias Normas (.

      Este documento introduce las etiquetas de modo informal, con ejemplos. Como incentivo para aprender el conjunto completo de etiquetas TEI, menciona de vez en cuando etiquetas que están en el conjunto completo de etiquetas pero que se han omitido aquí para que el conjunto básico de etiquetas sea sencillo. Estas referencias se pueden ignorar en la primera lectura. Se puede encontrar en las Normas una discusión completa de todas las etiquetas y su descripción formal en términos del Standard Generalized Markup Language (SGML).





3 SGML Básico

     El SGML, Standard Generalized Markup Language, es un lenguaje formal para representar textos en formato electrónico. El conjunto de etiquetas del TEI está definido en términos de SGML y todos los documentos que cumplan el TEI también deben ser conformes al SGML.

      En los esquemas de etiquetado basados en SGML, un documento se representa como una combinación de contenido (hablando a grandes rasgos, los caracteres del texto, lo que se puede ver en una hoja cuando el texto está impreso) y marcado (hablando a grandes rasgos, información sobre la estructura del texto o los rasgos importantes para el procesamiento del texto, tales como su división en capítulos y secciones o el hecho que una palabra sea un término técnico y deba aparecer en cursiva). El sofware que no es SGML, como los procesadores de texto propietarios, usa una división parecida de contenido y marcado. En el software sofisticado, el marcado suele estar invisible para el usuario a menos que usemos la función mostrar códigos o una similar, para hacerlos visibles. El SGML difiere de los sistemas de marcado propietarios en varios aspectos:

  • El SGML no es propietario y está totalmente documentado independientemente de cualquier sofware de SGML, por lo tanto podemos pasar nuestros documentos de un programa a otro en cualquier momento sin perder nada de información. En contraste, la conversión entre sistemas propietarios es notablemente difícil y propensa a errores.
  • Todos los sistemas usan el marcado para decidir cómo procesar el texto, pero en los sistemas SGML se define típicamente el marcado en términos abstractos, en lugar de directamente en términos de procesamiento. Un sistema SGML es más parecido a marcar una frase como un término técnico que como cursiva: normalmente se usa una hoja de estilo aparte para determinar si los términos técnicos van en cursiva y negrita en primera instancia, o en azul, y para especificar otros procesamientos tales como añadir una entrada en un glosario de términos técnicos. Hoy en día, los sistemas propietarios también suelen tener mecanismos de hojas de estilo, pero estos rara vez se igualan al software de SGML en conveniencia o potencia.
  • Los esquemas de marcado basados en SGML, llamados definiciones de tipo de documento (DTDs), van normalmente acompañados de documentación del marcado independiente del sistema. El documento que estás leyendo proporciona precisamente este tipo de documentación independiente del sistema —p. ej., dado que puedes usar estas etiquetas con cualquier software de SGML, este artículo no puede describir qué pasará en la pantalla o qué teclas debes apretar con el programa concreto que decidas usar. Estas cosas varían de un programa a otro y debes consultar la documentación del programa para recibir ayuda.
  • A diferencia de los sistemas propietarios, los sistemas SGML ofrecen invariablemente facilidades para exportar documentos a un formato estándar (SGML), por lo tanto pueden ser fácilmente usados por otros programas. Algunos entusiastas expresan esto como un tipo de eslogan: "Con SGML, tu posees tus documentos; sin SGML, tus documentos los posee gente de Orem, Utah, o de Redmond, Washington. ¿Qué prefieres?"

Hay otras diferencias, pero con estas basta por ahora.

      El marcado en SGML toma tres formas: declaraciones, referencias a entidades y etiquetas. [No puedo mentir: realmente, hay cuatro formas de marcado. La cuarta, instrucciones de procesamiento, no nos interesa aquí.]

      Las declaraciones se usan para definir las etiquetas y las referencias a entidades que son legales en un tipo de documento. Como las etiquetas y entidades que nos interesan aquí ya han sido todas definidas por el TEI, no hay necesidad de discutir más las declaraciones en este documento. Necesitarás aprender sobre esto si quieres personalizar el conjunto de etiquetas del TEI, pero esto no lo trataremos aquí. El único tipo de declaración de la que necesitas saber, para seguir los ejemplos de aquí, es el comentario, que va precedido de <!-- y seguido de -->:

 
       <!-- esto es un comentario. -->
       <!-- esto es un segundo comentario. -->
       <!-- Los comentarios son ignorados 
       por el analizador de SGML y suelen 
       ser ignorados por el software de SGML 
       de todo tipo. Como muestra este 
       comentario, los comentarios pueden 
       ocupar varias líneas. -->

      Las entidades se llaman partes de documentos, que pueden almacenarse por separado; las referencias a entidades muestran donde va cada entidad. Entre otras cosas, las referencias a entidades se usan para insertar caracteres especiales en el texto cuando, como suele pasar, los caracteres en cuestión no están disponibles en el teclado. Algunas entidades para caracteres especiales están definidas en estándares internacionales. Por ejemplo, la entidad eacute nombra el carácter "e con acento agudo" (é). Cuando se usan los conjuntos estándar de entidades, estos dos ejemplos significan exactamente lo mismo:

 
       L'&eacute;tat, c'est moi.
L'état, c'est moi.

      (En el caso de que esto haya sido corrompido en la transmisión o sea mostrado en un dispositivo sin caracteres acentuados, el segundo es el mismo que el primero, salvo que la referencia a la entidad eacute en los caracteres 3-10 del primer ejemplo ha sido reemplazada por una verdadera e con un acento agudo en el conjunto de caracteres propio del sistema en el carácter 3 del segundo ejemplo.)

      Las entidades también se usan para tratar gráficos y otro material que esté en notaciones que no sean SGML y para dividir un documento en secciones almacenadas en diferentes archivos por motivos de un mantenimiento más sencillo, pero no trataremos tales usos aquí.

      Las etiquetas marcan el comienzo y final de partes de un documento, estas partes se llaman elementos. Normalmente, las etiquetas se marcan en el documento por medio de paréntesis angulares; las etiquetas de cierre tienen una barra tras el paréntesis angular de apertura. En el siguiente ejemplo, la frase se marca como una cita con las etiquetas de apertura y cierre rodeándola; quote es un tipo de elemento definido por el TEI.

 
       <quote>L'&eacute;tat, c'est moi.</quote>

      Los elementos siempre tienen un tipo básico (en el ejemplo de arriba es quote); también pueden tener otros atributos, que se indican por medio de notaciones especiales dentro de la etiqueta de apertura del elemento. Por ejemplo, el TEI define el atributo lang que se aplica a todo tipo de elemento; su valor indica el idioma del contenido del elemento, usando abreviaturas estándares de dos o tres letras (p. ej. fra para "francés").

 
       <quote lang='fra'>L'&eacute;tat, c'est
       moi.</quote>

      Algunos atributos pueden estar restringidos a ciertos tipos de valores. Atributos del tipo id, por ejemplo, deben proveer un nombre o identificar único para el elemento en el que aparecen; se puede referir a este identificador por medio de otros atributos, del tipo idref (id reference o referencia al identificador). El TEI define un atributo global llamado id, del tipo id, para que se use en las referencias cruzadas y otros tipos de enlaces hipertextuales. (Los atributos del TEI se llaman globales cuando se aplican a todo tipo de elemento.)

      Finalmente, debemos observar que el SGML permite que se omitan algunas etiquetas de los documentos en aquellos casos en que son lógicamente redundantes y su situación puede inferirse por la de otras etiquetas; en los ejemplos que se dan aquí, no podemos explotar esta posibilidad, sino siempre dar todas las etiquetas explícitamente. La omisión de etiquetas suele ser interesante únicamente para aquellos que trabajan sin un editor SGML.

      En resumen: en SGML, todo está delimitado.

  • Los elementos están delimitados por etiquetas de apertura y cierre.
  • Las etiquetas de apertura y cierre están delimitadas por paréntesis angulares.
  • Los valores de los atributos están delimitados por comillas simples o dobles.
  • Las referencias a entidades están delimitadas por un ampersand y un punto y coma.

      Esto es todo. Si entiendes las reglas descritas, no tendrás problemas para entender todos los ejemplos SGML de este documento.





4 Etiquetado básico de textos

      Un texto electrónico conforme al TEI consiste en el propio texto (transcrito de alguna fuente o creado en formato electrónico), precedido por un TEI header, que identifica el texto electrónico y puede también documentar las prácticas de etiquetado usadas en su creación. Todo está incluido dentro del elemento tei.2 y precedido por una declaración SGML que identifica el tipo de documento a usar para validar el documento.

      La declaración SGML no se describirá aquí. Más abajo trataré el encabezado TEI (TEI header) y las etiquetas especializadas para el material del front y del back del texto. Al trabajar con textos electrónicos, se pasa la mayoría del tiempo en el cuerpo (body) del propio texto, y por tanto empezaré con una descripción de las etiquetas necesarias para realizar un marcado básico del texto: párrafos y otras cosas similares a los párrafos, elementos del nivel de carácter o frase que aparecen dentro de párrafos, etc.

4.1 Párrafos

      Debemos marcar los párrafos con la etiqueta p. Los párrafos no se anidan y tampoco los elementos p. Por ejemplo:

 
       <p>I call specific attention to
       the authority given by the 21st Amendment
       to the Constitution to prohibit transportation
       or importation of intoxicating liquors into
       any State in violation of the laws of such
       State.</p>
       <p>I ask the wholehearted cooperation of all our
       citizens to the end that this return of individual
       freedom shall not be accompanied by the repugnant
       conditions that obtained prior to the adoption of
       the 18th Amendment and those that have existed
       since its adoption. Failure to do this honestly
       and courageously will be a living reproach to us
       all.</p>
       <p>I ask especially that no State shall by law
       or otherwise authorize the return of the saloon
       either in its old form or in some modern guise.</p>

[Este ejemplo, como la mayoría de los que no se identifican, es de la proclamación sobre la anulación de la Prohibición de Franklin D. Roosevelt, perteneciente a The Public Papers and Addresses of Franklin D. Roosevelt, vol. II (New York: Random House, 1938), pp. 510-514.]

4.2 Frases enfatizadas

      Las frases que están enfatizadas en la fuente (o deben estar enfatizadas en la salida), ya sea en cursiva, negrita, versalita u otro tipo, deben ir etiquetadas con el elemento hi. El atributo rend puede opcionalmente decir cómo está enfatizada la frase. En el ejemplo de abajo, la palabra whereas y la frase therefore, I, Franklin D. Roosevelt están impresas en versalita en la fuente:

 
       <p><hi rend='vers'>Whereas</hi> the
       Congress of the United States ... </p>
       <p><hi rend='vers'>Whereas</hi> Section 217(a) of
       the Act of Congress entitled "An Act ..." ...</p>
       <p><hi rend='vers'>Whereas</hi> it appears ...</p>
       <p>Now, <hi rend='vers'>therefore, I, Franklin
       D. Roosevelt</hi>, President of the United
       States of America ... do hereby proclaim that
       the Eighteenth Amendment to the Constitution of
       the United States was repealed on the fifth
       day of December, 1933.</p>

      El atributo rend puede omitirse si la apariencia no es de interés o si todas las frases enfatizadas aparecen el mismo modo. Sus valores puede elegirlos arbitrariamente el etiquetador —los valores usados, por tanto, pueden usarse a su vez para guiar el software de procesamiento para mostrar o procesar el elemento correctamente.

[Suele ser preferible marcar las frases con tipos de elementos que indiquen por qué están enfatizadas, en lugar de simplemente indicar que lo están. El esquema completo de etiquetado TEI define elementos que permiten identificar el énfasis tipográfico marcándolo como énfasis lingüístico (emph), como palabras en otros idiomas (foreign), como palabras en lenguajes especializados o no estándares (distinct), como términos técnicos (term), como glosas o explicaciones de términos (gloss) y como palabras mencionadas en lugar de usadas (mentioned). El elemento genérico hi se usa normalmente sólo cuando no es económica o intelectualmente factible usar una de las alternativas más informativas.]

4.3 Citas

      Debemos marcar las citas de otras obras o los diálogos pronunciados por los personajes en una obra en prosa con elementos q (quotation):

 
       <p><hi rend='vers'>Whereas</hi>
       Section 217(a) of the Act of Congress
       entitled "An Act ..." approved June 16,
       1933, provides as follows:
       <q>Section 217(a) The President shall
       proclaim the ... </q></p>

      Las citas aparte y las que van en medio de párrafos se distinguen únicamente por el valor de su atributo rend; para las primeras usamos el valor "block" o "display", para las otra usamos "inline".

[El esquema completo del TEI también ofrece un elemento quote que está restringido a citas reales de fuentes externas y, a diferencia de q no puede usarse para el estilo directo y las citas ficticias. También se ofrecen ahí, pero no aquí, los elementos cit, para citas acompañadas de las referencias bibliográficas a sus fuentes y soCalled, para material impreso entre comillas para indicar que el autor niega toda responsabilidad sobre esta..]

4.4 Referencias cruzadas

      Las referencias a otros documentos o a otros lugares en el propio documento deben marcarse con la etiqueta ref:

 
       WHEREAS <ref>Section 217(a) of
       the Act of Congress ... approved June
       16, 1933</ref>, provides as follows: ...

[El esquema completo define un elemento vacío llamado ptr para usarlo cuando la frase que hace referencia al otro documento o sección puede ser generada automáticamente por el programa, como suele hacerse en los sistemas de producción de documentos.]

      Para las referencias cruzadas dentro del mismo documento SGML debemos usar el atributo target para indicar a qué sección se está haciendo referencia; su valor es el valor del id asignado a otro elemento del documento. Por ejemplo, la siguiente referencia cruzada

 
       I there expressed the hope,
       and asked for united cooperation, that
       this return of individual freedom would
       not be accompanied by anti-social
       conditions, such as the saloon and the
       other evils of the pre-prohibition era.
       (See also <ref target='pc1993-10-11'>Press
       Conference of October 11, 1933, Item 137,
       this volume</ref>.)

asume la existencia de algún elemento en algún lugar del volumen con el identificador dado:

 
       <div id='pc1933-10-11'>
       <head>Press Conference, 11 October 1933</head>
       <!-- ... -->
       </div>

[Este ejemplo es de la nota de Public Papers que sigue a la proclamación de la anulación de la Prohibición.]

      Los elementos div y head usados en este ejemplo se describen más abajo.

4.5 Fines de página

      Si los fines de página de la fuente son interesantes, como suele ser en los materiales transcritos de ediciones impresas, debemos marcarlos usando el elemento pb. Este es un elemento vacío, esto es, no tiene ni contenido ni etiqueta de cierre. No marca un pasaje o fragmento de texto, sino simplemente un punto dentro del texto. El atributo n, definido para todos los elementos del TEI, debe usarse para indicar el número de página; si se transcriben números de página de más de una edición, se debe usar el atributo ed para distinguir las dos paginaciones:

 
       <p>I ask the wholehearted cooperation
       of all our citizens to the end that
       this return of individual freedom shall
       not be accompanied by the repugnant
       conditions that obtained prior to the
       <pb n='512' ed='1938'>
       adoption of
       the 18th Amendment and those that
       have existed  since its adoption....</p>

[Además de los fines de página, los fines de columna y de línea pueden ser de interés; el esquema completo del TEI define los elementos cb y lb para estos casos, así como el elemento genérico milestone para los límites y fines de cualquier tipo no previsto. Etiquetas específicas del encabezado TEI pueden describir cómo se usan estos elementos milestone en los esquemas de referencia estándar de la obra.]

4.6 Poesía

      Cada uno de los versos debe etiquetarse con l (eso es una "L"), las estrofas u otras estructuras de poema por encima del nivel del verso debe etiquetarse con lg (line group o grupo de líneas); en el caso de lg se puede usar opcionalmente el atributo type para identificar la estructura formal en cuestión, por motivos de recuperación u otros:

 
       <lg type='cuarteto'>
       <l>Awake! for Morning in the Bowl of Night</l>
       <l>Has flung the Stone that puts the Stars to Flight:</l>
       <l>And Lo! the Hunter of the East
       has caught</l>
       <l>The Sultan's Turret in a Noose of Light.</l>
       </lg>

[El ejemplo es de Rubáiyát of Omar Khayyám, traducción de Edward Fitzgerald (New York: Collier; Londres: Collier-Macmillan, 1962), primer cuarteto de la primera edición.]

      Cuando la sangría de los versos es significativa, puede marcarse usando el atributo global rend, con algún valor apropiado:

 
       <l rend='indent'>And Lo! the Hunter
       of the East has caught</l>
       <l>The Sultan's Turret in a Noose of Light.</l>

      Por supuesto, si el poema está citado de otro texto, los elementos l deben estar incluidos en un elemento q.

4.7 Teatro

      El teatro debe etiquetarse con los elementos sp (speech o parlamento) and stage (stage direction o acotación escénica). Las acotaciones escénicas pueden aparecer bien dentro de los parlamentos o bien entre éstos. Como puede observarse en el siguiente ejemplo, el hablante puede indicarse en el atributo who del elemento sp:

 
       <sp who='Casca'>
       <l>Speak, hands, for me!</l></sp>
       <stage>They stab Caesar.</stage>
       <sp who='Julius Caesar'>
       <l>Et tu, Brute? -- then fall, Caesar!</l>
       <stage>Dies.</stage></sp>

[El ejemplo pertenece a una reimpresión moderna de Julius Caesar, III.i: William Shakespeare, The Tragedy of Julius Caesar (New York: Airmont, 1965).]

      Cuando es importante la forma precisa de la referencia al hablante de la fuente, el hablante puede ser identificado con el elemento speaker al principio del elemento sp.

 
       <sp><speaker>Cas.</speaker>
       <l>Speak, hands, for me!</l></sp>
       <stage>They stab Caesar.</stage>
       <sp><speaker>Caes.</speaker>
       <l>Et tu, Brute? -- then fall, Caesar!</l>
       <stage>Dies.</stage></sp>

      Estas etiquetas pueden usarse también en otro material que no esté escrito en forma de teatro, pero que esté presentado siguiendo convenciones teatrales (p. ej. transcripciones de diálogos o conferencias de prensa):

 
       The brave men living and dead
       who struggled here have consecrated it
       far above our power to add or detract.
       <stage>[Applause.]</stage>
       <!-- ... -->
       and that Governments of the people,
       by the people, and for the people,
       shall not perish from the earth.
       <stage>[Long-continued applause.]
       </stage>

[Versión periodística de "Address Delivered at the Dedication of the Cemetery at Gettysburg", de Abraham Lincoln en The Collected Works of Abraham Lincoln, edición de Roy P. Basler, vol. VII (New Brunswick: Rutgers University Press, 1953), pp. 20-21. Dado que en este texto las acotaciones escénicas están siempre impresas entre corchetes, el etiquetador puede omitir los corchetes de la transcripción, anotando en la cabecera (header) que los elementos stage van siempre entre corchetes.]

      Del mismo modo que en poesía, si el texto teatral está citado de otro texto, debe estar incluido en un elemento q.

4.8 Referencias bibliográficas

      Las Referencias bibliográficas deben normalmente ir dentro de elementos bibl; dentro de estos elementos, o fuera de ellos, se puede usar title para marcar títulos de artículos, libro, periódicos, etc. Su atributo level tiene los valores A, M, J, S o U para indicar si el título es un título analítico (artículo), un título monográfico (libro), el título de un periódico, el de una serie o el de material no publicado como una tesis. Por ejemplo una referencia a: "Inaugural Address, March 4, 1933", en The Public Papers and Addresses of Franklin D. Roosevelt, vol. II (New York: Random House, 1938), pp. 510-514 se etiquetaría del siguiente modo:

 
       <bibl>
       <title level='A'>Inaugural Address,
       March 4, 1933</title>, in
       <title level='M'>The Public Papers and
       Addresses of Franklin D. Roosevelt
       </title>, vol. II
       (New York:  Random House, 1938), pp. 11-16.
       </bibl>

[Se han omitido de este conjunto básico de etiquetas las etiquetas para otros elementos bibliográficos, tales como autor, editor, editorial, etc. También se han omitido los elementos biblStruct y biblFull, que requieren entradas bibliográficas consistentemente estructuradas y son útiles cuando todos los artículos de una bibliografía deben estar correctamente estructurados (p. ej., para el procesamiento automático).]

4.9 Omisiones

      Si se ha omitido material de un texto electrónico (p. ej., porque es ilegible o no tiene interés para los futuros usuarios), la omisión debe indicarse normalmente por medio del elemento gap en el punto de omisión. Los atributos desc, reason y extent pueden usarse opcionalmente para describir qué se ha omitido, para explicar por qué y para dar un tamaño aproximado de esta, respectivamente. Por ejemplo:

 
       <p>
       Suppose I see two individuals approaching
       whose rank I wish to ascertain.  They are,
       we will suppose, a Merchant and a Physician,
       or in other words, an Equilateral Triangle
       and a Pentagon:  how am I to distinguish
       them?</p>
       <p><gap desc='geometric figure'
       reason='editorial policy'
       extent='ca. 14 lines'></p>
       <p>It will be obvious ... </p>

[Este ejemplo es deFlatland: A Romance of Many Dimensions, de Edwin A. Abbott (1884; rpt. New York: Dover, 1992), p. 19, extraído del capítulo 6, "Recognition by Sight."]
[El conjunto de etiquetas básico omite los elementos definidos en el conjunto de etiquetas estándar del TEI para marcar otros tipos de intervenciones del editor o alteraciones del autor en el texto, como supresiones, inserciones, correcciones o la no-corrección de errores, la normalización ortográfica, los textos ilegibles o diálogos inaudibles y el desarrollo de abreviaturas.]

4.10 Notas

      Las notas de un texto, ya sean notas al pie, al final o en medio del texto, deben etiquetarse con el elemento note. La situación puede indicarse, si se desea, en el atributo place. Las notas del autor pueden distinguirse de las del editor por medio del atributo resp, que indica quién es el responsable de la nota. Por ejemplo:

 
       <p>IN WITNESS WHEREOF,
       I have hereunto set my hand and caused
       the seal of the United States to be
       affixed.</p>
       <note resp='ed' place=inline><p>The 72d
       Congress, which
       convened following the 1932 election,
       passed the Twenty-first Amendment to the
       Constitution to repeal the Eighteenth
       Amendment.</p>
       <p> ... </p>
       </note>

      Las notas al pie y las finales deben transcribirse en su lugar de unión. Su número puede darse opcionalmente en el atributo n:

 
       ... have consecrated it
       far above our power<note place='foot' n=21>
       Philadelphia <title>Inquirer</title> has
       <q>our poor attempts</q> and Chicago
       <title level='J'>Tribune</title> has
       <q>our poor power.</q></note>
       to add or detract.

4.11 Listas

      Las listas deben etiquetarse usando los elementos list e item; el encabezado o título de la lista debe etiquetarse con un head. Se puede distinguir entre listas (numeradas), no ordenadas (con un símbolo), etc., por medio del atributo type. Por ejemplo:

 
       The President shall proclaim
       the date of
       <list type=ordered>
       <item n='(1)'>the close of the first fiscal
       year ending June 30 of any year after the
       year 1933, in which ..., or</item>
       <item n='(2)'>the repeal of the
       eighteenth amendment to the Constitution,
       </item>
       </list>
       whichever is the earlier.

      El esquema completo del TEI también define un elemento label para usarlo como una alternativa al uso del atributo n para aportar los número o símbolo de cada elemento (item).

4.12 ¿Qué falta?

      En las as notas de las secciones anteriores se han mencionado algunos de los elementos definidos en el conjunto completo de etiquetas del esquema del TEI, pero que se han omitido de esta versión básica. Además de las ya mencionadas, se han omitido aquí etiquetas para nombres propios y otras referencias a personas y lugares, direcciones, números, unidades de medida y cantidades, fechas y horas.

      El esquema completo también define conjuntos de etiquetas opcionales para enlaces hipertextuales, análisis o interpretación (incluyendo tantos los análisis literarios como los lingüísticos) del texto, transcripción del manuscrito, aparato crítico textual, tablas, imágenes y otros intereses especializados.





5 Estructura general del texto

5.1 Materia del Front, Body y Back

      Sobre todo, los textos se dividen en materia preliminar (front matter), cuerpo (body) y materia final (back matter), etiquetados como front, body y back, respectivamente. La materia preliminar y final se diferencian únicamente por su situación: pueden contener exactamente el mismo tipo de material. La estructura general de un libro común, por ejemplo, sería así:

 
       <text>
          <front>
             <!-- materia preliminar: portada,
             dedicatoria, prefacio, etc. -->
          </front>
          <body>
             <!-- cuerpo principal de la edición. -->
          </body>
          <back>
             <!-- materia final: índice,
             bibliografía, etc. -->
          </back>
       </text>

5.2 Divisiones textuales

      Dentro del cuerpo, o de la materia preliminar o final, el texto puede estar subdividido en divisiones textuales (partes, capítulos, secciones; actos, escenas; cantos, estrofas; etc.). Para estas divisiones, se debe usar el elemento div; las subsecciones se etiquetan con elementos div anidados. El atributo type puede usarse para indicar que la división tiene un nombre o tipo concreto; las siguientes divisiones tomaran el mismo valor del type a menos que se especifique un valor diferente. Dentro de una división textual, pueden aparecer párrafos o elementos del mismo nivel que los párrafos (p. ej., note, list).

 
       <div type='Section' n=1>
          <p>The eighteenth article of amendment
          to the Constitution of the United States
          is hereby repealed.</p>
       </div>
       <div n=2>
          <p>The transportation or importation
          into any State, Territory, or possession of
          the United States for delivery or use
          therein of intoxicating liquors, in
          violation of the laws thereof, is hereby
          prohibited.</p>
       </div>
       <div n=3>
          <p>This article shall be inoperative
          unless it shall have been ratified as an
          amendment to the Constitution by conventions
          in the several States, as provided in the
          Constitution, within seven years from
          the date of the submission hereof to the
          States by the Congress.</p>
       </div>

      En aquellos casos en que las divisiones textuales no tengan encabezados o consistentes en su valor del type y un número, no es necesario dar un encabezado, como se muestra en el ejemplo anterior. Si se desea, sin embargo, el encabezado puede darse de forma explícita:

 
       <div type='Section' n=1>
          <head>Section 1.</head>
          <p>The eighteenth article of amendment
          to the Constitution of the United States
          is hereby repealed.</p>
       </div>
       <div n=2>
          <head>Section 2.</head>
          <p>The transportation ...</p>
       </div>
       <div n=3>
          <head>Section 3.</head>
          <p>This article shall be inoperative
          unless ...</p>
       </div>

      Los encabezados en el ejemplo anterior son texto fijo (la palabra Section seguida del valor del atributo n), que cualquier programa de SGML relativamente inteligente puede generar automáticamente. En general, la gestión de documentos es más conveniente y los resultados más consistentes si dicho material no se transcribe como parte del texto, sino que es generado por un programa cuando el texto es mostrado o impreso. La inconsistencia de la fuente, por supuesto, puede ser de interés, en este caso deberá mantenerse explícitamente.

[El esquema completo de etiquetado del TEI incluye elementos específicos para antologías (textos que contienen otros textos), epígrafes, fechas, declaraciones de responsabilidad primaria (o bylines), salutaciones, firmas y grupos de encabezados, etc. al inicio o final de una división textual.]

5.3 Portadas

      El esquema de etiquetado TEI define etiquetas específicas para transcribir portadas, con el fin de asegurarse de que los programas de procesamiento puedan localizar e identificar fácilmente el autor, título y fecha del documento tal y como aparecen en su portada. La propia portada, y sus principales partes constitutivas, se ilustran es este ejemplo:

 
       <titlePage>
          <docTitle>
             <titlePart type='main'>The Public 
             Papers and Addresses of Franklin 
             D. Roosevelt</titlePart>
             <titlePart type='sub'>With a special 
             introduction and explanatory notes 
             by President Roosevelt</titlePart>
             <titlePart type='vol number'>
             Volume Two</titlePart>
             <titlePart type='vol title'>
             The Year of Crisis 1933</titlePart>
          </docTitle>
          <docImprint>
             <publisher>Random House</publisher>
             <pubPlace>New York</pubPlace>
             <docDate>1938</docDate>
          </docImprint>
       </titlePage>

      El elemento titlePart se usa tanto para las diferentes partes del título del documento (como se ha mostrado) como también para las diferentes partes de la portada que no son ni el título del documento ni el autor del documento ni información sobre la impresión.

[Además de las etiquetas mostradas aquí, el esquema completo del TEI define un elemento docEdition para etiquetar información como "segunda edición revisada y ampliada".]





6 El encabezado TEI

      El encabezado TEI (TEI header) permite a los usuarios de los textos electrónicos que tú crees encontrar qué texto es, quién lo creó (p. ej., tú) y de qué edición o ediciones fuente lo transcribiste. En su total expansión, también permite un recuento completo de cómo se llevó a cabo la trancripción (si se corrigieron los errores tipográficos sin indicar nada, si se desarrollaron las abreviaturas, si se normalizó la ortografía, etc.) y también permite incluir una descripción detallada del propio texto (datos de nacimiento y defunción del autor y de la audiencia, tema, género, etc.) y un completo historial de cambios, que es importante para la gestión del documento en proyectos grandes.

      Sin embargo, para los objetivos de este manual básico, lo más sencillo es copiar el siguiente encabezado TEI de forma mecánica y reemplazar el texto entre corchetes por la información aproximada sobre el texto que se va a etiquetar. Si el texto electrónico no se transcribe de una fuente preexistente, sino que se crea en forma electrónica, las etiquetas bibl del elemento sourceDesc se deben reemplazar por p.

 
       <teiHeader>
          <fileDesc>
             <titleStmt>
                <title>
                  [Put the title of the electronic 
                  text here.]
                </title>
             </titleStmt>
             <publicationStmt>
                <p>
                  [Indicate who is publishing 
                  this electronic text (i.e. you).]
                </p>
             </publicationStmt>
             <sourceDesc>
                <bibl>
                  [Indicate the source from 
                  which this etext is transcribed.]
                </bibl>
             </sourceDesc>
          </fileDesc>
       </teiHeader>

      Por ejemplo, el encabezado TEI de este documento sería así:

 
       <teiHeader>
          <fileDesc>
             <titleStmt>
                <title>Bare Bones TEI:  A Very 
                Very Small Subset of the TEI 
                Encoding Scheme</title>
             </titleStmt>
             <publicationStmt>
                <p>Published electronically by 
                the Text Encoding Initiative, 
                Chicago and Oxford, in 1994.</p>
             </publicationStmt>
             <sourceDesc>
                <p>This text was created 
                in electronic form.</p>
             </sourceDesc>
          </fileDesc>
       </teiHeader>

6.1 Lo que te pierdes

[Aquí no se describen las posibilidades del encabezado TEI para señalar:

  • la descripción bibliográfica completa del texto electrónico (nombre de la edición, información de la serie, indicaciones completa de quién es el responsable de esta, identificación de la editorial, distribuidora, restricciones de su disponibilidad, precio, etc.
  • la descripción bibliográfica completa de la fuente, incluyendo la identificación de fuentes no textuales como cintas de audio.
  • la documentación de cómo se etiquetó el texto: naturaleza del proyecto, política de muestreo del corpus, prácticas editoriales, las etiquetas SGML usadas, reconocimiento de los criterios de utilización de las etiquetas, cómo se mostrarán las etiquetas usadas (p. ej., "a no ser que se indique otra cosa, los términos de los glosarios irán impresos en cursiva y en el margen izquierdo"), documentación de las notaciones especializadas que se usan para indicar las anotaciones sobre la estructura del rasgo, el análisis métrico o el aparato crítico textual.
  • la caracterización del texto en términos no bibliográficos: cuándo y cómo se creó, los idiomas usados, la clasificación según el tema o el tipo de texto, datos de nacimiento y defunción del autor (o de los hablantes en el caso de materiales de audio).
  • el historial de cambios que indica las modificaciones que ha sufrido el texto electrónico.

Todas estas posibilidades están presente en el encabezado completo; pueden no estar todas definidas en el TEI Lite.]





7 Lo juntamos todo

      Un texto electrónico codificado según el TEI siempre va etiquetado con un elemento tei.2, quien a su vez contiene un elemento teiHeader seguido de un elemento text. La estructura general es esta:

 
       <tei.2>
          <teiHeader>
            <!-- información del TEI header ... -->
          </teiHeader>
          <text>
            <front> <!-- ... --> </front>
            <body>  <!-- ... --> </body>
            <back>  <!-- ... --> </back>
          </text>
       </tei.2>

      La etiqueta de inicio del elemento tei.2 va precedida de un referencia explícita al archivo externo que contiene la definición del tipo de documento que se aplica al texto por medio de un programa de SGML. La DTD recortada y simplificada que se describe aquí puede invocarse con la siguiente declaración del tipo de documento:

 
       <!DOCTYPE tei.2 SYSTEM 'barebone.dtd'>

      En algunos sistemas, la asociación de un documento con un tipo de documento dado es tratada de forma interna y dicha declaración explícita no es visible hasta que el documento es "exportado" del sistema. En dichos sistemas, al usuario se le pedirá que seleccione una archivo de "reglas" o "lógico" cuando se crea el documento por primera vez o cuando es importado al editor.





8 Un ejemplo completo

      Este es un documento pequeño, pero completo, etiquetado según el conjunto de etiquetas declarado aquí:

 
       <tei.2>
 
          <teiHeader>
             <fileDesc>
                <titleStmt>
                   <title>Bare-bones Sample 
                   of Bare-bones Tagging</title>
                </titleStmt>
                <publicationStmt>
                   <p>An unpublished document.</p>
                </publicationStmt>
                <sourceDesc>
                   <p>This document created in 
                   electronic form.</p>
                </sourceDesc>
             </fileDesc>
          </teiHeader>
 
          <text>
             <body>
                <p>The world's shortest TEI document.</p>
             </body>
          </text>
 
       </tei.2>




9 Un ejemplo más interesante

      Un ejemplo un poco más realista de etiquetado básico of la transcripción abreviada de la proclamación de Franklin D. Roosevelt de que se ha anulado la Prohibición (p. ej., la prohibición del alcohol, impuesta en los Estados Unidos por la adopción de la 18ª Enmienda de la Constitución). En el siguiente ejemplo, la estructura general es la que se usaría si se transcribieran los Public Papers de Roosevelt completos o una selección de varios de ellos.

 
<tei.2>

      El encabezado identifica el texto electrónico y da la fuente de donde se ha hecho.

 
       <teiHeader>
         <fileDesc>
           <titleStmt>
             <title>Proclamation of the 21st Amendment:
             an Electronic Version</title>
           </titleStmt>
           <publicationStmt>
             <p>Published by the TEI as a specimen of tagged
             text.</p>
           </publicationStmt>
           <sourceDesc>
             <bibl><title level='M'>The Public Papers and Addresses 
             of Franklin D. Roosevelt </title>, vol. II (New York: 
             Random House, 1938).  <!-- here we transcribe only
             <title level='A'>The President Proclaims the Repeal of 
             the Eighteenth Amendment. Proclamation No. 2065.
             December 5, 1933</title>, pp. 510-514.  --> </bibl>
           </sourceDesc>
         </fileDesc>
       </teiHeader>

      El elemento text contiene la transcripción real.

 
       <text>
         <front>
           <titlePage>
             <docTitle>
               <titlePart type='main'>The Public Papers and 
               Addresses of Franklin D. Roosevelt</titlePart>
               <titlePart type='sub'>With a special 
               introduction and explanatory notes by 
               President Roosevelt</titlePart>
               <titlePart type='vol number'>Volume Two</titlePart>
               <titlePart type='vol title'>The Year of 
               Crisis 1933</titlePart>
             </docTitle>
             <docImprint>
               <publisher>Random House</publisher>
               <pubPlace>New York</pubPlace>
               <docDate>1938</docDate>
             </docImprint>
           </titlePage>
           <div type='copyright page'> <!-- ... --> </div>
           <div type='notice'> <!-- ... --> </div>
           <div type='table of contents'> <!-- ... --> </div>
         </front>

      El cuerpo del texto electrónico es una serie de elementos div.

 
       <body>
           <div n=1 type='speech'>
             <head>Inaugural Address.</head>
             <head type='date'>March 4, 1933</head>
             <!-- ... -->
           </div>
 
           <div n=2 type='Proclamation'>
             <head>The President Calls the Congress
             into Extraordinary Session.</head>
             <head type='docno'>Proclamation No. 2038.</head>
             <head type='date'>March 5, 1933</head>
             <!-- ... -->
           </div>
 
           <!-- ... etc. -->

      La anulación de la 18ª Enmienda es el artículo nº 175 de este volumen.

 
       <div n=175 type='Proclamation'>
         <head>The President Proclaims the Repeal
         of the Eighteenth Amendment.</head>
         <head type='docno'>Proclamation No. 2065.</head>
         <head type='date'>December 5, 1933</head>
 
         <p><hi rend='sc'>Whereas</hi> the Congress 
         of the United States in 2d Session of the 
         72d Congress, begunat Washington on the fifth 
         day of December in the year one thousand nine
         hundred and thirty-two, adopted a resolution in 
         the words and figures following, to wit &mdash;</p>

      En este punto la resolución del Congreso se cita en su integridad. Tiene su propio título y división en párrafos e incluye a su vez el texto completo de otro documento, que se convirtió en la 21ª Enmienda. Como Franklin D. Roosevelt está citando la resolución, la etiquetamos con una q. Dentro de la q hay un elemento text. La q se muestra como una cita en bloque aparte con comillas al principio y al final, y comillas de apertura al comienzo de cada párrafo.

 
       <q rend='display, quoted paras'>
         <text>
           <body>
             <head rend='caps'>Joint Resolution</head>
             <head type='sub'>Proposing an amendment to 
             the Constitution of the United States.</head>
             <p>Resolved by the Senate and House of
             Representatives of the United States of America
             in Congress assembled (two-thirds of each House
             concurring therein), That the following article
             is hereby proposed as an amendment to the
             Constitution of the United States, which shall
             be valid to all intents and purposes as part of
             the Constitution when ratified by conventions
             in three-fourths of the several States:

      Aquí está el comienzo del texto de enmienda embebido:

 
       <q>
         <text>
           <body>
             <head rend='caps'>Article</head>
             <div type='Section' n=1>
               <p>The eighteenth article of amendment
               to the Constitution of the United States
               is hereby repealed.</p>
             </div>
             <div n=2>
               <p>The transportation or importation
               into any State, Territory, or possession of
               the United States for delivery or use
               therein of intoxicating liquors, in
               violation of the laws thereof, is hereby
               prohibited.</p>
             </div>
             <div n=3>
               <p>This article shall be inoperative
               unless it shall have been ratified as an
               amendment to the Constitution by conventions
               in the several States, as provided in the
               Constitution, within seven years from
               the date of the submission hereof to the
               States by the Congress.</p>
             </div>
           </body>
         </text>
       </q>

      Aquí está el final del texto de enmienda embebido:

 
           </body>
         </text>
       </q>

      Y aquí, el final de la cita de la resolución del Congreso.

 
       <p><hi rend='sc'>Whereas</hi> Section 217(a) of
       the Act of Congress entitled <title>An Act
       to encourage national industrial recovery,
       to foster competition, and to provide for
       the construction of certain useful
       public works, and for other purposes</title>
       approved June 16, 1933, provides as follows:

      Aquí tenemos una cita dentro de un párrafo, que contiene a su vez un párrafo con una lista embebida.

 
         <p>
           <q>
             <p>Section 217(a) The President
             shall proclaim the date of
             <list type=ordered>
               <item n='(1)'>the close of the first fiscal
               year ending June 30 of any year after the
               year 1933, during which the total receipts
               of the United States (excluding
               public-debt receipts)exceed its total
               expenditures (excluding public-debt
               expenditures other than those
               chargeable against such receipts),
               or</item>
               <item n='(2)'>the repeal of the
               eighteenth amendment to the Constitution,
               </item>
             </list>
             whichever is the earlier.</p>
           </q>
         </p>
 
         <p><hi rend='sc'>Whereas</hi> it appears from
         a certificate issued December 5, 1933, by the
         Acting Secretary of State that official notices
         have been received by the Department of State
         that on the fifth day of December, 1933,
         Conventions in thirty-six States of the
         United States, constituting three-fourths of
         the whole number of the States had ratified the
         said repeal amendment:</p>
 
         <p>Now, <hi rend='sc'>therefore, I, Franklin
         D. Roosevelt</hi>, President of the United
         States of America pursuant to the provisions
         of Section 217(a) of the said Act of June 16,
         1933, do hereby proclaim that
         the Eighteenth Amendment to the Constitution of
         the United States was repealed on the fifth
         day of December, 1933.</p>
 
         <p><hi rend='sc'>Furthermore</hi>, I enjoin
         upon all citizens of the United States and
         upon others resident within the jurisdiction
         thereof, to co-operate with the Government
         in its endeavor to restore greater respect
         for law and order, by confining such purchases
         of alcoholic beverages as they may make
         solely to those dealers or agencies which
         have been duly licensed by State or Federal
         license.</p>
 
         <!-- ... -->
 
         <p>I call specific attention to
         the authority given by the 21st Amendment
         to the Constitution to prohibit transportation
         or importation of intoxicating liquors into
         any State in violation of the laws of such
         State.</p>

         <p>I ask the wholehearted cooperation of all our
         citizens to the end that this return of individual
         freedom shall not be accompanied by the repugnant
         conditions that obtained prior to the adoption of
         the 18th Amendment and those that have existed
         since its adoption.  Failure to do this honestly
         and courageously will be a living reproach to us
         all.</p>

         <p>I ask especially that no State shall by law
         or otherwise authorize the return of the saloon
         either in its old form or in some modern guise.
         </p>
 
         <!-- ... -->
 
         <p><hi rend='sc'>In witness whereof</hi>,
         I have hereunto set my hand and caused
         the seal of the United States to be
         affixed.</p>

         <note resp='ed' place=inline>
           <p>The 72d Congress, which convened following 
           the 1932 election, passed the Twenty-first 
           Amendment to the Constitution to repeal the 
           Eighteenth Amendment.</p>

           <p> <!-- ... --> </p>
         </note>
 
       </div>

      Aquí está el final de la proclamación de anulación. A partir de aquí, la transcripción continua del mismo modo, hasta el final del volumen.

 
             <!-- ... -->
           </body>
         </text>
       </tei.2>




10 ¿Y qué Software?

      Los documentos creados usando el conjunto de etiquetas descrito aquí pueden ser creados:

  • usando un editor de SGML como SoftQuad's Author/Editor o ArborText's Adept o DataLogic's EditStation o el editor de dominio público emacs, para el que se ha construido un modo especializado para editar SGML (psgml.el). (Si usas emacs, encontrarás psgml.el en las fuentes normales del material sobre emacs. Los otros programas están disponibles por sus proveedores.)
  • usando un editor estándar o un procesador de textos, tecleando los paréntesis angulares, etc. como se observa en los ejemplos aquí mostrados. Trabajar de este modo requiere que guardes el archivo en modo "ASCII", de otro modo, el marcado propietario de tu procesador de textos se entremezclará
  • usando un procesador de textos estándar con una herramienta de ampliación para traducir los documentos del formato propio de tu procesador de textos a SGML.

De todos estos, el primero y el tercero son más convenientes para la mayoría de los usuarios, mientras que el primero y el segundo son más fiables para producir SGML válido. La principal dificultad con el tercer método es que la traducción mecánica de un procesador de textos a SGML suele ser posible sólo para conjuntos de etiquetas SGML muy restringidos y es sólo fiable si los documentos han sido creados con un uso extraordinariamente disciplinado de la herramienta de hojas de estilo del procesador de textos. Cualquier usuario interesado en aprender SGML probablemente lo hará mejor con un editor de SGML.

      Una vez creados, los documentos SGML pueden procesarse con una gran cantidad de herramientas comerciales y de dominio público. Aquí no es posible realizar un listado completo; cuando se escribe esto, el resumen más conveniente de SGML software es el Whirlwind Guide to SGML Tools mantenido pro Steve Pepper de Oslo y disponible en Internet vía ftp en ftp.uio.no (si no sabes de ftp o si todo es párrafo parece un rollo técnico, consulta tu centro de informática, o una de las muchas guías recientes de Internet para usuarios que no tengan soporte de un centro de informática). La herramienta de dominio público más popular es el programa sgmls, creado por James Clark en función de los materiales creados por Charles Goldfarb. Usar sgmls para procesar los documentos SGML implica normalmente programas de escritura para leer su formatos estándar de salida, pero puede usarse por no programadores para comprobar la validez de sus documentos SGML. (Si quieres hacer esto, busca en el servidor del TEI los archivos por lotes (batch files) para DOS, los shell scripts para Unix o el equivalente para tu sistema, que simplifican la tarea de instalar y arrancar sgmls como validador. Si encuentras dificultades, pide ayuda a la TEI-L.) Un gran número de herramientas de SGML también usan sgmls como un pre-procesador, por lo que adquirir una copia de sgmls tiene sentido incluso para aquellos que no tiene la intención de hacer programas.





11 Resumen del subconjunto básico del TEI

11.1 Elementos del subconjunto básico del TEI

      Las etiquetas incluidas en este TEI Básico son:

  • Etiquetas del encabezado TEI (no explicadas; usadas de forma mecánica)
    • teiHeader
    • fileDesc
    • titleStmt
    • title
    • publicationStmt
    • sourceDesc
  • Párrafos y otros elementos de cantidad considerable
    • p
    • note
    • list, item, head
  • Poesía y Teatro
    • l
    • lg
    • sp
    • stage
  • Variado
    • hi
    • q
    • ref
    • pb
    • gap
  • Referencias bibliográficas
    • bibl
    • title
  • Estructura general del texto
    • tei.2
    • text
    • front
    • body
    • back
    • div, head
  • Portadas
    • titlePage
    • docTitle, titlePart
    • docAuthor
    • docDate
    • docImprint

11.2 Declaraciones formales

      El subconjunto básico del TEI es un subconjunto recortado del esquema de marcado del TEI tal y como se publicó: los textos creados con este esquema básico conforman la DTD publicada del TEI. El subconjunto está definido únicamente por medio de la supresión de elementos que están normalmente disponibles en los documentos TEI. Esta supresión se llevó a cabo por un fragmento de la DTD disponible en los archivos del servidor del TEI bajo el nombre de bb.ent (bare-bones entities o entidades básicas).


Subir / Up


Contact: DHWorkgroup