Procesadores de documentos

¿Qué problema hay con el formato .doc?

En lo siguiente sigo el artículo de Jordi Mas y las páginas donde Sun defiende el uso del software libre y de los estándares abiertos, en OpenOffice

  1. Es el complicado resultado de una larga cadena de parches y actualizaciones de un formato original

    Dice Jordi Mas

    Existen muchas variedades de versiones del formato .doc, incluso Microsoft ha tenido problemas de compatibilidad entre diferentes versiones de su propio producto. Cuando la empresa de Bill Gates introdujo una variante del formato .doc con la versión del Word 97 resultaba imposible compartir documentos con versiones de anteriores del mismo producto.

    De hecho, el formato .doc, como muchas de las tecnologías en Windows, arrastran una complejidad excesiva debido al número de versiones y ampliaciones con el que deben mantener compatibilidad. El .doc es un formato de intercambio de documentos difícil de interpretar por otras aplicaciones debido a su innecesaria complejidad, si lo comparamos, por ejemplo, con cualquier formato basado en el estándar XML como el de OpenOffice o AbiWord.

  2. Serios problemas de portabilidad de los documentos: ¿cómo ver documentos en Beos, Mac, Solaris, Linux y resto de Unixes?

  3. La presentación de los documentos varía de una máquina a otra y favorece errores de diseño de página/tipográficos en los usuarios; no respeta adecuadamente la distinción lógica entre forma, contenido y metainformación

  4. Es propietario y Microsoft puede modificarlo cuando quiera que compremos una nueva versión

    Dice Sun

    Open and free licensing guarantees that you are not at the mercy of a single company for improvements and fixes of the format or its supporting software, thus providing very strong protection for all investments and efforts you put into this format.

  5. Es cerrado y no sabemos qué información contiene

    Jordi Mas:

    (…) aún es más preocupante el hecho de que Microsoft Word almacena un identificador único que permite determinar con gran precisión el PC que ha creado el documento, éste es el sistema que por ejemplo se utilizó para determinar el autor del virus Melissa.

  6. Es inseguro porque admite código ejecutable

    Sigue Jordi

    Otro problema importante del formato .doc es que su lenguaje de macros es una fuente inagotable para la transmisión de virus informáticos debido a la debilidad de su modelo de seguridad.

  7. No hay analizadores (parsers) ni admite validación. Ante un error no hay manera de saber qué está pasando.

  8. Ha sido superado por XML; si Microsoft lo mantiene es por cuestión comercial (dominación del mercado), no porque lo considere válido. Se dice incluso que el formato ‘nativo’ de la próxima versión de MS Office será XML.

Uso de AbiWord para crear un fichero .doc

Se va a crear el fichero s2.doc

El objetivo es comprobar las posibilidades y las limitaciones de la versión actual de la aplicación (rápidamente descubren los problemas con las tablas, la edición de fórmulas matemáticas…)

Uso de swrite de OpenOffice para abrir un fichero creado con MS Word

Los profesores abrirán un fichero cualquiera creado con MS Word y se examinará en común el nivel de éxito en la conversión.

Cada profesor utilizará el editor para experimentar sus recursos relativos a la materia que imparte (posible esbozo de un examen).

Independizándonos de Word: más allá

Se ofrece a los profesores una panorámica rápida de las posibilidades de los recursos libres más avanzados.

Jugando con LyX

El más sencillo de utilizar es LyX (véase Figura 3.1. Ejemplo de uso de LyX).

Figura 3.1. Ejemplo de uso de LyX

Ejemplo de LyX

Se generará un pequeño documento con la clase Book y varios capítulos.

Cosas que pueden hacerse con LaTeX

LaTeX es el hermano mayor de LyX y realmente es un programa de composición de documentos con resultados tipográficamente asombrosos, sobre todo en lo que refiere a expresiones matemáticas (y tengo que señalar que el fonética/fonología). No podemos entrar aquí más que en mostrar unos cuantos ejemplos de su uso.

Figura 3.2. Ejemplo matemático con LaTeX

Ejemplo matemático

Figura 3.3. Ejemplo musical con LaTeX

Ejemplo musical

DocBook XML

El documento que está usted leyendo se ha creado en formato DocBook XML. Quizás sea instructivo examinar cómo está escrito el fragmento anterior (“Creación local y subida con ftp”) sobre el uso de ftp:


<para>
  Teclee las siguientes instrucciones e intente comprender los
  mensajes que devuelve el ordenador. ¿Todas las instrucciones
  transcritas son necesarias?
</para>
<screen>
   <prompt>[Máquina_local]$ </prompt><userinput>mcedit s1.txt</userinput>
   <prompt>[Máquina_local]$ </prompt><userinput>ftp linux1</userinput>
   <prompt>linux1 ftp> </prompt><userinput>cd Curso_Linux</userinput>
   <prompt>linux1 ftp> </prompt><userinput>pwd</userinput>
   <prompt>linux1 ftp> </prompt><computeroutput>Curso_Linux</computeroutput>
   <prompt>linux1 ftp> </prompt><userinput>put s1.txt</userinput>
   <prompt>linux1 ftp> </prompt><userinput>quit</userinput>
</screen>  
                                                                            
	  

DocBook lleva más allá la separación entre el contenido y la presentación. Se pretende que el autor sólo se preocupe del valor semántico del texto y queel contenido pueda puede ser leído por una máquina. El original es independiente de la presentación, que es modificable mediante hojas de estilo. El presente texto, tanto si está bajo la forma de texto .html como en forma impresa, es un ejemplo de la salida de DocBook con una hoja de estilo propia.