miércoles, abril 28, 2010

Otro "bonito" ejemplo que parece sacado de un traductor automático...

...y que refleja el problema de las homografías y términos multicategoriales. Si así fuera, la postedición debería ser un requisito obligado para cualquier publicación de resultados de sistemas de TA, sea en el medio que sea.

En el blog lafragua tenéis el caso.

No obstante, ni Google Traductor, ni el sistema del Instituto Cervantes, ni el de Lucy Software, ni Babel Fish, que si no me equivoco utiliza Systran para alguno (si no todos) de sus pares de lenguas, ni Opentrad ofrecen este resultado. ¿Será que un humano también puede sucumbir a las ambigüedades categoriales de la lengua?

  • Google Traductor:
    1. Español: Conservas: Delicias del mar
    2. Inglés: Canned: Sea Delights

  • Instituto Cervantes:
    1. Español: Conservas: Delicias del mar
    2. Inglés: Conserves: Delicias of the sea

  • Lucy Software:
    1. Español: Conservas: Delicias del mar
    2. Inglés: Preserves: Delights of the sea

  • Babel Fish / Systran:
    1. Español: Conservas: Delicias del mar
    2. Inglés: Conserves: Delights of the sea

  • Opentrad:
    1. Español: Conservas: Delicias del mar
    2. Inglés: Conserves: Delights of the sea

Curioso también que sólo las dos últimas traducciones coincidan...

Concurso de Literatura Multimedia Bubok

Bubok, empresa dedicada a la publicación de libros electrónicos, ha convocado su I Concurso de Literatura Multimedia.

Al enterarme de la noticia por medio de su blog y leer las bases del concurso un alud de ideas de fusión de tópicos literarios y tópicos digitales arrasaron mi mente: interacción entre redes sociales, elementos multimedia, aplicaciones de web 2.0, de web semántica, opciones de creación individual y/o colaborativa...

Y entonces recordé que hace poco descubrí en Libros y bitios un bonito ejemplo, no de creación literaria, pero sí de innovación de presentación y soporte: La fábula del cuervo huidizo, de La Fontaine, que me resultó realmente inspirador y, sobre todo, realmente original.

Ambas propuestas, tanto la de creación de literatura multimedia como la de adaptación a los nuevos medios de obras consagradas me resultan realmente sugerentes y con unas posibilidades infinitas.

Afortunadamente, aún nos queda mucho por inventar :-)

La molesta barra de traducción automática de Google...

No creo ser la única que ha tenido que enfrentarse al último regalo de Google instalado en su navegador: la barra de traducción automática para páginas web. He de reconocer que las aplicaciones de Google me encantan y soy una fan de su sistema de traducción automática. No obstante, creo que en esta ocasión han menospreciado al usuario.

En el mundo cada vez más multilingüe en el que vivimos, no sólo las aplicaciones, las empresas o las páginas web se manifiestan en diferentes idiomas, también las personas hemos experimentado ese cambio y cada vez son (somos) más loas bilingües, trilingües o incluso políglotas.

Así, dejando de lado aspectos más técnicos como su interferencia en la navegación o la dificultad para desinstalarla, creo que desde Google deberían tener en cuenta un aspecto más en la mejora de su barra de traducción: las lenguas que conoce de antemano el internauta y de las que no necesitará traducción en ningún caso.

Un pequeño formulario tras la instalación de la barra informando al usuario de la nueva actualización y solicitándole que indique en qué lenguas no desea que se aplique este servicio podría resultar realmente agradable al navegante que, cuando "surfee" por una página en una lengua que conoce seguirá disfrutando tan ricamente de su contenido, y cuando acceda a una página en bielorruso automáticamente se le ofrecerá traducción gratuita.

Si eres de los que aún luchas cada día con esta barra teniendo que desactivar la opción de traducción al visitar una página nueva en otra lengua, la información que recoge a este respecto el Foro de ayuda de Google te podrá ayudar.

1st Workshop on Computational Approaches to Subjectivity and Sentiment Analysis

Primer taller sobre aproximaciones computacionales a la subjetividad y al análisis de sentimientos (WASSA 2010).

Parece ser que una de las aplicaciones prácticas del PLN más de moda en la actualidad es la de analizar opiniones, pareceres y sentimientos a través de los elementos que conforman el discurso escrito de los internautas.

Por lo que leo en la descripción del encuentro, las aportaciones que se esperan para el taller irán en la siguiente línea:
  1. Recuperación y organización de la información pertinente para el objeto de estudio
  2. Análisis computacional pragmático y semántico de los elementos lingüísticos que puedan manifestar opiniones subjetivas y sentimientos, ayudándose, incluso, de las aplicaciones de la web semántica
  3. Creación de amplios córpora estructurados y anotados (lingüística de corpus) que aporten datos fiables a los sistemas de minería textual de opiniones.
Es decir, un claro ejemplo de interacción de diferentes técnicas que conforman el actual panorama de la ingeniería lingüística para la obtención de resultados orientados a aplicaciones prácticas.

Estaremos al tanto de los resultados que se obtengan, y confiemos en que sean buenos, pues a más de uno le convendría un buen análisis objetivo de los sentimientos y opiniones que se manifiestan en sus discursos...

martes, abril 27, 2010

Y la vida siguió...

...como siguen las cosas que no tienen mucho sentido. Y casi cinco años después, la tecnofilología volvió a despertar. Esperemos que esta vez no se apague la llama tan pronto.