Secciones bajar

Etiquetando automáticamente noticias

Por RAÚL RIVERO (SOITU.ES) *
Actualizado 28-10-2008 19:53 CET

Una de las máximas que tenemos en MET es que todo aquello que pueda hacer una máquina, que lo haga. Es una pena que trabajos repetitivos o que acarreen manejar cientos/miles de datos los intente hacer un humano. Como siempre, para todo hay excepciones y seguro que a ti ya se te han ocurrido unas cuantas. Allá cada uno :).

Pongámonos en situación. Uno de nuestros periodistas acaba de terminar una noticia superchula pero, como siempre, antes de publicarla debe etiquetarla. ¡Uops! Lo que pasará a continuación es que se quedará quieto, con la mirada clavada en la pantalla, pero sin mirar a ningún sitio, y con cara de estar pensando mucho-mucho.

Parece una broma pero no lo es, intentar resumir en 3 ó 4 conceptos todo un artículo y, a fin de cuentas, clasificarlo perfectamente es una buena tarea para un documentalista, ni que decir tiene para alguien que no es técnico en la materia. Hacerlo mal implicaría que alguien interesado en la temática no encontrará la noticia y, por tanto, se perderá. Hacerlo bien ayudará a tener grandes sacos de información con temáticas perfectamente acotadas y los usuarios podrán elegir/encontrar lo que les interesa de una manera muy sencilla.

¿Qué podemos hacer nosotros [MET]? Ayudarle y aconsejarle sobre los temas que creemos que trata en esa noticia que acaba de terminar. Tenemos más de 250.000 noticias, supuestamente clasificadas y, por tanto, un sistema entrenado :) que puede aconsejar sobre temáticas e inferir etiquetas.

¿Funciona? Pues sí. Es una máquina pero si se le da un texto lo suficientemente descriptivo, lo hace bastante bien. Bueno, ya sabéis, o no :) pero, si no lo consigue, estaríamos como al principio, sin ninguna ayuda.

Nuevo servicio

Por tanto, hoy liberamos un nuevo servicio que sugiere el etiquetado de un artículo partiendo de un resumen del mismo. El motor de inferencia es el mismo usado para aconsejar a Redacción en nuestros editores.

Tened en cuenta que:

  • Es una máquina aconsejando.
  • Las etiquetas siguen las normas de etiquetado de soitu.es.
  • Se irá perfeccionando poco a poco pero, con 250.000 noticias, nosotros lo usamos en producción.
  • Una revisión humana no está de más pues el texto introducido puede llevar al sistema a meter cierto ruido o descartar etiquetas válidas.

En un futuro próximo habrá una API que os permita acceder a este servicio pero, por ahora, debéis hacerlo desde esta página web (para la que hará falta que estéis autenticados en soitu.es):

http://www.soitu.es/soitu/met/inferirtags.pl


ACTUALIZACIÓN del 28/10/2008: ya existe un acceso mediante API para recuperar las recomendaciones de esta herramienta.


* Raúl Rivero es el director técnico de soitu.es


PS: no intentes etiquetar automáticamente esta noticia, no funcionará. Cualquier párrafo del artículo no es significativo y no resume el espíritu del mismo. Hay que pensar... :).

Temas relacionados

Selección de temas realizada automáticamente por Autonomy

Di lo que quieras

Aceptar

Si quieres firmar tus comentarios puedes iniciar sesión »

En este espacio aparecerán los comentarios a los que hagas referencia. Por ejemplo, si escribes "comentario nº 3" en la caja de la izquierda, podrás ver el contenido de ese comentario aquí. Así te aseguras de que tu referencia es la correcta. No se permite código HTML en los comentarios.

Di lo que quieras

Lo sentimos, no puedes comentar esta noticia si no eres un usuario registrado y has iniciado sesión.
Si ya lo estás registrado puedes iniciar sesión ahora.

Volver a met Volver a portada
subir Subir al principio de la página