A blog about data, information and IT, by Mario Alberich

Oct 11
2007

Propuestas para un sistema de tagging - 1


Morfología del tag

Uno de los aspectos clave que para mí debe ofrecer un sistema de organización de tags es la capacidad para indicar al sistema que el tag en sí no es un término a secas, sino que se trata de un conjunto interpretable morfológicamente.

La morfología de un tag puede venir por una estructura de este estilo:

[prefijo][contexto][concepto][sufijo]

Por ejemplo:

**geo:country=spain(?)

El análisis morfológico para el sistema indicaría lo siguiente:

  • **: Es un prefijo que podría indicar la importancia (dos estrellas) de esa etiqueta en el conjunto, aunque podría indicar otras cosas.
  • geo: Se nos está indicando una información de tipo geográfico.
  • country: En esencia es lo equivalente a un campo de formulario. Aunque a nivel documental, podemos considerarlo una faceta.
  • (?): Indicaría las garantías de veracidad de la información, aunque también podría indicar otro tipo de modificadores.

Esto no es especialmente novedoso: se denominan machine tags, concepto que ya disponde de un site propio, aunque otros lo llaman triple tags.

El concepto no nada es innovador, aunque es valiente que sitios como Flickr hayan activado estas funcionalidades (por lo que se ve en geobloggers, hace casi dos años).

Documentalistas e informáticos están habituados (de un modo u otro) a este tipo de gestión de la información. Los primeros por el constante trabajo con los metadatos, aunque con una sintaxis diferente. Los segundos, porque en el momento de compilar programas (especialmente en entornos Unix) aparecen las flags, que son opciones de configuración, algunas de las cuales incluyen parámetros y valores.


Aplicabilidad de los tags

También existen trabajos como el del análisis de tags emocionales y operativos realizado por Margaret E. Kipp, que nos indica que el etiquetado no sólo es un lenguaje no controlado, sino también algo más íntimo y/o operativo. No queda claro cuál es la causa y cuál el efecto: es incontrolado porque es personal, o se hace personal por hacerse incontrolado.

Lo que aflora a la vista de las posibilidades indicadas por Kipp es que la falta de control no significa que exista una falta de criterio, sino que simplemente los criterios no están consensuados, ni objetivados.

Cuando es un servicio ajeno a nuestro entorno local de trabajo (un servicio web como del.icio.us) el que ofrece esas funcionalidades, es comprensible que los sistemas de etiquetado y anotaciones (como las que ofrece diigo) sirven para contentar y satisfacer gran cantidad de necesidades.


Vivo en la red, trabajo en mi ordenador

Sin embargo, hay que dar un paso más: aunque los servicios hayan nacido en la web social, cada vez existe un mayor interés en poder disponer de los datos off-line, en el propio disco duro o en el teléfono móvil, y sincronizarlos cuando sea preciso.

Ante este paso adelante, el tagging no sólo sirve para el etiquetado de los recursos ajenos, sino también los personales: la lista de tareas pendientes, la agenda, los contactos, los correos electrónicos, los documentos propios, los favoritos (o en un sentido más amplio, las referencias), la colección de música, fotografías,...

Este etiquetado universal, dejando de lado por un momento los tags compuestos, podría ofrecer funcionalidades del tipo: «puedes buscar el tag "pepito" y te recupera todos los documentos, temas pendientes...». Esta recuperación se basa en el principio que el texto buscado informa sobre el contenido. Este planteamiento de considerar los tags como simples portadores de lo que en inglés denominan aboutness es una visión reduccionista que en un entorno social de etiquetado, lo único que consigue es provocar ruido. En cierto modo sólo es una evolución más de la búsqueda full-text.

Al introducir funcionalidades basadas en tags compuestos, permitimos el tratamiento de metadatos, la inclusión de facetas, y muchas posibilidades (por ejemplo, indexar utilizando la CDU: *cdu=...).

(Continuaré comentando este tema en otro post).

Tags

gestión documental 10     Recuperación información 11     Linux 7     Usabilidad 5     open source 3     Tagging 12     lógica borrosa 2     fuentes de información 12     Google 6     off-topic 6     spam 2     grafos 6     Web social 11     modelización 12     Productividad 11     buscadores 2     utilidades 17     Profesionales 9     SEO 5     estándares 3     veracidad 3     relevancia 2     lingüística 2     PLN 2     lenguajes documentales 2     apis-mashups 3     reseñas 7     Flash 7     Gráficos estadísticos 13     Publicidad 3     Innovación 5     muestreo estadístico 9     PHP 14     internet 2     testeo 12     desarrollo 3     visualizacion 36     javascript 16     datos abiertos 9     elecciones 2     simulación 5     html5 7     phing 9     ssh 2     seguridad 3     indicadores 2     demografía 3     media 2     algoritmos 7     shell 4     mysql 2     backup 2     big data 6     twitter 2     d3js 11     revealjs 2     metodología 6     data-journalism 6     smartcities 2     NYT 2     privacidad 3     benchmarking 4     recopilaciones 21     magento 5     formacion 2     github 2     HHVM 3     psicología 2     angularjs 3     grep 2     nodejs 5     promises 2     mapreduce 3     crossfilter 2     exploración de datos 2     machine learning 2    

© 2007 and beyond Mario Alberich, licensed under CC-BY-SA unless stated otherwise.