A blog about data, information and IT, by Mario Alberich

Jan 24
2008

Aspectos clave 2008 - Microformatos


Microformatos

Como extensión a los dos artículos anteriores, hay otro aspecto al cual habrá que hacer un seguimiento a lo largo de este año. Se trata quizá del escalón más fácil de subir entre la web "1.0", la web social y la semántica. Por todos es sabido que el escalón más fácil de subir es el más utilizado.

No sé si los microformatos proporcionan todo lo necesario para la semantización de la web, pero sí aportan su sistematización.

Definir los microformatos no es fácil. En general se pueden definir como documentos con un formato concreto dentro de otro formato general (para nuestro caso, XHTML). Se pueden entender como formatos utilizados para tratar conjuntos de información muy concretos y enfocados a usos muy determinados. Puedes encontrar información ampliada en microformats.org.

La sistematización en un entorno cargado de información y ruido permite la extracción de significado. En general, si un sistema automático es capaz de extraer información de una fuente, la información extraída es susceptible de ser más relevante para el destinatario. Esa es la primera consideración a tener en cuenta para entender el importante papel los microformatos.

Otra consideración a tener en cuenta es que esta sistematización favorece al intercambio de pequeños conjuntos de datos (tarjeta de visita, datos de un contacto, cita o evento de calendario...) y por lo tanto da un paso más allá en los mecanismos ya conocidos de intercambio y filtrado colaborativo en entornos sociales.

El principal problema que han tenido los sistemas hasta ese momento es que la información debía procesarse e identificarse. Hasta la llegada del XHTML, tratar de abordar un contenido HTML de una web y esperar que una máquina pudiera identificar fragmentos independientes y significativos de contenido era una utopía. Con la aparición del XHTML es posible plantear la inclusión de etiquetas significativas, bloques de información sistematizados, etc. Es decir, estamos trasladando la sistematización de la base de datos a la interficie, sin pérdida de transparencia para el usuario.

Dando dos pasos más hacia adelante, vale la pena poner énfasis en un aspecto: la simplificación del rastreo de información significativa y segmentada. Echando un vistazo a los posibles microformatos, nos encontramos hCard y hCalendar (contactos y eventos), hReview (comentarios y opiniones), hResume (Currículum / carrera profesional), y hAudio.

Los dos primeros coinciden con tipos de información comentados en el apartado de identidad: agenda, contactos, y tareas. También hResume cumple con su objetivo de estructurar el currículum personal. Lo que sí vale la pena es observar los otros tipos de microformatos: hAudio o hReview.

En ambos tipos de microformatos, será interesante comprobar hasta qué punto se integran en software colaborativo, pero tienen interés. Pongamos el caso de portales verticales de música, películas, videojuegos... Si tuvieran la capacidad de disponer de una lista de fuentes de información desde la que se pueda capturar estos datos, podrían proporcionar información completamente filtrada y preparada para el usuario final, y creada de forma distribuida.

En un escenario ideal, eso significa segmentación y relevancia. Y probablemente signifique mayores ingresos. Pero por encima de todo significa cambiar las reglas de los criterios de producción de contenidos. El prosumer se ha cansado que ganen dinero los otros.

Es así que sería posible, por ejemplo asistir a un proceso distribuido de producción de contenidos en el que un portal detectara líderes de opinión que disponen de su espacio personal (una especie de despacho profesional en Internet). Tras el contacto se pactarían los servicios y su frecuencia de colaboración. Es un modelo conocido, pero no por ello menos eficiente.

Estoy seguro que habrá miles de razones para abrazar el uso de los microformatos en la web, pero hasta aquí llego por ahora, que uno también sigue aprendiendo.

Tags

gestión documental 10     Recuperación información 11     Linux 7     Usabilidad 5     open source 3     Tagging 12     lógica borrosa 2     fuentes de información 12     Google 6     off-topic 6     spam 2     grafos 6     Web social 11     modelización 12     Productividad 11     buscadores 2     utilidades 17     Profesionales 9     SEO 5     estándares 3     veracidad 3     relevancia 2     lingüística 2     PLN 2     lenguajes documentales 2     apis-mashups 3     reseñas 7     Flash 7     Gráficos estadísticos 13     Publicidad 3     Innovación 5     muestreo estadístico 9     PHP 14     internet 2     testeo 12     desarrollo 3     visualizacion 36     javascript 16     datos abiertos 9     elecciones 2     simulación 5     html5 7     phing 9     ssh 2     seguridad 3     indicadores 2     demografía 3     media 2     algoritmos 7     shell 4     mysql 2     backup 2     big data 6     twitter 2     d3js 11     revealjs 2     metodología 6     data-journalism 6     smartcities 2     NYT 2     privacidad 3     benchmarking 4     recopilaciones 21     magento 5     formacion 2     github 2     HHVM 3     psicología 2     angularjs 3     grep 2     nodejs 5     promises 2     mapreduce 3     crossfilter 2     exploración de datos 2     machine learning 2    

© 2007 and beyond Mario Alberich, licensed under CC-BY-SA unless stated otherwise.