A blog about data, information and IT, by Mario Alberich

Oct 02
2013

Visualizar dinàmicamente el proceso de crawling de #googlebot con #gephi

Más allá de los simples gráficos, en cuanto a complejidad se refiere, encontramos los grafos. Y en este caso hay una herramienta especialmente interesante: Gephi.

Como ejemplo interesante de uso, podemos generar un proceso de visualización sobre cómo Googlebot captura nuestros contenidos de nuestra web, partiendo del análisis de los logs de Apache.

Pero tiene más aplicaciones, algunas de ellas muy relevantes para la exploración de datos:

Con los datos necesarios, es posible realizar mapas como los de linkedIn, y empezar a analizar a fondo las características de los nodos.

Más allá del ejemplo particular, hay dos enlaces interesantes para seguir aprendiendo con Gephi:

Tags

gestión documental 10     Recuperación información 11     Linux 7     Usabilidad 5     open source 3     Tagging 12     lógica borrosa 2     fuentes de información 12     Google 6     off-topic 6     spam 2     grafos 6     Web social 11     modelización 12     Productividad 11     buscadores 2     utilidades 17     Profesionales 9     SEO 5     estándares 3     veracidad 3     relevancia 2     lingüística 2     PLN 2     lenguajes documentales 2     apis-mashups 3     reseñas 7     Flash 7     Gráficos estadísticos 13     Publicidad 3     Innovación 5     muestreo estadístico 9     PHP 14     internet 2     testeo 12     desarrollo 3     visualizacion 36     javascript 16     datos abiertos 9     elecciones 2     simulación 5     html5 7     phing 9     ssh 2     seguridad 3     indicadores 2     demografía 3     media 2     algoritmos 7     shell 4     mysql 2     backup 2     big data 6     twitter 2     d3js 11     revealjs 2     metodología 6     data-journalism 6     smartcities 2     NYT 2     privacidad 3     benchmarking 4     recopilaciones 21     magento 5     formacion 2     github 2     HHVM 3     psicología 2     angularjs 3     grep 2     nodejs 5     promises 2     mapreduce 3     crossfilter 2     exploración de datos 2     machine learning 2    

© 2007 and beyond Mario Alberich, licensed under CC-BY-SA unless stated otherwise.