El ArXiv es un servidor de preprints creado por Paul Ginsparg en 1991. Su acceso es gratuito y se lo considera pionero en materia del llamado Open Access, acceso abierto, en momentos en que la World Wide Web recién nacía. Ginsparg se enteró un tiempo después del potencial de la WWW, en momentos en que para acceder a los papers había que utilizar el correo electrónico. Actualmente el portal recibe unos 8000 papers por mes, cifra que tiene una clara tendencia de aumentar. Inicialmente el ArXiv estaba focalizado en publicaciones en física, y actualmente las categorías se agrupan en matemática, computación, biología cuantitativa, finanzas cuantitativa y estadística. Naturalmente el fuerte del ArXiv es la física y prácticamente no hay físico que no haya publicado en algún momento por lo menos un preprint en el mencionado repositorio.
Una fuente de datos abiertos como el ArXiv es una interesante oportunidad para demostrar las cosas que se pueden hacer con el muy de moda data mining (minería de datos) y la visualización de la información obtenida mediante estas técnicas. Es precisamente el caso de Paperscape, una interesante muestra de lo que se puede hacer con toda esta información. Realizado por Damien George y Rob Knegjens, Paperscape mapea el ArXiv y permite navegar en la información procesada. Los datos se despliegan en un formato bastante denso, en el que cada color representa a cada una de las categorías: cada esfera es un paper y su diámetro está en función de la cantidad de citas que el mismo tiene en el ArXiv. Naturalmente la información se hace más precisa a medida que hacemos un zoom in, en la que eventualmente se puede ver el autor y título del trabajo. La vecindad de cada círculo está en función de la relación de citas entre ellos. La aplicación dispone de un sistema de búsqueda completo y muy eficiente que permite destacar visualmente los trabajos buscados.
Las novedades y mejoras de Paperscape se presentan en un blog que bien vale la pena hojear para conocer más a fondo esta interesante forma de aproximarse a la información científica.
[Vía: Physics World]