[NEWS] Faraónico proyecto de la Biblioteca del Congreso: Archivar los tweets de todos los estadounidenses


Resulta significativa la labor que una de las mayores bibliotecas del mundo, la Biblioteca del Congreso de los Estados Unidos de América, está realizando, sin duda un síntoma más del cambio hacia un mundo digital, una de esas noticias que dentro de unos años dejarán de ser noticia para convertirse en algo común.

La referida institución, se enfrenta cada día a la complicada tarea de archivar los más de 400 millones de tweets que se publican por los ciudadanos del referido país cada día, ya que se muestran convencidos de que estos pequeños mensajes reflejan una parte de la narrativa nacional.

Gayle Osterberg, director de comunicaciones de la biblioteca comenta:

"Una parte de nuestra misión es recoger la historia de América, y adquirir colecciones que tengan valor para la investigación."

La Biblioteca del Congreso, que alberga bajo su techo más de 138 millones de documentos, quiere controlar y catalogar también lo que se publica en Internet, información que en muchos casos queda sin archivar.


Para ello han llegado a un acuerdo con Twitter, que les cederá el acceso a los tweets publicados por estadounidenses desde el año 2006; eso sí, los tweets que hayan sido borrados o bloqueados por los usuarios no serán recogidos por la Biblioteca del Congreso.

Además, están guardando de forma especialmente accesible los tweets más famosos para la historia del país, como el publicado por el presidente Barack Obama (gran seguidor de las nuevas tecnologías) en 2008, al accedes a la Casa Blanca:


"We just made history. All of this happened because you gave your time, talent and passion. All of this happened because of you. Thanks,"

Simplemente hicimos historia. Todo esto ocurrió porque nos has dado tu tiempo, talento y pasión. Todo esto ocurre por ti. Gracias.


El mayor desafío a la hora de archivar tweets, a diferencia de los libros o incluso de las páginas web, es su tremendo crecimiento exponencial, por ejemplo, de febrero a octubre del año pasado, la aparición mensual de tweets se multiplicó por tres.

La empresa Gnip, ha sido la elegida para contener toda esta información, Gnip proporciona a la Biblioteca del Congreso un espacio de 133,000 gigabytes, que muy pronto pasará a ser ocupado por ingentes cantidades de tweets.


La mayor dificultad para Gnip, como ellos han dicho, es recoger todos los tweets cuando ocurre algo excepcional en el mundo, es decir, durante las "horas punta", por ejemplo el tsunami de Japón del 2011 provocó miles de tweets por segundo.

La otra gran dificultad, es proporcionar a los investigadores un motor de búsqueda factible, con tal cantidad de información, una búsqueda acotada a cuatro años podría tardar 24 horas en terminar de ejecutarse.

Este proyecto ha reunido también voces críticas, al considerarlo "prohibitivamente caro", sin embargo, cuenta con defensores como Lee Humphreys, profesor de comunicación de la Universidad de Cornell en Nueva York, que opina que estos mensajes cortos pueden revelar episodios:

"...sobre la cultura en la que se hayan producido"

Fuentes: Businessinsider
              Usahitman

0 comentarios:

Publicar un comentario