domingo, 15 de mayo de 2011

El código detrás del tuit

Por cada carácter que se ve en la red social existen otros 12 ocultos - Twitter vende los datos que acompañan a un mensaje a agencias de mercadotecnia

En el reino de tuitilandia cada día se envían algo más de 50 millones de tuits (frente a 200.000 millones de correos electrónicos). A 140 caracteres por tuit, equivale aproximadamente al contenido de un disco de siete gigabytes. Un marasmo de mensajes cortos, la mayoría irrelevantes, inconexos en su conjunto, dedicados a la comunicación de un instante.

Pero esa cifra es solo la punta del iceberg. Bajo la superficie del texto, cada tuit va embebido en un envoltorio de software que ocupa mucho más espacio: Hasta 10 o 12 veces más que el propio mensaje. Son los metadatos, paquetes de información que acompañan al mensaje de un lado a otro de la red, pero que el usuario raramente llega a ver.

Tales datos contienen información muy valiosa, si se sabe aprovechar. Dicen mucho acerca de quién, cómo, cuándo y dónde se ha originado el tuit. Un filón para quien se dedique a la minería de datos que, después venderá a las agencias de publicidad y mercadotecnia.

Un "objeto tuit" empieza con una simple "matrícula" de más de diez dígitos que permite identificarlo a lo largo de su recorrido por el ciberespacio.

Después vienen los 140 caracteres reglamentarios (que, por cierto, pueden reducirse algo si no se utilizan caracteres complejos: una letra acentuada cuenta por dos). Y a partir de ahí, docenas de datos adicionales, incluyendo los nombres o alias del autor, su dirección en la red y desde dónde escribe. También contiene información para identificar la foto del autor, si la hay, la fecha en que creó su cuenta, qué idioma usa, la zona horaria desde donde trabaja, el número de personas a las que sigue y el número de contribuciones que ha hecho.
El mensaje también suele ocultar datos en formatos antiguos, ya obsoletos, pero que hay que respetar porque nunca se sabe quién va a leerlos ni con qué versión del programa.

El tuit incluye también información de geolocalización, aunque en general es ambigua y no estandarizada por lo que no resulta fácil tratarla. Sin embargo, en caso de que el autor lo permita, también se incluyen detalles acerca de la población, el barrio y las coordenadas geográficas aproximadas desde donde se emitió el mensaje.

Twitter tiene en estudio -aunque todavía no en producción- la posibilidad de añadir a cada mensaje un texto adicional en forma de "anotaciones". Por ahora, limitado a 512 bytes (casi el triple del texto de un mensaje normal) con el objetivo de ampliarlo a dos Kbytes. Este campo adicional admite enlaces a casi cualquier tipo de material; incluso audio, vídeo, libros electrónicos, codificación de lugares o convocatorias para algún acontecimiento. Todo ello en un formato estructurado que permita tratarlos masivamente.

Las posibilidades son inmensas y un tanto intranquilizadoras. Por ejemplo, cabría investigar las preferencias de un segmento de población, acotado según edades y área geográfica: Cuáles son sus tendencias de voto, sus películas favoritas, sus programas de televisión o incluso qué marcas prefieren. Un verdadero tesoro de información, que algunas empresas comienzan a escarbar

Son los casos de Crimson Hexagon o Mediasift, que acaban de llegar a un acuerdo con Twitter para acceder a los metadatos de ese tráfico de 50 millones de tuits diarios. La empresa británica, distinguida con premios internacionales por su autoría del botón verde de retweetme (retuiteame), mide y descontextualiza los datos por un precio anual, en su máxima complejidad, de 8.000 dólares (5.600 euros).

Gracias a programas complementarios, como Lexalytics, la minería de datos va mucho más allá de saber de dónde proceden los mensajes o qué seguidores tiene quién. En este caso, las computadoras de Mediasift son capaces de distinguir el lenguaje: si se habla bien o mal de una marca, de una película o de cualquier producto que se lanza a la venta; dónde tiene más o menos éxito, entre qué edad y qué sexo. Y todo prácticamente en tiempo real, es decir, mucho más rápido que Google Analyticis. Tuitear es algo más que un pasatiempo.

Extraído de El País (Rafael Clemente)

No hay comentarios:

Glosario

  • Comunicación corporativa: Conjunto de formas de expresión que presenta una organización. Prácticamente todos los actos cotidianos del comportamiento de una empresa son en última instancia actos comunicativos.
  • Cultura corporativa: Conjunto de presunciones y valores compartidos por la mayoría de los miembros de la organización. Estos valores son al mismo tiempo elementos de integración interna y de construcción social de la identidad corporativa. También son un factor clave para la adaptación a las realidades existentes fuera de la organización.
  • Identidad visual: Conjunto de signos que traducen gráficamente la esencia corporativa. Estos elementos están regulados por un código combinatorio que determina la forma y los usos del logotipo, del símbolo, de los colores corporativos y del identificador.
  • Marketing: Conjunto de actividades que dirigen el flujo de bienes y servicios del productor al consumidor. (Gorostegui).
  • Reputación: Podríamos definir la reputación como el resultado de la estimación de los distintos públicos que tienen una relación con la empresa. (UCM)
  • Responsabilidad Social Empresarial: El Conjunto de obligaciones y compromisos, legales y éticos que se derivan de los impactos que la actividad de las organizaciones producen en el ámbito social, laboral, medioambiental y de los derechos humanos. (Universidad Antonio de Nebrija - Escuela de Negocios)