big data archivos - El Documentalista Enredado

Refinando el nuevo petróleo: el poder de los datos

Publicado el lunes, 25 de noviembre de 2024 por Marcos Ros

Refinando el nuevo petróleo: el poder de los datos

Data is the new oil. Like oil, data is valuable, but if unrefined it cannot really be used. It has to be changed into gas, plastic, chemicals, etc. to create a valuable entity that drives profitable activity. so, must data be broken down, analysed for it to have value.*

Clive Humby, 2006

Las personas nos hemos convertido en unas nuevas fuentes de información inagotable para las empresas. No es necesario ni siquiera que estemos interactuando con dispositivos electrónicos, sólo llevando uno en nuestro bolsillo, ya puede estar compartiendo información sobre nosotros de forma ininterrumpida.

Los datos que vamos dejando de forma inconsciente según la economía se digitaliza más y más conforman nuestra huella digital. Al contrario que el petróleo pero de forma similar, nuestros datos son finitos, sí, pero pueden ser refinados en infinitas formas, con distintos objetivos y usos. Tienen un valor económico intrínseco, ya que pueden mostrar patrones y modos de comportamiento de los que ni nosotros somos conscientes y que puede que no puedan ser explotados hoy, pero sí en el futuro. En definitiva, esos datos dicen mucho más de nosotros que nosotros mismos. Por supuesto que sucede lo mismo con la información de las empresas, que van dejando datos según desarrollan sus propias actividades.

La industria de los datos avanza muy rápido, más allá de legislaciones y acuerdos tácitos entre empresas. Sólo hay que comprobar la polémica entre empresas editoras y las empresas que desarrollan las inteligencias artificiales puesto que consideran que las últimas han cometido abusos sobre los datos compartidos en Internet que no se han utilizado con el fin con el que fueron publicados en un inicio.

Este punto incide sobre lo más importante del uso de los datos. No es importante acaparar los datos, conservarlos, extraerlos; si no lo especialmente relevante es cómo se usan esos datos. Como documentalistas, debemos saber establecer unas pautas de esa explotación del dato: de dónde viene el dato, qué se permite hacer con el dato y qué no; y cómo se pasa de un dato a un dato útil.

Origen del dato. No todos los datos son fiables. Algunos de ellos tienen sesgos, otros son falsos, otros erróneos… Es relevante saber de dónde proviene el dato, de dónde se extrae para valor la utilidad del mismo.
Privacidad del dato. Si hablamos de datos de personas o de cualquier índole, es importante saber con qué medio, con qué finalidad se ha extraído el dato y su finalidad de uso. Esto deviene a la capacidad de poder explotarlos y sobre todo según la legislación madura y avanza, es importante tenerlo presente.
Protección del dato. La privacidad es una manera de proteger el dato, otro es cómo asegurar que siempre está disponible cuando es necesario y se va a usar. Hay que tener presente que cuanto más importante sea la disponibilidad de los datos para la empresa, mayor será el impacto de la no disponibilidad de los mismos.
Preparación del dato. El dato en crudo no es útil, necesita ser refinado (preparación del dato, limpieza de los dato). Tener una estrategia para la preparación del dato es esencial.

Deja un comentario

La gamificación no os hará libres

Publicado el lunes, 14 de septiembre de 2015 por Marcos Ros

“Technology is neither good nor bad; nor is it neutral.”

Melvin Kranzberg

La revolución que se aproxima respecto a la optimización continua de máquinas mediante la sensorización y la explotación de esos datos mediante el Big Data, no se limita tan sólo, y muy a nuestro pesar, a los artefactos inertes destinados a realizar tareas repetitivas; sino que también se extiende a otros ámbitos como las propias personas. El artículo del New York Times Inside Amazon: Wrestling Big Ideas in a Bruising Workplace publicado el pasado mes de agosto denunciaba la política empresarial desarrollada por Amazon respecto a la productividad de sus trabajadores. El artículo era tan crítico con la empresa que el CEO de Amazon, Jeff Bezos, no tardó en asegurar que no reconocía a su empresa en el texto del Times. Sin embargo, ha servido para iniciar una reflexión sobre la profundidad de los cambios que se nos avecinan y que puede llevarnos a una especie de nuevo taylorismo.

De hecho, Bezos se mostró horrorizado respecto a la descripción de las condiciones laborales descritas en el medio de comunicación de los “amazonians” que es como se define a los trabajadores del gigante americano de la distribución y llegó a asegurar que nadie querría trabajar en una empresa de esas características. En el texto de Jodi Kantor y David Streitfeld se afirma que el nivel de experimentación bajo el que están sujetos los trabajadores llega hasta límites insospechados. Según los periodistas, desde la empresa se incentivaba a que los compañeros fuesen muy críticos y destrozasen las ideas de sus compañeros durante las reuniones, se empujaba a que se trabajasen horas extras, se animaba a enviar correos relacionados con el trabajo por la noche teniendo la certeza de que sería respondido inmediatamente e incluso boicotear el trabajo de los compañeros. La presión dentro de Amazon era tan grande que según el relato de Bo Olson, que trabajó en el departamento de Marketing y libros, no era infrecuente ver a gente llorando por los pasillos o sobre su mesa.

Y es que la gestión de Amazon está totalmente gobernada por los datos y se dedica a recopilarlos constantemente. No sólo de sus clientes, donde se detallan los usos y costumbres de los mismos, sino también sobre sus propios empleados. Así, en los almacenes, los trabajadores son monitorizados constantemente para asegurarse de que realizan suficientes pedidos a la hora, mientras que en las oficinas la empresa está desarrollando un algoritmo propio de mejora del desempeño. De hecho, también se invita a enviar feedbacks secretos al jefe de un compañero de otra división a través de la herramienta “Anytime feedback tool.” De este modo, los equipos son ordenados y clasificados. Aquellos miembros que obtienen los peores resultados son despedidos cada año, mientras que los más eficientes puede llegar a ser considerados como promocionales. Lo normal es que todo el mundo compita con todo el mundo para tratar de mantener su puesto de trabajo.

Desde luego que los intentos para cuantificar el trabajo no son nuevos. Las empresas trataron de seguir y cuantificar el trabajo de los sastres a principios del siglo pasado, mientras que actualmente los call-centers siguen el trabajo de sus empleados teniendo en cuenta el uso de la web y del correo electrónico. Pero no ha sido hasta ahora cuando ha llegado la monitorización de los oficinistas y es una tendencia que se ha ido extendiendo los últimos cinco años.

El nuevo taylorismo digital descrito por el New York Times y que también se ha aplicado y abandonado en Microsoft, General Electric o Accenture puede llegar a ser tan contraproducente como el antiguo que inspiró las obras “Un mundo feliz” de Aldous Huxley (1932) y “Tiempos modernos” de Charles Chaplin (1936). Sin embargo, esta práctica del “rank and yank” puede limitar la creatividad en el puesto del trabajo y el rendimiento a largo plazo debido a la falta de compañerismo en los equipos y acabar laminando y quemando a equipos y trabajadores.

2 comentarios

Big Data, Twitter y la Library of Congress

Publicado el domingo, 20 de enero de 2013 por Marcos Ros

No dudéis que el Big Data va a ser trending topic este año. Habrá discusiones de si el término se utilizaba previamente o si simplemente es una buena idea de marketing, ¿no las hubo antes?, pero las discusiones terminológicas en ocasiones obvian la eficiencia y el desarrollo efectivo de las ideas.

Uno de los proyectos más apasionante en torno al Big Data que actualmente se están desarrollando se sitúan justamente en el ámbito bibliotecario. En abril de 2010, the Library of Congress (LoC) de Estados Unidos y Twitter llegaban a un acuerdo para que ésta se hiciese cargo del archivo de todos los tweets que almacenaba la empresa. En total, en ese momento, la biblioteca nacional estadounidense se hacía cargo de 170.000 millones de tweets públicos, 130 terabytes de información que crecían a un ritmo de 140 millones de tweets al día pero que actualmente lo hace más rápido, en torno a 500 millones.

El proyecto, además de la preservación, era ambicioso queriendo poner a disposición de los investigadores una basta fuente documental de hechos desarrollados los últimos años como la Primavera Árabe y que habían utilizado Twitter como correa de transmisión. Desde el punto de vista, periodístico, social e histórico, Twitter se presenta como una fuente primaria basta, pero de datos en crudo, de información dispersa que hay que ir hilvanando para poder obtener conclusiones.

Para tratar de hacer viable la recuperación de información, la LoC ha utilizado técnicas de Big Data desde distintos enfoques. Sin embargo, la biblioteca ha declarado su frustración a la hora de hacer viable la recuperación de la información considerando que las técnicas actuales no están tan avanzadas como la tecnología para crear y distribuir esos datos. Desde la LoC, afirman que si hoy en día las grandes empresas son incapaces de obtener resultados relevantes para las cantidades de información que generan dentro de su actividad diaria, qué puede hacer una organización pública con un presupuesto limitado.

El archivo de Twitter está planteado para que sólo pueda ser utilizado por investigadores, de momento 400 personas han declarado su interés por usarlo, sin embargo la situación actual no es muy prometedora, puesto que al lanzar una consulta, el sistema tardaría 24 horas en ofrecer resultados. Para poder mejorar la eficiencia del sistema, desde la LoC afirman que sería necesaria la inversión de una cantidad mayor de recursos de los que la institución no dispone actualmente, además de existir restricciones presupuestarias por la situación económica actual, por lo que la viabilidad del proyecto a la hora de ofrecer una herramienta útil de recuperación de la información es incierta en un corto plazo.

Comentarios cerrados

Etiqueta: big data

Refinando el nuevo petróleo: el poder de los datos

La gamificación no os hará libres

Big Data, Twitter y la Library of Congress