DOCTORA EN FILOSOFÍA (Ph.D) EN TECNOLOGÍA DE LA INFORMACIÓN Y DOCENCIA UNIVERSITARIA: ENSAYO DEL LIBRO: “Big Data. La revolución de los datos masivos”

Atlantic International University

ENSAYO DEL LIBRO:

“Big Data. La revolución de los datos masivos”

ESTUDIANTE:

Brindicys Rosario de González

TUTORA:

Dra. Linda Collazo.

FECHA:

20 de Marzo del 2017

Santo Domingo, República Dominicana

INTRODUCCIÓN

Los datos ya no se contemplaban como algo estático o rancio, cuya utilidad desaparecía en cuanto se alcanzaba el objetivo para el que habían sido recopilados, es decir, nada más aterrizar el avión (o, en el caso de Google, una vez procesada la búsqueda en curso). Por el contrario, los datos se convirtieron en una materia prima del negocio, en un factor vital, capaz de crear una nueva forma de valor económico. En la práctica, con la perspectiva adecuada, los datos pueden reutilizarse inteligentemente para convertirse en un manantial de innovación y servicios nuevos. Los datos pueden revelar secretos a quienes tengan la humildad, el deseo y las herramientas para escuchar.

hoy en día los datos masivos, se refieren a cosas que se pueden hacer a gran escala, pero no a una escala inferior, para extraer nuevas percepciones o crear nueva formas de valor, de tal forma que transforman los mercados, las organizaciones, las relaciones entre los ciudadanos y los gobiernos, etc. Pero esto no es más que el principio. La era de los datos masivos pone en cuestión la forma en que vivimos e interactuamos con el mundo. Y aún más, la sociedad tendrá que desprenderse de parte de su obsesión por la causalidad a cambio de meras correlaciones: ya no sabremos por qué, sino solo qué. Esto da al traste con las prácticas establecidas durante siglos y choca con nuestra comprensión más elemental acerca de cómo tomar decisiones y aprehender la realidad. Los datos masivos señalan el principio de una transformación considerable.

No existe ninguna definición rigurosa de los datos masivos. En un principio, la idea era que el volumen de información había aumentado tanto que la que se examinaba ya no cabía en la memoria que los ordenadores emplean para procesarla, por lo que los ingenieros necesitaban modernizar las herramientas para poder analizarla.

Ese es el origen de las nuevas tecnologías de procesamiento, como Map-Reduce, de Google, y su equivalente de código abierto, Hadoop, que surgió de Yahoo. Con ellos se pueden manejar cantidades de datos mucho mayores que antes, y esos datos –esto es lo importante– no precisan ser dispuestos en filas ordenadas ni en las clásicas tabulaciones de una base de datos.

EL LADO OSCURO DE LOS DATOS MASIVOS

Como hemos visto, los datos masivos permiten una mayor vigilancia de nuestras vidas y vuelven obsoletos, en buena medida, algunos de los medios legales de proteger la intimidad. También vuelven ineficaz el método técnico central para preservar el anonimato. Igualmente inquietante, las predicciones sobre individuos basadas en datos masivos pueden ser utilizadas en la práctica para castigar a la gente por sus propensiones, y no por sus acciones.

Esto niega el libre albedrío y erosiona la dignidad humana. Al mismo tiempo, existe un riesgo real de que los beneficios de los datos masivos nos induzcan a aplicar las técnicas en situaciones a las que no se ajustan del todo, o a confiar excesivamente en los análisis. Conforme las predicciones basadas en datos masivos vayan mejorando, el recurrir a ellas se irá tornando más atractivo, alimentando una obsesión por esos datos que tanto pueden aportarnos.

Esa fue la maldición de McNamara, y la lección que ofrece su historia.

Debemos guardarnos contra la confianza excesiva en los datos, no vayamos a caer en el error de Ícaro, quien adoraba su capacidad técnica de volar pero no supo usarla y se precipitó en el mar. En el próximo capítulo, veremos algunas formas de controlar los datos masivos para evitar que sean ellos los que nos controlen a nosotros.

CONTROL

Los cambios en la forma en que producimos la información e interactuamos con ella provocan, a su vez, cambios en las reglas que usamos para gobernarnos y en los valores que la sociedad necesita proteger. Veamos un ejemplo tomado de un diluvio de datos anterior, el que desencadenó la imprenta. Antes de que Johannes Gutenberg inventase los caracteres móviles hacia 1450, la difusión de las ideas se limitaba en líneas generales a las conexiones entre personas. Los libros estaban confinados en su mayoría en las bibliotecas monásticas, vigilados de cerca por los monjes, que actuaban en nombre de la iglesia católica para proteger y preservar su dominio. Fuera del ámbito de la iglesia, los libros eran extremadamente raros.

Unas pocas universidades habían reunido solo docenas, o tal vez un par de cientos de libros. La de Cambridge125 poseía escasamente ciento veintidós volúmenes a principios del siglo XV. En cuestión de unas décadas a partir de la invención de Gutenberg, su imprenta se había extendido por toda Europa, haciendo posible la producción masiva de libros y panfletos.

Cuando Martín Lutero tradujo la Biblia latina al alemán corriente, hubo de repente un motivo para aprender a leer: leyendo la Biblia por cuenta propia, se podría prescindir de los curas para aprender la palabra de Dios. La Biblia se convirtió en un éxito de ventas. Y, una vez que la gente supo leer, siguió haciéndolo. Algunos incluso decidieron escribir.

En menos de lo que dura la vida de una persona, el flujo de información había pasado de goteo a torrente. Este cambio radical abonó asimismo el terreno para nuevas reglas de gobierno de la explosión informativa que provocaron los caracteres móviles.

Conforme el estado secular consolidaba su poder, estableció la censura y las licencias para contener y controlar la palabra impresa. Se introdujo la propiedad intelectual, brindando a los autores incentivos legales y económicos para crear. Más adelante, los intelectuales presionarían para lograr reglamentos que protegieran las palabras de la censura gubernativa; llegado el siglo XIX, la libertad de expresión se convirtió en un derecho garantizado por la constitución cada vez en más países. Pero estos derechos traían aparejadas unas responsabilidades.

En la medida en que algunos periódicos vitriólicos pisoteaban la intimidad o ensuciaban reputaciones, surgieron reglas para proteger el ámbito privado de las personas y permitirles presentar demandas por difamación. Sin embargo, estos cambios en la gobernanza reflejan asimismo una transformación más honda y fundamental de los valores subyacentes.

A la sombra de Gutenberg, empezamos a comprender el poder de la palabra escrita; y, a la larga, también la importancia de la información que se disemina sin trabas por la sociedad. Con el paso de los siglos, optamos por más, y no menos, flujos de información y por protegernos de sus excesos no por medio de la censura principalmente, sino a través de normas que limitaban el mal uso. Según se vaya adentrando el mundo en el ámbito de los datos masivos, la sociedad experimentará un desplazamiento tectónico similar.

Los big data ya están transformando muchos aspectos de nuestra vida y forma de pensar, forzándonos a reconsiderar algunos principios básicos acerca de su crecimiento y su potencial dañino. Sin embargo, a diferencia de nuestros antepasados en tiempos de la revolución de la imprenta y después, no dispondremos de siglos para adaptarnos: puede que solo se trate de unos pocos años.

No serán suficientes unos simples cambios de las reglas actuales para gobernar en la era big data y atemperar su lado oscuro. Más que un cambio de valores, la situación exige un cambio de paradigma. La protección de la privacidad requiere que los usuarios de datos masivos asuman mayor responsabilidad por sus actos. Al mismo tiempo, la sociedad tendrá que redefinir la misma noción de justicia para garantizar la libertad de actuación del ser humano (y, por consiguiente, la de ser considerado responsable de esas acciones). Por último, hará falta que surjan nuevas instituciones y profesionales para interpretar los complejos algoritmos que subyacen a los hallazgos de los datos masivos, y para defender a aquellas personas que podrían verse perjudicadas por ellos.

DE LA PRIVACIDAD A LA RESPONSABILIDAD

Durante décadas, un principio esencial de las leyes de protección de la vida privada alrededor del mundo pasaba por atribuirle el control a los individuos, dejándoles decidir si, cómo y por quién podría ser procesada su información personal.

En la era de internet, este loable ideal se ha transformado a menudo en un sistema formal de “notificación y consentimiento”. Al llegar los datos masivos, sin embargo, cuando la mayor parte del valor de estos reside en unos usos secundarios, que puede que ni siquiera se hubiesen concebido cuando se recogieron, un mecanismo así ya no sirve para asegurar la privacidad. Para la era de los datos masivos, prevemos un marco muy diferente centrado menos en el consentimiento individual en el momento de la recogida de los datos, y más en hacer responsables a los usuarios de lo que hacen. Las firmas valorarán formalmente una reutilización determinada de los datos, basada en el impacto que tenga sobre los individuos cuya información personal están procesando.

Las futuras leyes de protección de la privacidad no tienen por qué detallar de forma exhaustiva todos los casos, sino que definirán categorías amplias de uso, incluyendo las que son permisibles sin cortapisas, o con solo algunas, limitadas y estandarizadas.

Para las iniciativas de mayor riesgo, los legisladores establecerán reglas básicas para que los usuarios valoren los peligros de un uso previsto, y encuentren la forma de evitar o mitigar los daños potenciales.

Esto estimulará la reutilización creativa de los datos, y al mismo tiempo asegurará que se adopten las medidas suficientes para no perjudicar a los individuos.

Valorar formal y correctamente el uso de datos masivos e implementar sus conclusiones con precisión ofrece beneficios tangibles a los usuarios de datos: en muchos casos, serán libres de buscar usos secundarios para los datos personales sin tener que volver a ponerse en contacto con los individuos para recabar su consentimiento explícito.

Por otra parte, unas valoraciones chapuceras, o la mala implementación de las salvaguardias, expondrán a los usuarios de datos a responsabilidades legales, y a mandatos, multas y quizá incluso procesos penales. La responsabilidad del usuario de datos solo será efectiva si tiene rigor.

El cambio en el control desde el consentimiento individual a la responsabilidad del usuario de los datos es un cambio fundamental y esencial, necesario para una gobernanza efectiva del ámbito de los datos masivos. Pero no es el único.

PERSONAS CONTRA PREDICCIONES

Los tribunales hacen responsables de sus actos a las personas. Cuando el juez pronuncia su veredicto imparcial al acabar un juicio justo, se ha hecho justicia. Sin embargo, en la era de los datos masivos, tenemos que redefinir la noción de justicia para preservar la idea de la capacidad de decisión del ser humano: el libre albedrío por el que la gente elige sus actos. Se trata de la sencilla idea de que los individuos pueden y deben ser considerados responsables de su comportamiento, no así de sus propensiones. Antes de los datos masivos, esta libertad fundamental resultaba obvia. Tanto, de hecho, que apenas necesitaba articularse.

Al fin y al cabo, así es como funciona nuestro sistema legal: hacemos responsables de sus actos a las personas, valorando lo que han hecho. En cambio, con los datos masivos podemos predecir las acciones humanas cada vez con mayor exactitud, lo que podría incitarnos a juzgar a las personas no por lo que han hecho, sino por lo que hemos predicho que harían.

En la era de los datos masivos, tendremos que ampliar nuestra visión de la justicia y exigir que incluya salvaguardias para el albedrío humano, del mismo modo que, en la actualidad, velamos por la imparcialidad procesal. Sin esas salvaguardias, la idea misma de la justicia podría debilitarse por completo. Al garantizar la capacidad de decisión del ser humano, nos aseguramos de que el gobierno juzga nuestro comportamiento basándose en acciones reales, no simplemente en análisis de datos masivos. Así pues, solo debe hacernos responsables de nuestras acciones pasadas, no de predicciones estadísticas de unas acciones futuras. Y cuando el estado juzgue actos anteriores, no debería basarse exclusivamente en datos masivos. Por ejemplo, considérese el caso de nueve compañías sospechosas de amañar los precios.

Resulta del todo aceptable emplear análisis de datos masivos para identificar posibles colusiones, de forma que los reguladores puedan investigar y levantar el caso por medios tradicionales. Pero no se puede hallar culpables a estas empresas solo porque los datos masivos sugieran que probablemente hayan cometido un delito.

El mismo principio debería aplicarse a las empresas privadas que adoptan decisiones importantes sobre las personas: contratarnos o despedirnos, ofrecernos un préstamo hipotecario o negarnos una tarjeta de crédito.

Cuando estas decisiones se basen principalmente en predicciones a partir de datos masivos, recomendamos que se adopten determinadas salvaguardias.

La primera es la transparencia: los datos y el algoritmo en que se fundamenta la predicción que afecta al individuo han de estar disponibles.

La segunda es la certificación: una tercera parte experta ha de certificar que el algoritmo es correcto y válido para determinados usos sensibles.

La tercera es la refutabilidad: hay que especificar formas concretas de que las personas puedan refutar una predicción sobre ellas. (Esto viene a ser análogo a la tradición, en el ámbito de la investigación científica, de revelar aquellos factores que pudieran debilitar los hallazgos de un estudio).

CONCLUSIÓN

Lo que somos capaces de recopilar y procesar siempre será una fracción minúscula de la información que existe en el mundo.

Solo puede ser un simulacro de la realidad, como las sombras en la pared de la cueva de Platón. Como nunca podemos disponer de información perfecta, nuestras predicciones resultan inherentemente falibles. Tampoco significa que sean incorrectas, solo que siempre están incompletas. Esto no niega las percepciones que ofrecen los datos masivos, pero los pone en su sitio: el de una herramienta que no ofrece respuestas definitivas, solo algunas suficientes para ayudarnos por ahora, hasta que aparezcan métodos mejores y, por consiguiente, respuestas mejores. También sugiere que debemos usar esta herramienta con una generosa dosis de humildad… y de humanidad.