Atlantic International University
ENSAYO DEL LIBRO:
“Big Data. La revolución de los datos
masivos”
ESTUDIANTE:
Brindicys
Rosario de González
TUTORA:
Dra. Linda Collazo.
FECHA:
20
de Marzo del 2017
Santo Domingo, República
Dominicana
INTRODUCCIÓN
Los datos ya no se
contemplaban como algo estático o rancio, cuya utilidad desaparecía en cuanto
se alcanzaba el objetivo para el que habían sido recopilados, es decir, nada
más aterrizar el avión (o, en el caso de Google, una vez procesada la búsqueda
en curso). Por el contrario, los datos se convirtieron en una materia prima del
negocio, en un factor vital, capaz de crear una nueva forma de valor económico.
En la práctica, con la perspectiva adecuada, los datos pueden reutilizarse
inteligentemente para convertirse en un manantial de innovación y servicios
nuevos. Los datos pueden revelar secretos a quienes tengan la humildad, el
deseo y las herramientas para escuchar.
hoy en día los
datos masivos, se refieren a cosas que se pueden hacer a gran escala, pero no a
una escala inferior, para extraer nuevas percepciones o crear nueva formas de
valor, de tal forma que transforman los mercados, las organizaciones, las
relaciones entre los ciudadanos y los gobiernos, etc. Pero esto no es más que
el principio. La era de los datos masivos pone en cuestión la forma en que
vivimos e interactuamos con el mundo. Y aún más, la sociedad tendrá que
desprenderse de parte de su obsesión por la causalidad a cambio de meras
correlaciones: ya no sabremos por qué, sino solo qué. Esto da al traste con las
prácticas establecidas durante siglos y choca con nuestra comprensión más
elemental acerca de cómo tomar decisiones y aprehender la realidad. Los datos
masivos señalan el principio de una transformación considerable.
No existe ninguna
definición rigurosa de los datos masivos. En un principio, la idea era que el
volumen de información había aumentado tanto que la que se examinaba ya no
cabía en la memoria que los ordenadores emplean para procesarla, por lo que los
ingenieros necesitaban modernizar las herramientas para poder analizarla.
Ese es el origen
de las nuevas tecnologías de procesamiento, como Map-Reduce, de Google, y su
equivalente de código abierto, Hadoop, que surgió de Yahoo. Con ellos se pueden
manejar cantidades de datos mucho mayores que antes, y esos datos –esto es lo
importante– no precisan ser dispuestos en filas ordenadas ni en las clásicas
tabulaciones de una base de datos.
EL LADO OSCURO DE
LOS DATOS MASIVOS
Como hemos visto, los datos masivos permiten
una mayor vigilancia de nuestras vidas y vuelven obsoletos, en buena medida,
algunos de los medios legales de proteger la intimidad. También vuelven
ineficaz el método técnico central para preservar el anonimato. Igualmente
inquietante, las predicciones sobre individuos basadas en datos masivos pueden
ser utilizadas en la práctica para castigar a la gente por sus propensiones, y
no por sus acciones.
Esto niega el libre albedrío y erosiona la
dignidad humana. Al mismo tiempo, existe un riesgo real de que los beneficios
de los datos masivos nos induzcan a aplicar las técnicas en situaciones a las
que no se ajustan del todo, o a confiar excesivamente en los análisis. Conforme
las predicciones basadas en datos masivos vayan mejorando, el recurrir a ellas
se irá tornando más atractivo, alimentando una obsesión por esos datos que
tanto pueden aportarnos.
Esa fue la maldición de McNamara, y la lección
que ofrece su historia.
Debemos guardarnos contra la confianza
excesiva en los datos, no vayamos a caer en el error de Ícaro, quien adoraba su
capacidad técnica de volar pero no supo usarla y se precipitó en el mar. En el
próximo capítulo, veremos algunas formas de controlar los datos masivos para
evitar que sean ellos los que nos controlen a nosotros.
CONTROL
Los cambios en la forma en que producimos la
información e interactuamos con ella provocan, a su vez, cambios en las reglas
que usamos para gobernarnos y en los valores que la sociedad necesita proteger.
Veamos un ejemplo tomado de un diluvio de datos anterior, el que desencadenó la
imprenta. Antes de que Johannes Gutenberg inventase los caracteres móviles
hacia 1450, la difusión de las ideas se limitaba en líneas generales a las
conexiones entre personas. Los libros estaban confinados en su mayoría en las bibliotecas
monásticas, vigilados de cerca por los monjes, que actuaban en nombre de la
iglesia católica para proteger y preservar su dominio. Fuera del ámbito de la
iglesia, los libros eran extremadamente raros.
Unas pocas
universidades habían reunido solo docenas, o tal vez un par de cientos de
libros. La de Cambridge125 poseía escasamente ciento veintidós volúmenes a
principios del siglo XV. En cuestión de unas décadas a partir de la invención
de Gutenberg, su imprenta se había extendido por toda Europa, haciendo posible
la producción masiva de libros y panfletos.
Cuando Martín
Lutero tradujo la Biblia latina al alemán corriente, hubo de repente un motivo
para aprender a leer: leyendo la Biblia por cuenta propia, se podría prescindir
de los curas para aprender la palabra de Dios. La Biblia se convirtió en un
éxito de ventas. Y, una vez que la gente supo leer, siguió haciéndolo. Algunos
incluso decidieron escribir.
En menos de lo que dura la vida de una
persona, el flujo de información había pasado de goteo a torrente. Este cambio
radical abonó asimismo el terreno para nuevas reglas de gobierno de la
explosión informativa que provocaron los caracteres móviles.
Conforme el estado
secular consolidaba su poder, estableció la censura y las licencias para
contener y controlar la palabra impresa. Se introdujo la propiedad intelectual,
brindando a los autores incentivos legales y económicos para crear. Más
adelante, los intelectuales presionarían para lograr reglamentos que
protegieran las palabras de la censura gubernativa; llegado el siglo XIX, la
libertad de expresión se convirtió en un derecho garantizado por la
constitución cada vez en más países. Pero estos derechos traían aparejadas unas
responsabilidades.
En la medida en
que algunos periódicos vitriólicos pisoteaban la intimidad o ensuciaban
reputaciones, surgieron reglas para proteger el ámbito privado de las personas
y permitirles presentar demandas por difamación. Sin embargo, estos cambios en
la gobernanza reflejan asimismo una transformación más honda y fundamental de
los valores subyacentes.
A la sombra de
Gutenberg, empezamos a comprender el poder de la palabra escrita; y, a la
larga, también la importancia de la información que se disemina sin trabas por
la sociedad. Con el paso de los siglos, optamos por más, y no menos, flujos de
información y por protegernos de sus excesos no por medio de la censura
principalmente, sino a través de normas que limitaban el mal uso. Según se vaya
adentrando el mundo en el ámbito de los datos masivos, la sociedad
experimentará un desplazamiento tectónico similar.
Los big data ya
están transformando muchos aspectos de nuestra vida y forma de pensar,
forzándonos a reconsiderar algunos principios básicos acerca de su crecimiento
y su potencial dañino. Sin embargo, a diferencia de nuestros antepasados en
tiempos de la revolución de la imprenta y después, no dispondremos de siglos
para adaptarnos: puede que solo se trate de unos pocos años.
No serán suficientes unos simples cambios de
las reglas actuales para gobernar en la era big data y atemperar su lado
oscuro. Más que un cambio de valores, la situación exige un cambio de
paradigma. La protección de la privacidad requiere que los usuarios de datos
masivos asuman mayor responsabilidad por sus actos. Al mismo tiempo, la sociedad
tendrá que redefinir la misma noción de justicia para garantizar la libertad de
actuación del ser humano (y, por consiguiente, la de ser considerado
responsable de esas acciones). Por último, hará falta que surjan nuevas
instituciones y profesionales para interpretar los complejos algoritmos que
subyacen a los hallazgos de los datos masivos, y para defender a aquellas
personas que podrían verse perjudicadas por ellos.
DE
LA PRIVACIDAD A LA RESPONSABILIDAD
Durante décadas,
un principio esencial de las leyes de protección de la vida privada alrededor
del mundo pasaba por atribuirle el control a los individuos, dejándoles decidir
si, cómo y por quién podría ser procesada su información personal.
En la era de
internet, este loable ideal se ha transformado a menudo en un sistema formal de
“notificación y consentimiento”. Al llegar los datos masivos, sin embargo,
cuando la mayor parte del valor de estos reside en unos usos secundarios, que
puede que ni siquiera se hubiesen concebido cuando se recogieron, un mecanismo
así ya no sirve para asegurar la privacidad. Para la era de los datos masivos,
prevemos un marco muy diferente centrado menos en el consentimiento individual
en el momento de la recogida de los datos, y más en hacer responsables a los
usuarios de lo que hacen. Las firmas valorarán formalmente una reutilización
determinada de los datos, basada en el impacto que tenga sobre los individuos
cuya información personal están procesando.
Las futuras leyes de protección de la
privacidad no tienen por qué detallar de forma exhaustiva todos los casos, sino
que definirán categorías amplias de uso, incluyendo las que son permisibles sin
cortapisas, o con solo algunas, limitadas y estandarizadas.
Para las iniciativas de mayor riesgo, los
legisladores establecerán reglas básicas para que los usuarios valoren los
peligros de un uso previsto, y encuentren la forma de evitar o mitigar los
daños potenciales.
Esto estimulará la
reutilización creativa de los datos, y al mismo tiempo asegurará que se adopten
las medidas suficientes para no perjudicar a los individuos.
Valorar formal y
correctamente el uso de datos masivos e implementar sus conclusiones con
precisión ofrece beneficios tangibles a los usuarios de datos: en muchos casos,
serán libres de buscar usos secundarios para los datos personales sin tener que
volver a ponerse en contacto con los individuos para recabar su consentimiento
explícito.
Por otra parte, unas valoraciones chapuceras,
o la mala implementación de las salvaguardias, expondrán a los usuarios de
datos a responsabilidades legales, y a mandatos, multas y quizá incluso
procesos penales. La responsabilidad del usuario de datos solo será efectiva si
tiene rigor.
El cambio en el
control desde el consentimiento individual a la responsabilidad del usuario de
los datos es un cambio fundamental y esencial, necesario para una gobernanza
efectiva del ámbito de los datos masivos. Pero no es el único.
PERSONAS
CONTRA PREDICCIONES
Los tribunales hacen responsables de sus actos
a las personas. Cuando el juez pronuncia su veredicto imparcial al acabar un
juicio justo, se ha hecho justicia. Sin embargo, en la era de los datos
masivos, tenemos que redefinir la noción de justicia para preservar la idea de
la capacidad de decisión del ser humano: el libre albedrío por el que la gente
elige sus actos. Se trata de la sencilla idea de que los individuos pueden y
deben ser considerados responsables de su comportamiento, no así de sus
propensiones. Antes de los datos masivos, esta libertad fundamental resultaba
obvia. Tanto, de hecho, que apenas necesitaba articularse.
Al fin y al cabo,
así es como funciona nuestro sistema legal: hacemos responsables de sus actos a
las personas, valorando lo que han hecho. En cambio, con los datos masivos
podemos predecir las acciones humanas cada vez con mayor exactitud, lo que
podría incitarnos a juzgar a las personas no por lo que han hecho, sino por lo que
hemos predicho que harían.
En la era de los datos masivos, tendremos que
ampliar nuestra visión de la justicia y exigir que incluya salvaguardias para
el albedrío humano, del mismo modo que, en la actualidad, velamos por la
imparcialidad procesal. Sin esas salvaguardias, la idea misma de la justicia
podría debilitarse por completo. Al garantizar la capacidad de decisión del ser
humano, nos aseguramos de que el gobierno juzga nuestro comportamiento
basándose en acciones reales, no simplemente en análisis de datos masivos. Así
pues, solo debe hacernos responsables de nuestras acciones pasadas, no de
predicciones estadísticas de unas acciones futuras. Y cuando el estado juzgue
actos anteriores, no debería basarse exclusivamente en datos masivos. Por
ejemplo, considérese el caso de nueve compañías sospechosas de amañar los
precios.
Resulta del todo aceptable emplear análisis de
datos masivos para identificar posibles colusiones, de forma que los
reguladores puedan investigar y levantar el caso por medios tradicionales. Pero
no se puede hallar culpables a estas empresas solo porque los datos masivos
sugieran que probablemente hayan cometido un delito.
El mismo principio
debería aplicarse a las empresas privadas que adoptan decisiones importantes
sobre las personas: contratarnos o despedirnos, ofrecernos un préstamo
hipotecario o negarnos una tarjeta de crédito.
Cuando estas
decisiones se basen principalmente en predicciones a partir de datos masivos,
recomendamos que se adopten determinadas salvaguardias.
La primera es la
transparencia: los datos y el algoritmo en que se fundamenta la predicción que
afecta al individuo han de estar disponibles.
La segunda es la certificación: una tercera
parte experta ha de certificar que el algoritmo es correcto y válido para
determinados usos sensibles.
La tercera es la refutabilidad: hay que
especificar formas concretas de que las personas puedan refutar una predicción
sobre ellas. (Esto viene a ser análogo a la tradición, en el ámbito de la
investigación científica, de revelar aquellos factores que pudieran debilitar
los hallazgos de un estudio).
CONCLUSIÓN
Lo que somos
capaces de recopilar y procesar siempre será una fracción minúscula de la
información que existe en el mundo.
Solo puede ser un
simulacro de la realidad, como las sombras en la pared de la cueva de Platón.
Como nunca podemos disponer de información perfecta, nuestras predicciones
resultan inherentemente falibles. Tampoco significa que sean incorrectas, solo
que siempre están incompletas. Esto no niega las percepciones que ofrecen los
datos masivos, pero los pone en su sitio: el de una herramienta que no ofrece
respuestas definitivas, solo algunas suficientes para ayudarnos por ahora,
hasta que aparezcan métodos mejores y, por consiguiente, respuestas mejores.
También sugiere que debemos usar esta herramienta con una generosa dosis de
humildad… y de humanidad.