Big Data, Open Data i informació pública

En una sessió formativa recent que tenia per finalitat donar conèixer el projecte d’implantació del nou sistema integrat d’informació estadística de Catalunya (SIIE) [1], el director de l’Idescat avançava que, a banda de treballar en l’arquitectura d’un nou servidor força més funcional amb les dades generades a partir dels diferents registres administratius (censos, padrons, enquestes i estimacions,… públics), s’estava sospesant la possibilitat d’incorporar al sistema informació estadístiques originàries de fonts privades, tals com bancs, asseguradores, empreses subministradores, empreses de telecomunicacions o grans companyies comercials, etc, com ja ho estaven fent altres instituts d’estadística públics de l’Estat.

El Gran Iceberg de la informació estratègica, a OESST, “Dades: la teva caixa d’eines. L’ús estratègic de la informació per millorar la gestió pública”, conferència a la sèrie Reptes de l’Ajuntament de Terrassa en l’aprenentatge organitzatiu, 25 feb 2014.

El Gran Iceberg de la informació estratègica, a OESST, “Dades: la teva caixa d’eines. L’ús estratègic de la informació per millorar la gestió pública”, conferència a la sèrie Reptes de l’Ajuntament de Terrassa en l’aprenentatge organitzatiu, Terrassa, 25 feb 2014.

 

El Dr. Udina plantejava a grans trets un “canvi radical a la manera de concebre la realitat estadística”, com resava la presentació, a posar en marxa “una revisió global del paradigma de la producció i la difusió estadística que requereix una perspectiva innovadora dels processos, les capacitats dins l’organització i les tecnologies utilitzades” (òbviament associada als requeriments febrils del Big Data, però també a la necessitat d’apropar l’estadística als ciutadans), per a la qual cosa invitava a una reflexió comuna tant als serveis productors o usuaris de dades estadístiques de dins el Govern català com de les diferents corporacions locals [2].

Per part de l’Idescat el propòsit del nou projecte es fonamenta en donar prioritat a la utilització dels registres públics, però també a “altra informació” ja disponible “per davant del model tradicional d’obtenir les dades, més car i més molest per al ciutadà, basat en enquestes i censos, i en la organització d’un sistema que permeti relacionar al màxim la informació disponible”. Aquest projecte d’integració es basa en la denominada Plataforma Cerdàque preveu les fases de captura de les dades, d’integració de les mateixes, de generació de productes i finalment a les fórmules d’accés a les dades. A aquesta plataforma hi seguirà el projecte Qualitas, relatiu a la traçabilitat de les dades que assegurin la seva qualitat, emprant un model Generic Statistical Business Process (GSBPM 5.2), que té en compte no només la producció d’estadístiques, sinó també la seva anàlisi (utilitat), les formes de facilitar la seva difusió, així com l’avaluació dels processos i dels continguts, en ares a una permanent adaptació a les necessitats tant internes, com les demandes dels usuaris que són els que, al cap i a la fi, afegeixen valor a les dades.

Posava sobre la taula, entre d’altres, dos aspectes claus amb els que ens hem anat trobant habitualment en la nostra feina d’observadors: l’accés relacional a les dades censals o registrals públiques (la millora, per tant, de l’arquitectura d’un servidor, d’una nova generació d’Open Data públic, un d’avançat), i d’altra banda, la necessitat d’abundar en altres formes de captació puntual de la informació a base de mètodes d’enquesta o àdhuc la informació a la que es pugui accedir de la que capten, processen i/o faciliten (i/o comercialitzen) entitats privades, que ja fa lustres que treballen en mecanismes de magatzematge, tractament, gestió i transformació en coneixement de la informació capturada a base principalment de les transaccions amb els clients, i emprada, fins ara, en la planificació estratègica del negoci propi, en el coneixement del mercat, en la millora i adaptació de processos productius i de productes. La pràctica posició quasi monopolista exercida per algunes d’aquestes companyies en determinats territoris fa que aquella informació pugui ser expressament considerada més enllà de la fiabilitat d’una enquesta representativa. Per tant, sense cap mena de rubor, s’elevava la consideració de les possibilitats d’ús d’aquella “altra informació” a pràcticament el mateix nivell d’ús i de significació que la informació administrativa; entre altres coses perquè, a més, la actualització de molts d’aquells registres privats és constant, i, en molts casos i per a determinats usos, de més alta robustesa, significació i actualitat que les enquestes públiques. I el nou paradigma està exigint, entre d’altres coses, una puntualitat i una pertinència més gran que la que ha estat oferta fins ara pels registres administratius, més evident en aquells capítols en els quals no hi ha cap informació registral. Malgrat aquelles s’hagin prodigat en els últims anys en la publicació de la informació en plataformes web (algunes força enrevessades) i en la construcció d’Open Datas publics, no s’han apaivagat les crítiques dels professionals de la mineria de dades que exigeixen encara molt més d’allò que ja s’ha publicat en obert, tot i més actualitzat, i en formats compatibles que facilitin la captació automatitzada i el seu lliure tractament. Estem parlant, per tant, de la resposta a una certa pressió del sector que gaudeix de lobbies influents lligats amb el gremi de la comunicació, però també a la necessitat de les pròpies administracions de comptar amb informació més actualitzada i fiable per respondre amb eficàcia als requeriments del seu propi funcionament i de les seves pròpies estratègies com a organització.

Curiosament, l’esforç d’algunes administracions (com el de força ajuntaments) per desenvolupar i disponibilitzar servidors oberts i sistemes Open Data com a nous emblemes d’una administració decididament oberta i transparent, no s’ha seguit per les grans corporacions privades, que ara entenen que la informació que es desprèn dels seus processos també pot ser matèria de nou negoci, en esdevenir un element comercialitzable. Molt poques posen de manifest les seves dades en un format obert (especialment aquelles que consideren matèria d’interès per a la competència més directa [3])  i les que es vanen de disposar de potents bases de dades ho han fet fins ara mitjançant demostracions genèriques adreçades a l’exhibició del nou producte que és la informació capturada i processada, que es deriva de les dades dels seus clients (altrament ciutadans també!), sobre els seus estats (social, econòmic, laboral,…) i sobre els seus comportaments com a consumidors, productors o venedors, és a dir, sobre els seus gustos i les seves activitats quotidianes. Entitats com BBVA o Telefònica, fins i tot han jugat amb joint ventures o cessions temporals a investigadors innovadors, per tal de procurar a través de samples l’admiració ciutadana en el camp del Big Data i, per tant, com a clara matèria de publicitat, profusament mostrats en estudis ex professo (vegeu el desenvolupat per Telefónica amb el Temps de Flors gironí) o àdhuc en exposicions divulgatives (com la tan exitosa Big Bang Dataauspiciada per Telefónica Fundación i celebrada a la primavera de 2014 en el Centre de Cultura Contemporània de Barcelona, en la qual es mostrava les experiències en l’ús de la informació privada per part de Telefónica i del BBVA), per captar nous clients als quals pot interessar aquella informació per a la realització de nous estudis de mercat. La informació esdevé “un nou petroli” per a l’activació de negocis en un mercat pràcticament infinit. Però potser també per posar en evidència les mancances del sistema censal del sector públic, fins al punt de denunciar-les públicament en conferències sobre administració oberta, emprant en realitat una gran dosi de demagògia interessada, atès que ells gairebé mai (o en comptadíssimes ocasions) posen en obert les dades que capturen o produeixen.

Les grans corporacions privades, a la vista de les grans possibilitats del negoci, han potenciat el tractament d’informació creant sengles departaments o noves empreses dins els grups respectius per a l’explotació de les seves bases de dades, capturades a resultes de les transaccions amb els clients per caixa o per caixer automàtic o per pagaments amb targeta de crèdit via datàfon (vegeu, per exemple, BBVA Data & Analytics SL). Àdhuc hi ha empreses creades ad-hoc per a l’explotació de les dades que es capturen mitjançant els seus propis sensors, instal·lats i mantinguts de forma permanent a la via pública, a l’objecte de calcular afluències de vianants o de participants en un determinat festival. És més, la disponibilitat de dades ha apressat l’emergència d’una col·lecció d’empreses intermediàries dedicades al tractament estadístic específic que, de fet, ha donat forma a un nou sector Big Data molt agressiu, a través del qual es dóna sortida a aquelles bases de dades entre els possibles compradors per mitjà d’una sort de propostes diverses revestides de business intelligence.

En tots aquells casos, l’accés no és exactament lliure, sinó que és de previ pagament; les dades es comercialitzen. Allò que es genera és en realitat Closed Datas, quelcom oposat a allò que el propi sector paradoxalment està exigint a les administracions públiques. La informació recollida que expressen els clients de les empreses ja no es considera pública sinó que passa a cedir-se i a ser propietat de l’empresa, d’ús exclusiu o restringit, i es dona per fet que és així (i expressat en la lletra petita dels documents contractuals que regulen la relació entre empresa i client), ningú sembla posar en dubte tal apropiació. Resulta que qui demanda transparència és en realitat el menys transparent: no cal esforçar-se massa per advertir els resultats de tants anys d’opacitat (àdhuc en temps de l’eclosió del Big Data) transformats en els majors casos de frau social, com la de les informacions sobre la gestió que es publicaven per algunes entitats financeres, que han desembocat en la necessària intervenció dels Estats i, en alguns casos, a la venda i/o a la desaparició de les mateixes.

Al damunt de la taula planen, doncs, qüestions d’ètica, especialment punyents sobre l’ús i la propietat de les dades individuals obligatòriament “prestades” al sector privat, sobre les quals es fonamenta especialment el nou capitalisme sorgit amb darrera crisi: especulant sobre la informació de les persones, a les quals se’ls fa conscient que és gairebé impossible deixar d’estar fitxat, i que contínuament són requerides d’augmentar encara més la seva informació en els fitxers privats, tal vegada quan es demana el codi postal al pagar en un hipermercat, tal vegada en acceptar participar en una rifa o en un concurs via internet, tal vegada cada cop que es paga amb una targeta de crèdit, etc… I aquestes són dades que són un bon material de transacció comercial i d’alta rendibilitat, a un cost relativament baix.

Nogensmenys, en el tinter del debat encetat a l’Idescat, hi resta un apunt sobre la via legal per a l’accés i utilització d’aquella informació “privada” als efectes dels estudis socioeconòmics de transcendència estratègica endegats per les administracions públiques en benefici del comú, entenent que les dades facilitades pels usuaris dels serveis privats, ho són per ciutadans que també se’n podrien beneficiar dels resultats de les anàlisis públiques generades amb aquelles dades. Com podíem llegir en l’expo de Big Bang Data, “les dades han de ser també una oportunitat per al coneixement, la prevenció, l’eficàcia i la transparència, una ocasió a no desaprofitar per fer una societat més democràtica a través de la transparència que ofereixen les noves tecnologies i els nous mètodes d’explotació de grans volums de dades”. Però on queda aquesta oportunitat si bases de dades generades amb les aportacions individuals dels ciutadans resten en el patrimoni de les grans corporacions? Certament la informació és la base d’oportunitat per al capital, com els Open Data ho són en realitat per a un segment petit i expert de la població que és capaç de tractar-la, per tant, encara restringint les veritats a mans especialitzades i també els avenços en democràcia. Cal, per tant, un nou model d’accés a les dades que inclogui el lliure accés a les dades que fan democràcia.

El director de l’Idescat informà succintament sobre l’adquisició onerosa de bases de dades per part d’algunes agències públiques a l’Estat espanyol o la signatura de convenis singulars d’ús (sovint amb una contraprestació associada). Tanmateix, també confessà que, paral·lelament a determinar la incorporació de dades privades, s’estava estudiant la manera que aquelles fossin en un futur no massa llunyà d’ús gratuït per a les administracions públiques, segurament associant-ho a la promulgació d’una norma amb rang de llei o lligant-ho, per exemple, a la concessió de noves llicències d’activitat o permisos d’ús de l’espai públic, en ares a un interès social evident.

Entretant, els preus pressupostats per a l’ús continu d’aquestes “Closed Datas”, malgrat totes les seves bondats i significació, malgrat rebaixes i alguns exemples espectaculars, ara per ara són difícilment assumibles per les administracions públiques i, més encara per les locals, quan, a la vegada, la posició dels gestors propietaris no estat en realitat massa generosa, a comptada excepció de les exhibicions volgudament interessades del seu potencial; quan, a la vegada, la posició en el mercat local els permetria, més enllà de l’exercici del pur mercantilisme, una funcionalitat tan pública i de responsabilitat social com la que aquelles mateixes entitats sovint pregonen. Entretant, les vies alternatives al classicisme estadístic, també aptes per a les administracions públiques, s’hauran de decantar per una dosi més gran d’enquestes generals i sectorials, pels baròmetres de país o de ciutats, per explotacions més en profunditat de registres administratius existents o per opcions més entroncades amb l’ús d’aplicacions lliures per processar i relacionar informació seriada publicada a la xarxa (àdhuc la privada), com el webscraping, que permeten obtenir també resultats força interessants i útils per a la presa de decisions.

Xavier Muñoz Torrent, Observatori Econòmic i Social i de la Sostenibilitat de Terrassa


 

Notes

[1] El SIIE havia d’entrar en funcionament en una primera fase durant 2016. Desenvolupat per l’Idescat amb l’assistència de Hewlett Packard Enterprise.

[2] El Dr. Frederic Udina ha presentat àmpliament el nou model en diferents àgores. Vegeu el repositori de la UAB.

[3] És interessant recordar com l’eliminació dels monopolis d’empreses als anys 1990, com els de Telefónica o algunes subministradores, com l’aleshores FECSA o Catalana de Gas, van redundar en una reducció dràstica de les dades disponibles i molt especialmente en el seu detall territorial, fins i tot a deixar-les de donar completament, atesa la irrupció de competidors. Tampoc aleshores la demanda d’informació i de transparencia era la que és ara.

La teva valoració d'aquest article: 
Sigues el primer el valorar aquest article!
sistema integrat d’informació estadística de Catalunya (SIIE) [1], el director de l’Idescat avançava que, a banda de treballar en l’arquitectura d’un nou servidor força més funcional amb les dades generades a partir dels diferents registres administratius (censos, padrons, enquestes i estimacions,… públics), s’estava sospesant la possibilitat d’incorporar al sistema informació estadístiques originàries de fonts privades, tals com bancs, asseguradores, empreses subministradores, empreses de telecomunicacions o grans companyies comercials, etc, com ja ho estaven fent altres instituts d’estadística públics de l’Estat." data-share-imageurl="http://perfilciutat.net/sites/default/files/images/blog/iceberg.jpg">

Volem saber que en penses...

Sigues el primer en escriure un comentari

Rep les darreres notícies al teu e-mail