El terme 'data lake' s'ha normalitzat entre els CIOs i els CMOs, però estan sent moltes les ocasions en què la seva implantació no està donant els resultats esperats. Els avenços en les tecnologies de tractament i emmagatzematge d'informació estan permetent obtenir valor d'una informació cada vegada més diferent. També està permetent la presa de decisions de forma més ràpida. Moltes empreses tracten d'assegurar la rendibilitat de les seves inversions tecnològiques transformant el seu 'data lake' passiu en un mercat de dades actiu.
Una de les novetats que aporta la gestió de dades amb un 'data lake' és facilitar un entorn que permeti la congregació d'informació de fonts molt dispars en estat brut. Aquesta s'ha vist com una via per evolucionar (amb menors costos de temps) el model de 'datawarehouse' i 'datamart' que fins fa ben poc eren la clau del màrqueting de clients.
Cada vegada més a tota l'organització, i no només els departaments de negoci com màrqueting, s'entén que el seu futur està en maximitzar el valor del client a llarg termini. Per això és fonamental comprendre el global de l'experiència del client amb la companyia i per tant incorporar la informació que abans estava en les sitges de màrqueting, operacions, recursos humans o finances. Això passava quan l'empresa generava dades per a una acció promocional, l'activitat comercial o de postvenda, un estudi de mercat, el seguiment de les operacions o de recursos humans i la informació la feia servir només per a aquest ús.
Un dels majors riscos que suposa l'ús d'aquestes tecnologies és que degeneri el 'data lake' en un gran magatzem de dades passius, el que s'anomena un 'data swamp'. L'èxit del 'data lake' fa que creixi el nombre d'usuaris que aporten i requereixen informació i el nombre de fonts o la tipologia d'informació. Augmenta així el risc de perdre capacitat per identificar els continguts i que el cost de recuperar la informació pertinent sigui tan alt que al final cada usuari simplement utilitzeu la part a la qual està habituat, tornant de facto, a un sistema de sitges.
Convé recordar que la filosofia del 'data lake' està orientada a la demanda d'informació. Cada usuari pot reconstruir, a partir de dades brutes, la mètrica de negoci al contrari del que passava amb les bases de dades estructurades, que faciliten les mètriques ja elaborades. El valor incremental del 'data lake' està en que cada vegada més equips puguin acudir a ell de forma autònoma i descentralitzada per extreure la informació que necessiten. Per exemple, perquè àrees operatives puguin millorar els seus processos aplicant tècniques de 'process mining' o les de recursos humans puguin augmentar la seva aportació de valor acudint al 'people analytics'.
És important que disposem d'un 'Business Case' que serveixi de guia estratègica a l'hora d'implantar el 'data lake', comptant que els seus beneficis estan més enllà de l'estalvi de costos d'emmagatzematge. La reducció de temps per accedir i accionar la informació, la capacitat de treballar amb noves fonts de dades o l'augment del nombre d'àrees de negoci que podran millorar la seva aportació de valor gràcies a l'analítica són elements que haurà d'incorporar.
El primer pas perquè el 'data lake' sigui un mercat de dades actiu està en la correcta planificació del projecte. Permetre que creixi a mesura que s'identifiquen necessitats de negoci dins de l'organització.
–Multivalent: mantenir tant àrees d'informació bruta com a àrees de 'datamart' amb la informació pretractada i estructurada per facilitar l'accés a diferents perfils d'usuaris.
–Versatilitat: al costat de les tecnologies de gestió de la informació, disposar d'aplicacions que s'executin de manera àgil i flexible la fase de preparació de la dada.
–Govern de la dada: és fonamental que el govern de la dada inclogui, a mesura que s'incorporen fonts en el 'data lake', el seu complet mapeig. Al costat de la tipologia i naturalesa de cada indicador, conèixer la vinculació als processos de negoci permetrà entendre com s'ha generat la informació, amb quin objectiu. Permetrà conèixer les vinculacions de negoci més enllà de les dades, quins equips de l'empresa estan darrere de les dades i en quines condicions i amb quin objectiu han estat recollides.
Per convertir un 'data lake' passiu en un mercat de dades actiu assegurarem l'accés autònom i descentralitzat a usuaris de diferent perfil. Per a això, al costat dels requeriments tecnològics per assegurar la versatilitat de la informació, és fonamental el correcte govern de la dada. Aquest ha de permetre, en tot moment, que l'usuari conegui tots els detalls pertinents de la informació que pot arribar a demanar.