Automatización desatendida de descarga de datos mediante RPA para nutrir data lake
Héctor Martín Gutiérrez
Escuela de Ingeniería Informática, Oviedo
El primer paso que hay que realizar en analitica de datos es la obtención de información, para posteriormente, estructurarla y tratarla. En este trabajo se ha estudiado el desarollo de un automatismo para la descarga masiva de datos, con los que, alimentar un lago de datos donde tener centralizada toda la información.
En este contexto, todas las distribuidoras publican cada día, alojadas en sus servidores, los datos horarios de energía bruta validada. Se trata de una cantidad grande de ficheros, por lo que, sería interesante que se pudiesen descargar de manera desatendida y que se ordenarsen por distribuidora para, poder nutrir un lago de datos.
Descripción: