Data Archiving: Qué es y cómo se utiliza en el panorama de datos actual

 

Data Archiving es el proceso de proteger y retener datos para almacenarlos a largo plazo. El data archiving permite que la información importante se almacene en lugares seguros para que se pueda utilizar cuando sea necesario. A este proceso de almacenamiento generalmente se le aplican algunas políticas, dependiendo de la información en cuestión. Por ejemplo, cuanto tiempo de retención tendrán, lo sensibles que son o las medidas de seguridad que se deben contemplar, entre otras.

data_archiving.jpg

Créditos fotográficos: TCmake_photo

 

Índice de contenidos

1. ¿Qué es Data Archiving y en qué se diferencia de un Back Up de datos?

2. Mejores prácticas de Data Archiving

3. El impacto de GPDR en Data Archiving

4. Influencia del Big Data en el Data Archiving

5. Material complementario

1. ¿Qué es Data Archiving y en qué se diferencia de un Back Up de datos?

El data archiving protege los datos más antiguos que ya no son necesarios para el uso diario durante las operaciones de una organización pero a los que puede ser necesario acceder ocasionalmente. De esta forma, el data archiving reduce el almacenamiento primario requerido y permite a una organización mantener datos que pueden ser necesarios para requisitos legales, de auditoría u otros.

El data archiving puede permitir, si se desea, un acceso de solo lectura para protegerlos de modificaciones, mientras que en otros casos se tratan los datos para permitir que los usuarios los modifiquen.

El beneficio del data archiving es que reduce el coste del almacenamiento, ya que el la conservación de archivos cuesta menos porque se basa en un medio de almacenamiento de alta capacidad y bajo rendimiento. Además, esta opción está disponible a través de distintas alternativas:

  1. Almacenamiento de datos en línea: coloca los datos de archivo en los sistemas de disco donde es fácilmente accesible. Los archivos suelen estar basados en archivos, aunque el almacenamiento de objetos está creciendo en popularidad. Un desafío clave cuando se usa el almacenamiento de objetos para archivar datos basados en archivos es el impacto que puede tener en los usuarios y las aplicaciones. Para evitar el impacto del cambio de paradigmas se recomienda emplear soluciones de administración de datos que proporcionen una interfaz de archivo a los datos que se archivan como objetos.
  2. Almacenamiento de datos offline: en este caso, los datos de archivo se graban en medios extraíbles utilizando el software de archivo de datos en lugar de mantenerse en línea. Lo que se consigue de esta forma es reducir el consumo de energía y, por lo tanto, también el coste.
  3. Almacenamiento en la nube: se trata de un sistema barato, pero que requiere una inversión continua.

 

Hoy, un enfoque popular para el data archiving es hacer que el archivo sea "transparente", por lo que los datos archivados, aunque estén en línea, puedan ser accedidos por usuarios y aplicaciones exactamente como antes, para que no experimenten ningún cambio en el comportamiento.


La diferencia entre la copia de seguridad de datos y el data archiving

Pese a que muchas veces ambos términos se confunden y son utilizados indistintamente, una copia de seguridad y un archivo se utilizan para fines completamente diferentes y son bastante distintos entre sí en muchos aspectos, como los siguientes:

  • Duración: el tiempo que los datos se encuentran almacenados en una copia de seguridad es mucho más breve que el que permanecen en un archivo. Dependiendo de su importancia operativa, los datos almacenados en una copia de seguridad se pueden actualizar con gran frecuencia. Son datos necesarios por un espacio de tiempo muy breve y pueden actualizarse cada día o incluso varias veces en 24 horas. Por el contrario, los archivos pueden almacenar grandes cantidades de datos durante muchos años y, debido a ello, su integridad debe quedar garantizada.
  • Ubicación: una copia de seguridad es simplemente una copia de la información actual y activa almacenada en los servidores. Crearla no afecta a los archivos de datos originales, que continúan ubicados en el mismo sitio. Sin embargo, el proceso de data archiving, aunque también permite tener una copia de los datos, reubica los datos, trasladándolos a localizaciones de almacenamiento más económicas y a largo plazo.
  • Propósito: un Back Up es una copia de los datos actuales y activos que puede usarse para recuperaciones operativas en caso de que la información se pierda o se corrompa, su misión es restaurar sus datos a un punto anterior en el tiempo. Los archivos ayudan a alcanzar una meta muy diferente, ya que están destinados a ser utilizados como repositorios de datos que deben mantenerse durante un largo período de tiempo, al no ser necesariamente importantes para las actividades operacionales.
  • Velocidad: como el propósito de una copia de seguridad y un archivo son diferentes, las características que se valoran en cada una de ellas también lo son. Al hacer una copia de seguridad, la velocidad es un atributo importante, ya que su frecuente actualización lo requiere. Igual de relevante es la capacidad de recuperar y restaurar datos rápidamente en caso de pérdida de datos, ya que un procedimiento de copia de seguridad rápido le permite a su empresa limitar el impacto operativo. En el caso del archivado de datos, no existen situaciones en las que los datos guardados puedan ser requeridos con dicha urgencia, por lo que no sería un atributo prioritario.
  • Capacidad de búsqueda: poder localizar fácilmente un archivo es de vital importancia en el archivado de datos. Al fin y al cabo, se trata de datos acumulados durante años, en grandes cantidades, y sobre los que muy probablemente no se conoce la ubicación. El Back Up no suele estar asociado a este tipo de problemas, ya que su volumen de contenido no solo es mucho menor, sino que es más actual, por lo que resulta más sencillo encontrar ubicaciones.

Accede al Webinar sobre Data Archiving

Se podría concluir estableciendo que, los datos almacenados en una copia de seguridad son una copia de los datos operativos actuales y activos que usa una empresa, a los que se accede de forma regular. Por el contrario, los datos almacenados en un archivo generalmente ya no se usan, no cambian con frecuencia y no se requieren con regularidad. Por ello, el traslado de estos archivos del almacenamiento habitual de una empresa a otra ubicación no afecta a los usuarios, siempre que pueden estar fácilmente accesibles en caso de ser requeridos.

 

2. Mejores prácticas de Data Archiving

Pese a que el planteamiento de data archiving parece sencillo, a la hora de llevarlo a la práctica puede revestirse de complejidad. Los retos están, muchas veces, relacionados con la planificación que necesita todo proceso de archivado de datos, aunque so se trata del único desafío. Para hacerles frente a todos, es recomendable aplicar las siguientes mejores prácticas de archivo de datos:

  1. Decidir acerca de la información que se desea guardar. Es necesario tener claro qué datos se quiere conservar. Pero ¿Cómo decidir acerca de datos que no se han modificado en meses? Para determinar qué datos se deben archivar se puede tener en cuenta la fecha en la que se accedió por última vez a la información. Sin embargo, no es conveniente orientarse únicamente por este criterio. Existen otros aspectos a considerar, como el tipo de datos. Como no puede hablarse de un método universal de data archiving, habrá que establecer políticas y métodos específicos para gestionar cada case de datos.
  2. Gestionar el ciclo de vida de los datos. El análisis de la trayectoria vital del dato permite hacerse preguntas cuya respuesta será de gran utilidad para guiar el proceso de data archiving y establecer prioridades. ¿Qué datos se deben eliminar? ¿Cuándo se deben borrar definitivamente? ¿Quién decide que es el momento de hacerlo? ¿Qué garantías ofrece el proceso de eliminación? Resulta imprescindible definir planes específicos para cada circunstancia y, por eso, es de gran ayuda abordar de antemano las diferentes situaciones que pueden presentarse. Además de tener en cuenta a los propietarios del dato, hay que observar la legislación vigente. La gestión del ciclo de vida del dato y todo lo que rodea a data archiving debe permitir aumentar la eficiencia en la administración de los activos informacionales de la compañía, pero también debe alinearse con los requisitos de cumplimiento.
  3. Desarrollar una política de archivado de datos integral. Una vez se conocen los datos que se van a archivar, hay que definir un conjunto formal de procedimientos que dicte las reglas de aplicación al proceso de archivo. En estas normas no pueden faltar referencias a los criterios para archivar cada tipo de dato, los medios que se emplearán para almacenar los datos archivados, los mecanismos que se utilizarán para facilitar el proceso de archivo, el acceso a los datos y la permanencia máxima de los datos en el archivo. Otra consideración importante es proteger la integridad del archivo, por una parte, contra manipulaciones, lo que impedirá que un usuario final pueda encubrir comportamientos poco éticos haciendo modificaciones a los datos archivados; y, por otra, contra la pérdida. Este último frente se resuelve asegurando que existan varias copias de los datos archivados en distintos medios, online, offline o la nube.
  4. Establecer criterios de archivo. La automatización sería uno de ellos, el que garantiza que los datos siempre se archivan de acuerdo con la política y que nada queda a la improvisación. Otro es la búsqueda, una capacidad esencial que está muy relacionada con el criterio de flexibilidad. El motivo es que el proceso de descubrimiento electrónico generalmente implica examinar grandes cantidades de datos archivados y, por eso, el motor de búsqueda que se utilice debe ser lo suficientemente flexible como para permitir realizar búsquedas granulares. Por último, no hay que olvidarse de hacer referencia al seguimiento de auditoría, una característica importante puesto que, con cada pista se debe poder conocer la identidad de quien accede a cada archivo, el momento, medio y conjunto de datos al que se ha tenido acceso.

 

3. El impacto de GPDR en Data Archiving

La influencia del GDPR sobre el archivado de datos es que eleva la importancia de la privacidad de datos como un elemento crítico a considerar cuando se selecciona una solución de gestión, ya esté encaminada a cubrir las necesidades de data archiving del negocio, ya busque resolver las cuestiones de gobierno de datos. Uno de los focos se pone en la nube, donde, dependiendo del proveedor, las prácticas de seguridad operacional y de datos varían ampliamente. Y, precisamente por eso, hay que extremar las precauciones Y:

  1. Segmentar por ubicación de datos. Las organizaciones deben comprender dónde residen los datos personales y los riesgos potenciales a los que están expuestos. Para lograrlo, primero deben entender dónde se almacena la información de cada individuo, después, hay que confirmar que los datos se almacenan exclusivamente en esa ubicación y, por último, implementar las políticas de retención y disposición adecuadas que cumplan con las pautas de GDPR.
  2. Comprender, limitar y supervisar el acceso a los datos personales. No todos los usuarios de negocio pueden ni debe tener el mismo nivel de autorización de acceso a la información. Para que las organizaciones puedan cumplir con los requisitos que establece el GDPR deben comprender y limitar el acceso de los empleados a datos personales. En los niveles más altos de autorización, los que disfruten de más privilegios, deberán recibir capacitación. Asimismo, tendrán que crearse procedimientos documentados para la gestión de datos personales.
  3. Evaluar las capacidades existentes. Es importante poder buscar, filtrar y recuperar datos rápidamente y no todos los métodos y procedimientos existentes pueden asegurarlo. Por tanto, es preciso evaluar si se puede cumplir con los nuevos requisitos de privacidad de datos, sin demora y filtrando información personal no pertinente al tema que se está litigando o investigando.
  4. Estar en disposición de eliminar registros completos para individuos. Es uno de los nuevos derechos que reconoce el GDPR y al que las empresas se deben asimilar. Deben estar preparadas para recibir solicitudes de individuos que exigen que sus datos personales sean eliminados de los sistemas.
  5. Alinearse con los proveedores. El GDPR también establece la obligación de que las organizaciones implementen medidas técnicas y organizativas para demostrar cómo se ha integrado la protección de datos en sus actividades de procesamiento, y esto incluye a sus proveedores, que deberán ayudarles a garantizar que los datos están seguros y sometidos a una gobernanza adecuada.

 

4. Influencia del Big Data en el Data Archiving

Data archiving y Big Data no son incompatibles, sin embargo, cada organización deberá encontrar la forma de alinear la estrategia de archivado de datos con los proyectos de Big data en marcha. Pasado y futuro se reencuentran en los sistemas de negocio.

Cuando pensamos en las estrategias de archivo, a menudo hablamos sobre el pasado, mientras que, cuando se trata del futuro, la incertidumbre es el denominador común.

Es difícil pronosticar todos los eventos, tendencias y cambios que afectarán los requisitos de archivado de información. ¿Cómo saber qué datos hace falta preservar? ¿De qué modo escoger plataforma y herramientas? ¿Es posible garantizar la accesibilidad de la información para los usuarios del mañana?

Lo cierto es que, considerar la variable Big Data al definir el plan de data archiving sirve para contener costes, reducir riesgos y mejorar la productividad.

Pero no se puede considerar los programas de archivo como un proyecto independiente. El análisis de Big Data, que aplica un conjunto de tecnologías para examinar tendencias actuales de conjuntos de datos múltiples y no relacionados, necesita tener garantizado el acceso a los datos, a información activa, con potencial de generar valor en la toma de decisiones comerciales cotidianas o la resolución de problemas. Y los archivos no tienen un significado real en un marco como éste.

De hecho, el recurrir a ubicaciones de archivado fuera del núcleo centralizado y hacia una serie de configuraciones discretas, desafía el equilibrio del sistema. Por tanto, hay que entender que las filosofías de diseño de infraestructura ágiles no pueden asumir una práctica de archivo independiente y, por esa razón, la forma en que se concibe data archiving debe evolucionar.

Así, hay que dejar de pensar en un archivo como un conjunto de operaciones e infraestructura separadas y distintas y buscar una estrategia de archivado en el lugar donde se concentra todo el conocimiento.

¿Quieres implementar un proyecto de Big Data?  Consulta con un experto para lograr que tu iniciativa en Big Data tenga éxito 

 

5. Material complementario

Soluciones y recursos para Data Archiving

Guías

Artículos

 Ebook Data Archiving