Las empresas cada vez le dan mayor importancia al respaldo de su información, especialmente de la crítica que se encuentra en los servidores de la empresa, equipos de gerentes y directores. Pero no basta con sólo copiar la data a un dispositivo. Actualmente existen una serie de soluciones que permiten guardar la información como recuperarla fácilmente.
La información es uno de los bienes más importantes en la empresa moderna. Datos financieros, proyectos, correos electrónicos y listado de clientes son algunos de los datos informáticos que las compañías necesitan respaldar constantemente. Las actuales redes internas, externas o el mismo Internet permiten un backup eficaz y continuo, pero existen muchas organizaciones en donde los datos críticos se encuentran en los notebooks de los gerentes, los cuales muchas veces no se respaldan. Incluso, cuando estos ejecutivos viajan constantemente, el respaldo o la recuperación de datos se hace esencial.
Si un monitor, la tarjeta de memoria o el procesador de un computador fallan, trae algunas molestias, pero pueden ser reemplazados. En cambio, si es el disco duro el que presenta problemas, existe la posibilidad de perder información importantísima. Esto se hace más crítico en sectores como la banca, los seguros o el retail.
Por otro lado, también pueden presentarse interrupciones en el funcionamiento de un dispositivo que contiene datos. Virus informáticos, errores humanos, inundaciones, incendios, hackers, caídas de red o problemas de software son algunos ejemplos. Y aunque no se pueda prevenir cada una de estas interrupciones, la organización puede prepararse para evitar las consecuencias que éstas tengan sobre su negocio. Del tiempo que tarde en reaccionar una empresa dependerá la gravedad de sus consecuencias.
Las copias de seguridad son uno de los elementos más importantes y que requieren mayor atención a la hora de definir las medidas de seguridad del sistema de información.
Políticas de Respaldo
Antes de elegir el tipo de respaldo, backup o storage para proteger la información, se deben tomar en cuenta una serie de prácticas permanentes para tal efecto. Se podría decir que las políticas de respaldo son tan importantes como las políticas de seguridad informática al interior de una empresa. Es más, son parte de ellas.
Las copias de seguridad se pueden realizar en diferentes momentos del día, incluso en diferentes días, pero siempre se han de realizar de acuerdo a un criterio y calendario. Si es posible, la copia se debe efectuar de forma automática por un programa de copia y según la configuración de éste, se podrá realizar un día concreto, ya sea de forma diaria, semanal o mensualmente, incluso a una hora determinada, cuando el sistema esté inactivo. Todos estos y muchos más parámetros pueden estar presentes en los programas que realizan las copias de seguridad y deben permitirnos la realización únicamente de las tareas de supervisión.
La mejor forma de controlar los procesos que se desarrollan en el sistema de información, aunque éstos sean desplegados en una parte importante por el propio sistema, es que exista un responsable que incluya entre sus funciones la supervisión del proceso de copias de seguridad, el almacenamiento de los soportes empleados en un lugar designado a tal fin e incluso de la verificación de que las copias se han realizado correctamente.
Por último, se debe considerar el uso de diferentes soportes para almacenar los datos. Por ejemplo, realizar una copia de seguridad completa cada semana y guardar la cinta durante algunos meses (preferentemente en algún sitio seguro ajeno a la empresa). A esto, agregarle un sistema de copias de seguridad diarias, que se guardan durante una semana y que pueden ser completas, incrementales o diferenciales. Por último realizar un backup de forma remota (replicación) a una empresa externa, tendencia que cada vez crece más en el mundo corporativo.
También se recomienda guardar las copias de seguridad en un lugar alejado, como por ejemplo, una caja de seguridad o cualquier otro sitio asegurado contra incendios, para que, en caso de que se produzca algún desastre, los datos se encuentren protegidos.
Tipos de Respaldo
1. Copias de información (backups)
Estos respaldos son sólo duplicaciones de archivos que se guardan en "Tape Drives" de alta capacidad. Los archivos que son respaldados pueden variar desde archivos del sistema operativo y bases de datos hasta archivos de un usuario común. Existen varios tipos de software que automatizan la ejecución de estos respaldos, pero el funcionamiento básico de estos se llevan acabo mediante tres tipos de respaldos comúnmente utilizados:
- Full: Guarda todos los archivos que sean especificados al tiempo de ejecutarse el respaldo.
- Incremental Diferencial: En esta caso Guarda todos los archivos modificados desde el último respaldo ya sea Full o Incremental
- Incremental Acumulativo: En este caso Guarda todos los archivos modificados desde el último respaldo Full. Mediante esta opción se beneficia el tiempo de recuperación ante un desastre
- Full Sintetizado: Este tipo avanzado de respaldo permite generar respaldos full en el servidor de respaldo sin necesidad de acceder al servidor original donde se extrajeron los datos, esta técnica permite generar un respaldo full mezclando el último respaldo full con los incrementales. Esta técnica permite generar respaldos full sin producir carga innecesaria en los servidores origen.
2. Secuencia de Respaldo GFS (Grandfather-Father-Son)
Esta secuencia de respaldo es una de las más utilizadas y consiste en Respaldos Completos cada semana y Respaldos de Incremento o Diferenciales cada día de la semana.
3. Duplicado de Información en Línea (RAID)
Una medida básica de protección de datos es el respaldo de los datos en línea esto se logra incorporando redundancia en los discos rígidos de los servidores, esto se logra mediante un conjunto de 2 o más "Discos Duros" que operan como grupo y logran ofrecer una forma más avanzada de respaldo, ya que es posible mantener copias en línea ("Redundancy"), agilizando las operaciones del sistema (sobre todo en bases de datos). Además, el sistema es capaz de recuperar información sin intervención de un Administrador. Existen varias configuraciones de Tipo RAID, sin embargo, hay cuatro tipos que prevalecen en muchas arquitecturas:
- RAID-0: Cada archivo es dividido (striped) y sus fracciones son colocadas en diferentes discos.
- RAID-1: Cada vez que se vaya a guardar un archivo en el sistema éste se copiara íntegro a dos discos (en línea). Es por esto que RAID-1 también es llamado mirroring o copias espejo.
- RAID-3: Divide la información de todos los archivos (striping) en varios discos, pero ofrece un nivel de respaldo que RAID-0 no ofrece. En RAID-0 si falla un disco del grupo, la información no puede ser recuperada fácilmente, ya que cada disco del grupo contiene una fracción del archivo; sin embargo RAID-3 opera con un disco llamado "de paridad", que guarda fracciones de los archivos necesarias para recuperar toda su Información.
- RAID-5 : ¿Qué ocurre si falla el disco de paridad? Para resolver este problema RAID-5 no solo distribuye todos los archivos en un grupo de discos (striping), sino también la información de paridad es guardada en todos los discos del sistema (striping). Esta configuración RAID suele ser usada en sistemas que requieren un "alto nivel" de disponibilidad, inclusive con el uso de "Hot-Swappable Drives" es posible sustituir y recuperar la información de un disco dañado, con mínima intervención del administrador y sin la necesidad de configurar o reiniciar al sistema.
Según Fernando Norero, gerente de Productos de CIENTEC Computación, muchas veces se usa una mezcla de métodos y formatos de backup según sean las necesidades de la empresa. "El gran problema de hoy es que los usuarios tienen poco tiempo para realizar respaldos. Por eso existe la posibilidad que de forma remota vaya al servidor de respaldo y recupere -por ejemplo- sólo los datos incrementales de la última actualización", indica.
El ejecutivo agrega además que lo otro novedoso es la integración con sistemas de almacenamiento sofisticado. "Por ejemplo, los sistemas de respaldo centralizado tienen la posibilidad de realizar copias internas, respaldar y duplicar la data. De esta forma, cuando un usuario necesite recuperar información, los sistemas de respaldo aprovechan esa característica para ir a al espejo, recuperar los datos y no tener que recurrir al servidor central," señala.
Dispositivos Utilizados
Cuando se planifica una estrategia de respaldo o de copias de seguridad lo primero que se debe tener en cuenta es el soporte que se utilizará para tal efecto. Esta decisión depende de una serie de variables, como el volumen de datos a copiar, la frecuencia, disponibilidad de la copia y el tiempo en que demora el sistema en ser recuperado. Entre los soportes más recurrentes para respaldar servidores encontramos una mezcla entre un caché de respaldo en sistemas de discos rígidos económicos (SerialATA) y unidades robotizadas de cintas magnéticas. Los sistemas de respaldo de estaciones de trabajo y/o Notebooks normalmente consolidan automáticamente la información de estas en discos rígidos de algún servidor destinado a ese fin el cual es respaldado usando técnicas de respaldo de servidores, los sistemas de respaldo de Estaciones de trabajo normalmente permiten generar un conjunto de Compact Disc que permitan reconstruir la información de una estación de trabajo, siendo el primer CD normalmente booteble.
Norero indica que existen distintos tipos de formatos de cintas LTO, SDLT, MLR, DAT, etc, incluso unidades ópticas, pero la idea es siempre la misma: evitar riesgos en la pérdida de información y lograr una recuperación rápida. "Por ejemplo, para todo lo que es ambiente de servidores se requieren altas tasas de transferencia que minimicen la intervención humana", explica.
Entre las características que deben tener los dispositivos se destacan las siguientes:
- Ser confiable: Minimizar las probabilidades de error. Muchos medios magnéticos como las cintas de respaldo, los disquetes o discos duros tienen probabilidades de error o son particularmente sensibles a campos magnéticos, elementos todos que atentan contra la información que hemos respaldado allí. Otras veces la falta de confiabilidad se genera al rehusar los medios magnéticos. Las cintas en particular tienen una vida útil concreta. Es común que se subestime este factor y se reutilicen mas allá de su vida útil, con resultados nefastos.
- Estar fuera de línea, en un lugar seguro: Tan pronto se realiza el respaldo de información, el soporte que almacena este respaldo debe ser desconectado del computador y almacenado en un lugar seguro tanto desde el punto de vista de sus requerimientos técnicos como físicos: humedad, temperatura, campos magnéticos, seguridad física y lógica.
- La forma de recuperación sea rápida y eficiente: Es necesario probar la confiabilidad del sistema de respaldo no sólo para respaldar sino que también para recuperar. Hay sistemas de respaldo que aparentemente no tienen ninguna falla al generar el respaldo de la información, pero que fallan completamente al recuperar estos datos. Esto depende de la efectividad y calidad del sistema que realiza el respaldo y la recuperación.
Arquitectura Escalable
Existen muchos productos destinados a la copia de seguridad y la recuperación de entornos de sistemas abiertos. Sin embargo, muy pocos están en condiciones de manejar los grandes volúmenes de datos que suelen presentar los data centers de hoy en día. Si antes se trataba de un dominio único de grandes computadores, los centros de datos modernos se desarrollan actualmente en torno a grandes servidores y clústeres Unix y Windows, en los que las empresas ejecutan sus aplicaciones críticas para el negocio.
Veritas NetBackup, por ejemplo, consta de una arquitectura básica de tres niveles que, combinada con una gestión de dispositivos sofisticada y un alto rendimiento, permite atender a las exigencias de los más complejos centros de datos. Este tipo de soluciones posee básicamente tres niveles.
a) El servidor maestro constituye la "inteligencia" de todas las actividades de protección de datos, desde la planificación y el seguimiento de las copias de seguridad de los clientes hasta la gestión de dispositivos de cinta y catálogos de archivos. Además, el servidor maestro puede tener conectados uno o varios dispositivos de almacenamiento para la copia de seguridad de los datos de múltiples clientes o bien contar con una configuración de clúster orientada a la disponibilidad.
b) Las empresas que disponen de datos en diferentes ubicaciones o que utilizan aplicaciones con grandes volúmenes de datos, por ejemplo un datawarehouse, pueden implementar servidores de dispositivos -el segundo nivel- para efectuar una copia de seguridad local de grandes aplicaciones, mientras que realizan el backup de otros sistemas de cliente a través de la red. Un servidor de dispositivos puede compartir una librería de cintas con el servidor maestro o con otro servidor de dispositivos, o bien funcionar con sus propios dispositivos de cinta. Si un servidor de dispositivos falla, los backups de cliente conectados pueden desviarse a otro servidor de dispositivos.
c) El tercer nivel es el agente de cliente que realiza la copia de seguridad de servidores y estaciones de trabajo. Normalmente, este nivel implica la mayor cantidad de máquinas individuales, pero no necesariamente la mayoría de los datos. Tanto los servidores de dispositivos como clientes pueden administrarse de forma central desde el servidor maestro.
El Correo Electrónico
Realizar el backup de los archivos de una empresa, si bien es una labor importantísima, es sencilla de operar, ya que literalmente se copian archivos de un lugar a otro. Pero existen problemáticas puntuales al interior de las empresas como el correo electrónico.
La pregunta de muchas organizaciones es: ¿qué pasa con los e-mails?, ya que por lo general existe mucha información crítica en los servidores de correo y en las estaciones de trabajo de los empleados, especialmente de directores y gerentes. Por ejemplo, es fácil encontrar en la "Bandeja de Entrada" contratos, convenios, estudios e investigaciones de mercado, entre otros datos relevantes. Cuando esta información está distribuida el riesgo de perderla es muy alta.
Según Fernando Norero, muchas veces mantener toda la data centralizada en un servidor de correo provoca que el respaldo se vuelva inmanejable. Debido a esto, existen técnicas que permiten migrar los e-mails y documentos adjuntos de los mismos a medios ópticos o de escritura de una sola vez, como también su traspaso a cintas.
La idea es crear políticas referentes a los ciclos de vida de la información y establecer períodos de tiempo en los cuales todos los datos del servidor de correo se trasladarán a un respaldo y así liberar el espacio. "Por ejemplo, que todos los correos con tres meses de antigüedad en el servidor sean trasladados al sistema de backup", señala Norero. Para esto, existen una serie de soluciones avanzadas que permiten administrar mediante un software los períodos de desocupación y respaldo.