Preparación ante desastres y planes de continuidad del negocio

17/06/2019
agenda

LACTLD entrevistó a cuatro especialistas en planes de contingencia para ccTLD: Sebastián Castro, director científico de InternetNZ (el registro de los dominio .NZ y el operador del espacio de nombres de dominio .NZ); Dave Baker, director de tecnología de InternetNZ; Pablo Rodríguez, vicepresidente ejecutivo de Puerto Rico Top Level Domain; y Julio Cossío, director de sistemas de información de NIC México.

Cada uno de ellos pudo reflexionar sobre: ¿Cuáles son las amenazas que ponen en riesgo las operaciones de los ccTLD? ¿Cómo se pueden prevenir y mitigar los incidentes, desastres y emergencias? ¿Cómo se deben restablecer las operaciones luego de estos sucesos? ¿Quién debe estar a cargo de esta tarea? ¿Por qué es importante que los ccTLD de la región desarrollen un plan de respuesta a incidentes?

Además, Pablo Rodríguez (.PR) compartió los acontecimientos que experimentó su ccTLD cuando dos huracanes impactaron Puerto Rico.

Desastres naturales en la región: Irma y María

En 2017, Puerto Rico experimentó dos huracanes de categoría 5 en un período de aproximadamente quince días. Pablo Rodríguez (.PR) comenta:

“El 7 de septiembre de 2017, el huracán Irma pasó cerca de las costas de Puerto Rico dejando un millón de personas sin energía eléctrica y los terrenos saturados por las intensas lluvias. Trece días más tarde, el huracán María ingresó provocando pérdidas en exceso de $9,161 millones (US), destruyendo la red de transmisión eléctrica totalmente y dejando un saldo de aproximadamente tres mil personas muertas”.

A pesar de estas consecuencias devastadoras, los servicios de DNS de .PR mantuvieron sus operaciones constantes antes, durante, y después del desastre atmosférico. Tal como detalla Pablo Rodríguez (.PR):

“Dos de las medidas que aseguraron la operatividad del DNS fueron el uso de servicios de alojamiento en instalaciones a prueba de tormentas y terremotos, y el uso de los servicios Anycast. Las condiciones y factores que causan la vulnerabilidad de un ccTLD son numerosas y varían de uno a otro. Todos los ccTLDs deben identificar cuáles son los factores que causan este tipo de riesgos, tomar las medidas para mitigarlos y asegurar la resiliencia de sus operaciones en la eventualidad de un desastre”.

Plan de recuperación ante desastres y Plan de continuidad del negocio

De acuerdo con nuestros entrevistados, un plan de recuperación ante desastres proporciona los procesos y las prioridades que se deben atender cuando un incidente significativo afecta a la organización. Se trata de una serie de procesos calendarizados, documentados y probados que se establecen con el fin de estar preparados para enfrentar las condiciones del entorno que podrían poner en riesgo al negocio.

Sebastián Castro y Dave Baker (.NZ) sostienen: “Un desastre puede ser un peligro natural (como un terremoto o un tsunami), un incendio en una de las instalaciones, un camión que colisiona un centro de datos, etc. El plan se enfoca en restaurar las funciones empresariales críticas lo antes posible cuando un desastre de este tipo impacta un área del negocio”.

Por otra parte, ambos explican que el plan de continuidad del negocio o BCP (por sus siglas en inglés, Business Continuity Plan), específicamente, incluye una lista de las prioridades en las que habrá que enfocarse durante las primeras horas de la eventualidad, pero también abarca un plan de respuesta, definición de roles y responsabilidades, una lista de verificación de recuperación, etc. El BCP se compone, a su vez, de un conjunto de planes de recuperación ante desastres.

Julio Cossío (.MX) remarca que además de los desastres e incidentes existen otros tipos de procesos, como las transformaciones del negocio, los cambios de gobierno, sociales o en el mercado, que pueden afectar las operaciones de la organización y, por ende, pueden poner en marcha el plan de continuidad del negocio. Agrega también:

“La implementación del plan de recuperación ante desastres y del plan de continuidad del negocio está relacionada con la gestión de riesgos. Existen diferentes riesgos que son genéricos. Otros son específicos de la operación con computadoras, específicos de la operación en Internet y específicos de la gestión de infraestructura crítica. El punto principal de ambos planes es mitigar el riesgo en diferentes niveles, identificando y definiendo un camino para enfrentar los incidentes. No todos los riesgos se pueden gestionar o identificar, por lo que es un proceso continuo. La prioridad para manejar el riesgo se define por una combinación de probabilidad e impacto, ya que una organización querrá enfocarse en los riesgos de alto impacto y en los riesgos que tienen mayor probabilidad de presentarse”.

Sebastián Castro y Dave Baker (.NZ) destacan además que la implementación de estos planes es fundamental para que el personal y la organización puedan responder rápidamente a un evento: “Cuando el incidente involucra una amenaza inmediata para la seguridad del personal o las instalaciones principales, se requieren acciones críticas inmediatas”.

¿Cuáles son los riesgos y amenazas que suelen afrontar los ccTLD y que desencadenan la puesta en marcha de estos planes?

Los expertos explican que los riesgos pueden provenir del lugar desde donde se opera, principalmente, como consecuencia de desastres naturales (terremotos, tsunamis, inundaciones, tormentas, huracanes, fenómenos meteorológicos extremos). No obstante, también se identifican desastres relacionados con los sistemas informáticos operativos (fallas severas, corrupción de datos, errores de software), riesgos relacionados con las personas (error humano, personal descontento, personal deshonesto), riesgos relacionados con Internet (DDoS, phishing, malware o infección de virus).

Dado que los ccTLD ejecutan una infraestructura crítica tanto en el registro como en el DNS, y el impacto en la reputación podría ser muy alto, también se vuelven susceptibles a la falta de disponibilidad y a los riesgos de manipulación de datos.

¿Cómo se elabora y desarrolla un plan de recuperación ante desastres y un plan de continuidad del negocio?

Nuestros entrevistados explican que cada ccTLD es diferente y deberá adaptar el contenido de su plan a sus circunstancias específicas. En líneas generales, para poder reaccionar eficazmente ante riesgos y amenazas, los planes deben establecer las responsabilidades, medios de comunicación y guías de recuperación. Además, se sugiere analizar previamente los artefactos y/o condiciones prioritarias que se deben atender.

Los expertos de .NZ describen al plan de continuidad del negocio como un kit de recursos que se utilizará en una serie de circunstancias, por lo que debe contener una variedad de información para cada tipo de contingencia: “Cuando ocurra un incidente, este kit se empleará para armar y ejecutar el plan. Se debe tener en cuenta que el plan probablemente tenga un alcance limitado cuando llegue el momento de ser activado y una cantidad de recursos en él ya no serán relevantes o no contarán con la información más reciente”.

Una vez que se haya diseñado un plan, este debe ser probado con regularidad y se debe establecer un programa de mantenimiento frecuente para que su contenido se mantenga actualizado. Al respecto, Julio Cossío (.MX) explica: “Las pruebas contenidas en el plan logran que el equipo experimente los diferentes procesos acordados e identifique áreas de oportunidad que puedan ser mejoradas antes de que suceda un incidente real. Así, cuando se presenta el desastre, el equipo sabe cómo identificarlo oportunamente, conoce qué es lo que debe hacer, con quién debe estar en comunicación y las alternativas para resolverlo lo más pronto posible”. Entre otras tareas, se aconseja establecer un calendario anual con las actividades de preparación y prevención que incluya las pruebas, el análisis de los recursos necesarios y las modificaciones a las guías y/o procedimientos.

La conformación multidisciplinaria del equipo de recuperación que llevará adelante el plan es un punto central. Julio Cossío (.MX) comenta que en el caso de NIC México el equipo de recuperación está compuesto por la alta dirección, administradores de recursos humanos y responsables de la infraestructura y tecnología. En esta línea, Sebastián Castro y Dave Baker (.NZ) sostienen:

“Es fácil pensar que solo los servicios técnicos están involucrados en la preparación, evaluación y ejecución del plan, pero la realidad está muy lejos de ello. Toda la organización debe estar lista en el caso de un desastre. Se debe involucrar a las diferentes áreas para asegurarse de que el plan está actualizado y puede ser ejecutado cuando sea necesario. Todos necesitan conocer sus responsabilidades bajo las distintas circunstancias”.

Sebastián Castro y Dave Baker (.NZ) proponen una serie de mejores prácticas y de acciones clave que pueden ser incorporadas al plan de recuperación ante desastres o de respuesta a emergencias:

  • Evaluar la situación y recopilar datos: quién, qué, cuándo, dónde y cómo
  • Notificar al personal clave, a la junta y a los familiares directos (en el caso de que el personal haya sufrido lesiones)
  • Notificar a las autoridades/servicios de emergencia
  • Evaluar el impacto potencial del incidente en el negocio
  • Activar el plan de respuesta de emergencia
  • Movilizar al equipo de respuesta de emergencia
  • Preparar los mensajes clave
  • Informar y dar instrucciones al vocero de la organización
  • Comunicarse con las partes interesadas
  • Completar los informes iniciales
  • Mantener un registro de los eventos

Del mismo modo, nos presentan un listado de pasos clave para un plan de recuperación de las operaciones del negocio:

  • Notificar e informar al personal y a los proveedores que se ha producido un evento que compromete la continuidad del negocio
  • Seleccionar al manager y al personal que integrará el equipo de gestión del plan de continuidad del negocio
  • Determinar el estado del personal
  • Establecer el alcance de los daños y evaluar cuál es el nivel de impacto del incidente sobre el negocio
  • Evaluar el daño al hardware e instalaciones críticas, proteger y salvaguardar el equipo cuando sea posible
  • Preparar un inventario
  • Mantener a la gente informada
  • Ejecutar la transición de regreso a las operaciones normales
  • Realizar revisiones e informes de las actividades de recuperación

¿Por qué todos los ccTLD deberían desarrollar este tipo de planes?

La reputación de los ccTLD es uno de los puntos destacados por los expertos. “Los incidentes ocurren y será mejor estar preparado”, sostienen Sebastián Castro y Dave Baker (.NZ).

Pablo Rodríguez (.PR), por su parte, considera que cuando ocurre una emergencia, un desastre o un incidente, “el pronto restablecimiento de las operaciones nutre otras dimensiones igualmente importantes como la reputación de la organización, la confianza en sus servicios y la retención de los clientes”.

Otro aspecto fundamental se refiere a los riesgos asociados a la región en donde se encuentra el ccTLD. En este sentido, Pablo Rodríguez (.PR) remarca que América Latina y el Caribe es altamente vulnerable a distintos tipos de desastres naturales y, en consecuencia, los ccTLD deberán adoptar todas las medidas y planes de mitigación, recuperación y continuidad de las operaciones.

Finalmente, Julio Cossío (.MX) expresa: “Es primordial que cada uno de los ccTLD de la región se comprometa a salvaguardar su infraestructura para poder seguir teniendo un Internet universal y económicamente accesible. La creación de una comunidad comprometida con la continuidad de Internet es una tarea moralmente obligatoria”.

*La nota original fue publicada en el Reporte LACTLD N°11