Un incidente de TI es cualquier interrupción en los servicios de TI de una organización que afecta cualquier cosa, desde un solo usuario hasta toda la empresa. En pocas palabras, un incidente es cualquier cosa que interrumpe la continuidad del negocio.
La gestión de incidentes es el proceso de gestionar las interrupciones del servicio de TI y restaurar los servicios dentro de los acuerdos de nivel de servicio (SLA) acordados. El alcance de la gestión de incidentes comienza con un usuario final que informa un problema y termina con un miembro del equipo de la mesa de servicio que resuelve ese problema.
Con una gestión de incidentes adecuada, recopilar información sobre los incidentes es más fácil y menos caótico ya que no es necesario enviar y recibir cientos de correos electrónicos para hacerlo. Los equipos de la mesa de servicio pueden publicar formularios en el portal de autoservicio del usuario para garantizar que se recopile toda la información relevante al momento de crear el ticket.
La siguiente etapa en la gestión de incidentes es la categorización y priorización de incidentes. Esto no solo ayuda a ordenar los tickets entrantes, sino que también garantiza que los tickets sean asignados a los técnicos más calificados en el tema. La categorización de incidentes también ayuda a que el sistema de mesa de servicio aplique los SLA más apropiados a los incidentes y a comunicar esas prioridades a los usuarios finales. Una vez que se clasifica y prioriza un incidente, los técnicos pueden diagnosticar el incidente y proporcionar una resolución al usuario final.
El proceso de gestión de incidentes, cuando se habilitan las automatizaciones relevantes, permite a los equipos de la mesa de servicio vigilar el cumplimiento del SLA y enviar notificaciones a los técnicos en caso de posibles infracciones del SLA. Los técnicos también pueden escalar las violaciones del SLA al automatizar el escalamiento, según corresponda al incidente. Después de diagnosticar el problema, el técnico ofrece al usuario final una resolución, que el usuario final puede validar. Este proceso de varios pasos garantiza que cualquier problema de TI que afecte la continuidad del negocio se resuelva lo antes posible.
Los incidentes en un entorno de TI se pueden clasificar de varias maneras diferentes. Algunos factores que influyen en la categorización de incidentes incluyen la urgencia del incidente y la gravedad de su impacto en los usuarios o en el negocio en general. Clasificar y categorizar los incidentes de TI ayuda a identificar y asignar los incidentes al técnico adecuado, lo cual ahorra tiempo y esfuerzo. Por ejemplo, los incidentes se pueden clasificar como incidentes mayores o menores en función de su impacto en el negocio y su urgencia. Por lo general, los incidentes mayores son los que afectan los servicios críticos para el negocio (afectan a toda la organización) y que necesitan soluciones inmediatas. Los incidentes menores generalmente afectan a un solo usuario o a un departamento, y es posible que ya tengan una resolución documentada.
La gestión de incidentes cubre todos los aspectos de un incidente a lo largo de su ciclo de vida. Acelera el proceso de resolución y hace que la gestión de tickets sea transparente. Sin un modelo de gestión de incidentes, manejar los tickets puede ser toda una molestia. Algunos de los principales problemas que pueden surgir incluyen:
Las prácticas de gestión de incidentes son ampliamente utilizadas por los equipos de la mesa de servicio de TI. Las mesas de servicio suelen ser el único punto de contacto para que los usuarios finales reporten los problemas a los equipos de gestión de TI.
El proceso de gestión de incidentes se puede resumir de la siguiente manera:
Estos procesos pueden ser simples o complejos según el tipo de incidente; también pueden incluir varios flujos de trabajo y tareas además del proceso básico descrito anteriormente.
Se puede registrar un incidente mediante llamadas telefónicas, correos electrónicos, SMS, formularios web publicados en el portal de autoservicio o mediante mensajes de chat en vivo.
Los incidentes se pueden clasificar y subcategorizar en función del área de TI o negocio en la que el incidente causa una interrupción, como la red, el hardware, etc.
La prioridad de un incidente se puede determinar en función de su impacto y urgencia utilizando una matriz de prioridad. El impacto de un incidente denota el grado de daño que el problema causará al usuario o empresa. La urgencia de un incidente indica el tiempo dentro del cual se debe resolver el incidente. Según la prioridad, los incidentes se pueden clasificar como:
Una vez que se clasifica y prioriza el incidente, se asigna automáticamente a un técnico con la experiencia relevante.
Según la complejidad del incidente, se puede desglosar en sub-actividades o tareas. Por lo general, las tareas se crean cuando se requiere la contribución de múltiples técnicos de varios departamentos para resolver el incidente.
Mientras se procesa el incidente, el técnico debe asegurarse de no infringir el SLA. Un SLA es el tiempo aceptable dentro del cual se debe responder (SLA de respuesta) o resolver (SLA de resolución) un incidente. Los SLA se pueden asignar a incidentes en función de sus parámetros, como categoría, solicitante, impacto, urgencia, etc. En los casos en que está a punto de infringirse o ya se ha infringido el SLA, el incidente se puede escalar funcionalmente o jerárquicamente para garantizar que se resuelva lo antes posible.
Un incidente se considera resuelto cuando el técnico ha encontrado una solución temporal o una solución permanente para el problema.
Un incidente se puede cerrar una vez que se resuelve el problema y el usuario acepta la resolución y está satisfecho con ella.
Después de que se haya cerrado un incidente, se recomienda documentar todas las conclusiones de ese incidente. Esto ayuda a preparar mejor a los equipos para futuros incidentes y a facilitar una resolución más rápida la próxima vez que ocurra un incidente similar.