Marzo 2008PAG: 1 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz Guía para el Análisis de Causa Raíz José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 2 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz Tabla de Contenido 1. 1.1 1.2 2. 2.1 3. 4. 4.1 Introducción ............................................................................................................... 4 Generalidades del Análisis de Causa Raíz ................................................................. 4 Restricciones y asunciones .................................................................................... 4 Convenciones, Versiones y Definiciones ....................................................................... 5 Definiciones ........................................................................................................ 5 Pasos Generales de la Metodología de Análisis de Causas Raíz ..................................... 8 Focalizar Eventos de Fallas Bajo Enfoque de “Pocos Vitales” ........................................ 8 Técnicas de Jerarquización .................................................................................... 9 4.1.1 Jerarquización por impacto o exposición al riesgo .............................................................. 9 4.1.2 Jerarquización 80-20 ó Pareto ...................................................................................... 12 4.2 Definición del Problema....................................................................................... 13 4.2.1 Propósito de la definición del problema .......................................................................... 13 4.2.2 Criterios para la definición correcta del problema ............................................................. 14 4.3 Secuencia para Definir el Problema ....................................................................... 14 5. Preservar la Información de la Falla Relacionada con las Partes, Posición, Papeles, Paradigmas y Gente (5P´s) ............................................................................................. 16 5.1 5.2 5.3 Recopilación de datos e información ...................................................................... 16 Secuencia de Eventos en la Línea del Tiempo.......................................................... 20 Carta o Mapa de Eventos y Factores Causales ......................................................... 20 6. Ordenar el Análisis Fijando Estrategias de Responsabilidades para la Captura de los Datos y Conformar el Equipo de Trabajo ........................................................................... 27 6.1 6.2 7. 7.1 7.2 7.3 7.4 7.5 7.6 8. 8.1 8.2 Responsabilidades. ............................................................................................. 27 Análisis de las Actividades Mediante la Simulación del Proceso en Campo .................... 29 Análisis del Evento .................................................................................................... 29 Análisis de Barreras de Control. ............................................................................ 31 Análisis de Cambios............................................................................................ 32 Análisis Causa Efecto .......................................................................................... 33 Análisis de Árbol de Fallas ................................................................................... 37 Planteamiento de Hipótesis .................................................................................. 41 Determinación de Causas Raíces Físicas, Humanas y Latentes: .................................. 43 Comunicar los Resultados Encontrados y Emitir las Recomendaciones ........................ 43 Selección de la Recomendaciones ......................................................................... 44 Reporte o Informe.............................................................................................. 44 http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos Marzo 2008 PAG: 3 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz 9. Control y Seguimiento a la Implantación y Ejecución de Recomendaciones ................. 45 10. Referencias y Bibliografía.......................................................................................... 45 11. Anexos ..................................................................................................................... 47 11.1 11.2 Anexo A – Formato para recolección de datos de inicio ............................................. 47 Anexo B – Análisis de actividades ......................................................................... 50 José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 4 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz 1. Introducción En esta guía se mostrarán las herramientas y métodos para evaluar los eventos significativos dentro de cualquier tipo de instalación industrial. Estas herramientas pueden ser utilizadas para evaluar cualquier evento no deseado, fracaso o problema potencial. Las herramientas tienen su origen en el Human Performance Enhancement System (HPES) usadas por las plantas de energía nuclear en los Estados Unidos. La Florida Power & Light Company (FPL) utilizó estas herramientas en la identificación y corrección de problemas para mejorar la confiabilidad humana en sus diferentes áreas. El proceso de Análisis de Causa Raíz (ACR) ayuda en la determinación de las causas de un evento no deseado. Esto es importante cuando se desea que un evento no vuelva a ocurrir. Particularmente esto es cierto tanto para problemas de equipo o maquinaria, como para cuando también se involucran errores humanos y de la organización. Este método puede ser relacionado con cualquier evento que se pudiera presentar, aunque en este punto se debe buscar el equilibrio económico, pues si las consecuencias no son significativas, no valdrá mucho la pena invertir dinero y esfuerzo en intentar encontrar y arreglar la causa raíz del evento. 1.1 Generalidades del Análisis de Causa Raíz El propósito de esta guía es servir de ayuda para el proceso de capacitación y también como un instrumento de apoyo en el proceso del Análisis de Causa Raíz. Este método de evaluación puede ser utilizado como una guía básica, pues las herramientas que se mencionan, son herramientas probadas, pero si en el transcurso del análisis, surgieran otras herramientas que puedan apoyar el proceso de análisis, se deberán utilizar. En otras palabras las herramientas dadas en el presente trabajo no son limitativas. En conclusión, es esencial entender lo que pasa antes de intentar descubrir las causas. Una vez que se entiende el mecanismo o mecanismos que se dan durante el evento no deseado de un equipo o una persona, entonces es que se pueden determinar el porqué la falla o comportamiento ocurrió (causas) y qué factores causales contribuyeron al problema. Una vez conocidas las causas se pueden determinar las mejores acciones correctivas para solucionar el problema. Este proceso (aplicable a fallas de equipo, errores humanos, problemas de diseño, etc.) no está completo hasta que no se comuniquen los resultados a la administración de la organización y a las áreas involucradas en la implantación de las acciones correctivas y en la revisión de la efectividad de las mismas. 1.2 Restricciones y asunciones Esta guía asume que el lector está familiarizado con el Análisis de Causa Raíz (ACR) y reconoce que este material no es una receta, es más bien una guía para realizar el ACR. Esta guía representa un punto de inicio para la planificación y ejecución del ACR, y no es un sustituto para la interacción con el cliente ni la personalización de ciertas herramientas de acuerdo a sus necesidades. Esta personalización se realizará una vez que se posea la información pertinente y se encuentre interactuando directamente con el cliente. José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 5 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz 2. Convenciones, Versiones y Definiciones Periódicamente, nuevas versiones de la Metodología son publicadas para incorporar nuevo material. En consecuencia, este guía podrá ser actualizada periódicamente para incorporar el nuevo material y realinear con la última versión de la metodología. 2.1 Acción: Definiciones Asignación para ejecutar una tarea o series de tareas para resolver una causa identificada en la investigación de una falla. Análisis de Fallas: Estudio sistemático de un ítem, su construcción, aplicación y documentación para identificar la falla para poder determinar sus modos de falla y el desarrollo básico de estos. Análisis Causa Raíz (ACR): Metodología que permite identificar las causas físicas, humanas y latentes de cualquier tipo de falla o incidente que ocurren una o varias veces permitiendo adoptar las acciones correctivas o recomendaciones que reducen los costos del ciclo de vida útil del proceso, mejora la seguridad y la confiabilidad del negocio. Barreras de Control: Métodos y/o equipos administrativos y físicos empleados para dirigir un proceso. Causas que contribuyen: Causas que por ellas mismas no podrían causar el problema pero contribuyen a que el problema se lleve a cabo. Sin embargo, es necesario identificarlas para definir recomendaciones y evitar su reaparición. Causas Raíz: Razón más básica de un problema, el cual, si se corrige, previene la recurrencia del problema. Causa Raíz Física: Es el mecanismo de falla del componente. Su solución resuelve la situación de falla. Ej.: Material de la empaquetadura inadecuado. Causa Raíz Humana: Identifica las acciones humanas que disparan la causa raíz física. Ej.: Selección inadecuada de la empaquetadura. José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 6 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz Causa Raíz Latente o de Sistema (Organizacional): Representan la manifestación de los procesos organizacionales que explican la ocurrencia de las causas raíces humanas. Solo su erradicación garantizará que la falla no se repita en el equipo estudiado o en uno similar. Se basa en que el origen de todos los problemas son las decisiones u omisiones del personal Staff o de la gerencia. Ej. Falta de adiestramiento, incumplimiento prácticas-procedimientos, MDC (manejo de cambio) no realizado o incompleto (falta de actualización de la información), entre otros. Causa Supuesta: Causas que aparentemente podrían ser el origen del problema al inicio de la investigación o que surge durante el proceso de recolección de información y datos. Son hipótesis que deben explicar los efectos del problema, pero necesitan de validación. Confiabilidad ( R(t) ): Probabilidad de que un sistema, equipo o componente lleve a cabo su función adecuadamente durante un periodo dado bajo condiciones de operación previamente definidas y constantes. Confiabilidad Humana: Probabilidad de que previamente definida. Criticidad: Medida relativa de la consecuencia de un modo de falla y su frecuencia de ocurrencia. Evento: Término usado para describir la totalidad del problema y/o resultado del problema. Eventos de Alto Impacto: Estos se refieren a eventos esporádicos o únicos que resultan en una pérdida de producción importante y/o altos costos de mantenimiento. Los eventos, donde el impacto sea mayor en Seguridad, Higiene y Ambiente, tendrán un tratamiento siguiendo el procedimiento de Investigación de Accidentes e Incidentes. Facilitador: Es el experto o grupo de expertos en la metodología ACR de cada localidad, responsable de implantar los programas de análisis. Por lo general será un Ingeniero de Confiabilidad que tendrá dentro de sus responsabilidades la de facilitar las sesiones de análisis. una persona ejecute adecuadamente una actividad José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 7 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz Falla: Hecho no previsible inherente a un sistema que desvía su comportamiento al descrito en su especificación, y que en la mayoría de los casos impide que este cumpla su misión. Hipótesis: Lista de posibles mecanismos de falla de cada modo de falla. Al ser verificada una hipótesis, ésta se convierte en una causa. Impacto Económico: Representa el impacto financiero por incremento en costos de mantenimiento o pérdidas de producción. Líder de ACR: El líder del equipo es una persona con ascendencia/liderazgo sobre el equipo de trabajo de cada localidad, entrenado en el proceso de ACR. Los lideres guían a un equipo a través del proceso y ayudan a desarrollar en el sitio de trabajo una mentalidad de búsqueda de las verdaderas causas raíces de los problemas, como beneficio adicional de la aplicación del ACR. Normalmente el Líder será el jefe de Operaciones del área. Modo de falla/Componente Fallado: Modo en que se evidencia la falla. Método del Árbol lógico: Es una herramienta usada en el proceso del ACR para ordenar gráficamente el análisis de manera secuencial, desde el evento y a través de los diferentes modos de falla, encontrando la relación de causas y efectos hasta llegar a las causas raíces de dicho evento. Las verdaderas causas raíces son descubiertas permitiendo que las evidencias físicas conduzcan al equipo hasta encontrar los factores que intervinieron para que éstas se produjeran. Patrocinador de ACR: Es aquel gerente que promueve y motiva iniciativas y programas referentes a análisis causa raíz que se ejecutan en áreas bajo su responsabilidad. Perfil del Equipo de ACR: El equipo típico de ACR está comprendido por un Líder de Equipo, un Facilitador, personal de Operaciones, ingeniero de Procesos, personal de Mantenimiento y personal experto en la materia en análisis. Los miembros del equipo deben ser imparciales y necesitan estar enfocados en hallar la(s) causa(s) raíz latente(s) o asociadas a la organización. Se recomienda un equipo de 5 a 8 personas. Es importante anexar a este equipo personal que esté directamente relacionado con las fallas que se estén analizando. Entre éstas pueden citarse Operadores y Mantenedores. José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 8 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz Problemas Recurrentes o Crónicos: Son problemas repetitivos en el tiempo. Un problema se considera recurrente cuando se repite en una manera inusual para el tipo de equipo o proceso. Los problemas recurrentes son listados en una lista jerarquizada por su impacto, compuesto por la suma de los costos de mantenimiento y pérdidas de oportunidad. Promotor de ACR: Es la persona a nivel gerencial de cada localidad, responsable de la implantación de esta metodología. Recomendaciones: Sugerencias de cambio para corregir el evento y prevenir su recurrencia. Estas necesitan la aprobación de la gerencia. Tasa de Fallas: Frecuencia de ocurrencia de las fallas. 3. Pasos Generales de la Metodología de Análisis de Causas Raíz En el siguiente diagrama de flujo se describen las actividades principales para la elaboración de un Análisis de Causas Raíz, el cual consiste en los siguientes pasos generales: 1. Focalizar eventos de fallas bajo enfoque de ―Pocos Vitales‖ 2. Preservar la información de la falla relacionada con las partes, posición, papeles, paradigmas y gente (5P´s) 3. Ordenar el análisis fijando estrategias de responsabilidades para la captura de los datos y conformar el Equipo de Trabajo 4. Análisis del evento. 5. Comunicar los resultados encontrados y emitir las recomendaciones. 6. Control y seguimiento a la implantación y ejecución de recomendaciones. En los siguientes capítulos se desarrollará cada uno de los pasos, y la forma en cómo se pueden ejecutar en campo. 4. Focalizar Eventos de Fallas Bajo Enfoque de ―Pocos Vitales‖ Los problemas o fallas sujetos a la aplicación de esta metodología están asociados a los denominados problemas recurrentes, los cuales se definen como rutinarios en su naturaleza, parecen ocurrir una y José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 9 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz otra vez y por las mismas razones aparentes. El problema es que las causas reales nunca han sido analizadas y corregidas. El punto central del proceso para tratamiento de problemas recurrentes será la lista jerarquizada de problemas (lista base de problemas). De esta lista se extraerán los problemas a ser manejados por los equipos de trabajo de las distintas localidades. Para la priorización de las fallas o eventos se utilizan dos técnicas, las cuales son descritas a continuación. 4.1 Técnicas de Jerarquización 4.1.1 Jerarquización por impacto o exposición al riesgo La jerarquización de los problemas recurrentes es fundamental para poder focalizar los esfuerzos de análisis y dar solución a los de mayor impacto. Un aspecto importante a considerar para esta jerarquización es el agrupamiento de problemas similares. Por ejemplo, si son comunes las fallas de Condensadores de tope de las plantas Destiladoras, el problema podría agrupar a todos estos equipos con el enunciado: ―Fallas Recurrentes de Condensadores de Tope de las Plantas Destiladoras‖, debido a que puede presumirse que las características de las fallas y/o causas del problema son similares. En contraposición, no conviene agrupar muchos equipos con distintas modalidades (modos) de falla, ya que esto haría difícil el análisis de causas de esas fallas. Ejemplos de estos últimos serían: ―Fallas recurrentes de Bombas de Servicios Industriales‖, donde existe una gran diversidad de tipos, marcas, tamaños, modos de falla y condiciones operacionales. Para crear la lista de Problemas Recurrentes de un área se hará mediante datos extraídos de las siguientes fuentes: Listas de problemas recurrentes en equipos Estáticos, Automatización. Reportes de Pérdidas de Oportunidad de Gestión. SAP Reportes de Confiabilidad Operacional Inspecciones Civiles Entrevistas con Operadores, Mecánicos, Supervisores, etc.(*) Otros Rotativos, Eléctricos y de (*) En estas entrevistas debe tratar de hallarse aquellas fallas que no sean de fácil identificación mediante los datos existentes. Por ejemplo, problemas como ―fallas recurrentes de empaques de válvulas especiales‖ que pudieran estar produciendo altos costos de mantenimiento, tanto en labor como en materiales, pueden encontrarse en este tipo de entrevista. Una vez enunciados los problemas, se les debe asignar el impacto asociado a Pérdidas de Oportunidad y Costos de Mantenimiento anuales. En algunos casos, donde las Pérdidas de Oportunidad no han ocurrido, pero existe el riesgo de que ocurran, podrá considerarse el Riesgo Adicional (tratado más José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 10 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz adelante), el cual toma en cuenta la probabilidad de que un evento mayor ocurra si ocurre otro evento antes. En el caso de ser utilizados los costos o pérdida de oportunidad históricos, se deberán utilizar los datos disponibles para un período, que dependerá del tipo de problema, de uno a dos años a fin de que los impactos se ajusten lo más posible a la realidad. El Impacto asociado a un problema estará representado por la probabilidad de que ese problema se comporte de manera similar en el futuro (o sea, su impacto será una predicción, conocida como Exposición al Riesgo), y se calculará multiplicando la Probabilidad de Falla (PF) por la Consecuencia de la Falla (CF) o bien, la Frecuencia de Falla (FF) por la Consecuencia de la Falla. Por ejemplo, Se estima que en un sistema de tubería dado, puede ocurrir una fuga masiva de hidrocarburo 1 vez en 10 años y que existe una probabilidad de ignición de 50%. Esto produce un riesgo de explosión de 1 en 20 años. Si la consecuencia de la explosión es de 1 millón de $, Exposición al Riesgo = (1/20) x 1.000.000$ = 50.000$/año Las fallas recurrentes en válvulas de bloqueo en servicio HF han producido las siguientes pérdidas de oportunidad en la planta de Alquilación: Ago 05 (180 M$), Mar 06 (320M$) y Ene 07 (170 M$). Exposición al riesgo = 3/3 x (180+320+170)/3 = 223 M$/año Cada falla del Compresor K-5401 tiene un impacto de 560M$ en costos de mantenimiento (repuestos, asistencia técnica, contratos). La estadística indica que falla cada 4.5 años. Exposición al Riesgo = (1/4.5) x 560 = 124.4 M$/año Este método de cálculo se cumple para los casos donde los costos "cuantificables" como costos de repuestos, contratos, entre otros, sean significativamente mayores a los costos de difícil cuantificación como transporte, costos de taller y mano de obra propios, etc. En estos casos conviene tomar como costos los estándares internacionales. Un ejemplo de esto, son los costos por falla de bombas y motores eléctricos, donde para cualquier tipo / tamaño de bomba / motor se establecen los siguientes costos, en los cuales son incluidos repuestos, transporte, supervisión, mano de obra, equipos y herramientas de taller, etc.: Ejemplos: Falla de Falla en Falla en Falla de rodamientos en bombas: $4.500 sellos mecánicos en bombas: $6.000 sellos mecánicos dobles en bombas: $8.500 rodamientos en motores eléctricos: $3.000 José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 11 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz Las Bombas P-2714 A/B/C sufrieron 23 fallas durante los últimos 12 meses. Las fallas fueron por sellos mecánicos y rodamientos. Exposición al Riesgo = 23 x (6.000+4.500)/2 = M$ 120.7 /año Tomando estos valores de impacto, por un lado cuantifican en promedio los costos de las fallas, pero más importante aun es que aunque el reemplazo de un rodamiento pueda costar solo 100$, la reducción sistemática de las fallas de rodamientos conllevará en el futuro a la optimización de talleres, mano de obra, etc. Riesgo Adicional En ocasiones, aunque no se han producido pérdidas de oportunidad o costos de mantenimiento significativos, existe el riesgo de que ocurra algo adicional para que estos impactos se produzcan. Por ejemplo, ¿cuál es el riesgo de operar un sistema de tuberías de alta presión y temperatura con problemas recurrentes de fugas? Posiblemente los costos históricos asociados a mantenimiento y pérdida de oportunidad son bajos, pero existe el riesgo de que un evento mayor ocurra si no se hace algo al respecto. Por otro lado, ¿cuál es el riesgo de operar una bomba y su respaldo si ambas presentan una alta tasa de fallas? Ejemplo Las bombas P-512 A/B (una respaldo de la otra) proveen agua de alimentación a una máquina de alta velocidad. Entre las dos suman 14 fallas en los últimos 12 meses. El TPPR (Tiempo Promedio Para Reparar) es de 8 días. En caso de falla de ambas bombas (doble contingencia) se incurre en una Pérdida de Oportunidad de M$ 680. ¿Cuál es la Exposición al Riesgo para esta situación? Exposición al Riesgo (debido solo a impactos en mantenimiento) = 14 x (6.000+4.500)/2 = $73.500 /año El Riesgo Adicional considera la probabilidad de la doble contingencia en virtud de la alta exposición a ese riesgo debido a la frecuencia de fallas. Así, la Probabilidad de que una bomba falle mientras la otra se encuentra en reparación causa el Riesgo Adicional. En promedio 7 fallas por año (cada bomba) x exposición de 8 días, resulta en una PF = 7 x 8 / 365 = 0.153 ó 15.3 % Exposición al Riesgo (debido al Riesgo Adicional) = 0.153 X M$ 680 = M$ 104 /año Exposición al Riesgo Total = 73.500 + 104.000 = $177.500 /año En resumen, la lista de los problemas recurrentes jerarquizados según su impacto (Exposición al Riesgo), como fue mostrado, debe parecer lógica y de común aceptación. Cuando el común de las personas acepta la lista por la forma en que fueron agrupados los problemas y como fueron jerarquizados, podrá asumirse que se ha hecho el trabajo correcto. José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 12 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz 4.1.2 Jerarquización 80-20 ó Pareto Es un diagrama que se utiliza para determinar el impacto, influencia o efecto que tienen determinados elementos sobre un aspecto. Consiste en un grafico de barras similar al histograma que se conjuga con una curva de tipo creciente y que representa en forma descendente el grado de importancia o peso que tienen los diferentes factores que afectan a un proceso, operación o resultado. Para la correcta identificación de los ―Pocos Vitales‖, es necesario que los datos recolectados para elaborar el diagrama de Pareto se encuentren en cantidad adecuada, sean verdaderos y en un periodo de tiempo determinado. Procedimiento para elaborar el diagrama de Pareto: Paso 1: Identificar el Problema Paso 2: Identificar los factores. Elaborar una lista de los factores que pueden estar incidiendo en el problema, por ejemplo, tipos de fallas, características de comportamiento. Paso 3: Definir el periodo de recolección. Establecer el periodo de tiempo del cual se recolectaran los datos. Paso 4: Diseñar una tabla para conteo o verificación de datos, en el que se registre los totales (tabular tipo de falla y frecuencia). Ordenar los datos de mayor frecuencia a menor frecuencia. Paso 5: Calcular los porcentajes. Obtener el porcentaje relativo de cada falla o factor, con respecto a un total, mediante la siguiente ecuación (la suma de los %relativos debe ser igual a 100%): %relativo = ffalla / ftotal Paso 6: Calcular los porcentajes acumulados %relativo. Calcular el porcentaje relativo acumulado, sumando en forma consecutiva los porcentajes de cada factor. Con esta información se señala el porcentaje de veces que se presenta la falla y que se eliminaría si se realizan acciones efectivas que supriman las causas principales de esta (se tabula tipo de falla, frecuencia, % relativo y % relativo acumulado en orden descendente). Paso 7: Identificar los ejes. En el eje horizontal se anotan los factores de izquierda a derecha, en orden decreciente en cuanto a su frecuencia. El eje vertical izquierdo se gradúa de forma tal que sirva para mostrar el número de datos observados (la frecuencia de cada factor), el eje vertical derecho mostrara el porcentaje relativo acumulado. Paso 8: Generar gráfico de barras. Trazar las barras o rectángulos correspondientes a los distintos factores. La altura de las barras representa la frecuencia o el número de veces que se presento el factor, se dibujan con la misma amplitud. Paso 9: Colocar los puntos que representan el porcentaje relativo acumulado, tomando en cuenta la graduación de la barra vertical derecha; los puntos se colocan partiendo desde el origen y después en la posición que corresponde al extremo derecho de cada barra, y se traza una curva que una dichos puntos. En esta forma queda graficada la curva del porcentaje relativo. José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 13 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz Para determinar las causas de mayor incidencia en un problema se traza una línea horizontal a partir del eje vertical derecho, desde el punto donde se indica el 80% hasta su intercepción con la curva acumulada. De este punto trazar una línea vertical hacia el eje horizontal. Los ítems comprendidos entre esta línea vertical y el eje izquierdo (de cantidades acumuladas) constituyen las fallas que resuelve el 80% de la problemática presente. Figura # 1 Diagrama de Pareto o Diagrama 80-20 Una vez que se han jerarquizado las fallas o los problemas que se han presentado, se procede a definir correctamente el problema de acuerdo a lo que se menciona en los siguientes puntos. 4.2 Definición del Problema 4.2.1 Propósito de la definición del problema El propósito es identificar claramente y describir el problema que se intentará resolver mediante el Análisis de Causas Raíz. Se debe identificar el qué, quien, cuando, donde y el cómo acerca del la situación no deseada para tener una clara definición del problema. Durante este esfuerzo sistemático se pueden descubrir además otros problemas, pero estos deben ser tratados de manera independiente. José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 14 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz Una buena y clara definición del problema ahorra tiempo, esfuerzo y dinero al momento de ejecutar el Análisis de causas Raíz, ya que enfoca el esfuerzo de investigación. Finalmente, un esfuerzo honesto en la definición cuidadosa del problema evitará la actitud de ―preparen, fuego y apunten‖ que es tan común a la hora de resolver problemas. Una mala definición del problema puede conducir erróneamente a la resolución del problema. Cuando ocurre un evento, se debe sospechar de aquellas áreas o condiciones que no están bien definidas o sustentadas por los hechos. Adicionalmente, la manera en la cual el problema es descrito inicialmente, podría ser muy subjetivo o ambiguo. Entonces es necesario contar con una buena definición del problema para enfocar la generalidad del Análisis de Causas Raíz. 4.2.2 Criterios para la definición correcta del problema Para la correcta definición del problema se deben tomar en cuanto los dos criterios siguientes: 1. Se enfoca en la brecha. La brecha entre lo que es y lo que debería ser refleja un cambio o desviación con respecto a algún requerimiento, norma, estándar o expectativa 2. Establece solamente el efecto. Estipula lo que está mal y no porqué está mal. 3. Debe ser medible. Es decir, qué tanto, con qué frecuencia, cuando. Esto evita caer en ambigüedades tal como cuestiones morales, de productividad y comunicación. 4. Enunciar de una manera positiva y describir la falla. 5. Evitar la palabras ―falta de‖ y el ―no‖. Esto implica soluciones inmediatas. 6. Resaltar la importancia del efecto. Podría resaltar las áreas de malestar, daños, molestias, o cómo el personal es afectado por esta situación. 4.3 Secuencia para Definir el Problema Organizar la información inicial con que se cuenta sobre el qué, quien, cuando, donde, cuanto y que tanto acerca del problema sucedido. En la siguiente Tabla # 1 se dan algunos ejemplos de preguntas para definir los hechos del problema y organizar los datos con que se cuenta hasta el momento. Evaluar la magnitud de la situación problemática y determinar si se requiere implementar acciones inmediatas para prevenir una falla más grande. Identificar cualquier información adicional que sea necesaria para definir claramente el problema para enfocar adecuadamente el esfuerzo del Análisis de Causas Raíz. Finalmente, determinar qué datos se requieren recolectar y qué herramientas se utilizarán para hacerlo. José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 15 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz Tabla 1. Preguntas de apoyo para la correcta definición del problema Categoría Pregunta de apoyo ¿Qué equipo, máquina o herramienta… Qué ¿Qué salió mal, en qué se equivocó, cuál es el cumplimiento… ¿Qué comportamiento está involucrado en… Quién ¿Quienes están involucrados: empleados de confianza, sindicalizados, contratistas, clientes, proveedores, ingenieros…Obtener el nombre y su puesto de responsabilidad. ¿Cuando ocurrió? Día, fecha, hora. Cuándo ¿Durante qué turno o fase de la operación? ¿Durante qué parte del ciclo de vida de la planta o equipo? ¿Qué patrones de tiempo se encuentran involucrados? ¿Cada que? ¿En qué área, unidad o departamento? Dónde ¿Cuál es la ubicación del defecto o falla en el equipo? ¿Qué parte del equipo, máquina o herramienta? Cómo Daños, muertes, paros, disparos de elementos de seguridad, arranque de dispositivos o equipos, tipo o clasificación de la falla. Cantidad de personas o componentes afectados. ¿Cuánto tiempo duró? ¿Qué tanto tiempo de afectación hubo? ¿Cuántas fallas ocurrieron? Cuánto Qué tanto José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 16 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz 5. 5.1 Preservar la Información de la Falla Relacionada con las Partes, Posición, Papeles, Paradigmas y Gente (5P´s) Recopilación de datos e información Con cualquier falla o problema es muy importante recolectar los datos con respecto al problema. El procedimiento utilizado para la recopilación de la información es el de las 5 P´s y es utilizado como un medio para ayudar al analista a recodar los diferentes tipos de datos a recolectar. Las 5 P´s es una sigla para: a) Partes. Consiste en recopilar las partes falladas. Las partes falladas brindan muchas pistas de valor sobre el problema. Por lo tanto, todas las partes asociadas con el problema deben estar recolectadas inmediatamente después de la falla, y se deberían embolsar e identificar las mismas para su análisis futuro, como por ejemplo se puede mencionar: cojinetes, sellos, acoples, impeler, pernos, grasa, muestras de agua, herramientas y pruebas de equipos. b) Posición. El área afectada por el evento deberá ser fotografiada. El objetivo principal es capturar la mayor cantidad de información como sea posible, ambas posiciones en tiempo como también en espacio físico son importantes. La posición de los componentes fallados deberá ser registrada. También deberán ser registrados la posición física del equipo, lectura de instrumentos y personal que se encontraba en el lugar cuando ocurrió la falla. La clase de datos posicionales necesarios para un análisis exitoso varia mucho con las diferentes clases de problemas a analizar. Otros datos posicionales que pueden ser de importancia en el análisis del problema podrían incluir elementos como el horario del día, la ubicación de dispositivos de grabación, las condiciones de operación en el momento del problema, etc. El objetivo es obtener todos los datos posiciónales que son pertinentes al problema a analizar. c) Papeles. Se refiere a recolección de todos los datos en el papel que son pertinentes al análisis. Por ejemplo, puede ser necesario capturar las variables de operación y registros (temperatura, presión, nivel, nivel de producción, etc.) antes, durante, y después del incidente. Otros ejemplos de papel incluyen: Historiales de mantenimiento. Libros diarios de los eventos en cada turno. Resultados de inspecciones. Resultados de laboratorio. Datos de vibraciones. Manuales y dibujos del proveedor. d) Paradigmas. Los paradigmas son las cosas que las personas están totalmente convencidas y que muchas veces afectan la forma en que vemos al mundo. Son una vista personal del mundo que ha sido desarrollado a través del conocimiento individual obtenido, basado en una historia de éxitos previos. Al lograr el éxito, muchas veces suponemos que nuestras conclusiones son validas para cualquier problema nuevo que surja. Los paradigmas muchas veces evitan que veamos como son las cosas realmente porque las tomamos como hechos en José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 17 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz lugar de lo que creemos, basados en ese caso aislado. Ya que los paradigmas son el resultados de creencias arraigadas que son el resultado de años de experiencia. e) Personas. Se debe elaborar una lista de testigos que incluya a los observadores físicos, operadores de cuarto de control, personal de mantenimiento e ingeniería que hayan estado ligados al evento. Es muy importante realizar las entrevistas inmediatamente después de haber ocurrido el evento. Las entrevistas serán dirigidas de mejor manera por el personal que conduce el análisis, es una buena idea desarrollar una serie de preguntas que se pueden realizar a los individuos entrevistados. Esto permite al analista no solamente cuantificar las respuestas, sino agregar una medición cualitativa al análisis basado en la respuesta de los entrevistados. Los entrevistadores deberán tratar de recopilar la mayor cantidad de información posible y se deberá informar a los testigos que el objetivo es tratar de conocer que es lo que paso para así evitar la ocurrencia de fallas similares y que las mismas puedan ser prevenidas. El propósito de este capítulo es orientar en la definición del problema y el correcto levantamiento de información. Para definir el problema se debe reunir cierta información inicial. Cuando se inicia el análisis se debe reunir toda la información posible acerca del problema y una vez que se conoce lo que sucedió, entonces se procede a definir el problema. A lo largo del proceso de análisis se recopilará información adicional. Además la recolección de los datos se orienta a dar respuesta a las preguntas generadas con anterioridad acerca de qué, quién, cuándo, cómo, cuánto y que tanto. Para realizar la recolección y organización de los datos, de acuerdo a las 5 P´s, se recomienda usar la metodología o herramientas denominada ―Secuencia del evento en la línea del tiempo‖. Consideraciones para recolectar la información Evalúe la magnitud de la situación. Pregúntese lo siguiente: • • • • • • • • • ¿Es un problema recurrente? ¿La causa raíz es difícil de encontrar? ¿La situación es crítica? ¿La situación empeorará si no se toma una acción inmediata? ¿Existen otros problemas potenciales que se pueden desarrollar mientras se investiga la situación o evento ocurrido? ¿El equipo tiene una alta atención administrativa o regulatoria? ¿Dónde se dio la desviación de los requerimientos? ¿Estas desviaciones son severas o críticas? ¿Qué recursos necesitará para llevar a cabo la evaluación, análisis y solución del problema? http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos Marzo 2008 PAG: 18 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz Considerar las siguientes guías para la recolección de los datos. 1. Recolectar datos de condiciones: antes, durante y después del evento, factores ambientales (condiciones del clima), hora del día, día de la semana y cantidad de tiempo extra trabajado. 2. Etiquetar adecuadamente todas y cada una de las fotografías tomadas. 3. Mantener, clasificar y preservar la evidencia física. 4. Establecer un área de cuarentena para el equipo o componente que falló. Identificar piezas y materiales. Es importante realizar esto a pesar de la presión que operación pueda aplicar para reestablecer el equipo. 5. Considerar las cosas que existen u ocurren en las inmediaciones del área donde ocurrió el evento (software, hardware, cambios de equipo, programas recientes, lugar, etc.). 6. Revisar los datos y corroborar su objetividad y exactitud. (¿Los testimonios son consistentes? ¿La información soporta la evidencia física? ¿Se necesita más información? ¿Se necesita realizar otra entrevista para solucionar ciertos aspectos pendientes?, etc.). Medios para obtener la información • • • • Observar la escena actual del evento, tan rápido como sea posible. Revisar grabaciones, bitácoras o cintas de video. Conducir entrevistas con el personal involucrado en el evento. Conducir entrevistas con expertos de la materia respecto a las posibles consecuencias de las acciones correctivas. Buscar información escrita (políticas, procedimientos, instructivos, etc.) usando un formato predeterminado el cual se encuentra en el Anexo A del presente documento. Tomar fotografías del equipo, planta o proceso, es decir de toda la escena del evento. Observar el efecto de las acciones correctivas anteriores. Desarrollar o requerir pruebas de laboratorio. Desarrollar las actividades de investigación por uno mismo. • • • • • Métodos más comunes para recolectar información y datos. 1. Revisión de documentos a) Revisión de documentos relevantes o partes del mismo, según sea necesario. Referenciar adecuadamente su uso. Registrar los datos correctos y tiempos asociados al evento / problema. A continuación se da una lista de documentos que pueden ser utilizados: José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 19 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz • • • • • • • • • • • • • • • Bitácoras de trabajo o de operación Correspondencia o correo electrónico Minutas de reunión Registro de inspecciones y pruebas Registros de mantenimiento Registros históricos del equipo Registros de computadora Registros de tendencias y gráficas Procedimientos e guías Manuales de maquinaria Dibujos y especificaciones Información de diseño Cambios en los documentos Lecturas de parámetros de planta Resultados y análisis de muestreos b) Revisión de proveedores de los equipos y registros de fabricantes relacionados con el problema analizado. 2. Levantamiento de observaciones en el lugar de trabajo. 3. Ejecución de inspecciones. Una inspección es un método que puede verificar los resultados de una evaluación. Este método permite recolectar datos de un grupo grande de personas. No es muy utilizado durante el proceso de la identificación y corrección del problema. Se recomienda que sea un experto en estas inspecciones quien desarrolle este proceso. 4. Entrevistas Esta recolección de datos se desarrollará a través de todo el proceso de evaluación y por eso existen varios métodos o herramientas que pueden ayudar en la recolección y adecuada organización de los datos. José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 20 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz 5.2 Secuencia de Eventos en la Línea del Tiempo Esta es una metodología simple, que provee soporte para mantener una secuencia durante el periodo de recolección de datos e información y provee un orden lógico de la información para el Análisis de Causas Raíz. Los pasos de esta metodología son los siguientes: 1. Comenzar con el desarrollo del análisis tan pronto como se notifique el evento. En una pizarra se crea una línea de tiempo con etiquetas o notas autoaderibles o se utiliza la computadora para hacerlo. Al recolectar y analizar la información de esta manera, se tendrá una línea base de hechos que mantendrá el enfoque. 2. Al estar recolectando la información de acuerdo a las 5 P´s por medio del desarrollo de la secuencia de eventos en la línea del tiempo, se debe asegurar de que la fuente de la información sea registrada adecuadamente en la línea del tiempo, dado que en eventos significativos, podría ser cuestionada la procedencia de dicha información. 3. Asegure, además, que la información quede adecuadamente ligada a cada hecho y que esté respaldada de manera correcta, esto es que se usen tarjetas, bitácoras o se encuentre por lo menos en dos dispositivos electrónicos de respaldo para evitar que esta información se pierda de manera accidental. 4. Esta secuencia de eventos en la línea del tiempo se irá complementando en el transcurso de la investigación y mediante la ejecución de los análisis correspondientes. 5.3 Carta o Mapa de Eventos y Factores Causales Este mapa es una herramienta de análisis, por medio de la cual podemos ―mapear‖ o relacionar la relación existente entre los eventos, condiciones, cambios, barreras de control y factores causales que se han desarrollado en un periodo de tiempo usando símbolos estandarizados para cada uno. Es también un mapa de flujo, que despliega gráficamente un evento por completo. La parte principal del Mapa de Eventos y Factores Causales es que va un paso más allá de la herramienta anterior (Secuencia de Eventos en la Línea del Tiempo). Al desarrollar este mapa, se pueden seleccionar los puntos de inicio y final, para capturar toda la información pertinente de la situación evaluada o investigada. Al establecer la línea de eventos, se pueden agregar características circunstanciales adicionales, tales como condiciones relacionadas, eventos o acontecimientos secundarios y presunciones. Algunos posibles factores causales se harán evidentes al desarrollar el mapa. Algunos otros que no son evidentes al principio llegan a ser evidentes con esta técnica. Este mapa es particularmente útil para las situaciones complejas y complicadas y es más entendible que las explicaciones narrativas que se pudieran dar por medio de una descripción escrita. José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 21 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz Este Mapa de Eventos y Factores Causales, provee una excelente oportunidad para mostrar gráficamente las barreras de control, los cambios y causas efectos; además de mostrar cómo se involucran, con la maquinaria o equipo, las condiciones de confiabilidad humana. Beneficios del Mapa de Eventos y Factores Causales. • • Organiza la situación y todos los datos involucrados con el análisis. Muestra la secuencia exacta de los eventos desde el inicio hasta el fin y destaca el desarrollo de otras condiciones, eventos secundarios, presunciones, factores causales, cambios, eventos primarios y barreras de control. Usa los resultados de los análisis de barreras y cambios. Estos resultados podrían ampliarse a la secuencia de eventos. Presenta la situación analizada de un solo vistazo. Provee la explicación de orientación de causas para la situación o evento que se analiza. Ayuda a asegurar la objetividad. Ayuda a asegurar la información cuantitativa (tiempo, temperatura, altura, presión, etc.) Proporciona una base para determinar cambios beneficiosos para prevenir problemas futuros similares. • • • • • • Cómo elaborar un Mapa de Eventos y Factores Causales Tan pronto como se conozca que ocurrió un evento. Se comienza a armar con la información de inicial con que se cuente y se va adicionando más información conforme vaya avanzando la investigación y se tenga algún bloque nuevo de información. Continuamente se estará actualizando el Mapa de acuerdo a las entrevistas y recolección de información que se haga. Considerar además lo siguiente: 1. Use el mapa para reconstruir el escenario, teniendo el cuidado necesario para identificar los eventos indeseados (efectos primarios). 2. Examine estos efectos primarios y determine qué causas o condiciones permitieron que el efecto ocurriera. Coloque estas condiciones en el mapa, indicando su relación con el efecto. 3. Para cada condición identificada, pregúntese porqué existe esa condición, es decir, que cada condición sea tratada como un efecto y determine la causa. Incorpore esta nueva condición en el Mapa. 4. Se deben aplicar diferentes metodologías para análisis de falla para encontrar las causas raíz de la situación no deseada. Para esto se puede hacer uso de diferentes metodologías de análisis de fallas, tales como: José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 22 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz a) Análisis de Barreras de Control. b) Análisis de Cambios. c) Análisis Causa Efecto. d) Análisis de Árbol de Fallas. e) Análisis de Modo y Efecto de Falla, etc. 5. Ejecutar los Análisis de Fallas necesarios hasta que: f) La solución de la causa esté fuera del control de la planta. g) El efecto primario sea completamente explicado en cuanto a porqué ocurrió. h) No existan otras causas que puedan explicar el efecto, y el empleo de otro análisis de fallas, no arroja beneficios adicionales para corregir el problema inicial. Procedimiento para construir un Mapa de Eventos y Factores Causales. Paso 1. Defina el alcance del mapa a partir de la información inicial. Se puede comenzar con una simple línea de tiempo. a) Evento de inicio b) Evento final. Paso 2. Evaluar la información inicial y la documentación recolectada de acuerdo a las 5 P´s. a) ¿Cuál fue el efecto primario? (Acción inapropiada, falla de componente o falla de la función de un sistema). b) ¿Cuándo ocurrió? ¿Durante qué actividad o evaluación? c) ¿Cómo ocurrió? d) ¿Cuáles fueron las consecuencias? Paso 3. Construir la línea preliminar de eventos primarios. a) Inicie colocando los hechos conocidos hasta ese momento. b) Coloque notas en etiquetas autoaderibles, o bien utilice la computadora para este proceso. c) Establezca la secuencia conocida de eventos primarios en la línea correspondiente (línea de eventos primarios). d) Agregue eventos secundarios y condiciones en el lugar adecuado del mapa. Paso 4. Recolecte nuevos hechos y agréguelos en el mapa. a) Lo eventos secundarios se colocan arriba o debajo de la línea de eventos primarios. Esto se continúa a través de todo el proceso de evaluación. José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 23 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz b) Identificar las condiciones, tales como: • • • Las condiciones iniciales (potencia, hora, número de trabajadores, etc.) Aquellas que conduzcan a los efectos primarios (procedimientos sin actualizar, problemas con herramientas y equipo de comunicación, reparaciones frecuentas, etc.) Aquellas que se encontraban presentes después de que le efecto primario ocurrió (respuesta a un problema, acciones tomadas, etc.) Paso 5. Identificar y agregar en el mapa los factores causales, las fallas en las barreras de control y los cambios detectados. a) Integrar los resultados de otras técnicas o metodologías de análisis de fallas, tales como: • • • • • Análisis de Barreras de Control. Análisis de Cambios. Análisis Causa Efecto. Análisis de Árbol de Fallas. Análisis de Modo y Efecto de Falla, etc. b) Decida cuáles acciones son inapropiadas. Verifique que los hechos soporten las conclusiones. Paso 6. Identificar qué acciones correctivas son necesarias y deben ser tomadas: a) En base a las fallas en las barreras de control y factores causales. b) Las acciones correctivas deben estar bien sustentadas en los hechos y deben ser factibles. En otras palabras se deben comprobar las hipótesis generadas. En la siguiente tabla se muestra la simbología y su definición utilizada para su elaboración. José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 24 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz Tabla # 2 Simbología para un Mapa de Eventos y Factores Causales # Símbolo Definición Evento: Acción o suceso durante alguna actividad. que ocurre 1 Incluir todos los acontecimientos o eventos en rectángulos. Evento Primario: Acción o suceso directamente ligado al efecto primario. Se muestra como un rectángulo en la línea de eventos primarios. La secuencia de eventos primarios se representa con una línea horizontal recta, con los eventos primarios conectados por una flecha gruesa. La secuencia de tiempo generalmente se coloca a la derecha. Evento No Deseado: Falla de equipo, condición o acción inadecuada, que fue crítica para la situación que se analiza. Se representa por un rombo (fallas de componentes, fallas de funcionamiento de sistemas, fallas humanas). Evento Secundario: Acción o suceso que impacta al evento primario, pero que no está directamente involucrado en la situación. Se representa por un rectángulo arriba o debajo de la línea de eventos primarios. Los eventos secundarios se conectan por una flecha delgada. Evento Supuesto: Acción o suceso que es tomado en cuenta porque aparece en la secuencia lógica pero no puede ser probada. Se representa por un rectángulo punteado. Condiciones: Circunstancias relacionadas a la situación, que podrían influir en el curso de los eventos. Se representa por óvalos conectados a los eventos. Las condiciones se conectan a otras condiciones y/o eventos por medio de flechas punteadas. http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab 2 3 4 5 6 José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos Marzo 2008 PAG: 25 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz # Símbolo Definición 7 Factor Causal: Factor que originó el resultado de la situación. Se representa por un óvalo con el lado derecho sombreado. 8 Factor Causal Supuesto: Factor tomado en cuenta porque parece lógico que afecta en otro evento o condición. Se representa por un óvalo punteado y sombreado por el lado derecho. 9 Barrera de Control: Barreras físicas o administrativas, necesarias para prevenir eventos o acciones no deseadas. 10 Falla en la barrera de control: Procedimiento no ejecutado, violación de dispositivos de seguridad, etc. 11 Antes Después Cambio: Cualquier cambio realizado en el procedimiento de ejecución de alguna actividad o en el procedimiento de operación de algún equipo. Se incluye también los cambios registrados en el equipo (variaciones en sus condiciones de operabilidad). Secuencia de Eventos Secundarios y Otros: La secuencia de eventos secundarios, factores causales que contribuyen y los factores causales se colocan arriba o debajo de la línea de eventos primarios. 12 José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 26 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz # Símbolo Definición 13 Fin del Análisis: Se representa por un círculo al final de la línea de eventos primarios. Criterios para la descripción de un evento 1. El evento es una descripción de lo que pasó y no el porqué pasó. 2. El vento describe sólo una acción o suceso. 3. Cada evento en la secuencia se describe por una oración corta. Sólo por un sustantivo y un verbo. 4. Cada evento se describe con exactitud. 5. Los eventos deben ser cuantificados cuando sea posible. 6. Los eventos deben estar basados en información válida (hechos). 7. El mapa va desde el inicio hasta el final de la situación analizada. 8. Considerar un nivel de detalle necesario que describa la secuencia de eventos. Consideraciones • • • Los eventos son el resultado de fallas en el equipo, problemas de diseño, errores humanos. Estos son denominados y se muestran como efectos primarios en el Mapa. Existen efectos generados por algunas causas adicionales. La causa raíz de un evento puede ser determinada usando la relación causa-efecto que existe alrededor del efecto primario. Frecuentemente los análisis de fallas conducirán a causas raíz que son controladas gerencialmente. Cuando más de una causa es responsable de un efecto, cada causa debe ser analizada. Los análisis de fallas son más efectivos cuando se utilizan dentro del marco del Mapa de Eventos y Factores Causales. No son métodos independientes, porque el suceso se debe desarrollar hasta donde se identifiquen todos los efectos primarios. Este proceso provee una lógica para mantener el enfoque de la evaluación. http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab • • • • José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos Marzo 2008 PAG: 27 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz La siguiente figura es un ejemplo del uso del Mapa de Eventos y Factores Causales. Figura # 2 Ejemplo de un Mapa de Eventos y Factores Causales 6. Ordenar el Análisis Fijando Estrategias de Responsabilidades para la Captura de los Datos y Conformar el Equipo de Trabajo Se deberá asignar un grupo de personas para realizar el análisis, quienes son expertos y tienen conocimientos relacionado directamente al evento que se esta analizando. Generalmente los equipos se conforman con personal técnico. Además se tiene como norma del grupo que el facilitador no deberá estar familiarizado con el evento. Por otro lado a continuación se describen las responsabilidades de cada miembro del equipo. 6.1 Responsabilidades. Promotor de ACR • • • Audita el uso de esta Guía en toda la localidad. Apoya la erradicación de las Causas Raíces Latentes. Desarrolla Estrategias dirigidas a cerrar cualquier brecha de entrenamiento identificada. http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos Marzo 2008 PAG: 28 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz • • Promueve entrenamiento a todos los grupos involucrados. Deberá tener un adiestramiento básico en la metodología de ACR utilizada en su localidad y en los conceptos básicos de Confiabilidad. Patrocinador de ACR • • • • Inicia los procesos de ACR en el área bajo su responsabilidad. Asigna y/u obtiene recursos para el equipo. Aprueba recomendaciones y gestiona los recursos para su implantación. El Patrocinador deberá tener un adiestramiento básico en la metodología de ACR usada en su localidad. Líder de ACR • • Es asignado por el Patrocinador de ACR. Lidera el análisis y garantiza que las reuniones se realicen y el proceso culmine en el tiempo previsto. Hace seguimiento a las recomendaciones del Análisis Causa Raíz y garantiza que sean ejecutadas trabajando en conjunto con el Patrocinador de ACR. • Facilitador • • Mantiene todos los reportes en un formato electrónico estándar. Mantendrá una base de datos, la cual permitirá hacer seguimiento a las acciones pendientes y la actualizará periódicamente. El facilitador aplicará la metodología de ACR durante las sesiones de análisis y se responsabiliza en garantizar que la metodología es utilizada apropiadamente. El facilitador sigue el progreso de implantación de todas las recomendaciones del ACR a través de los líderes de equipos. Coordina entrenamiento para todos los grupos involucrados. El facilitador coordinará junto con los Promotores de ACR, y el resto del equipo de trabajo, la revisión de la información sobre libranzas, Equipos con problemas recurrentes, pérdidas de producción y costos de mantenimiento, de donde se obtendrán las listas jerarquizadas de problemas a ser analizados. • • • • Miembros del equipo • Participa activamente en el ACR. Asisten a reuniones programadas y completan asignaciones entre reuniones. José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 29 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz Estas responsabilidades se asignarán de acuerdo a las necesidades y cantidad de personal que puede participar en el Análisis de Causas Raíz. Una vez definidas las responsabilidades en los diferentes niveles se procede con el análisis de las actividades y del proceso de acuerdo a lo descrito enseguida. 6.2 Análisis de las Actividades Mediante la Simulación del Proceso en Campo Es un método, en el cual, el personal que realiza la actividad o proceso, ejecuta una representación paso a paso de la actividad o proceso bajo análisis. Este método lo desarrolla un observador ajeno o externo al proceso. El método consiste en lo siguiente: 1. Obtener información acerca de qué personas se encontraban, la hora y la fecha, entre otros datos. 2. Determinar el alcance del análisis de las actividades o procesos analizados. 3. Obtener información acerca de los requerimientos del proceso analizado mediante entrevistas con expertos y consulta de documentos como procedimientos, dibujos técnicos, manuales, entrevistas con el personal involucrado, etc. 4. Dividir el proceso o actividad en componentes o pasos y generar un diagrama de bloques con la secuencia de ellos, observando al personal a través de todo el proceso y registrar sus acciones. Encuentre discrepancias y problemas en el área. 5. Para cada bloque o componente identificar quién realiza esa actividad, el equipo y herramienta que usa y los controles clave y displays que se tienen. Usar formato del Anexo B. 6. Familiarizarse con el diagrama y decidir qué información se registrará y cómo se hará esto. 7. Resuma y consolide cualquier problema detectado. Identifique probables contribuyentes a la acción inapropiada. 7. Análisis del Evento La determinación de la causa raíz es el proceso para detectar sistemáticamente y analizar las causas físicas, humanas y latentes posibles de un problema, con el objetivo de determinar las acciones correctivas. Se debe realizar un razonamiento lógico para alcanzar las conclusiones por medio de herramientas que plasman el pensamiento en un papel, tales como listas, hojas de cálculo, formatos, mapas, etc. De esta manera se tiene la información para mostrar las suposiciones y probar las conclusiones o las hipótesis generadas. José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 30 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz Los objetivos del análisis del evento son los siguientes: 1. Determinar las supuestas causas físicas, humanas y latentes que originan el problema. 2. Eliminar las causas aparentes, que no tienen soporte en la documentación. 3. Seleccionar las causas físicas, humanas y latentes que necesitan verificarse. 4. Determinar las causas raíz físicas, humanas y latentes, y las que solo contribuyen al problema; y que además necesitan de acciones correctivas para evitar su reaparición. Para encontrar las causas raíz físicas, humanas y latentes de la situación no deseada, se deben aplicar diferentes metodologías para análisis de falla, ya sea de manera independiente o combinada, pues lo que se pretende es encontrar las causas raíz más profunda de la situación o la causa raíz latente (también llamada de sistema). Estas metodologías son, entre otras: • • • • Análisis de Barreras de Control. Análisis de Cambios. Análisis Causa Efecto. Análisis de Árbol de Fallas, entre otras más. Una vez que se aplican estos análisis de manera independiente o conjunta, además de otras opciones que existen, el proceso del Análisis del Evento es el siguiente: 1. Establecer el enunciado del evento a analizar. 2. Determinar los modos de falla del evento. 3. Elaborar las hipótesis que pudieron originar la presencia de los modos de falla. 4. Validar o rechazar las hipótesis. Si se validan se convierte en causa. 5. Continuar bajando en el desarrollo del árbol con el planteamiento de las hipótesis a partir de las respuestas dadas al por qué de la hipótesis inmediata superior. 6. Así mismo, continuar con el proceso de validación, hasta encontrar las causas humanas que originaron el evento. 7. La causa inmediata superiora a esta causa humana, se denomina la causa física del evento. 8. Continuar bajando en el árbol hasta encontrar la causa raíz latente o de sistema que da origen a la causa humana del evento. 9. Separar las causas raíces de las que sólo contribuyen al problema. 10. Verificar las causas raíces físicas, humanas y latentes. Enseguida se describe la metodología de los análisis de fallas mencionados con anterioridad. José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 31 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz 7.1 Análisis de Barreras de Control. Esta es una herramienta para identificar las acusas de un evento. Algunos eventos simples necesitan solamente un análisis de control de barreras para la evaluación general. Es una técnica para analizar actividades o procesos, poniendo atención a las barreras físicas o administrativas, necesarias para prevenir eventos y acciones no deseadas. El análisis se concentra en aquellas barreras donde ninguna fue efectiva o donde se perdieron por alguna razón, que es la que se va a investigar. Algunas barreras de control físicas son: guardas, guarda coples, etc. Algunas barreras administrativas de control son: políticas, procedimientos, normas, estándares, reglamentos, señalizaciones, límites, etc. Estas barreras son parte de las condiciones de trabajo. Se utilizan para proteger a las personas y al equipo mismo, refuerzan la seguridad y desempeño del sistema Hombre-Máquina. El análisis de barreras de control es un método para encontrar y verificar que las barreras de control estén desempeñando adecuadamente su función, que es proteger a las personas y aumentar la seguridad en el sistema Hombre-Maquina. Si las barreras de control funcionan adecuadamente, entonces ningún vento debería ocurrir, pero la realidad es otra, pues existen algunas violaciones a estas barreras de control y los eventos indeseados ocurren. Existen dos métodos de análisis de barreras de control: 1. Método independiente. Involucra la identificación y evaluación de todas las barreras de control físicas y administrativas para la situación que se evalúa. 2. Método integrado. Involucra la sobreposición de barreras de control dentro del Mapa de Eventos y Factores Causales detallado anteriormente. Pasos para realizar el Análisis de Barreras de Control. Paso 1. Paso 2. Paso 3. Paso 4. Paso 5. Paso 6. Identificar todas las barreras de control administrativas y físicas pertenecientes a la situación evaluada. Usar la hoja de análisis de barreras y el Mapa de Eventos y factores Causales para el método integrado. Evaluar la efectividad de cada barrera. Identificar todas las barrearas aparentemente fallaron y permitieron el progreso del evento no deseado. Determinar cómo falló la barrera de control. Determinar porqué falló la barrera de control. Identificar qué barreras de control, si existieran, pudieron prevenir la ocurrencia. que José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 32 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz Paso 7. Con la información de otras fuentes, validar los resultados del análisis de barreras de control. Las entrevistas pueden aportar más información de cómo y porqué la barrera de control falló. Auxiliarse de un experto en el tema. Paso 8. Si no se identifican todas las barreras de control que contribuyen al evento, el análisis estará incompleto. Por esta razón, es recomendable el uso de otras metodologías de análisis de fallas, en conjunto con el análisis de barreras de control e integrarlos al Mapa de Eventos y Factores Causales. 7.2 Análisis de Cambios El objetivo de esta metodología es encontrar cambios en la ejecución de las actividades o procesos. Es también un proceso mediante el cual se compara y analiza lo que debería suceder con lo que actualmente sucede, poniendo especial atención en los cambios detectados. Para este punto se puede auxiliar con las preguntas tales como: • • • ¿Qué se hizo diferente de otras ocasiones en que no hubo ninguna falla? ¿Por qué ahora y no antes? ¿Por qué aquí y no allá? Los pequeños o grandes cambios nos pueden guiar a la causa raíz del evento no deseado. Se recomienda realizar el análisis de cambios cuando: • • • • Las causas de una acción inapropiada o falla de equipo no están claras. No se sabe donde comenzar. Se ha iniciado la evaluación y no se sabe qué más hacer. Si se sospecha que un cambio contribuyó a la acción inapropiada o a la falla del equipo. Metodología para el Análisis de Cambios Paso 1. Paso 2. Paso 3. Paso 4. Paso 5. Descripción de la situación actual con la ejecución de la acción inapropiada. Escribir cuándo fue realizada. Misma situación pero sin la acción inapropiada. Comparar ambas situaciones. Establecer las diferencias. Analizar las diferencias por efectos sobre la acción inapropiada. http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos Marzo 2008 PAG: 33 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz Paso 6. Paso 7. Integrar la información relevante para las causas de la acción inapropiada. Integrar esta información al Mapa de Eventos y Factores Causales. Al estar desarrollando este análisis se deben tener en cuenta los siguientes riesgos: • • • • No es fácil reconocer los cambios graduales a través del tiempo. No es fácil reconocer todos los cambios. No es fácil reconocer el efecto dominó de los cambios ocurridos en otros puntos del proceso. Se corre el riesgo de definir incorrectamente el cambio. Por esta razón el Análisis de Cambios debe ejecutarse de manera conjunta con otro análisis de fallas. 7.3 Análisis Causa Efecto El objetivo fundamental es el identificar y verificar todas las causas posibles de un problema y llegar a la causa raíz o principal del mismo para reducirlo o eliminarlo. Para llegar al corazón de un problema se requiere identificar todas las causas posibles de algún efecto (el problema). Las causas se atribuyen a la forma en que el trabajo se realiza y las variaciones en este proceso. Estas variaciones también pueden darse en materiales, equipo, métodos y la forma en la que las personas realizan su trabajo. Cuando se requiere solucionar un problema es de gran utilidad identificar las fuentes de variación antes de tomar acciones correctivas. Este trabajo deberá llevarse a cabo en equipo a efecto de lograr identificar el mayor número de causas posibles. El llevar a cabo un análisis causa-efecto permite identificar las fuentes clave de variación que están causando el problema. Cuando se eliminan o se efectúan cambios en estas causas raíz o principales, se tendrá un gran impacto en la solución del problema global. Metodología para su elaboración Paso 1. Construcción del diagrama a) Utilizando un pizarrón, rotafolio o cartulina escriba el problema a solucionar a la derecha dentro de un rectángulo. También trace una larga flecha que apunte al rectángulo. Deberá asegurarse de que todos los que participan en el equipo de análisis estén de acuerdo con la definición del problema (efecto) como se ha planteado. b) Seleccione las categorías que mejor atiendan las causas principales para hacer el diagrama. Existen dos tipos de categorías: José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 34 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz • Categorías causales principales.- También conocidas como del tipo de análisis de dispersión. Estas categorías son estándar y generalmente usadas para la mayoría de los problemas. Las 5 M’s : Maquinaria, Métodos, Materiales y Mano de Obra y Medio Ambiente. Las 6 P’s: Producto, Políticas, Proceso, Procedimientos, Personal y Planta (equipo con el que se cuenta, se utiliza o requiere). También es posible el combinar factores de las dos categorías a conveniencia. • Pasos Principales del Proceso.- también conocidos como del tipo de Clasificación de Procesos. Estos se refieren a los pasos principales del proceso que se analiza. El equipo deberá revisar el Diagrama de Flujo para determinar los pasos clave. En este caso no hay un número determinado de categorías. Estas se determinarán de acuerdo a la situación o necesidades que determine el equipo. c) Escriba las categorías causales principales (pasos principales del proceso) en el papel de rotafolio. Coloque cada una en un rectángulo y conéctela con una flecha hacia la línea principal del problema. d) Conduzca una sesión de tormentas de ideas para desarrollar una lista de factores que podrían estar causando o contribuyendo al problema. • • Sobre la misma identifique cuáles son todas las posibles causas del problema. Registre las identificadas en tarjetas para su más fácil manejo. e) Coloque las tarjetas de posibles causas debajo o junto cada una de las categorías en el diagrama. Las causas pueden colocarse en tantas categorías como se juzgue conveniente. f) Cree el siguiente nivel de causas. • Para cada una de las causas listadas en el diagrama pregunte a todo el equipo ¿Porqué sucede? Para cada respuesta, repita la misma pregunta y anótela. Cada respuesta se connotará como una posible causa. Registre las respuestas del equipo debajo de las causas principales. El colocar flechas de conexión muestra la relación lógica de cada respuesta ante aquella que la generó. Continúe preguntando los ―por qué‖ de cada causa hasta que el equipo decida que cuenta con suficiente información para identificar la causa o raíz principal. Como sugerencia puede utilizar notas autoaderibles para facilitar la organización de ideas proporcionadas. Revise el Diagrama Causa-Efecto • • • Paso 2. Puede utilizar los elementos que a continuación se listan para comprobar que tan completo y cercano a la realidad resulta el diagrama. José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 35 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz • ¿El problema se encuentra correctamente planteado?, ¿Incluye el nombre del proceso?; Si no es así; replantee el problema ayudado por las causas secundarias planteadas por el equipo e identifique nuevamente el efecto raíz (problema). ¿Ha enlistado todas las causas potenciales?; si no es así, integre al análisis a otras personas que conozcan el proceso para identificar causas posibles. ¿Todas las aportaciones de información fueron ordenadas (categorizadas)?; si no es así, y tiene problemas para encajar la causa en una de las categorías, cree una categoría de ―otros‖ e insértela ahí para tenerla a la vista, ya que puede resultar importante. ¿Ha identificado soluciones en lugar de causas?; Si es así, anótelas en unas tarjetas independientes y resérvelas para más adelante. Es importante que en este punto del desarrollo de la herramienta se enfoquen en las causas no en las soluciones. El diagrama está completo y es claro para todos? Asegúrese de que todas las categorías estén bien detalladas y que sean entendibles a todos, ya que si son propensas a ser interpretadas de manera diferente por los miembros del equipo puede haber confusiones para determinar soluciones. Determine si requiere de más información para clarificar el problema. • • • • Paso 3. Muchas de las causas identificadas por los miembros del equipo son conocidas, mientras otras son suposiciones derivadas de información que tiene que ser validada. Se hará necesario entonces, recabar datos y analizarlos. Paso 4. Seleccione la causa raíz o principal. 1. Identifique las candidatas que pudieran ser nominadas para ser la causa principal tomando alguna(s) de las siguientes acciones: • • • • Identifique causas que aparecen repetidamente dentro de las categorías fijadas. Identifique cambios y otras posibles fuentes de variación en el proceso o en el medio ambiente. Utilice la información /datos identificados que nutran una causa raíz potencial. Abra una discusión en el equipo para que a través de una explicación lógica y convincente, se determine como es que una causa está creando el problema (efecto). 2. Seleccione la(s) causa(s) de la lista que identificó como causas raíz o principales. Beneficios del Análisis Causa Efecto • • Ayuda a encontrar y a considerar todas las causas posibles del problema. Ayuda a determinar la causa raíz de un problema de manera estructurada. http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos Marzo 2008 PAG: 36 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz • • Anima la participación grupal y utiliza el conocimiento que tiene el grupo, del proceso analizado. Utiliza y ordena en un formato fácil de leer las relaciones del diagrama causa efecto. Limitaciones del Análisis de Causa - Efecto No es particularmente útil para problemas extremadamente complejos donde se relacionan muchas causas. Categoría 1 Categoría 2 Categoría 3 Causa 1 Causa 2 Causa 3 Sub 1 Sub 2 Sub 3 Efecto o Problema Causa 4 Causa 5 Sub 4 Sub 5 Categoría 4 Categoría 5 Figura # 3 Diagrama de Causa - Efecto José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 37 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz 7.4 Análisis de Árbol de Fallas El propósito del ―Fault Tree Analysis‖ es establecer la probabilidad de ocurrencia de un evento usando métodos analíticos estadísticos. Estos cálculos utilizan información del sistema cuantitativo de confiabilidad y mantenibilidad, tales como probabilidad de falla, tasa de fallas o tasa de reparación. En contraste con el FMEA o FMECA, el FTA se concentra solamente en una falla. El análisis utiliza la creación de un diagrama árbol de fallas (Fault Tree Diagram) compuesto de compuertas (gates) y eventos básicos que representan la descripción lógica de una falla del sistema conocida como TOP event, en términos de las fallas de los sistemas, sub-sistemas y componentes que componen el sistema mayor (instalación, máquina, proceso, etc.), representando la interacción de fallas y otros eventos dentro de un sistema. Proceso para construir un Diagrama de Árbol Paso 1. Paso 2. Definir los límites. Defina los límites del sistema que se analizará y el nivel de la complejidad al cual las fallas serán resueltas. Definir el evento superior. Para definir el evento superior, se tiene que identificar el tipo de falla que se va a investigar. Esto podría ser lo que haya sido el resultado final de un incidente, tal como la ruptura del tren de sellos del compresor. Tal vez sean necesarios varios FTA para estudiar un sistema completamente. Conocer el sistema. Se debe estudiar toda la información disponible sobre el sistema y su ambiente. Puede ser de ayuda un análisis de cambios y de barreras de control, para determinar la información necesaria. Construir el árbol. Este paso tal vez sea el más fácil porque se usan solamente pocos de los símbolos y la construcción práctica es muy sencilla. Paso 3. Paso 4. Para este paso se utilizarán los siguientes símbolos: Tabla # 3 Simbología para la creación de un Análisis de Árbol de Fallas # Símbolo Definición Puerta Y – Representa una condición en la cual todos los eventos mostrados debajo de la puerta (puerta de entrada) tiene que estar presentes para que ocurra el evento arriba de la puerta (evento de resultado). Esto significa que el evento de resultado ocurrirá solamente si todos los eventos de entrada existen simultáneamente. 1 José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 38 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz # Símbolo Definición Puerta O – Representa una situación en la cual cualquiera de los eventos mostrados debajo de la puerta (puerta de entrada) llevarán al evento mostrado arriba de la puerta (evento de resultado). El evento ocurrirá si solamente uno o cualquier combinación de los eventos de entrada ocurre. Rectángulo – El rectángulo es el principal componente básico del árbol analítico. Representa el evento negativo y se localiza en el punto superior del árbol y puede localizarse por todo el árbol para indicar otros eventos que pueden dividirse más. Este es el único símbolo que tendrá abajo una puerta de lógica y eventos de entrada. Círculo – Un círculo representa un evento base en el árbol. Estos se encuentran en los niveles inferiores del árbol y no requieren más desarrollo o divisiones. No hay puertas o eventos debajo del evento base. Diamante – El diamante identifica un evento terminal sin desarrollar. Tal evento es uno no completamente desarrollado debido a una falta de información o significancia. Una rama del árbol de fallas puede terminar con un diamante. Por ejemplo, la mayoría de los proyectos requieren personal, procedimientos, y equipo. El desarrollador del árbol tal vez se decida enfocarse en el aspecto de personal del procedimiento y no en los aspectos del equipo o procedimientos. En este caso el desarrollador usaría diamantes para mostrar ―procedimientos‖ y ―equipo‖ como eventos terminales no desarrollados. Óvalo – Un símbolo de óvalo representa una situación especial que puede ocurrir solamente si ocurren ciertas circunstancias. Esto se explica adentro del símbolo del ovalo. Un ejemplo de esto tal vez sea el caso de que si hay que cerrar ciertos interruptores por una secuencia específica http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab 2 3 4 5 6 José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos Marzo 2008 PAG: 39 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz # Símbolo Definición antes de ocurrir una acción. Triángulo – El triángulo significa una transferencia de una rama del árbol de fallas a otro lugar del árbol. Donde se conecta un triángulo al árbol con una flecha, todo lo que esté mostrado debajo del punto de conexión se pasa a otra área del árbol. Esta área se identifica con un triángulo correspondiente que se conecta al árbol con una línea vertical. Letras, números o figuras diferencian un grupo de símbolos de transferencia de otro. Para mantener la simplicidad del árbol analítico, el símbolo de transferencia debe usarse con moderación. Puerta Y Prioritaria – El suceso de salida ocurrirá si y sólo si todas las entradas ocurren en una secuencia determinada, que normalmente se especifica en un elipse dibujada a la derecha de la puerta. 7 8 9 Puerta O Exclusiva – El suceso de salida ocurrirá si lo hace una de las entradas, pero no dos o más de ellas. 10 X Puerta de inhibición – La salida ocurrirá si y sólo si lo hace su entrada y además se satisface una condición dada X Paso 5. • • Determine todos los eventos no deseados en la operación. Proporcione siempre la descripción completa del evento del sistema o componente en las cajas rectangulares de cada símbolo del árbol de fallas. Definir las causas inmediatas del nuevo sistema de eventos. Es importante que los eventos del sistema intermedio no queden fuera, al definir las causas inmediatas. De esta manera, los niveles del árbol de fallas se desarrollan sistemáticamente desde los http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos Marzo 2008 PAG: 40 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz sistemas de eventos mayores, a través de niveles intermedios de complejidad, hasta los eventos básicos que representan las fallas de los componentes en la raíz del árbol de fallas. • Continuar con este proceso de definición de causas inmediatas del sistema de eventos hasta que todas las raíces del árbol de fallas terminen en los eventos primarios. Recordar las definiciones de los eventos del sistema y sus componentes al construir el árbol. Resolver los eventos del sistema en sus causas inmediatas. Identificar las distintas causas de un evento. • • El árbol tiene que construirse al usar los símbolos de eventos nombrados arriba. Debe de mantenerse sencillo. Mantenga un formato lógico, uniforme y consistente de nivel a nivel. Use títulos claros y precisos al escribir dentro de los símbolos de eventos. Las puertas de lógica deben limitarse a ―la puerta y‖ y ―la puerta o‖ y se debe usar símbolos de restricción solamente cuando sea necesario. Un ejemplo sería el uso del símbolo ovalo de restricción para ilustrar una secuencia necesaria de eventos que tienen que suceder para que ocurra un evento. El triángulo de transferencia debe usarse muy poco o nunca. Mientras más se usa el triángulo de transferencia, más complicado se pone el árbol. El propósito del árbol es mantener el procedimiento tan sencillo como sea posible. Paso 6. Paso 7. Validar el árbol. Esto requiere a una persona experta en el proceso analizado para verificar que el árbol esté completo y exacto. Evaluar el árbol. El árbol ahora necesita examinarse para las áreas donde pueden hacerse mejoras en el análisis o donde tal vez haya oportunidad de utilizar procedimientos o materiales alternativos para disminuir el peligro. Considerar cambios constructivos. En este paso, cualquier método alternativo que se implemente debe evaluarse más. Esto permite que los asesores vean cualquier problema que esté relacionado con el nuevo procedimiento antes de implementarlo. Considerar alternativas y recomendar medidas. Este es el último paso en el proceso donde se recomiendan acciones correctivas o medidas alternativas. Paso 8. Paso 9. José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 41 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz En la figura siguiente se muestra una representación gráfica de un análisis de árbol de fallas, asociado a un posible daño a un pasajero durante el uso de un elevador. Figura # 4 Ejemplo de Diagrama de FTA 7.5 Planteamiento de Hipótesis Las hipótesis son conjeturas sobre cómo la falla ha ocurrido. Cuando se genera la hipótesis se debe tener en cuenta todas las posibilidades sin importar lo remoto que sea la posibilidad de que la misma ocurra. Uno de los errores más grandes en el análisis de un análisis de falla es ignorar aquellas posibilidades, que a primera vista, parecen ser tan remotas que carecen de la necesidad de una investigación más profunda. Aunque las hipótesis pueden llegar a ser falsas, el acto de verificarlas muchas veces da pistas sobre las causas reales del problema. José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 42 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz Para plantear las hipótesis se deben tomar en cuenta los siguientes puntos: 1. El enunciado debe incluir claramente la causa y el efecto del o los problemas inherentes a la situación o evento. 2. Usar la información y el razonamiento para soportar o eliminar las supuestas causas. Ésta es la parte central del Análisis Causa Raíz. 3. Tomar en cuenta los siguientes criterios: • • El problema podría no ocurrir si la causa no está presente. El problema no se repetirá debido al mismo factor causal si se corrige o elimina la causa. La corrección o eliminación de la causa prevendrá la repetición de condiciones similares. • Cuando estos puntos se convierten en preguntas, y si la respuesta es un ―si‖, entonces tenemos una causa raíz y si es un ―no‖, entonces es una causa que solo contribuye, pero no es una causa raíz. Verificación de Hipótesis Es el proceso de generar y ejecutar estrategias para comprobar o descartar las hipótesis planteadas con anterioridad. Este es el paso más laborioso y largo, debido a que por lo general, requiere la realización de análisis de laboratorios o complejos cálculos matemáticos, recopilación de informes, pruebas, simulaciones, registros, entre otros. Para la verificación de las hipótesis se recomienda que participe un grupo multidisciplinario de personas expertas en el tema que se está analizando. Considerar las premisas que se establecieron después de la conformación del equipo de trabajo. José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 43 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz 7.6 Determinación de Causas Raíces Físicas, Humanas y Latentes: Una vez identificadas las hipótesis probables de acuerdo al contexto operacional, se identifican las causas raíces que explican la ocurrencia de los modos de fallos. Las causas raíces se dividen en tres categorías, estas son: Raíces Físicas: Es el mecanismo de falla del componente. Es la causa que origina la falla. Raíces Humanas: Identifica las acciones humanas que disparan la causa raíz física. Raíces Latentes o de Sistema (Organizacional): Representan la manifestación de los procesos organizacionales que explican la ocurrencia de las raíces humanas. Solo su erradicación garantizará que la falla no se repita en el equipo estudiado o uno similar. Se basa en que el origen de todos los problemas son decisiones u omisiones del personal supervisorio o de la gerencia. Mecanismo de Falla. Una vez concluido este proceso de la determinación de las causas raíz, se procede a realizar una descripción detallada del mecanismo de falla, describiendo con lujo de detalle desde que el evento comenzó con los primeros avisos de presencia del problema, pasando por el desarrollo del evento hasta su finalización. Mencionar además los efectos e impactos que esta falla ocasionó en el proceso, en los operarios y en la planta en general. Relacionar siempre a cantidad de dinero perdido y daños a la seguridad del personal e instalaciones, así como al medio ambiente. 8. Comunicar los Resultados Encontrados y Emitir las Recomendaciones Una vez completado el análisis y que se han determinado las causas raíces físicas, humanas y latentes, se deberá preparar un informe comunicando a los niveles respectivos los hallazgos encontrados, con la finalidad de lograr el apoyo para la implementación de las recomendaciones, en este caso se deberá involucrar a todos los procesos que estén relacionados con las causas de las fallas encontradas. José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 44 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz 8.1 Selección de la Recomendaciones Las recomendaciones son acciones que se ejecutarán con la finalidad de corregir o eliminar las causas que provocaron el evento no deseado, y de esta manera evitar la reaparición del mismo. Estas acciones correctivas se dividen en: • • • Acciones correctivas. Acciones de adaptación. Acciones de monitoreo. El proceso a seguir para definir estas acciones correctivas es el siguiente: 1. Formular las acciones correctivas para las causas raíces físicas, humanas y latentes, así como aquellas que sólo contribuyen al problema. 2. Evaluar las alternativas y seleccionar las acciones correctivas. 3. Evaluar el impacto en otras áreas de la organización. 4. Evaluar el impacto en los recursos (humanos, económicos y materiales). 5. Evaluar el impacto en la programación de la empresa. 6. Evaluar el impacto en la normatividad que rige en la organización. 7. Asegurar la adecuación de las acciones correctivas. 8. Planificar la implantación. 8.2 Reporte o Informe Un buen reporte o informe, determina en gran medida el éxito de la implantación de las recomendaciones, por lo que es importante la primera impresión que la gerencia tendrá del mismo. Por esta razón, enseguida se enumerarán los puntos mínimos que deberá contener un reporte o informe de Análisis Causa Raíz. 1. Título del evento. Incluye el qué, cuándo, dónde, quién y el cómo de la situación. Indique el número de eventos que se han presentado. 2. Condiciones iniciales. Incluye la fecha, hora del evento, condición, configuración del equipo involucrado y eventos que generaron el problema entre otras cosas. 3. Secuencia del evento. Descripción detallada del evento, circunstancias que generaron el evento, método utilizado para descubrirlo, acciones automáticas, acciones de operación, fallas de equipo, fallas en las reglas de seguridad, higiene y medio ambiente, etc. 4. Causas del Evento. Descripción del porqué el problema ocurrió, incluyendo la causa principal del evento junto con cualquier otro factor que contribuya a la acción inadecuada. José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 45 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz 5. Consecuencias del evento. Incluir las causas raíces físicas, humanas y latentes del evento o problema. Incluir las consecuencias del evento y cualquier suceso o efecto adverso que pudiera empeorar las condiciones del evento. 6. Acciones correctivas. Describir cualquier acción correctiva inmediata a ser tomada en el corto, mediano y largo plazo. Indicar claramente los responsables de su ejecución. 7. Aplicabilidad en otros lugares o locaciones. 8. Datos de soporte. Reportes o formatos aplicables, reportes de inconformidades, requerimientos de asistencia o apoyo de ingeniería, modificaciones o cambios en la planta, órdenes de trabajo, figuras, tablas, fotografías y otros documentos que sean necesarios, Mapa de Eventos y factores Causales desarrollado, etc. 9. Control y Seguimiento a la Implantación y Ejecución de Recomendaciones La organización deberá establecer mecanismos para el control de la implantación y ejecución de los resultados, lo cual garantizará la eliminación de las causas raíces del problema analizado. Para cumplir con este punto se recomienda hacer uso de los formatos de Seguimiento y Control de Recomendaciones que la organización tenga declarados como parte de la documentación de su sistema de gestión de la calidad. 10. • • • • • • • • Referencias y Bibliografía Luís A. Sojo . ―El Proceso de Análisis de Causa Raíz‖. Contreras. Jesús . ―Aplicación de Metodología ―PROAT‖ para el ACR de Fallas Recurrentes en Activos de Producción‖. John Kacher and Tita Ouvreloil. ―What makes a Root Cause Failure Analysis Program Successful‖. Kaoru Ishikawa. ―¿Qué es el Control Total de la Calidad?‖. Douglas C. Montgomery. ―Introduction to Statical Quality Control‖. NTP 333. ―Análisis Probabilística de Riesgos. Metodología del Árbol de Fallos y Errores‖. Max Ammerman. ―The Root Cause Analysis Handbook—A Simplified Approach to Identifying, Correcting, and Reporting Workplace Errors‖. Manual de Mantenimiento del SAM José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 46 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz Anexos José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 47 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz 11. 11.1 Anexos Anexo A – Formato para recolección de datos de inicio NOMBRE _______________________ POSICIÓN O ROL________________ FECHA DEL EVENTO _________ HORA DEL EVENTO ______ DEPARTMENTO_______________________________________________ 1. Estatus de las condiciones antes de que el evento ocurriera (Incluye estatus de las actividades desarrolladas o equipo usado) _________________________________________________________________ _________________________________________________________________ 2. _________________________________________________________________ ¿Qué asignación de trabajo tuvo antes del evento? _________________________________________________________________ _________________________________________________________________ 3. _________________________________________________________________ ¿Qué controles aplican al trabajo que le está asignado? (Procedimientos, órdenes de trabajo, aclaraciones, etc.) _________________________________________________________________ _________________________________________________________________ 4. _________________________________________________________________ ¿Cuál fue la primera indicación de que existía un problema? _________________________________________________________________ _________________________________________________________________ 5. _________________________________________________________________ ¿Qué acción tomó, derivada de dicha indicación? _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 48 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz 6. ¿Cuáles fueron las siguientes indicaciones del problema y cuáles fueron las respuestas a éstas? Incluir las acciones manuales. _________________________________________________________________ _________________________________________________________________ 7. _________________________________________________________________ Mencione cualquier problema que haya notado en el equipo antes y después del evento.___________________________________________________________ _________________________________________________________________ 8. _________________________________________________________________ Explique si existe algún procedimiento o guía de trabajo asociado a la deficiencia con el evento. _________________________________________________________________ _________________________________________________________________ 9. _________________________________________________________________ ¿Que cree que haya causado este evento? _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ 10. ¿Qué recomendaciones haría para prevenir la recurrencia de este evento? _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ 11. Menciones otras personas o equipos involucrados en este evento. _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ 12. Comentarios adicionales: _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 49 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ _________________________________________________________________ ______________________ Firma ______________________ Fecha ______________ Hora José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab Marzo 2008 PAG: 50 DE: 50 Artículo Técnico Ingeniería de Confiabilidad Guía para el Análisis de Causa Raíz 11.2 Anexo B – Análisis de actividades Hoja de Trabajo para el Análisis de Actividades Análisis de la Actividad:____________________________________ Pasos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Nota: Asegurarse de que la actividad se descomponga en los pasos más sencillos posible, para poder tener un entendimiento adecuado de la ejecución de la misma. Se pueden agregar más campos, a criterio del analista. Quién Acciones requeridas Componentes Herramientas Comentarios José Ulises Ariza Rodríguez Maestría en Confiabilidad y Riesgos http://www.linkedin.com/pub/josé-ulises-arizarodríguez/11/2bb/8ab
Comments
Report "Guía para realizar un Análisis Causa Raíz (ACR)"