Procesamiento de señal para la clasificación automática de latidos y la adaptación al paciente en el electrocardiograma

Título

Procesamiento de señal para la clasificación automática de latidos y la adaptación al paciente en el electrocardiograma

Colaborador

Martínez Cortés, Juan Pablo
Troparevsky, María Inés

Editor

Universidad de Buenos Aires. Facultad de Ingeniería

Fecha

2012-05

Extensión

x, 170 p.

Resumen

Las enfermedades cardiovasculares son en la actualidad la mayor causa de muerte individual en los países desarrollados, por lo tanto cualquier avance en las metodologías para el diagnóstico podrían mejorar la salud de muchas personas. Hay evidencias para relacionar las arritmias con la muerte súbita cardíaca, esta última probablemente sea uno de los grandes desafíos de la cardiología moderna. Por otro lado, la clasificación de latidos en el electrocardiograma (ECG) es un análisis previo para el estudio de las arritmias. La automatización de esta tarea podría mejorar la calidad diagnóstica de las arritmias, especialmente en registros Holter o de larga duración. El objetivo de esta tesis ha sido estudiar algunas metodologías para la clasificación de latidos en el ECG. En principio se desarrolló y validó un clasificador de latidos sencillo, que utiliza características seleccionadas en base a una buena capacidad de generalización. Se han considerado características de la serie de intervalos RR (distancia entre dos latidos consecutivos), como también otras calculadas a partir de ambas derivaciones de la señal de ECG, y escalas de su transformada wavelet. Tanto el desempeño en la clasificación como la capacidad de generalización han sido evaluados en bases de datos públicas: la MIT-BIH de arritmias, la MIT-BIH de arritmias supraventriculares y la del Instituto de Técnicas Cardiológicas de San Petersburgo (INCART). Se han seguido las recomendaciones de la Asociación para el Avance de la Instrumentación Médica (AAMI) tanto para el etiquetado de clases como para la presentación de los resultados. Para la búsqueda de características se adoptó un algoritmo de búsqueda secuencial flotante, utilizando diferentes criterios de búsqueda, para luego elegir el modelo con mejor rendimiento y capacidad de generalización en los sets de entrenamiento y validación. El mejor modelo encontrado incluye 8 características y ha sido entrenado y evaluado en particiones disjuntas de la MIT-BIH de arritmias. Los resultados obtenidos en el set de evaluación han sido: exactitud global (A) de 93 %; para latidos normales, sensibilidad (S) 95 %, valor predictivo positivo (P+) 98 %; para latidos supraventriculares, S 77 %, P+ 39 %; para latidos ventriculares S 81 %, P+ 87 %.
Para comprobar la capacidad de generalización, se evaluó el rendimiento en la INCART obteniéndose resultados comparables a los del set de evaluación. El modelo de clasificación obtenido utiliza menos características, y adicionalmente presentó mejor rendimiento y capacidad de generalización que otros representativos del estado del arte. Luego se han estudiado dos mejoras para el clasificador desarrollado en el párrafo anterior. La primera fue adaptarlo a registros ECG de un número arbitrario de derivaciones, o extensión multiderivacional. En la segunda mejora se buscó cambiar el clasificador lineal por un perceptrón multicapa no lineal (MLP). Para la extensión multiderivacional se estudió si conlleva alguna mejora incluir información del ECG multiderivacional en el modelo previamente validado. Dicho modelo incluye características calculadas de la serie de intervalos RR y descriptores morfológicos calculados en la transformada wavelet de cada derivación. Los experimentos se han realizado en la INCART, disponible en Physionet, mientras que la generalización se corroboró en otras bases de datos públicas y privadas. En todas las bases de datos se siguieron las recomendaciones de la AAMI para el etiquetado de clases y presentación de resultados. Se estudiaron varias estrategias para incorporar la información adicional presente en registros de 12 derivaciones. La mejor estrategia consistió en realizar el análisis de componentes principales a la transformada wavelet del ECG. El rendimiento obtenido con dicha estrategia fue para latidos normales: S 98 %, P+ 93 %; para latidos supraventriculares, S 86 %, P+ 91 %; y para latidos ventriculares S 90 %, P+ 90 %. La capacidad de generalización de esta estrategia se comprobó tras evaluarla en otras bases de datos, con diferentes cantidades de derivaciones, obteniendo resultados comparables. En conclusión, se mejoró el rendimiento del clasificador de referencia tras incluir la información disponible en todas las derivaciones disponibles. La mejora del clasificador lineal por medio de un MLP se realizó siguiendo una metodología similar a la descrita más arriba. El rendimiento obtenido fue: A 89 %; para latidos normales: S 90 %, P+ 99 %; para latidos supraventriculares, S 83 %, P+ 34 %; y para latidos ventriculares S 87 %, P+ 76 %. Finalmente estudiamos un algoritmo de clasificación basado en las metodologías descritas en los anteriores párrafos, pero con la capacidad de mejorar su rendimiento mediante la ayuda de un experto. Se presentó un algoritmo de clasificación de latidos en el ECG adaptable al paciente, basado en el clasificador automático previamente desarrollado y un algoritmo de clustering. Tanto el clasificador automático, como el algoritmo de clustering utilizan características calculadas de la serie de intervalos RR y descriptores de morfología calculados de la transformada wavelet. Integrando las decisiones de ambos clasificadores, este algoritmo puede desempeñarse automáticamente o con varios grados de asistencia. El algoritmo ha sido minuciosamente evaluado en varias bases de datos para facilitar la comparación. Aún en el modo completamente automático, el algoritmo mejora el rendimiento del clasificador automático original; y con menos de 2 latidos anotados manualmente (MAHB) por registro, el algoritmo obtuvo una mejora media para todas las bases de datos del 6.9% en A, de 6,5% S y de 8,9% en P+. Con una asistencia de solo 12 MAHB por registro resultó en una mejora media de 13,1% en A , de 13,9% en S y de 36,1% en P+. En el modo asistido, el algoritmo obtuvo un rendimiento superior a otros representativos del estado del arte, con menor asistencia por parte del experto. Los resultados presentados en esta tesis representan una mejora en el campo de la clasificación de latidos automática y adaptada al paciente, en la señal de ECG.
Cardiovascular diseases are currently the biggest single cause of death in developed countries, so the development of better diagnostic methodologies could improve the health of many people. Arrhythmias are related to the sudden cardiac death, one of the challenges for the modern cardiology. On the other hand, the classification of heartbeats on the electrocardiogram (ECG) is an important analysis previous to the study of arrhythmias. The automation of heartbeat classification could improve the diagnostic quality of arrhythmias, specially in Holter or long-term recordings. The objective of this thesis is the study of the methodologies for the classification of heartbeats on the ECG.
First we developed and validated a simple heartbeat classifier based on features selected with the focus on an improved generalization capability. We considered features from the RR interval (distance between two consecutive heartbeats) series, as well as features computed from the ECG samples and from scales of the wavelet transform, at both available leads. The classification performance and generalization were studied using publicly available databases: the MIT-BIH Arrhythmia, the MIT-BIH Supraventricular Arrhythmia and the St. Petersburg Institute of Cardiological Technics (INCART) databases. The Association for the Advancement of Medical Instrumentation (AAMI) recommendations for class labeling and results presentation were followed. A floating feature selection algorithm was used to obtain the best performing and generalizing models in the training and validation sets for different search configurations. The best model found comprehends 8 features, was trained in a partition of the MIT-BIH Arrhythmia, and was evaluated in a completely disjoint partition of the same database. The results obtained were: global accuracy (A) of 93%; for normal beats, sensitivity (S) 95%, positive predictive value (P+) 98%; for supraventricular beats, S 77%, P+ 39%; for ventricular beats S 81%, P+ 87%. In order to test the generalization capability, performance was also evaluated in the INCART, with results comparable to those obtained in the test set.
This classifier model has fewer features and performs better than other state of the art methods with results suggesting better generalization capability.
With an automatic classifier developed and validated, we evaluated two improvements. One, to adapt the classifier to ECG recordings of an arbitrary number of leads, or multilead extension. The second improvement was to improve the classifier with a nonlinear multilayer perceptron (MLP). For the multilead extension, we studied the improvement in heartbeat classification achieved by including information from multilead ECG recordings in the previously developed and validated classification model. This model includes features from the RR interval series and morphology descriptors for each lead calculated from the wavelet transform. The experiments were carried out in the INCART database, available in Physionet, and the generalization was corroborated in private and public databases. In all databases the AAMI recommendations for class labeling and results presentation were followed. Different strategies to integrate the additional information available in the 12-leads were studied. The best performing strategy consisted in performing principal components analysis to the wavelet transform of the available ECG leads. The performance indices obtained for normal beats were: S 98%, P+ 93%; for supraventricular beats, S 86%, P+ 91%; and for ventricular beats S 90%, P+ 90%. The generalization capability of the chosen strategy was confirmed by applying the classifier to other databases with different number of leads with comparable results. In conclusion, the performance of the reference two-lead classifier was improved by taking into account additional information from the 12-leads. The improvement of the linear classifier classifier by means of a MLP was developed with a methodology similar to the one presented above. The results obtained were: A of 89%; for normal beats, S 90%, P+ 99%; for supraventricular beats, S 83%, P+ 34%; for ventricular beats S 87%, P+ 76%.
Finally we studied an algorithm based on the methodologies previously described, but able to improve its performance by means of expert assistance. We presented a patientadaptable algorithm for ECG heartbeat classification, based on a previously developed automatic classifier and a clustering algorithm. Both classifier and clustering algorithms include features from the RR interval series and morphology descriptors calculated from the wavelet transform. Integrating the decisions of both classifiers, the presented algorithm can work either automatically or with several degrees of assistance. The algorithm was comprehensively evaluated in several ECG databases for comparison purposes. Even in the fully automatic mode, the algorithm slightly improved the performance figures of the original automatic classifier; just with less than 2 manually annotated heartbeats (MAHB) per recording, the algorithm obtained a mean improvement for all databases of 6.9% in A, of 6.5% in S and of 8.9% in P+. An assistance of just 12 MAHB per recording resulted in a mean improvement of 13.1% in A, of 13.9% in S and of 36.1% in P+. For the assisted mode the algorithm outperformed other state-of-the-art classifiers with less expert annotation effort. The results presented in this thesis represent an improvement in the field of automatic and patient-adaptable heartbeats classification on the ECG.