HIGH-FREQUENCY ECG Features FOR CLASSIFICATION

П.Н. Подкур,Н.К. Смоленцев
DOI: https://doi.org/10.25699/sssb.2023.48.2.005
2023-04-30
Южно-Сибирский научный вестник
Abstract:Для записи электрокардиограммы (ЭКГ) в настоящее время используются электрокардиографы высокого разрешения с частотой дискретизации до 20 кГц. Однако при автоматическом анализе ЭКГ считается, что верхняя граничная частота кардиосигнала, заметно влияющая на его форму не превышает 100 Гц. Поэтому частоты выше 100 Гц обычно считаются шумовыми и их удаляют при помощи различных фильтров для сглаживания сигнала. Ясно, что при удалении высокочастотных колебаний теряется большая часть информации, зарегистрированная кардиографом. Поэтому возникает вопрос о том, несет ли эта часть сигнала ЭКГ полезную для диагностики информацию. Как известно, вейвлет-анализ позволяет разложить сигнал на несколько компонент, выделяя сглаженную часть сигнала и высокочастотные компоненты. При этом каждая высокочастотная вейвлет-компонента имеет свой частотный диапазон. Числовые характеристики (признаки) высокочастотных компонент отражают информацию, которая теряется при сглаживании. Целью работы является изучение вопроса о том, какие из признаков несут наибольшую информацию и могут быть использованы в задачах классификации и диагностики. В работе используется вейвлет-разложение ЭКГ и вычисление признаков в системе MATLAB и MATLAB Wavelet Toolbox. Для классификации и нахождения наиболее информативных признаков используется метод опорных векторов (SVM) пакета scikit-learn для машинного обучения в Python. Найдены наиболее информативные признаки, которые обеспечивают точность разделения классов более 85%. Самым информативным признаком является средняя основная частота в узле (3,2) пакетного разложения. Поэтому эта частота и другие информативные признаки имеют диагностическое значение и могут быть использованы в классификации и диагностике в качестве новых дополнительных характеристик ЭКГ. To record electrocardiograms (ECG), high-resolution electrocardiographs with sampling rates up to 20 kHz are currently used. However, in the automatic analysis of the ECG, it is considered that the upper limiting frequency of the cardiosignal, which noticeably affects its shape, does not exceed 100 Hz. Therefore, frequencies above 100 Hz are usually considered noise and are removed using various filters to smooth the signal. It is clear that when high-frequency oscillations are removed, most of the information recorded by the cardiograph is lost. Therefore, the question arises as to whether this part of the ECG signal carries useful information. As you know, wavelet-analysis allows you to decompose the signal into several components, highlighting the smoothed part of the signal and high-frequency components. In addition, each high-frequency wavelet component has its own frequency range. The numerical characteristics (features) of the high-frequency components represent the information that is lost during smoothing. The aim of the work is to study the question of which of the features carry the most information and can be used in the problems of classification and diagnostics. The work uses ECG wavelet-decomposition and feature calculation in the MATLAB system and MATLAB Wavelet Toolbox. To classify and find the most informative features, the support vector machine (SVM) of the scikit-learn package for machine learning in Python is used. The most informative features are found, which provide an accuracy of class separation of more than 85%. The most informative feature is the average main frequency at the node (3,2) of the wavelet-packet expansion. Therefore, this frequency and other informative features are of diagnostic value and can be used in classification and diagnosis as new additional ECG characteristics.
What problem does this paper attempt to address?