Resumen: La identificación biométrica está en constante desarrollo al igual que los sistemas que la vulneran, por lo que es un campo abierto de investigación que requiere nuevos análisis y aplicación de técnicas que permitan identificar sus vulnerabilidades y mejorar sus niveles de confiabilidad. En este trabajo se propone un sistema de identificación biométrica basado en señales EEG en múltiples estados emocionales considerando que la dinámica subyacente de las señales EEG varían de acuerdo con el estado emocional, lo que puede afectar la precisión en los modelos de clasificación. El estudio fue llevado a cabo usando la base de datos SEED la cual ha sido ampliamente aplicada en el estudio de emociones. Las señales fueron preprocesadas, luego se realizó mi proceso de extracción de características y finalmente se construyeron 5 diferentes modelos de clasificación logrando una exactitud del 94% con el modelo basado en el algoritmo de clasificación de bosques aleatorios.
Palabras-clave: Aprendizaje automático; biometría; emociones; señales EEG
Abstract: Biometric identification is in constant development as well as the systems that violate it, so it is an open field of research that requires new analysis and application of techniques to identify its vulnerabilities and improve its reliability levels. In this work we propose a biometric identification system based on EEG signals in multiple emotional states considering that the underlying dynamics of EEG signals vary according to the emotional state, which may affect the accuracy of classification models. The study was conducted using the SEED database which has been widely applied in the study of emotions. The signals were preprocessed, then a feature extraction process was performed and finally 5 different classification models were built achieving an accuracy of 94% with the model based on the random forest classification algorithm.
Keywords: Machine learning; biometrics; emotions; EEG signals.
1. Introducción
Actualmente existe una amplia variedad de métodos para la identificación humana como lo son las contraseñas, tarjetas de acceso, pines, entre otros, los cuales pueden ser robados, perdidos u olvidados con facilidad, por ello se han venido desarrollando los sistemas biométricos, los cuales hacen referencia a las técnicas utilizadas para la identificación de personas por medio de sus características físicas o sus señales fisiológicas (Zapata et al., 2017). Entre las características físicas más utilizadas están la huella dactilar (Jung et al., 2023), el iris, y el rostro y entre las señales se encuentran la electroencefalografía (EEG) (Oikonomou, 2023), electromiografía (EMG) (Pieva et al., 2022), electrocardiografía (EGG) (Mitchell et al., 2023), voz entre otros, siendo esta última la más utilizada en biometría. Sin embargo, los otros tipos de señal son actualmente un campo abierto de investigación de gran interés para los investigadores debido a sus características y la posibilidad de formar sistemas más robustos ante ataques de suplantación, ya que estas señales no son visibles por el ser humano (Zapata et al., 2017).
Las señales EEG (señal eléctrica del cerebro) son utilizadas actualmente para identificar patologías como tumores cerebrales, disfunciones cerebrales, trastornos del sueño entre otros. Por otro lado, los EEG han sido explorados recientemente como una alternativa para la identificación biométrica ya que estas señales cumplen con las condiciones de universalidad, singularidad, permanencia, medición y rendimiento (Moreno-Revelo et al., 2017; Rahman et al., 2022). En (Alyasseri et al., 2022) fue propuesto un sistema biométrico a partir de señales EEG en el cual se formula un problema de optimización binaria para la selección de los canales y aplican máquinas de vector soporte (SVM) con kernel de base radial (RBF) usando características basadas en coeficientes autorregresivos; el método propuesto obtuvo una precisión del 94.13% usando 23 sensores y 5 coeficientes autorregresivos. En (Abdi Alkareem Alyasseri et al., 2022) se presenta un método de selección de canales EEG, versión binaria к vecinos más cercanos (K-NN) multiobjetivo (MOBCS-KNN), obteniendo una precisión del 93.86% usando 24 sensores y coeficientes autorregresivos AR20. En (Radwan et al., 2022) se propone un método de identificación biométrica con redes neuronales profundas para la tarea de clasificación, construyeron 3 modelos discriminantes de aprendizaje profundo (CNN, LSTM y GRU), obteniendo resultados similares pero superior para LSTM con un 97.83% de precisión. En (Hendrawan et al., 2021) se describe un sistema biométrico a partir de un solo canal de EEG, la señal fue segmentada con una longitud de 5s, y se extrajo la banda Alpha por medio de la transformada discreta de wavelet (DWT), se aplicó densidad espectral de potencia (PSD), análisis discriminante lineal (LDA) y SVM para la clasificación, alcanzando un rendimiento de 86% de exactitud usando LDA.
Los sistemas biométricos a partir de señales EEG han demostrado buen rendimiento en la identificación, pero aun es un tema abierto de investigación debido a que estas señales pueden ser afectadas por las emociones, enfermedades, entre otros; generando con esto una variación en las señales de referencia que son usadas para el entrenamiento de los sistemas, llevando con ello a disminuir el rendimiento. Particularmente para la identificación de emociones, se han realizado múltiples estudios usando señales EEG (Becerra et al., 2018; Kumar & Kumar, 2021; Londoño-Delgado et al., 2019). En (Šakalie et al., 2021) fue propuesto un sistema de ondas cerebrales portable para el reconocimiento de emociones positivas, negativas y neutrales usando las bases de datos DEAP y SEED, el mejor rendimiento se obtuvo usando LSTM con una precisión del 94.12%. En (Galvão et al., 2021) fue construido un modelo de aprendizaje de máquinas, usando un regresor KNN con distancia de Manhattan, características de las bandas Alpha, beta, gamma y asimetría diferencial de la banda Alpha, los resultados obtenidos demuestran que el modelo puede predecir la valencia y el Arousal, con una exactitud del 84.4%.
Considerando lo anterior, en este trabajo se realiza un estudio comparativo de diferentes algoritmos de clasificación (K-NN, SVM, Bosques aleatorios, regresión lineal y redes neuronales artificiales-ANN) para la identificación biométrica a partir de señales EEG considerando las emociones de los individuos. En este estudio se utiliza la base de datos de señales EEG denominada SEED (Liu et al., 2022), la cual ha sido aplicada ampliamente en el estudio de las emociones. El algoritmo de bosques aleatorios demostró la mayor exactitud (94%) superando los demás algoritmos.
2. Marco experimental
En la figura 1 se muestra el procedimiento propuesto el cual se ejecutó en 5 etapas, en la primera se realizó un preprocesamiento para eliminar el ruido de las señales y normalizarlas. Luego, en la segunda etapa se segmentaron las señales en tramas de 9 segundos con el objetivo de tener un volumen más elevado de señales para la identificación de individuos. El siguiente paso aplicado fue la extracción de características, el cual permitió obtener un conjunto de atributos. Luego se seleccionaron los atributos más relevantes para la identificación de emociones, lo cual fue llevado a cabo poniendo a prueba individualmente cada uno de los atributos obtenidos sobre tres tipos de predictores de emociones (regresión lineal, bosques aleatorios (RE) y SVM). Finalmente, 5 modelos de clasificación fueron construidos usando las 4 características más relevantes obtenidas en el paso anterior. Los 5 modelos construidos son: regresión lineal, k-NN, bosques aleatorios, SVM y redes neuronales de aprendizaje profundo.
Base de datos SEED: esta base de datos consta de señales EEG de 7 hombres y 8 mujeres con una media de edad entre 23 y 27 años y una desviación estándar de 2,37. Para la base de datos se eligieron 15 clips de películas chinas como material de estímulo para generar emociones positivas, negativas y neutras, cada experimento consta de 15 ensayos, las señales EEG son tomadas con un gorro que cumple el sistema internacional 10-20 y consta de 62 canales, estas señales fueron preprocesadas y fueron filtradas a 200 Hz. Las etiquetas de cada señal corresponden a (-1 para negativo, o para neutral y +1 para positivo) (Liu et al., 2022).
Preprocesamiento: Se realizó un suavizado de las señales aplicando la media móvil, el cual elimina los cambios sutiles en el estado de ánimo, se realiza normalización para tener todos los datos en la misma proporción, filtrado pasa bandas [1HZ, 75HZ] y eliminación de línea base.
Extracción de características: Diferentes medidas fueron obtenidas para cada cada una de las señales EEG, a partir usando características derivadas de moving average, linear dynamic systems (LDS), rational asymmetry (RASM), computed differential symmetry (DASM), differential entropy (DE), differential caudality (DCAU), power spectral density (PSD), asymmetry (ASM).
Clasificación: En este estudio se implementaron 5 clasificadores así: Regresor lineal, máquina de vector soporte (SVM)(Cortes & Vápnik, 1995), bosques aleatorios (RE) (Gislason et al., 2006) redes neuronales (RNN)(Kumar & Kumar, 2021) у К vecinos cercanos (KNN). Se realizó la clasificación con una sola característica y con la fusión de varias de ellas para evaluar el rendimiento. Finalmente, se aplicó validación cruzada y kfolds con el fin de realizar un análisis estadístico de los resultados para validar el modelo.
3. Resultados y discusión
En la tabla 1 se presentan los resultados obtenidos con los predictores de emociones: lineal, RE y SVM. El predictor SVM obtuvo la más alta precisión 0.82% con la característica DE_LDS. Al mismo tiempo se puede ver como la entropía diferencial muestra ser una característica que aporta gran información obteniendo los mejores resultados con los 3 diferentes clasificadores 0.79 en promedio con DE_LDS seguido con un 0.78 en promedio con DE_movingaverage.
Se realizaron diferentes pruebas para la identificación biométrica bajo diferentes combinaciones de las características obtenidas. Los mejores resultados fueron obtenidos con las 4 variables en conjunto de mejor desempeño para la identificación de emociones obtenidos en el paso anterior (ver tabla i). En la tabla 2 y en la figura 2 se presentan los resultados obtenidos con los 5 diferentes clasificadores construidos y fusionando las 4 características DE_movingaverage, DE_LDS, PSD_movingaverage y psd_LDS para la identificación biométrica lo cual aumento significativamente la exactitud, logrando un 94.44% con bosques aleatorios y 92.59% con SVM.
4. Conclusiones
En este trabajo, se propuso un sistema de identificación biométrico a partir de señales EEG teniendo a las emociones como factor fundamental. Los resultados permitieron demostrar la influencia de las emociones sobre la identificación biométrica de los individuos. Este sistema se puede utilizar con el fin de mejorar el aprendizaje de los clasificadores para biometría basados en señales EEG. El clasificador basado en bosques aleatorios mostró el mejor desempeño con la fusión de características logrando una exactitud del 94.4% con LDS, DE y PSD.
La característica que más información aporto al sistema fue DE_LDS, la cual obtuvo los mejores resultados con los 3 diferentes clasificadores (SVM, Lineal, RF) alcanzando una exactitud máxima del 82% con una sola característica.
Se propone como trabajo futuro ampliar el espacio de representación usando otras medidas lineales y no lineales y realizar un estudio usando descomposición de modo empírico. Adicionalmente, se propone el uso de técnicas de análisis de relevancia para la reducción de dimensionalidad y determinar de manera efectiva cuales características son más inmunes a la variación de las emociones. También se proponer realizar un análisis de tolerancia al ruido de las características sobre los métodos propuestos considerando los diferentes tipos de estados emocionales.
Referencias
Abdi Alkareem Alyasseri, Z., Alomari, O. A., Al-Betar, M. A., Awadallah, M. A., Hameed Abdulkareem, K., Abed Mohammed, M., Kadry, S., Rajinikanth, V., & Rho, S. (2022). EEG Channel Selection Using Multiobjective Cuckoo Search for Person Identification as Protection System in Healthcare Applications. Computational Intelligence and Neuroscience, 2022,1-18. https://doi.org/1o.1155/2o22/5974634
Alyasseri, Z. A. A., Alomari, 0. A., Makhadmeh, S. N., Mirjalili, S., Al-Betar, M. A., Abdullah, S., Ali, N. S., Papa, J. P., Rodrigues, D., & Abasi, A. K. (2022). EEG Channel Selection for Person Identification Using Binary Grey Wolf Optimizer. IEEE Access, 10,10500-10513. https://d0i.0rg/10.1109/ACCESS.2021.3135805
Becerra, M. A., Londoño-Delgado, E., Pelaez-Becerra, S. M., Castro-Ospina, A. E., MejiaArboleda, C., Durango, J., &Peluffo-Ordóñez, D. H. (2018). Electroencephalographic Signals and Emotional States for Tactile Pleasantness Classification (pp. 309316). Springer, Cham, https://d0i.0rg/10.1007/978-3-030-01132-1_35
Cortes, C., & Vápnik, V. (1995). Support-Vector Networks. Machine Learning, 20(3), 273-297- https://d0i.0rg/10.1023/A:i022627411411
Galvão, F., Alarcão, S. M., & Fonseca, M. J. (2021). Predicting Exact Valence and Arousal Values from EEG. Sensors, 21(10), 3414. https://doi.org/1o.339o/s211o3414
Gislason, P. 0., Benediktsson, J. A., & Sveinsson, J. R. (2006). Random forests for land cover classification. Pattern Recognition Letters, 27(4), 294-300. https://doi. org/io.ioi6/j.patrec.2OO5.08.011
Hendrawan, M. A., Saputra, P. ¥., & Rahmad, C. (2021). Identification of optimum segment in single channel EEG biometric system. Indonesian Journal of Electrical Engineering and Computer Science, 23(3), 1847. https://doi.org/1o.11591/ijeecs. V23.İ3.PP1847-1854
Jung, H., Sim, S., & Lee, H. (2023). Biometric authentication security enhancement under quantum dot light-emitting diode display via fingerprint imaging and temperature sensing. Scientific Reports, 13(1), 794. https://doi.org/1o.1o38/ S41598-023-28162-6
Kumar, A., & Kumar, A. (2021). DEEPHER: Human Emotion Recognition Using an EEG-Based DEEP Learning Network Model. The 8th International Electronic Conference on Sensors and Applications, 32. https://doi.org/1o.339o/ecsa-811249
Liu, W., Zheng, W.-L., Li, Z., Wu, S.-Y., Gan, L., & Lu, B.-L. (2022). Identifying similarities and differences in emotion recognition with EEG and eye movements among Chinese, German, and French People. Journal of Neural Engineering, 19(2), 026012. https://doi.org/1o.1o88/1741-2552/ac5c8d
Londoño-Delgado, E., Becerra, M. A., Duque-Mejia, C. M., Zapata, J. C., Mejia-Arboleda, C., Castro-Ospina, A. E., & Peluffo-Ordóñez, D. H. (2019). Non-generalized Analysis of the Multimodal Signals for Emotion Recognition: Preliminary Results. In I. Rojas, 0. Valenzuela, F. Rojas, & F. Ortuño (Eds.), Bioinformatics and Biomedical Engineering (pp. 363-373). Springer International Publishing.
Mitchell, A. R. J., Ahlert, D., Brown, C., Birge, M., & Gibbs, A. (2023). Electrocardiogrambased biometri csforuseridentification-Usingyour heart beat asadigital key. JoMrwz/ of Electrocardiology, 80,1-6. https://d0i.0rg/10.1016/j.jelectr0card.2023.04.001
Moreno-Revelo, M., Ortega-Adarme, M., Peluffo-Ordoñez, D. H., Alvarez-Uribe, K. C., & Becerra, M. A. (2017). Comparison among physiological signals for biometric identification. In Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics): Vol. 10585 LNCS. https://doi.org/1o.1oo7/978-3-319-68935-7_47
Oikonomou, V. P. (2023). Human Recognition Using Deep Neural Networks and Spatial Patterns of SSVEP Signals. Sensors, 23(5), 2425. https://doi.org/1o.339o/ S23052425
Pleva, M., Korecko, S., Hladek, D., Bours, P., Skudal, M. H., & Liao, Y.-F. (2022). Biometric User Identification by Forearm EMG Analysis. 2022 IEEE International Conference on Consumer Electronics - Taiwan, 607-608. https://doi.org/10.1109/ ICCE-Taiwan553o6.2O22.9869268
Radwan, S. H., El-Telbany, M., Arafa, W., & Ali, R. A. (2022). Deep Learning Approaches for Personal Identification Based on EGG Signals (pp. 30-39). https://doi. or g/10.1007/ 978-3-030-89701-7^ 3
Rahman, A., Chowdhury, M. E. H., Khandakar, A., Tahir, A. M., Ibtehaz, N., Hossain, M. S., Kiranyaz, S., Malik, J., Monawwar, H., & Kadir, M. A. (2022). Robust biometric system using session invariant multimodal EEG and keystroke dynamics by the ensemble of self-ONNs. Computers in Biology and Medicine, 142,105238. https:// d0i.0rg/10.1016/j.c0mpbi0med.2022.105238
Šakalie, A., Tomar, P., Bhardwaj, H., Acharya, D., & Bhardwaj, A. (2021). A LSTM based deep learning network for recognizing emotions using wireless brainwave driven system. Expert Systems with Applications, 173,114516. https://d0i.0rg/10.1016/j. eswa.2020.114516
Zapata, J. C., Duque, C. M., Rojas-Idarraga, ¥., Gonzalez, M. E., Guzmán, J. A., & Becerra Botero, M. A. (2017). Data fusion applied to biometric identification - A review. In Communications in Computer and Information Science (Vol. 735). https://doi. org/io.ioO7/978-3-3i9-665Ó2-7_5i
You have requested "on-the-fly" machine translation of selected content from our databases. This functionality is provided solely for your convenience and is in no way intended to replace human translation. Show full disclaimer
Neither ProQuest nor its licensors make any representations or warranties with respect to the translations. The translations are automatically generated "AS IS" and "AS AVAILABLE" and are not retained in our systems. PROQUEST AND ITS LICENSORS SPECIFICALLY DISCLAIM ANY AND ALL EXPRESS OR IMPLIED WARRANTIES, INCLUDING WITHOUT LIMITATION, ANY WARRANTIES FOR AVAILABILITY, ACCURACY, TIMELINESS, COMPLETENESS, NON-INFRINGMENT, MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE. Your use of the translations is subject to all use restrictions contained in your Electronic Products License Agreement and by using the translation functionality you agree to forgo any and all claims against ProQuest or its licensors for your use of the translation functionality and any output derived there from. Hide full disclaimer
© 2023. This work is published under https://creativecommons.org/licenses/by-nc-nd/4.0/ (the “License”). Notwithstanding the ProQuest Terms and Conditions, you may use this content in accordance with the terms of the License.
Abstract
Palabras-clave: Aprendizaje automático; biometría; emociones; señales EEG Abstract: Biometric identification is in constant development as well as the systems that violate it, so it is an open field of research that requires new analysis and application of techniques to identify its vulnerabilities and improve its reliability levels. In this work we propose a biometric identification system based on EEG signals in multiple emotional states considering that the underlying dynamics of EEG signals vary according to the emotional state, which may affect the accuracy of classification models. El algoritmo de bosques aleatorios demostró la mayor exactitud (94%) superando los demás algoritmos. 2. Diferentes medidas fueron obtenidas para cada cada una de las señales EEG, a partir usando características derivadas de moving average, linear dynamic systems (LDS), rational asymmetry (RASM), computed differential symmetry (DASM), differential entropy (DE), differential caudality (DCAU), power spectral density (PSD), asymmetry (ASM).
You have requested "on-the-fly" machine translation of selected content from our databases. This functionality is provided solely for your convenience and is in no way intended to replace human translation. Show full disclaimer
Neither ProQuest nor its licensors make any representations or warranties with respect to the translations. The translations are automatically generated "AS IS" and "AS AVAILABLE" and are not retained in our systems. PROQUEST AND ITS LICENSORS SPECIFICALLY DISCLAIM ANY AND ALL EXPRESS OR IMPLIED WARRANTIES, INCLUDING WITHOUT LIMITATION, ANY WARRANTIES FOR AVAILABILITY, ACCURACY, TIMELINESS, COMPLETENESS, NON-INFRINGMENT, MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE. Your use of the translations is subject to all use restrictions contained in your Electronic Products License Agreement and by using the translation functionality you agree to forgo any and all claims against ProQuest or its licensors for your use of the translation functionality and any output derived there from. Hide full disclaimer
Details
1 Instituto Tecnológico Metropolitano, 050042, Medellín, Colombia
2 Institución Universitaria Pascual Bravo, 050042, Medellín, Colombia
3 Institución Universitaria ESUMER, 050042, Medellín, Colombia
4 SDAS Research Group (https://sdas-group.com/), Ben Guerir 43150, Morocco
5 College of Computing, Mohammed VI Polytechnic University, Ben Guerir 43150, Morocco