Análisis comparativo de distintas toolkits para el reconocimiento biométrico de personas mediante voz (original) (raw)

Reconocimiento biométrico entrenando y testeando con diferentes bases de datos de caras

2008

Resumen. El reconocimiento biométrico presenta un amplio conjunto de fuentes de variabilidad. Si bien algunas bases de datos públicas contemplan diversas variabilidades, se trata de condiciones de laboratorio y por tanto pertenecen a un entorno idealizado. En este artículo presentamos una serie de experimentos en los que los modelos de una determinada característica biométrica se han obtenido con una base de datos y el test se realiza con otra diferente. Para poder llevar a cabo este tipo de experimentos no se calcula un modelo por persona, sino un clasificador con dos clases: iguales y diferentes. Por tanto, durante el test basta con presentar al clasificador la imagen de la identidad declarada y la imagen de test para que el sistema decida si ambas medidas biométricas pertenecen a la misma persona o no. De esta forma, el clasificador puede tratar muestras pertenecientes a personas no usadas durante el entrenamiento. La realización de tests con datos biométricos de personas extraíd...

Análisis del algoritmo DTW para reconocimiento biométrico de personas mediante firma manuscrita on-line

2012

El principal objetivo de este proyecto es analizar los distintos parámetros del algoritmo DTW (Dynamic Time Warping) para evaluar su funcionamiento en una aplicación de reconocimiento biométrico de firma manuscrita on-line. Con este proyecto se quiere analizar bajo qué condiciones su funcionamiento es mejor, atendiendo sobre todo a dos características: el coste computacional y la tasa de error. De este modo se quiere conseguir un DTW lo más óptimo posible basándose en las características anteriores. Se establecen dos escenarios de experimentación, uno casual y otro seguro, para determinar en qué situaciones es mejor un coste computacional bajo y en cuales una tasa de error baja, cuándo se priorizará uno en detrimento del otro. Se podrá ver si estos elementos son directamente proporcionales, inversamente proporcionales o si son independientes el uno del otro. Se asumirá un compromiso entre ambos valores y se obtendrán unas conclusiones, siendo estas el aporte novedoso en el estudio d...

Selección De Características Usando HMM Para La Identificación De Patologías De Voz

Aunque se conocen diversos métodos de selección de características, orientados al mejor rendimiento de clasificación, en el caso de los procesos aleatorios markovianos, la reducción en la dimensionalidad del hiperespacio inicial de entrenamiento es compleja, por cuanto cada característica corresponde a un vector con dinámica de cambio propia. En el presente trabajo se analizan dos alternativas para selección de las características: Análisis de Componentes Principales y Análisis Discriminante Lineal. Los resultados obtenidos muestran un rendimiento de clasificación entre 76.25% y 91.45%.

Procesado digital de voz para el reconocimiento del hablante aplicado a dispositivos móviles

2014

This project aims to do a study on the possibility of implementing an authentication application using biometrics in mobile devices. It has been carried out a brief review of existing methods of biometric recognition today and the possibilities offered by tablets and smartphones in this area. It was decided to use the built-in microphone all devices to collect and analyze the digital voice signal of the user and use this signal as a biometric identifier. It has developed a complete system of speaker verification with Matlab software tool. The system can be divided in two blocks. The first, processes audio signal in several stages: signal conditioning, windowing, segmenting voiced frames and formant extracting among other operations. Have been used two types of coefficients to characterize the speech. For side LPCC coefficients based on linear prediction filters, and secondly MFCC coefficients using the Fourier

Aplicación de una Red Neuronal Convolucional para el Reconocimiento de Personas a Través de la Voz

Sexta Conferencia Nacional de Computación, Informática y Sistemas, 2018

El reconocimiento de personas a través de la voz se ha popularizado recientemente en aplicaciones para teléfonos móviles, seguridad, robótica social, entre otras. Los métodos convencionales de reconocimiento a partir de la voz utilizan coeficientes para generar vectores de características presentes en el audio que alimentan modelos de aprendizaje automático. Aunque se obtienen excelentes resultados con estos métodos convencionales, se requiere una alta cantidad de muestras de voz por persona para entrenar los modelos de aprendizaje automático, lo cual es una tarea tediosa para los usuarios. En ese sentido, el objetivo de este trabajo consiste en utilizar un método no convencional en aras de disminuir la cantidad de muestras requeridas para el entrenamiento. El método propuesto consiste en generar imágenes con los espectrogramas de la voz, para entrenar una red neuronal convolucional que las clasifique. En este trabajo se comparan los resultados de entrenamiento y validación para distintas cantidades de muestras con el propósito de identificar la cantidad adecuada. Luego, con la cantidad identificada se comparan los resultados de entrenamiento y validación para distintos valores de un parámetro utilizado en la generación de los espectrogramas denominado ganancia, con el objetivo de optimizar los resultados. Los mejores resultados obtenidos indican que deben utilizarse 5 muestras con una ganancia de 0.9, para obtener una exactitud de validación del 93,34%.

Comparación de técnicas de clasificación de múltiples anotadores para la valoración automática de la calidad de voz

2014

2.3.1. Base de datos "Iris Plant Database" 2.3.2. Base de datos de voz 2.4. Algoritmos 2.4.1. Procesos Gaussianos para regresión con múltiples anotadores 2.4.2. Regresión logística multiclase para múltiples anotadores 2.5. Medidas de desempeño 3. Resultados y Discusión 37 3.1. Resultados obtenidos sobre la base de datos "Iris Plant Database" 3.1.1. Clasificador basado en regresión logística multiclase para múltiples anotadores 3.1.2. Clasificador basado en Procesos Gaussianos para regresión con múltiples anotadores 3.2. Resultados obtenidos sobre la base de datos de voz 3.2.1. Problema de clasificación binaria 3.2.2. Problema de clasificación multiclase 4. Conclusiones 49 4.1. Trabajo Futuro A. Aparato Fonador I A.1. Anatomía i A.1.1. Cavidades infra-glóticas ii A.1.2. Cavidad Laríngea ii A.1.3. Cavidades Supra-glóticas ii A.2. Patologías iii A.3. Protocolo para la valoración de la calidad de voz (Escala GRBAS) iv B. Parametrización usando coeficientes cepstrales en la escala de frecuencia Mel VI B.1. Características dinámicas x