Publication: Uncertainty assessment for speaker verification systems using a bayesian approach
Institution Authors
Authors
Journal Title
Journal ISSN
Volume Title
Type
Master's thesis
Access
restrictedAccess
Publication Status
Unpublished
Abstract
The Automatic Speaker Verification (ASV) systems are developed to discriminate the genuine speakers from the spoofing attacks and they are also used as a security application in various industries (e.g., Banking and telephone-based systems). The spoofing countermeasure systems (SCS) are important for the ASV systems to pro tect themselves against spoofing attacks. In general, the SCSs are developed using the cross entropy loss function and the softmax classification layer to perform the best classification scores. Even though the softmax function is popularly used as a classification layer for the deep neural network tasks, it increases the uncertainty of the estimated class probabilities by squishing the probabilistic predictions of the pre dictive models. The aim of this work was to decrease uncertainty of the conventional cross entropy metrics and softmax function SCS by using the Bayesian approach. To accomplish this, multiple SCSs were developed to outperform the base system of the Automatic Speaker Verification Spoofing and Countermeasures 2017 Challenge. The Bayesian approach was applied to the best model (e.g., the model which performed the lowest EER score) to decrease the uncertainty of the conventional cross entropy met rics and softmax function SCS. The uncertainty of the both systems were compared with the probability distribution function, AUC value and the ROC curve. As it can be observed from the ROC curve, the Bayesian network decreased the uncertainty of the conventional cross entropy metrics and softmax function SCS by increasing AUC value 14%. Also the Bayesian network has provided the lowest EER score (16.79%) by outperforming the base system of the ASV spoof 2017 challenge.
Otomatik Konuşmacı Doğrulama (OKD) sistemleri, gerçek konuşmacıları, sahte konuş macılardan ayırt edebilmek için ve aynı zamanda bazı sektörlerde (Örn; Bankacılık, telekominikasyon) güvenlik sistemi oluşturma amacı ile kullanılmaktadır. Sahte konuş macı önleme (SKÖ) sistemleri, OKD sitemlerinin kendilerini sahte konuşmacılara karşı koruyabilmeleri açısından büyük önem taşımaktadır. Genellikle SKÖ sistemleri, en iyi sınıflandırma performansını elde edebilmek için, çapraz entropi kaybı fonksiyonu ve softmax sınıflandırma fonksiyonu kullanarak geliştirilirler. Softmax sınıflandırma fonksiyonu derin öğrenme alanında birçok defa kullanılmasına rağmen, SKÖ sis temlerinin ürettiği tahmini olasılık değerlerinde sıkıştırılmaya sebep olarak, olasılık değerlerinin belirsizlik ölçümlerinde artışa sebep olabilmektedir. Bu araştırmanın asıl amacı, Bayes teorisini kullanarak geleneksel çapraz entropi kaybı ve softmax fonksiy onu SKÖ sistemlerindeki softmax kaynaklı belirsizlik değerlernin düşmesini sağla maktır. Bunu yapabilmek için, Otomatik Konuşmacı Doğrulama ve Sahte Konuş macı Önleme (OKDSKÖ 2017) 2017 yarışmasına birden fazla SKÖ sistemi geliştir ilmiştir ve bu sistemlerin arasından en yüksek sınıflandırma başarısını gösterebilen sisteme Bayes teorisi uygulanmıştır. Sistemlerdeki belirsizlik ölçümlerini karşılaştır mak amacı ile Olasılık Dağılım Fonksiyonu (ODF), Eğri Altında Kalan Alan (EAKA) ve Alıcı Operasyon Karakteristiği (AOK) eğrisi kullanılmıştır. Araştırma sonucunda, Bayes teorisi ile yapılandırılan sistemin, geleneksel çapraz entropi kaybı ve softmax fonksiyonu SKÖ sisteminin EAKA değerini 14% yükselterek, geleneksel sistemin be lirsizlik değerini düşürdüğü gözlemlenmiştir. Aynı zamanda, Bayes sistemi en başarılı Eşit Hata Oranı (EHO) değerini üreterek (16.79%), OKDSKÖ 2017 yarışmasında kullanılan temel sistemden daha üstün bir başarı elde etmiştir.
Otomatik Konuşmacı Doğrulama (OKD) sistemleri, gerçek konuşmacıları, sahte konuş macılardan ayırt edebilmek için ve aynı zamanda bazı sektörlerde (Örn; Bankacılık, telekominikasyon) güvenlik sistemi oluşturma amacı ile kullanılmaktadır. Sahte konuş macı önleme (SKÖ) sistemleri, OKD sitemlerinin kendilerini sahte konuşmacılara karşı koruyabilmeleri açısından büyük önem taşımaktadır. Genellikle SKÖ sistemleri, en iyi sınıflandırma performansını elde edebilmek için, çapraz entropi kaybı fonksiyonu ve softmax sınıflandırma fonksiyonu kullanarak geliştirilirler. Softmax sınıflandırma fonksiyonu derin öğrenme alanında birçok defa kullanılmasına rağmen, SKÖ sis temlerinin ürettiği tahmini olasılık değerlerinde sıkıştırılmaya sebep olarak, olasılık değerlerinin belirsizlik ölçümlerinde artışa sebep olabilmektedir. Bu araştırmanın asıl amacı, Bayes teorisini kullanarak geleneksel çapraz entropi kaybı ve softmax fonksiy onu SKÖ sistemlerindeki softmax kaynaklı belirsizlik değerlernin düşmesini sağla maktır. Bunu yapabilmek için, Otomatik Konuşmacı Doğrulama ve Sahte Konuş macı Önleme (OKDSKÖ 2017) 2017 yarışmasına birden fazla SKÖ sistemi geliştir ilmiştir ve bu sistemlerin arasından en yüksek sınıflandırma başarısını gösterebilen sisteme Bayes teorisi uygulanmıştır. Sistemlerdeki belirsizlik ölçümlerini karşılaştır mak amacı ile Olasılık Dağılım Fonksiyonu (ODF), Eğri Altında Kalan Alan (EAKA) ve Alıcı Operasyon Karakteristiği (AOK) eğrisi kullanılmıştır. Araştırma sonucunda, Bayes teorisi ile yapılandırılan sistemin, geleneksel çapraz entropi kaybı ve softmax fonksiyonu SKÖ sisteminin EAKA değerini 14% yükselterek, geleneksel sistemin be lirsizlik değerini düşürdüğü gözlemlenmiştir. Aynı zamanda, Bayes sistemi en başarılı Eşit Hata Oranı (EHO) değerini üreterek (16.79%), OKDSKÖ 2017 yarışmasında kullanılan temel sistemden daha üstün bir başarı elde etmiştir.
Date
2021-01-18