Publication:
ÖZÜ konuşmacı doğrulama sisteminin çok sınıflı senaryoda NIST 2010 veritabanı ile başarımı

dc.contributor.authorYeşil, Fatih
dc.contributor.authorDemiroğlu, Cenk
dc.contributor.departmentElectrical & Electronics Engineering
dc.contributor.ozuauthorDEMİROĞLU, Cenk
dc.contributor.ozugradstudentYeşil, Fatih
dc.date.accessioned2016-02-15T13:38:34Z
dc.date.available2016-02-15T13:38:34Z
dc.date.issued2011
dc.descriptionDue to copyright restrictions, the access to the full text of this article is only available via subscription.
dc.description.abstractPerformance of the speaker verification systems is typically measured based on their binary decision accuracy. However, in speaker verification applications where close to %100 accuracy is required, such as the systems that are used in the call centers of finance companies, it is not possible to rely on the binary decisions of the existing verification systems. Still, in such cases, multi-class verification outputs (for example, high, medium and low verification score) returned by the speaker verification systems can be used by a human agent to either reduce the verification time and/or increase the verification accuracy compared to a human-only scenario. In this work, we compare such multiclass output performance of some of the most popular speaker verification systems when a human agent is assumed to be in the verification loop. Performance is measured by the reduction in the number of questions used by the human agent for verifying the identity of the caller without compromising from the security. Experiments are performed using the NIST 2010 database for the 8 conversation sides (5 minutes each) enrollment data and 10 seconds verification data condition.
dc.description.abstractKonuşmacı doğrulama sistemlerinin başarımı tipik olarak ikili karar mekanizmasına dayanır. Yine de finans şirketlerinin çağrı merkezleri gibi 100%’ e yakın kesinlik gerektiren uygulamalarda var olan sistemlerin ikili kararlarına güvenmek mümkün değildir. Bu tür durumlarda doğrulama sisteminin döndürdüğü düşük, orta, yüksek gibi skorlar, sadece insan olan bir çağrı merkezi senaryosuyla kıyaslandığında doğrulamanın kesinliğini arttırabilir ve/veya doğrulama suresini kısaltabilir. Bu çalışmada bir temsilcinin doğrulama döngüsü içinde var olduğu düşünülerek bazı popüler konuşmacı doğrulama sistemlerinin çoklu sınıf başarımları karşılaştırılmıştır. Basarım güvenlikten ödün vermeden temsilcinin sorduğu soru sayısındaki azalmayla ölçülmüştür. Deneyler NIST 2010 veritabanı kullanarak 5er dakikalık çoklu eğitim, 5er dakikalık ve 10ar saniyelik test kayıtlarının olduğu durumlar için yapılmıştır.
dc.description.sponsorshipSANTEZ
dc.identifier.doi10.1109/SIU.2012.6204729
dc.identifier.endpage4
dc.identifier.isbn978-1-4673-0054-4
dc.identifier.issn2165-0608
dc.identifier.startpage1
dc.identifier.urihttp://hdl.handle.net/10679/2378
dc.identifier.urihttps://doi.org/10.1109/SIU.2012.6204729
dc.language.isoturen_US
dc.peerreviewedyes
dc.publicationstatuspublisheden_US
dc.publisherIEEE
dc.relation.ispartof2012 20th Signal Processing and Communications Applications Conference (SIU)
dc.relation.publicationcategoryInternational
dc.rightsrestrictedAccess
dc.subject.keywordsBinary decision diagrams
dc.subject.keywordsSpeaker recognition
dc.titleÖZÜ konuşmacı doğrulama sisteminin çok sınıflı senaryoda NIST 2010 veritabanı ile başarımıen_US
dc.title.alternativePerformance of the OZU speaker verification systems with the NIST SRE 2010 data in a multi-class scenario
dc.typeconferenceObjecten_US
dspace.entity.typePublication
relation.isOrgUnitOfPublication7b58c5c4-dccc-40a3-aaf2-9b209113b763
relation.isOrgUnitOfPublication.latestForDiscovery7b58c5c4-dccc-40a3-aaf2-9b209113b763

Files

Collections