Publication: Single-shot object detection and classification using HAAR-like feature based random decision forest
Institution Authors
Authors
Journal Title
Journal ISSN
Volume Title
Type
Master's thesis
Sub Type
Access
restrictedAccess
Publication Status
Unpublished
Abstract
Object detection and tracking have been studied for decades and many algorithms have been introduced. Vision-based object detection and tracking became an important task with the increasing number of surveillance cameras. However, false alarm rates are still an issue to be solved in human operator managed scenarios. As precision and accuracy increase, false alarm rates become more manageable. In this thesis, a novel system for single-shot detection and classification of the object in images is introduced. For this purpose, we implemented Random Decision Forests (RDF) using Haar-like features. RDF and Haar-like feature calculation implemented on GPU are known for their test time speed. Thus, we are using RDFs for pixel level object classification, a methodology known for its balanced test-time performance both for speed and quality. The increase in accuracy is shown by conducting experiments on MNIST, INRIA, and PETS09 data-sets. As a demonstrative application, we used proposed RDF for on-road vehicles detection and tracking. A Sequential Monte Carlo method based algorithm, also known as Particle Filter (PF), is implemented for tracking detected objects. For non-linear and non-Gaussian processes, PF is a powerful methodology and is easy and preferable to be implemented on GPU with RDF. The proposed system puts emphasis on real-time speed of the algorithm on conventional computers. Compared to YOLO (You Only Look Once), our method shows comparable vehicle detection accuracy and computational speed in a conventional computer. Moreover, we are introducing a new framework where different tracking algorithms can be implemented and tested. It provides various modules for data extraction, data generation, training and testing algorithms with different parameters. Usage of the modules in the framework is also discussed.
Son yirmi yılda gözetim sistemleri sayısının artması ile görüye dayalı nesne algılama ve takip algoritmalarına yönelik araştırmalar hız kazanmıştır. Bu araştırmalar dahilinde nesne algılama ve takip problemleri birçok yönü ile incelenmiştir, fakat otomatik alarm üretimi problemleri için başarım oranı daha yüksek izleme algoritmalarına halen ihtiyaç duyulmaktadır. Gözetim sistemlerinin yanlış alarm vermesi, insan operatörlere dayalı sistemlerde henüz tamamen çözülmemiş bir problemdir. Nesne tanıma başarımının artması, yanlış alarm verilen durumların azalmasına neden olmaktadır. Bu tez kapsamında resimde bulunan objeleri tek-seferde saptayan ve sınıflandıran bir yöntem geliştirilmiştir. Rastgele Karar Ormanlarının (RDF) test hızının oldukça yüksek olduğu bilinmektedir. Bu bağlamda, önerilen sistem piksel seviyesinde obje sınıflandırma işlemini RDF ile yapmaktadır. Kullanılan RDF'in performansını arttırmak amacı ile Haar benzeri öznitelikleri kullanan bir RDF geliştrilimiştir. Haar özniteliklerinin kullanan RDF'in performansı arttırdığı el yazısı ile yazılmış olan rakamlardan oluşan MNIST, insan resimleri içeren INRIA ve PETS09 veritabanları üzerinde yapılan testler ile gösterilmiştir. Örnek bir uygulama alanı olarak, önerilen RDF araç saptama ve takibi problemi üzerinde test edilmiştir. Saptanan objeleri takip etmek için Sıralı Monte Carlo, diğer adıyla Parçacık Filtresi (PF) uygulanmıştır. Saptama aşamasında her bir piksel için elde edilen olabilirlik değerleri ile parçacıkların ağırlıkları hesaplanmıştır. PF kullanılmasının temel nedeni, Gauss ve çizgisel olmayan işlemler için güçlü bir algoritma olmasının yanı sıra RDF gibi GPU'ya uygun bir yapıya sahip olmasıdır. Önerilen takip sistemi standard bilgisayarlarda gerçek zamanlı uygulamaya ağırlık vermektedir. YOLO ile kıyaslandığında, önerilen yöntem araç saptama başarımında yakın bir performans sunarken, standard bilgisayarlarda daha yüksek bir hıza sahip olduğu gözlemlenmiştir. Önerilen sisteme ek olarak bu tez kapsamında, farklı algoritmaları uygulamak ve test etmek için bir framework geliştirilmiştir. Bu framework, veri özütleme, veri oluşturma, algoritma eğitimi ve algoritmaları değişik parametrelerle test etmek için tasarlanan modüllerden oluşmaktadır. Tez içeriğinde modüllerin kullanımı ve fonksyonları anlatılmıştır.
Son yirmi yılda gözetim sistemleri sayısının artması ile görüye dayalı nesne algılama ve takip algoritmalarına yönelik araştırmalar hız kazanmıştır. Bu araştırmalar dahilinde nesne algılama ve takip problemleri birçok yönü ile incelenmiştir, fakat otomatik alarm üretimi problemleri için başarım oranı daha yüksek izleme algoritmalarına halen ihtiyaç duyulmaktadır. Gözetim sistemlerinin yanlış alarm vermesi, insan operatörlere dayalı sistemlerde henüz tamamen çözülmemiş bir problemdir. Nesne tanıma başarımının artması, yanlış alarm verilen durumların azalmasına neden olmaktadır. Bu tez kapsamında resimde bulunan objeleri tek-seferde saptayan ve sınıflandıran bir yöntem geliştirilmiştir. Rastgele Karar Ormanlarının (RDF) test hızının oldukça yüksek olduğu bilinmektedir. Bu bağlamda, önerilen sistem piksel seviyesinde obje sınıflandırma işlemini RDF ile yapmaktadır. Kullanılan RDF'in performansını arttırmak amacı ile Haar benzeri öznitelikleri kullanan bir RDF geliştrilimiştir. Haar özniteliklerinin kullanan RDF'in performansı arttırdığı el yazısı ile yazılmış olan rakamlardan oluşan MNIST, insan resimleri içeren INRIA ve PETS09 veritabanları üzerinde yapılan testler ile gösterilmiştir. Örnek bir uygulama alanı olarak, önerilen RDF araç saptama ve takibi problemi üzerinde test edilmiştir. Saptanan objeleri takip etmek için Sıralı Monte Carlo, diğer adıyla Parçacık Filtresi (PF) uygulanmıştır. Saptama aşamasında her bir piksel için elde edilen olabilirlik değerleri ile parçacıkların ağırlıkları hesaplanmıştır. PF kullanılmasının temel nedeni, Gauss ve çizgisel olmayan işlemler için güçlü bir algoritma olmasının yanı sıra RDF gibi GPU'ya uygun bir yapıya sahip olmasıdır. Önerilen takip sistemi standard bilgisayarlarda gerçek zamanlı uygulamaya ağırlık vermektedir. YOLO ile kıyaslandığında, önerilen yöntem araç saptama başarımında yakın bir performans sunarken, standard bilgisayarlarda daha yüksek bir hıza sahip olduğu gözlemlenmiştir. Önerilen sisteme ek olarak bu tez kapsamında, farklı algoritmaları uygulamak ve test etmek için bir framework geliştirilmiştir. Bu framework, veri özütleme, veri oluşturma, algoritma eğitimi ve algoritmaları değişik parametrelerle test etmek için tasarlanan modüllerden oluşmaktadır. Tez içeriğinde modüllerin kullanımı ve fonksyonları anlatılmıştır.
Date
2017-05