4
Müzik Türlerinin Co-MRMR ile Snflandrlmas Audio Genre Classification with Co-MRMR Yusuf Yaslan, Zehra Çataltepe Bilgisayar Mühendislii Bölümü stanbul Teknik Üniversitesi, Maslak stanbul {yyaslan, cataltepe}@itu.edu.tr Özetçe Çok sayda öznitelik vektörü ve etiketsiz verinin bulunduu snflandrma problemlerinde, Birlikte Örenme algoritmas (Co-training) kullanlarak iki snflandrc eitilip, etiketsiz veriler özyineli olarak etiketlendirilebilir ve sonuç snflandrclar birletirilebilir. Birlikte Örenme algoritmas özellikle veri etiketlemenin pahal, zor olduu ve az etiketli verilerin bulunduu durumlarda snflandrma baarmn arttrabilir. Bu çalmada, bütün özniteliklerden seçilen deiik altkümeleri kullanan snflandrclarn eitilmesi ve daha sonra birlikte örenmesine dayanan Co-MRMR algoritmas müzik türlerinin snflandrlmas için kullanlmtr. Öznitelik vektörleri, MRMR (Minimum Redundancy Maximum Relevance, En Küçük Artklk En Büyük lgililik) öznitelik seçme algoritmas kullanlarak seçilmektedir. Marsyas ve Music Miner yazlmlar ile elde edilmi iki öznitelik kümesi Birlikte Örenme algoritmas için kullanlmtr. Co-MRMR algoritmas daha önce Wang v.d. tarafndan 2008’de önerilmi olan rasgele altküme algoritmas RASCO’dan ve geleneksel Birlikte Örenme algoritmasndan daha iyi sonuç vermitir. Abstract In a classification problem, when there are multiple feature views and unlabeled examples, Co-training can be used to train two separate classifiers, label the unlabeled data points iteratively and then combine the resulting classifiers. Especially when the number of labeled examples is small due to expense or difficulty of obtaining labels, Co-training can improve classifier performance. In this paper, Co-MRMR algorithm which uses classifiers trained on different feature subsets for Co-training is used for audio music genre classification. The features are selected with MRMR (minimum redundancy maximum relevance)feature selection algorithm. Two different feature sets, obtained from Marsyas and Music Miner software are evaluated for Co-training. Experimental results show that Co-MRMR gives better results than the random subspace method for Co-training (RASCO) which was suggested by Wang et al. in 2008 and traditional Co-training algorithm. 1. Giri Günümüzde birçok örüntü tanma probleminde, etiketli veri ile birlikte çok sayda etiketsiz veri de bulunmaktadr. Etiketsiz veriler özellikle, veriye eriimin kolay fakat bunlar etiketlemenin zor olduu gerçek problemlerde karmza çkmaktadr [1]. Örnein web sayfalarn içeren birçok sunucudan web dokümanlar ya da resimleri elde edilebilmektedir. Fakat bunlarn snflandrlmas zaman gerektiren güç bir itir. Benzer olarak biyoinformatikte protein bilgilerini içeren birçok veri taban bulunmakta fakat bunlarn fonksiyonlarnn belirlenmesinde problem yaanmaktadr. Dier bir problem ise müzik türlerinin snflandrlmasdr. nternet ve çoul ortam sistemlerinin artmas müzik verisine eriimi kolaylatrm olmasna ramen türlerin snflandrlmas ilemi zor, uzun zaman gerektiren ilemlerdir. Geleneksel müzik snflandrma sistemleri eiticili sistemler olup çok sayda etiketli veriye ihtiyaç duymaktadrlar. Bazen verinin %90’ eitim için kullanlabilmektedir [2]. Bu tür durumlarda yar eiticili algoritmalardan yararlanlabilmektedir. Literatürde müzik türlerinin snflandrlmas için verilmi birçok algoritma bulunmaktadr [3, 4, 5]. Benzer olarak bu algoritmalarn kulland sfr geçileri, iaret bant genilii, Mel Frekans kepstrum katsaylar, bant enerji oranlar, izgesel merkez, gibi birçok öznitelik vektörleri tanmlanmtr [5]. Genel olarak birden fazla farkl ekilde elde edilmi öznitelik uzaylarnn olduu durumlarda tek bir öznitelik uzay oluturmak üzere tüm öznitelik vektörleri birletirilebilir. Fakat bu, bazen snflandrma baarm açsndan problemler dourabilmektedir [2]. Örnein birletirilen öznitelik vektör uzaylar fiziksel anlamlarn kaybedebilmekte veya öznitelik fazlal oluabilmektedir. Birlikte örenme algoritmas [6] farkl iki öznitelik uzaynn bulunduu durumlarda, iki snflandrc eiterek etiketsiz verileri özyineli olarak etiketlendirmektedir. [2]’de Xu ve arkadalar Birlikte Örenme algoritmasn kullanarak klasik, pop ve metal türlerinin snflandrmasn gerçekletirmilerdir. Bu çalmada Co-MRMR algoritmas klasik, jaz, pop, hiphop ve rege müzik türlerinin snflandrlmas için kullanlm ve dier algoritmalarla kyaslanmtr. Co-MRMR algoritmas farkl snflandrclar MRMR öznitelik seçme yöntemi ile elde edilen öznitelik vektörleriyle birlikte eitmektedir. Test sonuçlar Co-MRMR algoritmasnn RASCO ve Birlikte 978-1-4244-4436-6/09/$25.00 ©2009 IEEE 408

[IEEE 2009 IEEE 17th Signal Processing and Communications Applications Conference (SIU) - Antalya, Turkey (2009.04.9-2009.04.11)] 2009 IEEE 17th Signal Processing and Communications

  • Upload
    zehra

  • View
    215

  • Download
    0

Embed Size (px)

Citation preview

Page 1: [IEEE 2009 IEEE 17th Signal Processing and Communications Applications Conference (SIU) - Antalya, Turkey (2009.04.9-2009.04.11)] 2009 IEEE 17th Signal Processing and Communications

Müzik Türlerinin Co-MRMR ile S�n�fland�r�lmas� Audio Genre Classification with Co-MRMR

Yusuf Yaslan, Zehra Çataltepe

Bilgisayar Mühendisli�i Bölümü �stanbul Teknik Üniversitesi, Maslak �stanbul

{yyaslan, cataltepe}@itu.edu.tr

Özetçe Çok say�da öznitelik vektörü ve etiketsiz verinin bulundu�u s�n�fland�rma problemlerinde, Birlikte Ö�renme algoritmas� (Co-training) kullan�larak iki s�n�fland�r�c� e�itilip, etiketsiz veriler özyineli olarak etiketlendirilebilir ve sonuç s�n�fland�r�c�lar birle�tirilebilir. Birlikte Ö�renme algoritmas� özellikle veri etiketlemenin pahal�, zor oldu�u ve az etiketli verilerin bulundu�u durumlarda s�n�fland�rma ba�ar�m�n� artt�rabilir. Bu çal��mada, bütün özniteliklerden seçilen de�i�ik altkümeleri kullanan s�n�fland�r�c�lar�n e�itilmesi ve daha sonra birlikte ö�renmesine dayanan Co-MRMR algoritmas� müzik türlerinin s�n�fland�r�lmas� için kullan�lm��t�r. Öznitelik vektörleri, MRMR (Minimum Redundancy Maximum Relevance, En Küçük Art�kl�k En Büyük �lgililik) öznitelik seçme algoritmas� kullan�larak seçilmektedir. Marsyas ve Music Miner yaz�l�mlar� ile elde edilmi� iki öznitelik kümesi Birlikte Ö�renme algoritmas� için kullan�lm��t�r. Co-MRMR algoritmas� daha önce Wang v.d. taraf�ndan 2008’de önerilmi� olan rasgele altküme algoritmas� RASCO’dan ve geleneksel Birlikte Ö�renme algoritmas�ndan daha iyi sonuç vermi�tir.

Abstract

In a classification problem, when there are multiple feature views and unlabeled examples, Co-training can be used to train two separate classifiers, label the unlabeled data points iteratively and then combine the resulting classifiers. Especially when the number of labeled examples is small due to expense or difficulty of obtaining labels, Co-training can improve classifier performance. In this paper, Co-MRMR algorithm which uses classifiers trained on different feature subsets for Co-training is used for audio music genre classification. The features are selected with MRMR (minimum redundancy maximum relevance)feature selection algorithm. Two different feature sets, obtained from Marsyas and Music Miner software are evaluated for Co-training. Experimental results show that Co-MRMR gives better results than the random subspace method for Co-training (RASCO) which was suggested by Wang et al. in 2008 and traditional Co-training algorithm.

1. Giri� Günümüzde birçok örüntü tan�ma probleminde, etiketli veri ile birlikte çok say�da etiketsiz veri de bulunmaktad�r. Etiketsiz veriler özellikle, veriye eri�imin kolay fakat bunlar� etiketlemenin zor oldu�u gerçek problemlerde kar��m�za ç�kmaktad�r [1]. Örne�in web sayfalar�n� içeren birçok sunucudan web dokümanlar� ya da resimleri elde edilebilmektedir. Fakat bunlar�n s�n�fland�r�lmas� zaman gerektiren güç bir i�tir. Benzer olarak biyoinformatikte protein bilgilerini içeren birçok veri taban� bulunmakta fakat bunlar�n fonksiyonlar�n�n belirlenmesinde problem ya�anmaktad�r. Di�er bir problem ise müzik türlerinin s�n�fland�r�lmas�d�r. �nternet ve ço�ul ortam sistemlerinin artmas� müzik verisine eri�imi kolayla�t�rm�� olmas�na ra�men türlerin s�n�fland�r�lmas� i�lemi zor, uzun zaman gerektiren i�lemlerdir. Geleneksel müzik s�n�fland�rma sistemleri e�iticili sistemler olup çok say�da etiketli veriye ihtiyaç duymaktad�rlar. Bazen verinin %90’� e�itim için kullan�labilmektedir [2]. Bu tür durumlarda yar� e�iticili algoritmalardan yararlan�labilmektedir. Literatürde müzik türlerinin s�n�fland�r�lmas� için verilmi� birçok algoritma bulunmaktad�r [3, 4, 5]. Benzer olarak bu algoritmalar�n kulland��� s�f�r geçi�leri, i�aret bant geni�li�i, Mel Frekans kepstrum katsay�lar�, bant enerji oranlar�, izgesel merkez, gibi birçok öznitelik vektörleri tan�mlanm��t�r [5]. Genel olarak birden fazla farkl� �ekilde elde edilmi� öznitelik uzaylar�n�n oldu�u durumlarda tek bir öznitelik uzay� olu�turmak üzere tüm öznitelik vektörleri birle�tirilebilir. Fakat bu, bazen s�n�fland�rma ba�ar�m� aç�s�ndan problemler do�urabilmektedir [2]. Örne�in birle�tirilen öznitelik vektör uzaylar� fiziksel anlamlar�n� kaybedebilmekte veya öznitelik fazlal��� olu�abilmektedir. Birlikte ö�renme algoritmas� [6] farkl� iki öznitelik uzay�n�n bulundu�u durumlarda, iki s�n�fland�r�c� e�iterek etiketsiz verileri özyineli olarak etiketlendirmektedir. [2]’de Xu ve arkada�lar� Birlikte Ö�renme algoritmas�n� kullanarak klasik, pop ve metal türlerinin s�n�fland�rmas�n� gerçekle�tirmi�lerdir. Bu çal��mada Co-MRMR algoritmas� klasik, jaz, pop, hiphop ve rege müzik türlerinin s�n�fland�r�lmas� için kullan�lm�� ve di�er algoritmalarla k�yaslanm��t�r. Co-MRMR algoritmas� farkl� s�n�fland�r�c�lar� MRMR öznitelik seçme yöntemi ile elde edilen öznitelik vektörleriyle birlikte e�itmektedir. Test sonuçlar� Co-MRMR algoritmas�n�n RASCO ve Birlikte

978-1-4244-4436-6/09/$25.00 ©2009 IEEE 408

Page 2: [IEEE 2009 IEEE 17th Signal Processing and Communications Applications Conference (SIU) - Antalya, Turkey (2009.04.9-2009.04.11)] 2009 IEEE 17th Signal Processing and Communications

Ö�renme algoritmas�ndan daha iyi ba�ar�m verdi�ini göstermektedir.

2. Birlikte Ö�renme ve RASCO Birlikte Ö�renme algoritmas� farkl� öznitelik uzay�nda iki s�n�fland�r�c� e�iterek etiketsiz verileri özyineli olarak etiketlendirmeyi ve her bir s�n�fland�r�c�n�n ba�ar�m�n� artt�rmay� hedefleyen bir algoritmad�r. Birlikte Ö�renme algoritmas� Algoritma 1’de verilmi�tir. Algoritma 1’de FB1 Bve FB2B farkl� iki öznitelik uzay�n�, U etiketsiz verileri, L etiketli verileri, CB1 B(CB2B) etiketli veri kümesinin FB1 B(FB2B) öznitelik uzay� üzerinde e�itilmi� s�n�fland�r�c�y� göstermektedir. u etiketsiz veriden seçilecek örnek say�s�n�, n yineleme say�s�n� göstermektedir. UP

|P olarak,

U’nun tamam� da seçilebilir. Birlikte ö�renme s�ras�nda her bir s�n�fland�r�c� her bir s�n�f için en emin oldu�u bir etiketsiz örne�i etiketlemekte ve bunu etiketli veri kümesi içerisine atmaktad�r. [6]’da iki s�n�fl� s�n�fland�rma problemi için, p pozitif s�n�flar� n negatif s�n�flar� göstermek üzere, her bir s�n�fland�r�c� p+ n adet etiketsiz veriyi etiketlemektedir. Çal��mam�zda daha her bir s�n�fland�r�c� her s�n�f için s�n�f ba��na en emin oldu�u bir adet etiketsiz veriyi etiketli veri kümesine katmaktad�r. UAlgoritma 1: Birlikte Ö�renme Algoritmas� U’= Select u random examples from U for i = 1 to n do for j = 1 to 2 do

Train CBjB on FBjB

Classify UP

| Pby CBjB

Select most surely classified example on UP

|P

Remove this example from UP

| P and add to L

end for end for Genel olarak öznitelik vektörleri birbirleri aras�nda uyumlu (compatible) ve ko�ullu ba��ms�z (conditionally independent) ise Birlikte Ö�renme algoritmas� s�n�fland�rma ba�ar�m�n� artt�rmaktad�r [6]. Fakat bu iki özelli�i sa�lamak genellikle zordur. Bu problemi ortadan kald�rmak üzere, rasgele altküme yönteminin Birlikte Ö�renme algoritmas� ile birle�imi (RASCO) önerilmi�tir [7]. RASCO farkl� iki öznitelik vektörü uzay� üzerinde s�n�fland�r�c� e�itmek yerine, önce bütün öznitelikleri bir araya getirip F=FB1BUFB2B kümesini olu�turur. Daha sonra farkl� K adet, CBk B(k =1,…,K) s�n�fland�r�c�s�n�, F’den seçilmi� LBkB öznitelik alt uzay�nda e�itmektedir. RASCO algoritmas�, FB1B ve FB2B uzaylar�n bulunmad���, F uzay�n�n yeteri kadar büyük oldu�u tek bir uzay üzerinde de çal��abilmektedir. RASCO algoritmas� Algoritma 2’de verilmi�tir. Algoritmada VP pozitif s�n�flar için, VN ise negatif s�n�flar için seçilmi� etiketsiz verilerin kümesini temsil etmektedir. UAlgoritma 2: RASCO Randomly choose m dimensional subspaces for K times for j = 0 to J do Project L to each of the subspace to get LBkB (1 � k � K) Use each LBkB to train CBkB

Use each CBkB to predict the labels of unlabeled data Let C(q) = (1/K)�C(q)BkB , and q be an example to be Co-MRMR algoritmas� her bir öznitelik vektörü için MRMR

öznitelik seçme algoritmas�n� kullanarak öznitelik classified

if C(q)� 0 then put q into VP else put q into VN end if for VP and VN select qP

|P, qP

|P = argmax(|C(q)|)

put qP

|P into LBjB

Update L LULj , Lj Ø ; end for RASCO algoritmas� Birlikte Ö�renme ve Üçlü Ö�renme (Tri-training) [8] algoritmalar� ile kar��la�t�r�lm�� ve RASCO algoritmas�n�n daha iyi sonuç verdi�i gösterilmi�tir [7]. Öte yandan birçok gerçek veri kümesinde öznitelik vektörleri aras�nda ilinti bulunabilmektedir. RASCO öznitelik vektörlerini rasgele seçti�inden, birbiri ile ilintili öznitelikler ayn� alt kümede bulunabilmekte ve dolay�s�yla her bir s�n�fland�r�c�n�n ba�ar�m� azalabilmektedir. Öznitelik vektörleri aras�nda ili�kinin bulundu�u durumlarda, birçok çal��mada öznitelik seçme algoritmalar� kullan�labilmektedir. Genellikle öznitelik seçme algoritmalar� [9] daha küçük uzayda ve daha fazla ay�rt edici özelliklere sahip öznitelikleri bulmay� amaçlamaktad�r. Bu çal��mada, birçok veri taban�nda ba�ar�l� ve h�zl� sonuçlar verdi�i gözlemlenen MRMR öznitelik seçme algoritmas� RASCO algoritmas� ile tümle�tirilmi� ve yeni algoritma, Co-MRMR, kullan�larak müzik türleri s�n�fland�r�lm��t�r.

3. Co-MRMR Algoritmas� Bu bölümde öncelikli olarak MRMR öznitelik seçme algoritmas� aç�klanacak daha sonra Co-MRMR algoritmas� tan�t�lacakt�r.

3.1. MRMR Öznitelik Seçme Algoritmas�

Birçok s�n�fland�rma probleminde, birbirleriyle ilintili öznitelik uzay�ndan iyi öznitelik altkümesi seçmek önemli bir i�lemdir. Öznitelik seçme i�leminin öznitelik uzay�n� azaltma ve bu sayede i�lem zaman�n� dü�ürme, gürültüyü azaltma ve daha iyi ve ay�rt edici öznitelikleri belirleme gibi faydalar� vard�r. Genel olarak öznitelikler filtreleme (filtering methods) veya s�n�fland�r�c� ba�ar�mlar� (wrapper methods) dikkate al�narak seçilmektedir [9]. S�n�fland�r�c� ba�ar�m�na göre gerçekle�tirilen öznitelik seçme algoritmalar� iyi sonuç vermekle birlikte e�itim kümesi için çok say�da örnek ve zamana ihtiyaç duymaktad�rlar. MRMR öznitelik seçme algoritmas� önce öznitelikleri s�n�f etiketlerine olan ilgilerine (relevance) göre s�ralar. MRMR ayn� zamanda seçilmi� öznitelik kümesi ile en az ilintili olan öznitelik vektörünü seçmeyi amaçlar. MRMR öznitelik-öznitelik ve öznitelik-etiketler aras� benzerlik miktar�n� hesaplamak için kar��l�kl� bilgi miktar�n� (mutual information) kullanmaktad�r. Daha detayl� bilgiye [10]’dan ula��labilir.

3.2. Co-MRMR

978-1-4244-4436-6/09/$25.00 ©2009 IEEE 409

Page 3: [IEEE 2009 IEEE 17th Signal Processing and Communications Applications Conference (SIU) - Antalya, Turkey (2009.04.9-2009.04.11)] 2009 IEEE 17th Signal Processing and Communications

altkümelerini elde etmektedir [11]. Co-MRMR algoritmas� öncelikli olarak etiketli e�itim kümesi içerisindeki öznitelik vektörlerini ayr�kla�t�r�r. Sonraki a�amada d adet öznitelik vektörü için ilgililik (relevance) de�erlerinden elde edilen Q de�erleri, toplamlar� 1 olacak �ekilde normalize edilir ve öznitelik vektörleri için olas�l�k da��l�m fonksiyonu olu�turulur. Her bir alt küme için öncelikli olarak turnuva seçme yöntemi kullan�larak mP

| Padet öznitelik vektörü seçilir ve

DBiB kümesi olu�turulur. SBiB öznitelik altkümesi MRMR algoritmas�n�n DBi Bkümesi üzerinde buldu�u en iyi m adet öznitelik vektörünün seçilmesi ile olu�turulur. RASCO algoritmas�nda oldu�u gibi s�n�fland�r�c�lar SB1B,…,SBKB altkümeleri üzerinde e�itilir. Sonuç s�n�fland�r�c� olu�turulmu� s�n�fland�r�c�lar�n ço�unluk de�erine (majority vote) göre belirlenir. Algoritma belirli bir yineleme süresince etiketsiz veri kümesindeki verileri etiketleyerek, etiketli veri kümesini geni�letir. Co-MRMR algoritmas� Algoritma 3’te verilmi�tir. UAlgoritma 3: Co-MRMR Discretize(L) Q = Relevance(L) Q = Normalize(Q) for j = 1 to K do DBiBTournamentSelection(Q, mP

|P )

SBj B MRMR(DBiB,m) end for for i = 1 to I do for j = 1 to K do Train classifier CBjB using SBjB

end for Label examples on U by using C = (1/K)�CBk Select one most surely classified example from U for each class and add them to L. end for �ekil 1’de l etiket bilgisini göstermek üzere Co-MRMR, RASCO ve Birlikte Ö�renme algoritmalar�, kulland�klar� öznitelik uzaylar� ile birlikte gösterilmi�tir.

4. Veri Kümesi ve Test Sonuçlar� Veri kümesi olarak [5]’de verilmi� birbirleri ile en az kar��an klasik, jaz, pop, hiphop ve rege müzik türleri kullan�lm��t�r. Veri taban�nda her müzik türü için toplam 100 adet müzik dosyas� bulunmaktad�r. Benzer bir çal��ma daha önce Birlikte Ö�renme algoritmas� kullan�larak klasik, pop ve metal s�n�flar� için gerçekle�tirilmi�tir [2]. Xu ve arkada�lar� s�n�fland�r�c� olarak K En yak�n Kom�uluk (KNN) algoritmas�n� kullanm��lard�r. Bu çal��mada test sonuçlar� PRTools’ daki KNN(optimum) algoritmas� kullan�larak elde edilmi�tir[11].

4.1. Öznitelik Vektörleri

Bu çal��mada s�n�fland�r�c�lar�n kullanmas� için farkl� 2 tür öznitelik vektörü elde edilmi�tir. Öncelikli olarak [5]’te belirtilen 30 boyutlu öznitelik vektörleri MARSYAS yaz�l�m� kullan�larak ç�kar�lm��t�r. Bu öznitelikler 6 boyutlu Beat, 9 boyutlu STFT, 10 boyutlu MFCC ve 5 boyutlu MPITCH öznitelikleridir. Bu öznitelik vektörleri ile ilgili detayl� bilgi [5]‘te bulunabilir. MARSYAS öznitelik vektörlerinin tamam� Birlikte Ö�renme algoritmas� için FB1B öznitelik uzay� olarak seçilmi�tir. Benzer olarak [12]’da verilmi� Databionic Music Miner yaz�l�m� kullan�larak 20 adet en iyi ba�ar�m gösteren

öznitelik vektörü elde edilmi�tir. Bu öznitelik vektörleri dü�ük ve yüksek seviyeli (low and high level) birçok öznitelik vektöründen ç�kar�lm��t�r. Daha detayl� bilgi [12]’den elde edilebilir. Music Miner ile elde edilmi� öznitelik vektörlerinin tamam� Birlikte Ö�renme algoritmas� için FB2B öznitelik uzay� olarak seçilmi�tir. RASCO ve Co-MRMR her iki öznitelik uzay�n�n birle�imi ile elde edilen F üzerinde çal��t�r�lm��t�r.

Co-training

FB Bl LB1B LB2B … LBKB l

FB1 BFB2 Bl

Co-MRMR

FB Bl LB1B LB2B … LBKB l

Random Subspace Method

RASCO

MRMR + Random Subspace Method

ekil 1: Birlikte Ö�renme, RASCO ve co-MRMR algoritmalar�n�n kulland�klar� öznitelik uzaylar�.

4.2. Test Sonuçlar�

Test sonuçlar� için öncelikli olarak tüm veri kümesi test ve e�itim kümeleri olmak üzere e�it iki bölüme ayr�lm��t�r. E�itim kümesi de etiketli ve etiketsiz e�itim kümesi olmak üzere iki parçaya bölünmü�tür. Öncelikli olarak her bir s�n�f için 10 adet etiketli veri ile s�n�fland�r�c�lar e�itilmi� ve yinelemeli olarak etiketsiz veriler etiketlenerek etiketli e�itim kümesine eklenmi�tir. 20 yineleme için elde edilmi� sonuçlar �ekil 1’de gösterilmi�tir. Sonuçlar 10 adet rasgele yürütme ile elde edilmi� ve her bir yöntem için ortalaman�n standart ba�ar�mlar� verilmi�tir. Co-MRMR ve RASCO algoritmas� için seçilen öznitelik vektörü boyutu m = 25 ve s�n�fland�r�c� say�s� K = 5 olarak al�nm��t�r. Co-MRMR’da mP

| P25 olarak

al�nm��t�r. Birlikte Ö�renme algoritmas� yinelemelerde farkl� say�da etiketsiz veriyi etiketli veri kümesine ekledi�i için 10 yineleme ile sonuçland�r�lm��t�r. Birlikte Ö�renme algoritmas�n�n ba�lang�ç ba�ar�m� 67.60±1.51 ve 10 yineleme sonucundaki ba�ar�m� 74±1.08 olarak elde edilmi�tir. Co-MRMR ve RASCO algoritmalar� ilk birkaç yinelemede birbirlerine yak�n sonuçlar vermekle birlikte Co-MRMR algoritmas� RASCO’dan daha iyi ba�ar�m göstermektedir. Eklenen veri say�s� artt�kça her iki algoritman�n ba�ar�m� da

978-1-4244-4436-6/09/$25.00 ©2009 IEEE 410

Page 4: [IEEE 2009 IEEE 17th Signal Processing and Communications Applications Conference (SIU) - Antalya, Turkey (2009.04.9-2009.04.11)] 2009 IEEE 17th Signal Processing and Communications

artmaktad�r ve CoMRMR algoritmas� yinelemeler sonunda %80’e yak�n ba�ar�ma ula�m��lard�r. �ki algoritma da Birlikte Ö�renme algoritmas�ndan çok daha yüksek ba�ar�m göstermektedir.

0 5 10 15 2070

72

74

76

78

80

82

84

Yineleme

Sini

fland

irma

Bas

arim

i

CoMRMRRASCO

ekil 2: Co-MRMR ve RASCO algoritmalar�n�n yineleme say�s�na ba�l� s�n�fland�rma ba�ar�m�. Her bir s�n�f için ba�lang�çtaki etiketli veri say�s� = 5. E�itim kümesindeki etiketli veri say�s� her bir s�n�f için 10’a ç�kar�lm�� ve benzer sonuçlar ayn� parametreler için �ekil 3’de gösterilmi�tir. Birlikte Ö�renme algoritmas�n�n ba�lang�ç ba�ar�m� 71.28±1.43 ve 10 yineleme sonucundaki ba�ar�m� 76.16±1.64. Co-MRMR algoritmas� yinelemelerin tamam�nda RASCO’dan daha iyi ba�ar�m göstermekte ve 20 yineleme sonunda %83.08 s�n�fland�rma ba�ar�m�na ula�maktad�r. Etiketli verinin artmas� her üç algoritmada da ba�ar�m art�m�na neden olmaktad�r. Co-MRMR algoritmas�, özellikle s�n�fland�rma için de�erli öznitelikleri seçti�i için, eklenen etiketli verilerin s�n�fland�rma ba�ar�m�ndaki faydas�n� RASCO’dan daha fazla görmektedir.

0 5 10 15 2074

76

78

80

82

84

Yineleme

Sini

fland

irma

Bas

arim

i

CoMRMRRASCO

ekil 3: Co-MRMR ve RASCO algoritmalar�n�n yineleme say�s�na ba�l� s�n�fland�rma ba�ar�m�. Her bir s�n�f için ba�lang�çtaki etiketli veri say�s� = 10.

5. Sonuçlar Bu bildiride Co-MRMR algoritmas� müzik türlerinin s�n�fland�r�lmas� için kullan�lm�� ve ba�ar�m� RASCO ve

Birlikte Ö�renme algoritmalar� ile k�yaslanm��t�r. Co-MRMR algoritmas� iki algoritmadan da çok daha iyi ba�ar�m göstermektedir. �leriki çal��malarda s�n�f say�s�n�n artt�r�lmas� ve s�n�fland�r�c� olarak Karar Destek Makinelerinin kullan�lmas� planlanmaktad�r. Benzer olarak yüksek boyutlu öznitelik uzaylar�nda önerilen algoritman�n ba�ar�m� incelenecektir.

6. Kaynakça [1] Yaslan Y. and Cataltepe Z. “Co-training with adaptive

bayesian classifier combination” In International Symposium on Computer and Information Sciences (ISCIS2008), Istanbul Turkey, 27-29 October 2008.

[2] Y. Xu, C. Zhang and J. Yang, ”Semi-Supervised Classification of Musical Genre Using Multi-View Features”, International Computer Music Conference (ICMC 2005), 5-9 September 2005.

[3] Cataltepe Z., Yaslan Y., and Sonmez, A. “Music Genre Classification Using MIDI and Audio Features”, EURASIP Journal on Advances in Signal Processing, 2007.

[4] Yaslan Y. and Cataltepe Z. “Audio Music Genre Classification Using Different Classifiers and Feature Selection”, 18th International Conference on Pattern Recognition (ICPR 2006), Hong Kong, 2008.

[5] Tzanetakis, G. and Cook, P., "Musical Genre Classification of Audio Signals", IEEE Transactions on Speech and Audio Processing, vol.10 no.5, pp. 293-302, 2002.

[6] Blum A. and Mitchell T. “Combining Labeled and Unlabeled Data with Co-training” Proc. of the 11th Annual Conference on Computational Learning Theory (COLT ’98) (pp. 92-100),1998.

[7] Wang J. Luo S.W. and Zeng X.H “A random subspace method for co-training” In International Joint Conference on Neural Networks(IJCNN 2008), pp 195–200, 2008.

[8] Zhou Z. H. and Li M., “Tri-Training: Exploiting Unlabeled Data Using Three Classifiers”, IEEE Transactions on Knowledge and Data Engineering, vol.17, no.11, pp. 1529-1541, 2005.

[9] Guyon I. and Elisseeff, “An Introduction to Variable and Feature Selection”, Journal of Machine Learning Research,vol.3, pp. 1157-1182, 2003.

[10] Ding C. and Peng H. “Minimum redundancy feature selection from microarray gene expression data” In Computational Systems Bioinformatics(CSB 2003), pp 523–528, 2003.

[11] R.P.W. Duin. PRTOOLS A Matlab Toolbox for Pattern Recognition. 2004

[12] Mierswa I. and Morik K. “Automatic Feature Extraction for Classifying Audio Data”, Machine Learning, vol. 58, pp. 127-149,2005.

978-1-4244-4436-6/09/$25.00 ©2009 IEEE 411