View
6
Download
2
Category
Preview:
DESCRIPTION
Mantap
Citation preview
SISTEM TEMU KEMBALI INFORMASI
“IMAGE RETRIEVAL”
Oleh :
I Gusti Ayu Triwayuni (1304505011)
KELAS A
TEKNOLOGI INFORMASI
FAKULTAS TEKNIK
UNIVERSITAS UDAYANA
2016
Image Retrieval
Image retrieval merupakan teknik yang digunakan untuk mencari citra dari
suatu database yang memiliki kemiripan karakteristik dari citra query. Setiap citra
memiliki informasi fitur low-level yang unik. Contoh dari fitur low-level adalah
warna, tekstur, bentuk, dan sebagainya. Fitur-fitur inilah yang nantinya
dibandingkan antar citra dalam sistem image retrieval. Terdapat dua pendekatan
dalam image retrieval , yaitu :
Text-based : berdasarkan informasi metadata citra
Content-based : berdasarkan informasi isi citra
Text-based
Text-based menggunakan teknik query database tradisional untuk memperoleh
kembali citra berdasarkan kata kunci (keyword). Sistem membutuhkan penjelasan
atau metadata untuk setiap citra sebelum disimpan ke dalam database. Pendekatan
ini memiliki beberapa kekurangan, diantaranya :
Bersifat subyektif karena terdapat campur tangan manusia di dalam
memberikan penjelasan suatu citra. Setiap orang memiliki representasi yang
berbeda dalam menguraikan suatu karakteristik citra yang sama atau dikenal
dengan istilah semantic gap.
Dapat terjadi pendeskripsian yang tidak konsisten dan meluas saat
mendeskripsikan data dalam jumlah banyak karena sangat tergantung pada
pemahaman dan penafsiran manusia terhadap citra yang dilihat.
Content-Based
Content Based Image Retrieval (CBIR) adalah salah satu metodologi untuk
pemanggilan kembali data citra berdasarkan content sebuah citra. Pada sistem ini
menggunakan suatu algoritma image processing dalam mengekstraksi fitur yang
direpresentasikan oleh citra seperti warna, tekstur, dan bentuk.
Keuntungan utama dari CBIR ini adalah proses retrieval dilakukan secara
otomatis oleh sistem komputer. Tetapi kekurangan dari CBIR adalah terdapat
keterbasan alat capture data sehingga data tidak dapat menggambarkan seluruh
keadaan yang sebenarnya atau dikenal dengan istilah sensory gap. Adapun
arsitektur sistem CBIR dijelaskan pada gambar 2.1, yaitu:
Gambar 2.1 Arsitektur Sistem CBIR
Berdasarkan arsitektur pada Gambar 2.1, dalam proses CBIR terdapat dua
fungsionalitas utama, yaitu :
1. Data Insertion
Pada subsistem data insertion dilakukan ekstraksi fitur terhadap citra dan
hasilnya disimpan ke dalam database. Sebuah citra dapat direpresentasikan
dengan vektor multidimensi (N-dimensi) dari hasil ekstraksi fiturnya.
Sebagai contohnya, sebuah citra diekstraksi berdasarkan fitur warna dan
bentuk. Dimana komponen pertama (n1) adalah warna dan komponen
kedua (n2) adalah bentuk sehingga, terdapat N=n1+n2 komponen. Hasil
vektor ekstraksi tadi disimpan dalam database dan menjadi ciri untuk
suatu citra.
2. Query Processing
Pada tahap ini dilakukan ekstraksi fitur terhadap citra query dan hasilnya
dibandingkan dengan vektor ekstraksi yang terdapat di dalam database.
Setelah itu dilakukan proses perhitungan jarak vektor antara citra query
dengan citra database untuk mendapatkan tingkat kemiripan. Setelah itu,
dilakukan proses perankingan sehingga dikembalikan sejumlah citra yang
mirip dengan citra query.
Ekstraksi fitur merupakan proses penting pada sistem CBIR karena hasil
dari proses ini terdapat perbedaan pada setiap image yang dapat diketahui
berdasarkan cirinya seperti ciri bentuk, warna, tekstur dan lain-lain.
Gambar 2.1. Teknik pencarian image untuk memperoleh image
Proses matching merupakan proses pencocokan image untuk memperoleh
image yang mempunyai kemiripan dengan image query dapat dilihat pada
Gambar 2.1. Proses matching dilakukan dengan menghitung jarak antara dua
image yaitu image query dan image target pada sekumpulan image. Parameter
yang digunakan dalam perhitungan jarak berdasarkan pada hasil ekstraksi fitur.
( Ida Hastuti:2009).
Moment Invariant
Moment Invariants adalah salah satu metode yang digunakan sebagai
ekstraktor fitur bentuk. Sebuah ekstraktor bentuk harus dapat mengenali citra
walaupun telah mengalami perubahan geometrik seperti translasi, rotasi dan
penskalaan. Momen adalah teknik matematika yang diterapkan untuk
mengekstraksi informasi dari objek citra. Citra target sering diperoleh dari hasil
thresholding, yang merupakan salah satu bentuk optimal yang dapat menampilkan
single object dari sebuah citra. Aplikasi yang lebih kompleks menangani
permasalahan penutupan (occlusion) dan pengisian bagian yang hilang. Tahapan
ini dilakukan pada pra-proses sebelum citra tersebut diekstraksi menggunakan
Moment Invariants. Moment Invariants akan menghasilkan tujuh nilai invarian
momen yang konstan terhadap translasi, rotasi, dan skala pada sebuah citra
(Muharrem Mercimek:2008). Menurut Rao, et. Al (2010), Moment Invariants
digunakan dalam 2D image dengan rumus sebagai berikut:
1. Sebuah citra M x M memiliki fungsi keabuan :
2. Momen dua-dimensi berkaitan dengan sebuah orde yang dimulai dari low
(dimana terendah adalah 0) sampai orde tertinggi. Momen dari orde p+q
dijabarkan sebagai berikut :
3. Centroid ini merupakan first-order moment yang digunakan untuk
menentukan lokasi pusat dari sebuah objek. Pada citra biner, nilai ini
sesuai dengan koordinat pusat dari bentuk.
4. Central Moments (Translation Invariant) Nilai dari Central moment tidak
berubah walaupun citra telah mengalami translasi, sehingga terdapat
teorema : central moment adalah konstan terhadap translasi. Adapun
persamaan untuk mendapatkan central moment :
5. Normalized Central Moments (Scale Invariant) Central Moments hanya
konstan terhadap translasi tetapi tidak konstan terhadap transformasi
bentuk lainnya. Agar momen tersebut tidak berubah terhadap skala dan
rotasi maka Central Moment dinormalisasikan sebagai berikut :
Gray Level Co-occurrence Matrix
Ada beberapa metode yang digunakan untuk penghitungan kesamaan
texture menurut penelitian yang dilakukan oleh Howarth dan Ruger, antara lain
(Howarth & Ruger, 2004) : Co-occurrence merupakan metode awal yang
digunakan untuk penghitungan kecocokan texture. Di mana dalam penggunaannya
digunakan menggunakan Grey Level Co-occurrence Matrices (GLCM). Di mana
gambar akan dibagi per 2 pixel dan pemisahan akan ditandai dengan vector
tertentu. Distribusi dalam matrix akan tergantung pada sudut dan jarak hubungan
antar pixel. GLCM memungkinkan menangkap karakteristik tekstur yang berbeda.
Namun hasilnya bervariasi karena terpengaruh oleh kualitas gambar dan keutuhan
bentuk gambar. Sehingga tidak dapat digunakan untuk gambar yang berukuran
kecil dan gambar yang tidak utuh. GLCM didefenisikan sebagai tabulasi dari data
piksel citra dimana digambarkan seberapa sering kombinasi yang berbeda pada
nilai keabuan yang muncul pada citra (Yaltha Rullist : 2009). Fitur-fitur metode
ini sebagai berikut.
1. Quantization, merupakan konversi nilai grayscale (256 nilai keabuan) citra
kedalam rentang nilai tertentu.
2. Co-occurrence, yaitu jumlah kejadian satu level nilai intensitas piksel
bertetangga dengan satu level intensitas piksel lain dalam jarak (distance)
dan orientasi sudut (θ) tertentu. Jarak dinyatakan dalam piksel dan
orientasi dinyatakan dalam derajat. Orientasi dibentuk dalam empat arah
sudut dengan interval sudut 45o, yaitu 0o, 45o, 90o, dan 135o. sedangkan
jarak antar piksel ditetapkan sebesar satu piksel.
Gambar 2.2 Hubungan ketetanggaan antar piksel
3. Symetric Symmetric, yaitu diartikan sebagai kemunculan posisi piksel yang
sama. Misalkan terdapat piksel. Maka secara orientasi horizontal piksel
sama dengan piksel. Oleh karena itu, dijumlahkan matrik kookurensi
dengan matrik transpose-nya sendiri.
4. Normalization yaitu, suatu langkah yang dilakukan sebelum ciri tekstur
dihitung. Langkah ini menghitung probabilitas matrik, misalkan terdapat
hubungan ketetanggan piksel dan sangat mirip dengan hubungan
ketetanggaan piksel lainnya. Kemunculan piksel adalah 6 kali misalnya
dari 24 kombinasi horizontal, maka normalisasi berperan sebagai
membedakan antara piksel dan yang mirip dengan cara membagi jumlah
kemunculan piksel tersebut dengan jumlah kemungkinan yang muncul.
Piksel memiliki angka kemungkinan muncul sebesar 0.25 sedangkan
piksel sebesar 0.042. Normalisasi adalah membagi jumlah kemunculan
ketetanggaan piksel tertentu dengan jumlah seluruh piksel ketetanggaan
yang mungkin muncul.
5. Feature Exstraction, berdasarkan penelitian oleh Haralick diusulkan 14
jenis ciri tekstural. Namun tidak semua ciri dapat diterapkan, karena
diantara ciri teksutral tersebut terdapat beberapa ciri yang bisa menjadi ciri
pengacau terhadap obyek yang diteliti. Berikut beberapa persamaan ciri
tekstural tersebut diantaranya.
a) Angular Second Moment (Uniformity / Energy). 𝐴𝑆𝑀 = ∑ {𝑝(𝑖,𝑗)}2 𝑁−1 𝑖,𝑗=0
b) Contrast. 𝐶𝑂𝑁 = ∑ 𝑝𝑖,𝑗(𝑖 − 𝑗)2 𝑁−1 𝑖,𝑗=0
c) Inverse Difference Moment (Homogenity). 𝐻𝑂𝑀 = ∑ 𝑝(𝑖,𝑗) 1+ (𝑖−𝑗)2 𝑁−1 𝑖,𝑗=0
d) Entropy. 𝐸𝑁𝑇 = −∑ 𝑝(𝑖,𝑗) 𝑁−1 𝑖,𝑗=0 𝑙𝑜𝑔{𝑝(𝑖,𝑗)}
e) Dissimilarity. 𝐷𝐼𝑆 = ∑ 𝑝(𝑖,𝑗)|𝑖 − 𝑗| 𝑁−1 𝑖,𝑗=0
Color Moments
Color Moments adalah suatu metode yang digunakan untuk membedakan citra
berdasarkan fitur warnanya. Dasar dari metode ini adalah asumsi bahwa distribusi
warna pada sebuah citra dapat dinyatakan sebagai distribusi probabilitas. Oleh
sebab itu, akurasi yang dihasilkan adalah konstan walaupun ukuran citra berubah.
Color Moments disebut compact karena dapat memampatkan informasi warna
citra menjadi beberapa nilai. Ekstraktor warna ini tidak memerlukan kuantisasi
pada tahapan pra proses karena Color Moments hanya menyimpan fitur dominan
pada distribusi warna di dalam database.
Metode ini menggunakan tiga momen utama dari distribusi warna citra, yaitu
mean, standard deviation, dan skewness, sehingga metode ini menghasilkan tiga
nilai untuk masing-masing komponen warna.
Karena pada Tugas Akhir ini menggunakan ruang warna HSV yang terdiri
dari tiga komponen warna, maka metode ini menghasilkan sembilan nilai untuk
identitas sebuah citra. Sembilan nilai inilah yang digunakan sebagai ciri warna
citra untuk proses image retrieval. Berdasarkan hasil ekstraksi yang diperoleh
yaitu sembilan, maka proses perolehan data kembalipun dapat berlangsung
dengan cepat.
Kita mendefinisikan i-th komponen warna pada j-th piksel citra sebagai Pij.
Ketiga momen tersebut dapat didefinisikan sbb:
Moment 1 – Mean :
Mean dapat dikatakan sebagai rata-rata nilai warna pada citra.
Moment 2 – Standard Deviation :
Standard deviation adalah akar dua dari variance pada distribusi atau jangkauan tersebarnya data dari mean.
Moment 3 – Skewness :
Skewness merupakan sebuah ukuran asimetri data disekitar mean. Jika nilai skewness adalah negatif, berarti data lebih banyak tersebar di sebelah kanan rata-rata (mean) dibandingkan di sebelah kanan rata-rata mean dan begitu pula sebaliknya. Skewness dari distribusi normal adalah nol.
Adapun keterangan dari persamaan adalah sebagai berikut :
E : Mean
: Standard deviation
: Skewness
N : Jumlah piksel
i : indeks komponen warna sekarang (contoh : 1=H, 2=S, 3=V)
j : Urutan piksel
: mendefinisikan nilai i-th komponen warna pada j-th piksel citra
Jarak dari distribusi warna citra query dengan citra database dapat dihitung dengan persamaan (2.5) di bawah ini :
Dimana :
: 2 distribusi citra yang sedang dibandingkan
i : indeks komponen warna sekarang (contoh : 1=H, 2=S, 3=V)
r : jumlah komponen warna (contoh : 3)
: momen pertama (mean) dari dua distribusi citra
: momen kedua (standard deviation) dari dua distribusi citra
: momen ketiga (skewness) dari dua distribusi citra
wi : bobot (weight) dari setiap momen yang dispesifikasikan oleh user.
DAFTAR PUSTAKA
Dimai, A. (1999). Rotation Invariant Texture Description using General Moment Invariants and Gabor Filters. Proc. Of the 11th Scandinavian Conf. on Image Analysis.
Ida Hastuti.2009. Content Based Image Retrieval Berdasarkan Fitur Bentuk Menggunakan Metode Gradient Vector Flow Snake. Yogyakarta: Jurnal Teknik Elektro.
Muharrem Mercimek, Kayhan Gulez and Tarik Veli Mumcu.2008. Jurnal: Real object recognition using moment invariants. Yildiz Technical University, Electrical-Electronics Faculty, Electrical Engineering Department.Turkey.
Rao, C., Kumar, S., Mohan, B. (2010). Content Based Image Retrieval using Exact Legendre Moments and Support Vector Machine. India: The International Journal of Multimedia & Its Applications
Recommended