7
BAB 2
KAJIAN PUSTAKA
2.1 Citra
Citra atau image (Referensi : Kulkarni, Arun D., 2001, Computer Vision and
Fuzzy-Neural Systems, Prentice-Hall, Inc., New Jersey, hal. 9) adalah representasi
spasial dari suatu objek yang sebenarnya dalam bidang dua dimensi yang biasanya
ditulis dalam koordinat Cartesian x-y, dan setiap koordinat merepresentasikan satu
sinyal terkecil dari objek. Fungsi citra adalah model matematika yang sering digunakan
untuk menganalisis dimana semua fungsi analisis digunakan untuk mempertimbangkan
citra sebagai fungsi dengan 2 variabel.
2.1.1 Macam- Macam Citra
Setiap orang bekerja dengan banyak variasi raster digital citra seperti
pewarnaan, cetakan dokumen berupa citra abu- abu, rencana pembangunan, citra
dibidang kedokteran seperti x-ray dan lain- lain. Dalam komputasi dengan citra, akan
lebih mudah untuk bekerja dengan mengerti konsep citra analog dan citra digital.
Namun, selain itu masih terdapat citra skala abu- abu (grayscale image). (Referensi :
Burger, Wilhem dan Burge, Mark James, (2008), Digital Image Processing: An
Algorithmic Introduction using Java, edisi pertama, Springer Science+Business
Media,LLC, New York)
8
2.1.1.1 Citra Analog
Secara matematika, citra analog ialah citra dua dimensi F(x,y) yang memiliki
ketelitian tak terbatas di parameter spasial x dan y serta ketelitian yang tak terbatas
untuk intensitas di setiap titik spasial (x,y).
2.1.1.2 Citra Digital
Citra digital ialah citra dua dimensi I[r,c] yang diwakilkan oleh contoh
intensitas array 2 dimensi yang diskrit, yang mana setiapnya diwakilkan menggunakan
ketelitian yang terbatas. Fungsi citra ialah representasi matematik f(x,y) dari citra
sebagai fungsi dua variabel spasial x dan y yang menjelaskan nilai nyata dari citra dan
f(x,y) biasanya juga menjelaskan nilai nyata intensitas atau grayness level citra di titik
(x,y). Citra digital tersusun dalam bentuk raster (grid).
Citra digital hanya sekedar nilai diskrit array dua dimensi persegi panjang.
Baik ruang citra dan jangkauan intensitas dikuantisasi menjadi kumpulan nilai diskrit,
mengizinkan citra untuk disimpan di dalam struktur dua dimensi memori komputer.
Umumnya, intensitas direkam sebagai 8 bit (1byte) yang terdiri dari nilai 0 sampai 255.
256 tingkat yang berbeda biasanya berasal dari semua ketelitian yang disediakan dari
sensor.
Sistem koordinat harus mengalamatkan piksel- piksel individu dari sebuah
citra; untuk mengoperasikannya di program komputer, untuk melihat dalam rumus
matematika, atau mengalamatkannya berhubungan dengan koordinat peralatan.
Sayangnya, peralatan komputer yang berbeda sering menggunakan sistem yang berbeda
9
dan pengguna akan memerlukannya untuk membiasakan mereka. Beruntungnya,
konsep- konsep tersebut tidak terikat dengan sistem koordinat.
Koordinat terkecil ini biasanya disebut piksel. Setiap piksel memiliki nilai
yang menunjukkan intensitas keabuan pada piksel tersebut dan biasanya citra dianggap
sebagai sebuah matriks x-y yang berisi nilai piksel. Bentuk matriks ini kemudian diolah
menurut teori- teori tertentu yang bertujuan untuk memecahkan masalah tertentu, bentuk
matriks adalah perwujudan dari bentuk sinyal digital, sehingga proses pemecahan dan
pengolahan matriks dari citra ini biasanya disebut dengan digital image processing.
2.1.1.2.1 Citra Skala Abu- Abu
Citra skala abu- abu (Gray scale image) ialah sebuah citra digital monokrom
I[r,c] dengan nilai satu intensitas per piksel.
Gambar 2.1.1.2.1.1 citra skala abu-abu
2.1.2 Elemen Citra
Elemen- elemen pada citra adalah sebagai berikut,
- Kecerahan (Brightness )
Kecerahan pada citra ialah intensitas cahaya yang terdapat pada citra
tersebut. Semakin tinggi intensitas cahaya pada citra, maka citra akan
10
semakin tampak putih. Fungsi intensitas cahaya dapat dilihat dari fungsi
f(x,y) dimana f menunjukkan besarnya intensitas cahaya di titik (x,y).
Gambar 2.1.2.1 Brightness
Keterangan : (kiri - kanan) Citra dengan brightness rendah sampai
brightness tinggi.
- Kontras ( Contrast )
Kontras ialah sebaran terang dan gelap dalam sebuah citra. Sebuah citra
dikatakan memiliki kontras yang rendah jika citra tersebut memiliki
komposisi sebagian besar terang atau sebagian besar gelap.
Gambar 2.1.2.2 Contrast
Keterangan : (kiri - kanan) Citra dari kontras yang rendah sampai
gambar dengan kontras yang tinggi.
- Warna ( Color )
Persepsi yang dirasakan mata terhadap panjang gelombang cahaya λ yang
dipantulkan objek. Warna dengan panjang gelombang tertinggi adalah
merah dan warna dengan panjang gelombang terendah ialah ungu (violet).
11
Gambar 2.1.2.3 Color
- Bentuk ( Shape )
Pada citra yang dilihat dengan mata adalah citra 2D, namun sebenarnya
objeknya berupa 3D. Informasi bentuk objek diperoleh dari citra yang
ditangkap sistem visual atau yang disebut dengan segmentasi citra.
- Tekstur ( Texture )
Distribusi spasial dari derajat keabuan didalam sekumpulan piksel yang
bertetangga. Sistem visual manusia tidak menerima informasi per piksel,
namun yang diterima adalah sekumpulan piksel sebagai satuan.
Gambar 2.1.2.4 Texture
- Resolusi ( Resolution )
Resolusi (spasial) menunjukkan tingkat kerincian suatu citra dan dapat
dinyatakan sebagai banyak piksel per satuan panjang, contoh : 120 x 100
m (Semakin kecil ukuran, semakin tinggi resolusi) atau piksel per inci,
contoh : 72dpi (Semakin besar dpi, maka resolusi juga semakin tinggi).
12
2.1.3 Format Citra
Beberapa format berasal dari perusahaan – perusahaan yang membuat
perlengkapan pengolahan citra atau grafik; perangkat lunak dokumentasi umum dan
konversi tersedia. Rincian yang diberikan selanjutnya seharusnya memberikan bacaan
informasi praktis untuk mengatasi citra komputer. Walaupun berubah - ubah sesuai
dengan teknologi, ada beberapa konsep umum yang harus dikuasai. Berikut ini,
beberapa format citra (Referensi : Shapiro, Linda G., and Stockman, George C.,
(2001),Computer Vision, Prentice-Hall, Inc, New Jersey, hal 35-39).
2.1.3.1 PGM: Portable Gray Map
Salah satu format file paling sederhana untuk menyimpan dan menukar data
citra adalah PBM (Portable Bit Map), ini masih berhubungan dengan format
PBM/PGM,PPM. Informasi header dan pixel citra diencoding oleh ASCII.
2.1.3.2 Format file citra GIF
Graphics Interchange Format berasal dari CompuServe, Inc. Dan sudah
digunakan untuk mengencoding sejumlah besar citra di World Wide Web atau di
database di zaman sekarang. File – file GIF saling berhubungan dengan mudah untuk
digunakan, tetapi tidak dapat digunakan untuk warna dengan presisi tinggi ketika hanya
8 bit yang digunakan untuk mengencoding warna. Ada 256 nilai warna yang tersedia
yang biasanya cukup untuk menampilkan citra komputer.
13
2.1.3.3 Format file citra TIFF
Berasal dari Aldus, Corp., TIFF atau TIF sangat umum dan kompleks. Ini
digunakan untuk semua platform yang terkenal dan scanner sering menggunakan format
ini. Kepanjangan TIFF adalah Tag Image File Format, mendukung berbagai citra
dengan 1 sampai 24 bit warna per piksel. Pilihan- pilihan disediakan untuk kompresi
penuh atau kompresi rusak.
2.1.4.4 Format untuk foto : JPEG
JPEG (JFIF/ JFI/ JPG) adalah standar paling terakhir dari Joint Photographic
Experts Group; tujuan utamanya menyediakan kompresi praktis dari kualitas warna
yang tinggi bagi citra. Citra dapat memiliki 64K x 64K piksel dari setiap 24 bit,
walaupun hanya ada satu citra per file. JPEG tidak bergantung dengan sistem koding
pewarnaan, sebuah keuntungan baginya. Untuk mendapatkan kompresi yang tinggi,
skema koding yang rusak dan kompleks, namun flexibel digunakan yang mana sering
dapat mengkompres citra dengan kualitas tinggi dengan degradasi nyata 20:1. Kompresi
bekerja dengan baik ketika daerah yang besar memiliki warna yang hampir sama dan
ketika variasi frekuensi tinggi di daerah terinci tidak terlalu penting bagi pengguna.
Skema kompresi menggunakan transformasi kosinus diskrit yang diikuti oleh koding
Huffman. JPEG tidak didesain untuk video.
2.2 Computer Vision
Computer vision (Referensi : Kulkarni, Arun D., 2001, Computer Vision and
Fuzzy-Neural Systems, Prentice-Hall, Inc., New Jersey, hal. 1) didefinisikan sebagai
sebuah proses mengenal objek- objek penting dari sebuah citra dan dapat digambarkan
14
sebagai properti deduksi logik yang otomatis objek 3 dimensi dari single image atau
multiple image. Computer vision dapat didefinisikan juga sebagai ilmu dan teknologi
mesin dimana mesin dapat mengektrasi informasi dari citra yang diperlukan untuk
menyelesaikan suatu tugas tertentu.
Computer vision sulit untuk diwujudkan karena format citra pada dasarnya
adalah many to one mapping. Tugas- tugas seperti mengidentifikasi tanda tangan,
mengidentifikasi tumor di dalam citra resonansi magnetik, mengenal objek yang
diterima dari citra yang dihasilkan oleh satelit, mengidentifikasi wajah, menentukan
lokasi sumber mineral dari sebuah citra, dan membangun citra tiga dimensi dari
potongan citra dua dimensi dipertimbangkan sebagai lapangan subjek di Computer
Vision. Tipe sistem Computer Vision terdiri dari tingkatan seperti akuisisi citra (image
acquisition), preprocessing, ekstrasi fitur (feature extraction), menyimpan objek dengan
asosiasi, mengakses basis pengetahuan dan pengenalan.
Knowlegde Base
Input image pre‐ feature recognition output Acquisition processing extraction Assosiative Storage Keterangan : Sistem Computer Vision
Gambar 2.2.1 Bagan Sistem Computer Vision
Computer vision melibatkan pengolahan citra (image processing) dan analisa
citra (image analysis), yang mana dari setiap proses terbagi menjadi beberapa cara yang
bertujuan agar citra dapat diekstrasi dan sistem dapat menyelesaikan tugas.
15
2.2.1 Image Acquisition
(Referensi : Burger, Wilhem dan Burge, Mark James, (2008), Digital Image
Processing: An Algorithmic Introduction using Java, edisi pertama, Springer
Science+Business Media,LLC, New York) Proses dimana scene berubah menjadi citra
digital yang bervariasi dan rumit. Pada dasarnya, kebanyakan metode akuisisi citra
bervariasi bergantung pada optik kamera klasik, contohnya model kamera Pinhole yang
dikenal dengan istilah “Camera Obscura”. Kamera Pinhole terdiri dari kotak tertutup
dengan lubang kecil dibagian depan, sehingga cahaya dapat masuk dan membentuk citra
pada dinding yang berlawanan. Cahaya menjadi semakin kecil dan membalikkan citra
ke layar.
Tujuan akuisisi citra adalah memperoleh citra digital. Dari sebuah citra akan
dapat dilihat intesitas cahayanya dan dibuat dalam koordinat f(x,y). X dan y adalah
koordinat spasial dan f pada setiap titik (x,y) sebanding dengan tingkat kecerahan atau
abu- abu suatu gambar pada titik itu. Dari titik- titik tersebut dapat dibentuk matriks
yang merupakan tingkat keabu-abuan pada titik tersebut. Elemen- elemen dari array
digital disebut elemen citra atau piksel. Akuisisi citra ini berhubungan dengan sensor
yang menangkap citra dan sensor tersebut dapat berupa kamera atau scanner.
2.2.2 Preprocessing
Tujuan utama preprocessing adalah membangun deskripsi kanonikal yang
berguna dari bentuk dan permukaan citra yang diberikan. Teknik preprocessing yang
tersedia, termasuk manipulasi gray scale, edge detection, noise filtering, isolasi daerah,
koreksi geometrik, restorasi, rekonstruksi, dan segmentasi. Perubahan intensitas
16
menghasilkan petunjuk yang penting mengenai struktur dari permukaan yang terlihat.
Empat faktor utama yang memberikan nilai intensitas pixel dari sebuah citra adalah :
geometri, reflektansi permukaan yang terlihat, iluminasi scene, dan sudut pandang. Pada
citra yang diberikan, semua faktor ini tercampur aduk. Pada proses vision diawal, kita
menyelesaikan perubahan yang disebabkan oleh faktor apa dan membuat representasi
dimana keempat faktor digabungkan.
Teknik peningkatan citra dapat diklasifikasikan menjadi dua metode: domain
spasial dan domain frekuensi. Metode domain spasial berdasarkan manipulasi langsung
nilai-nilai piksel abu-abu dalam citra. Metode frekuensi domain berdasarkan modifikasi
Fourier transformasi citra. Dalam teknik manipulasi skala abu-abu, peningkatan setiap
titik pada citra tergantung pada nilai abu-abu pada titik itu, atau mungkin tergantung
pada nilai-nilai abu-abu titik dan tetangganya. Kategori pertama disebut sebagai titik
pengolahan.
Tahap preprocessing dalam sistem pengenalan mesin dapat menangani
persepsi tingkat kecerahan serta masalah seperti pemulihan citra dan
rekonstruksi. Sistem akuisisi citra dalam prakteknya tidak sempurna dan memiliki
resolusi terbatas. Metode restorasi citra berurusan dengan memperkirakan citra asli dari
citra yang rusak. Teknik restorasi mengkompensasi degradasi sistem citra yang
mungkin telah mengalami perubahan, dan baru-baru ini, jaringan syaraf tiruan dibangun
untuk restorasi citra.
Tingkat preprocessing berikutnya adalah tingkat menengah. Salah satu teknik
pengolahan terkenal tingkat menengah adalah fitur ekstraksi, yang terdiri dari pemetaan
17
suatu vektor observasi ke ruang fitur. Tujuan utama dari ekstraksi fitur adalah untuk
mengurangi data dengan mengukur fitur tertentu yang membedakan pola input. Untuk
ekstraksi ciri, orang dapat memilih subset dari vektor input yang diamati, atau salah satu
dapat mengubah vektor input pengamatan menggunakan beberapa aplikasi dasar fungsi.
Didalam banyak ortogonal, vektor observasi diperoleh dengan sampling sebuah citra
masukan yang mewakili vektor observasi yang dipetakan ke fitur domain ruang. Data
dalam domain diubah, kemudian dapat diurutkan menurut tingkat signifikansi isi dan
kualitas pola diambil.
2.2.3 Feature Extraction
Selama 30 tahun terakhir, banyak teknik telah dikembangkan untuk ekstraksi
fitur, contohnya Fourier transform, moment invariants, distribusi Wigner, Hough
transform, polymials ortogonal, fungsi gabor, dll. Banyak model jaringan neural telah
diusulkan untuk ekstraksi fitur. Masalah pengakuan invariant objek sering ditangani
pada tahap ekstraksi fitur karena, untuk mempertimbangkan translasi, rotasi, dan
perbedaan skala pada citra, sistem pengenalan harus melatih lebih dari sejumlah besar
sampel pelatihan. Untuk mendapatkan fitur invariant, sifat-sifat transformasi Fourier
sering digunakan. Fitur tekstur (texture feature) sering digunakan untuk mengenali
objek. Teksturnya umumnya diakui sebagai dasar untuk persepsi. Banyak metode
statistik dan struktural, serta model jaringan syaraf tiruan untuk menganalisis tekstur
tersedia. Metode statistik analisis tekstur didasarkan pada hubungan antara nilai-nilai
abu-abu piksel dalam gambar. Ekstraksi fitur panggung juga berkaitan dengan ekstraksi
fitur tekstur.
18
2.2.4 Assosiative Storage
Memori asosiatif adalah memori konten yang beralamat. Kemampuan untuk
mendapatkan satu representasi internal untuk yang lain atau untuk menyimpulkan
sebuah representasi yang kompleks dari pasangan asosiatif yang menyimpan pola
melalui proses mengatur dirinya sendiri dan menghasilkan pola respon yang sesuai pada
penyajian stimulus yang sesuai pola memori. Asosiatif juga berguna untuk pengenalan
objek invariant.
2.2.5 Recognition
Tahap pengenalan berhubungan dengan klasifikasi. Proses ini memberikan
label untuk suatu obyek berdasarkan informasi yang diberikan oleh
deskriptornya. Teknik klasifikasi konvensional dikelompokkan menjadi dua teknik :
diawasi dan tidak diawasi. Dalam mode diawasi, pengklasifikasi belajar dengan bantuan
pengelompokan latihan. Dalam pelatihan mode tanpa pengawasan, klasifikasi belajar
tanpa pengelompokkan pelatihan. Metode statistik dan pengklasifikasi jaringan syaraf
digunakan dengan sukses dalam pengenalan masalah. Bagaimanapun, ada banyak
masalah di dalam praktek di mana metode statistik tidak pantas digunakan dan metode
deskriptif lebih cocok. Metode deskriptif seringkali didasarkan pada aturan klasifikasi
yang memetakan vektor masukan fitur untuk kategori output. Aturan klasifikasi dalam
hal ini dapat disimpan dalam basis pengetahuan.
2.2.6 Knowledege Base
Basis pengetahuan berinteraksi tidak hanya dengan tahap-tahap ekstraksi fitur
dan pengenalan, tetapi juga dengan penyimpanan asosiatif. Pengetahuan sebelumnya
19
tentang suatu objek juga dapat dikodekan dalam basis pengetahuan. Basis pengetahuan
mungkin sederhana seperti rincian daerah dari sebuah citra di mana informasi yang
menarik diketahui berada, sehingga membatasi pencarian yang harus dilakukan dalam
mencari informasi tersebut. Dasar pengetahuan mungkin kompleks. Sistem mesin
pengenalan kebutuhan untuk mencakup semua tahap pengolahan sebelumnya.
Memori digital yang besar, transmisi bandwidth yang tinggi, dan komputer
multimedia pribadi telah memfasilitasi pengembangan database gambar. Penggunaan
yang baik dari banyak citra yang ada memerlukan metode pengambilan data yang
baik. Teknik database yang standar berlaku untuk citra yang telah ditambah dengan
tombol teks, namun, pengambilan berbasis konten diperlukan dan merupakan topik dari
banyak penelitian saat ini. Dengan menyimpan data gambar yang ada dan mesin
memberikan citra yang sama akan sangat membantu banyak pekerjaan, seperti yang
akan dibahas oleh penulis. Dengan menyimpan database citra hasil mamogram,
komputer diharapkan dapat mengambil contoh citra yang mirip dengan citra yang
ditanyakan (query image), sehingga tugas para dokter dapat diselesaikan lebih cepat dan
tepat. Fitur- fitur seperti geometrik, warna dan tekstur dapat berguna untuk membantu
menjalankan database citra yang ditanyakan.
2.3 Pengolahan Citra
Metode pengolahan citra digital berasal dari dua area aplikasi utama yakni
mengubah informasi citra untuk interpretasi manusia dan pengolahan data untuk
persepsi mesin. Pengo1alahan gambar berkaitan dengan analisis citra. Sub area utama
yang termasuk adalah digitisasi dan kompresi, peningkatan, restorasi dan rekonstruksi,
20
pencocokan, dan deksripsi dan pengenalan. Digitisasi adalah proses mengkonversi citra
ke bentuk diskrit. Kompresi berhubungan dengan efisiensi koding atau berhubungan
dengan pendekatan citra digital yang berguna untuk menghemat ruang penyimpanan
atau kapasitas saluran. Teknik peningkatan dan restorasi berkonsetrasi dengan
memperbaiki kualitas yang low- contrast (kontras rendah), blur dan noisy image.
Teknik pencocokan dan deksripsi berhubungan dengan membandingkan dan melapiskan
citra yang satu dengan yang lain, mensegmentasikan citra menjadi bagian- bagian, dan
mengukur hubungan antar bagian tersebut.
2.4 Pengenalan Pola
Pengenalan pola berhubungan dengan mengidentifikasi objek dari pola yang
diamati atau citra. Dalam pengenalan pola konvensional, suatu vektor ebservasi pertama
dipetakan ke ruang fitur. Selama 30 tahun, banyak teknik digital yang sudah dibangun
untuk memproses citra dan tugas untuk mengenal pola yang digunakan untuk aplikasi
praktis seperti penglihatan robot, pengenalan komputer, pengenalan suara, penginderaan
jauh, pengintaian militer, pengidentifikasi tanda tangan, diagnosis citra- citra medikal,
pendeteksian sumber mineral, dan survei geologi.
2.5 Metode CBIR
Content based image retrieval (CBIR) atau yang diartikan retrival citra
berbasis konten dalam bahasa indonesia adalah metode yang menggunakan fitur yang
dapat mengekstrasi citra itu sendiri. (Referensi :James C. French. Department of
Computer Science University of Virginia. Integrating Multiple Multi-Channel CBIR
System). CBIR merupakan teknik untuk mencari kemiripan sebuah citra dengan kriteria
21
citra tertentu dari sekumpulan citra. CBIR merupakan sebuah teknik yang menggunakan
ciri-ciri visual untuk mencari citra dari basis data citra yang berskala besar sesuai dengan
keinginan pengguna.
“Content-based” berarti bahwa pencarian akan menganalisis konten yang
sebenarnya atas sebuah citra. Istilah “Content” dalam konteks ini mungkin merujuk pada
warna, bentuk, tekstur, atau informasi lainnya yang terdapat pada citra tersebut. Content-
based image retrieval (CBIR) merupakan sebuah teknik yang menggunakan ciri-ciri
visual untuk mencari citra dari basis data citra yang berskala besar sesuai dengan
keinginan pengguna. Content-based image retrieval menggunakan ciri-ciri visual dari
citra seperti warna, bentuk, tekstur, dan spatial layout untuk menggambarkan dan
menunjukkan citra. Karena CBIR ini berdasarkan konten, maka dalam menyaring citra
akan memberikan hasil yang lebih akurat.
Teknik CBIR yang digunakan adalah teknik query dengan memberi contoh
yang berarti memasukkan citra query ke dalam program, kemudian menggunakan
algoritma pencarian untuk mencari citra. Algoritma pencarian yang mendasari dapat
bervariasi tergantung pada program. Hasilnya, semua citra yang akan ditest harus sesuai
atau paling tidak sangat mendekati kepada citra yang sudah masukkan ke dalam program
yang telah dibuat. Sebagai contoh, ketika hasil citra dari mamografi dimasukkan ke
dalam program, maka dengan proses CBIR akan dianalisa apakah citra tersebut sama
dengan citra normal atau merupakan citra abnormal, maka akan dicari jarak berapa jauh
dengan citra di dalam database. Biasanya sudah ditentukan batas jarak (pendekatan
kasar) sampai berapa citra yang abnormal itu dapat dikatakan normal.
22
Image Database Query
Database citra secara umum akan memiliki proses seleksi untuk menentukan
citra yang mana yang harus ditambahkan ke dalam koleksi dan proses klasifikasi untuk
menugaskan klasifikasi umum dan kata kunci lainnya untuk citra yang dipilih. Dalam
sistem database yang relasional, entitas dapat diambil berdasarkan nilai dari atibut
textualnya. Atribut yang digunakan untuk mengambil citra harus termasuk klasifikasi
umum, nama benda, nama orang, data buatan, dan sumber. Citra dapat diindeks
menurut atribut ini, sehingga dapat dengan cepat diambil ketika query diterbitkan.
Pendekatan dengan kata kunci memiliki batasan terhadap apa yang dapat dicari.
Pemrograman yang dibuat oleh manusia untuk mengambil citra berdasarkan kata kunci
sangat mahal dan terikat untuk meninggalkan beberapa istilah yang ingin
mereferensikan citra.
Query By Example (QBE)
Query by Example adalah database terminologi untuk sebuah query yang
diformulasikan dengan mengisi nilai dan pembatas di dalam sebuah tabel dan dapat
dikonversikan dengan sebuah sistem. Dalam database standar yang relasional, dimana
nilai atribut biasanya berupa text atau nilai numerik, QBE menyediakan antarmuka
(interface) yang nyaman bagi pengguna, tanpa tambahan kekuatan.
Bukan dengan mengetik kata kunci query, pengguna dapat menunjukkan
sistem sebuah citra contoh, atau menggambar salah satunya secara interaktif dari layar,
atau hanya sketsa gambaran dari sebuah objek. Sistem kemudian dapat mengambil citra
yang mirip atau citra yang mengandung objek yang sama. Ini adalah tujuan dari semua
sistem CBIR. Citra dapat berupa foto digital; contoh gambaran pengguna yang kasar;
sketsa gambar garis; ataupun kosong yang mana kasus pengambilan citra harus sesuai
23
batasan. Batasan berupa kata kunci yang harus direpresentasikan dalam beberapa sistem
indeksi atau oleh objek spesifikasi yang terdapat didalam citra dan bahkan hubungan
spasial diantaranya. Di beberapa kasus yang umum, query adalah citra digital yang
dibandingan dengan citra- citra di database menurut Pengukuran Jarak Citra (Image
Distance Measure). Ketika jarak yang dikembalikan adalah nol, citra dicocokan dengan
tepat dengan query. Semakin besar nilai dari nol mengindikasikan berbagai macam
derajat kemiripan dengan query.
2.5.1 Pengukuran Jarak Citra (Image Distance Measure)
Pertimbangan seberapa mirip citra database dengan query bergantung dengan
pengukur jarak citra mana yang digunakan untuk mempertimbangkan kemiripan. Ada 3
kelas utama dalam mengukur kemiripan, diantaranya :
- Kemiripan warna
- Kemiripan tekstur
- Kemiripan bentuk
2.5.1.1 Pengukuran Kemiripan Warna
Dalam membandingkan citra dengan konten menggunakan jarak ukuran citra
yang membandingkan jarak kesamaan antara dua citra dalam berbagai dimensi seperti
warna, bentuk, tekstur dan lainnya. Misalnya, jarak 0 menandakan persis dengan query.
Jika nilai yang didapat lebih besar dari 0, maka akan dicari berbagai tingkat kesamaan
antar citra. Dan hasil pencariannya kemudian diurutkan dengan jarak berdasarkan citra
query.
24
Pengukuran kemiripan warna membandingkan konten warna dari salah satu
citra dengan konten warna dari citra kedua atau dari spesifikasi query. Query
berdasarkan konten warna mengizinkan pengguna untuk menentukan query dalam batas
persentase warna. Pengguna memilih lima warna dari tabel warna dan menunjukkan
persentase yang diinginkan dari setiap warna.
Mengukur jarak komputasi berdasarkan kesamaan warna dicapai dengan
menghitung histogram warna untuk mengindentifikasi setiap proporsi piksel dalam
sebuah citra yang memegang nilai-nilai tertentu.
2.5.1.2 Pengukuran Kemiripan Tekstur
Tekstur merupakan tindakan mencari pola-pola visual dalam foto dan
bagaimana didefinisikan secara spasial. Tekstur adalah distribusi spasial dari keabuan di
dalam sekumpulan piksel yang dekat. Tekstur ditempatkan dalam sejumlah set yang
tergantung pada seberapa banyak tekstur yang terdeteksi dalam citra. Identifikasi tekstur
dalam citra ini diperoleh oleh pemodelan tekstur sebagai variasi tingkat dua dimensi
abu-abu. Dalam hasilnya piksel dihitung sedemikian rupa sehingga tingkat kontras,
kekasaran, dan keteraturan dapat diestimasi.
Kemiripan tektur lebih kompleks daripada kemiripan warna. Citra yang
memiliki kemiripan tektur dengan query seharusnya memiliki pengaturan spasial yang
sama dengan warna (pola abu- abu), tetapi tidak memerlukan warna yang sama (bukan
pola abu- abu). Pengukuran kemiripan tektur memiliki dua aspek :
- Representasi tekstur dan,
- Definisi kemiripan dengan memperhatikan representasinya
25
Representasi tekstur yang paling umum digunakan adalah vektor deskripsi
tekstur, yang mana vektor angka- angka yang meringkas tekstur dalam citra yang
diberikan atau bagian citra. Ketika vektor deskripsi tekstur dapat digunakan untuk
meringkas tekstur dalam semua citra, ini hanya sebuah metode yang baik untuk
menggambarkan citra tekstur single. Untuk citra yang lebih umum, vektor deskripsi
tekstur dihitung dengan setiap piksel yang mana piksel tersebut dikelompokkan oleh
algoritma clustering yang menetapkan label unik ke setiap kategori tektur yang berbeda
dengan yang ditemukan.
Untuk setiap citra database, vektor deskripsi tekstur query hanya memerlukan
untuk dibandingkan dengan vektor deskripsi tekstur dalam daftar. Pengindeksian dapat
menyediakan pengambilan citra yang lebih cepat.
2.5.1.3 Pengukuran Kemiripan Bentuk
Dengan bentuk suatu wilayah juga dapat dilihat tingkat kecocokan citra.
Bentuk sering diterapkan pada segmentasi pertama dalam mendeteksi awal sebuah citra.
Warna dan tekstur keduanya merupakan atribut global sebuah citra.
Pengukuran jarak berbasis kuantiti ini mencoba untuk menentukan dengan memberikan
citra yang memiliki warna atau tekstur yang ditentukan. Bentuk bukan merupakan
atribut citra; tidak masuk akal untuk menanyakan apa bentuk dari sebuah citra. Bentuk
lebih cenderung direferensikan sebagai bagian yang ditentukan dari sebuah citra.
Histogram bentuk adalah contoh pengukuran sederhana yang dapat mengesampingkan
bentuk yang tidak mungkin dapat dicocokkan, tetapi ini akan mengembalikan banyak
false positif, seperti yang histogram warna lakukan. Teknik- teknik batasan lebih
26
spesifik karena teknik ini bekerja dengan merepresentasikan batasan bentuk dan mencari
bentuk yang mirip dengan batasan. Pencocokan skesta bahkan dapat lebih spesifik,
tidak hanya mencari batasan objek single, tetapi untuk sekumpulan segmen citra yang
melibatkan satu atau lebih objek yang dicocokkan dengan query yang digambarkan oleh
pengguna. (Referensi :Thomas M Deserno. (2007), Ontology of Gaps in Content Based
Image Retrieval)
2.5.1.4 Ecludian Distance
d |f f | ∑ f , f , (1)
Di mana f adalah fitur query dan f adalah fitur dari database, dengan n adalah
banyaknya jumlah fitur.
Dalam bidang medis, CBIR digunakan untuk membantu ahli radiologi dalam
pengambilan citra dengan isi serupa. Metode ini umumnya dikembangkan untuk fitur
citra tertentu, dan akhirnya metode ini dapat digunakan untuk berbagai format citra
medis khususnya dalam citra mamografi. Metode ini terdiri dari dua bagian, yaitu
analisis citra dan retrival citra. Dalam analisis citra, ROI dipilih sebagai contoh untuk
semua dataset dan digunakan untuk menganalisis fitur tekstur berdasarkan tingkat
keabu-abuan (Gray Level Co-occurrance Matrices). Kemudian fitur ini dideskripsikan
lalu dimasukkan ke dalam sistem CBIR. Sehingga, dari deskripsi tersebut dapat
ditentukan yang termasuk normal dan abnormal. (Referensi : Chia-Hung Wei, Chang-
Tsun Li, and Roland Wilson. Department of Computer Science University of Warwick.
27
A General Framework for Content-Based Medical Image Retrieval with its Application
to Mammograms. )
Algoritma yang digunakan dalam sistem CBIR dibagi menjadi 3 tugas yaitu :
- Ekstrasi
mentranformasi citra yang kaya akan konten ke dalam isi berbagai fitur.
Fitur ekstrasi adalah proses menghasilkan fitur yang akan digunakan
dalam pemilihan dan klasifikasi tugas.
- Seleksi
Fitur seleksi mengurangi sejumlah fitur yang disediakan untuk tugas
klasifikasi. Fitur-fitur yang mungkin membantu dalam diskriminasi dipilih
dan digunakan dalam tugas klasifikasi. Fitur yang tidak dipilih akan
dibuang.
- Klasifikasi
Hasil akhir dari tugas klasifikasi adalah seperangkat fitur atau biasa
disebut dengan fitur vektor, yang merupakan representasi citra.
Dari ketiga aktivitas di atas, yang paling penting adalah fitur ekstrasi. Karena
fitur-fitur khusus yang tersedia untuk diskriminasi langsung mempengaruhi efektivitas
tugas klasifikasi. (Referensi : Ryszard S. Choras. Image Feature Extraction Techniques
and Their Application for CBIR and Biometrics Systems).
Pada content-based image retrieval, ciri-ciri visual pada citra diekstrak dan
digambarkan sebagai feature vector multidimensional. Feature vector pada citra- citra
yang berada di dalam basis data membentuk sebuah feature database. Untuk mencari
28
citra, pengguna memberikan contoh citra (citra query) pada sistem pencarian. Sistem
kemudian menghitung nilai-nilai feature vector pada citra query tersebut. Besarnya nilai
kesamaan atau jarak antara feature vector dari citra query dengan yang ada di dalam
basis data kemudian dihitung dan diurutkan berdasarkan jarak yang terkecil. Dengan
adanya proses pengurutan jarak akan mempermudah pengguna di dalam mencari citra
yang tersimpan di dalam basis data.
(Referensi : Isa Sani Muhamad, Juwita Elsa. (2007), Aplikasi Image Retrieval
Berdasarkan Tekstur dengan Menggunakan Transformasi Haar Wavelet.)
2.6 ROI (Region of Interest)
ROI atau Region of Interest adalah bagian yang dipilih sebagai sampel dalam
dataset yang diidentifikasi untuk tujuan tertentu. Konsep ROI biasanya digunakan dalam
pencitraan medis, oleh karena itu disini kita menggunakan konsep ini karena kita sedang
membahas tentang masalah kanker payudara. Untuk lebih mengefesiensikan sistem
CBIR, maka kita menggunakan ROI agar kita dapat memilih region of interest (ROI) dan
sistem tersebut akan mencari semua citra di dalam database untuk menemukan daerah
atau bagian yang berhubungan. (Referensi : Yung-Gi, Wu. Region of Interest Image
Indexing System by DCT and Entropy.)
2.7 GLCM (Gray Level Co-occurrence Matrix)
GLCM adalah matriks yang menjelaskan frekuensi satu level abu-abu yang
muncul dalam ruang linier tertentu yang mempunyai hubungan dengan level abu-abu
lainnya dalam bidang investigasi. Di sini, co-occurrence matrix dihitung berdasarkan
dua parameter, yaitu jarak relatif antara pasangan piksel d yang diukur dalam angka
piksel dan orientasi relatif φ. (Referensi :M.M Mokji. Gray Level Co-occurrence Matrix
Computation Based on Haar Wavelet)
o
d
d
m
e
C
G
b
b
GL
occurance d
dengan set ti
dimana d me
menunjukka
elemen-elem
Citra I pada
GLCM did
bertetangga
bernilai 1 da
GLCM meru
dari fitur tek
ingkat keabu
P(i,j
(x
f(x
enunjukkan j
an orientasi j
men di dalam
G
a gambar 2.7
dapat denga
pada citra I
an di sampin
upakan meto
kstural. Misa
u-abuan Ng, m
,j,d, φ) = car
x2,y2) =(x1,y1)
(x1,y1) = i, f(x
jarak antara
ajaran (x1,y1)
m set.
Gambar 2.7.1
7.1 di atas di
an mengkal
I dengan jara
ngnya bernil
ode statistik
alkan diberik
menetapkan
rd { ((x1,y1),
) + (d cos Ɵ
x2,y2) = j,,0 ≤
piksel (x1,y1)
) dan (x2,y2),
1 GLCM (su
iubah menja
lkulasikan
ak d. Contoh
lai 1, kemud
k untuk m
kan citra den
matriks p(i,j
(x2,y2)) ∈ (L
Ɵ, d sin Ɵ),
≤ i,j < Ng}
1) dan (x2,y2)
, dan card {
mber: www.
adi matriks G
jumlah set
h di atas nil
dian dihitung
menghitung
ngan f(x,y) b
j,d,�) sebag
Lr × Lc) x (Lr
di dalam ga
⋅} menunjuk
.mathworks.
GLCM, di m
tiap pasang
ai piksel pad
g banyaknya
probabilitas
berukuran Lr
gai
r × Lc) |
ambar, φ
kkan nomor
com)
mana nilai m
gan nilai p
da sudut kir
a pasangan p
29
s co-
r × Lc
dari
atriks
piksel
ri atas
piksel
30
yang bernilai [1 1]. Dimensi matriks GLCM adalah sebesar n x n, di mana n adalah nilai
piksel terbesar citra I. Berdasarkan contoh di atas, pasangan nilai piksel [1 1] berjumlah
1, lalu dibuat matriks GLCM pada titik (1, 1) dengan nilai 1. Demikian pula titik (1,2)
yang berasal dari jumlah pasangan [1 2] bernilai 2.
Fitur tekstur yang dapat di ekstraksi dari gray level co-occurrence matrices adalah :
Angular Second Moment (ASM) = ∑ ∑ p i, j (2)
Contrast = ∑ n ∑ ∑ p i, jN
| |
NN (3)
Correlation = ∑ ∑ , μ μ
σ σ (4)
Variance = ∑ ∑ i j i, j (5)
Inverse Difference Moment (ID_Mom) = ∑ ∑ i, j (6)
Sum Average (Sum_Aver) = ∑ iN (7)
Sum Variance (Sum_Var) = ∑ i Sum_Entro iN (8)
Sum Entropy (Sum_Entro) = ∑ p i log iN (9)
Entropy = ∑ ∑ p i, j log i, j (10)
Different Variance (Diff_Vari) = variance of px,y (11)
Different Entropy (Diff_Entro) = ∑ p i log iN (12)
Untuk mengembangkan deskriptor yang disesuaikan dijelaskan di bagian
selanjutnya, maka diperlukan untuk menganalisis fitur dari mamografi. Dalam studi ini,
matriks GLCM dibangun untuk menghitung ROI di masing-masing arah 00, 450, 900, dan
1350. (Referensi : Chia-Hung Wei, Chang-Tsun Li, and Roland Wilson. Department of
31
Computer Science University of Warwick. A General Framework for Content-Based
Medical Image Retrieval with its Application to Mammograms. )
2.8 Analisis Diskriminan
Analisis diskriminan merupakan suatu proses analisis dengan fungsi diskriminan (regresi
linear berganda) yang secara umum dinotasikan sebagai berikut:
(13)
di mana konstanta bn , n= 0,1,2,...,p dicari dengan persamaan berikut,
(14)
(15)
(16)
dalam hal ini, Yi adalah variabel output yang dihendaki untuk membedakan kategori
normal dan abnormal. Pada penelitian ini untuk kategori normal Yi bernilai 1 dan
bernilai 0 untuk kategori abnormal, sedangkan X1,X2, ... ,Xp adalah variabel bebas yang
terdiri dari seluruh fitur yang digunakan.
2.9 False Positive dan False Negative
Beberapa masalah yang khusus two-class problems dimana arti class bisa
menjadi : (a) objek baik versus objek buruk; (b) objek yang muncul di citra versus objek
yang tidak muncul; atau (c) orang memiliki penyakit D versus orang yang tidak
memiliki penyakit D. Disini, kesalahan mengambil arti khusus dan tidak simetris.
∑ ∑∑∑ =++++ ikikii YXbXbXbnb ...22110
∑ ∑∑∑∑ =++++ iikiikiiii YXXXbXXbXbXb 112122
1110 ...
∑ ∑∑∑∑ =++++ ikikikikiikiki YXXbXXbXXbXb 222110 ...
32
Kasus (c) lebih edukatif : jika sistem dengan salah mengatakan bahwa orang yang
memiliki penyakit D, kemudian kesalahan ini disebut false alarm atau false positive;
dimana jika sistem dengan salah mengatakan bahwa orang tersebut tidak memiliki
penyakit D, kemudian kesalahan ini disebut false dismissal atau false negative Dalam
kasus false positive, mungkin berarti bahwa orang tersebut akan menjalani lebih banyak
test, atau mengambil obat yang tidak diperlukan. Dalam kasus false negative, diagnosa
terlewatkan dan orang tersebut tidak dapat dirawat, mungkin dapat menyebabkan
kematian. Karena akibat kesalahan yang sangat hebat, adalah masuk akal untuk
membuat prasangka keputusan tersebut dalam usaha untuk meminimalkan false negative
sebagai akibat dari peningkatan sejumlah false positive. Kasus (b) dapat berarti
membuang- buang energi dengan menyalakan lampu ketika benar- benar tidak ada
gerakan dalam layar atau menghitung mobil di jalan raya ketika ada satu yang tidak
lewat; false negative dalam kasus (b) juga memiliki konsekuensi yang penting.
(Referensi : Shapiro, Linda G., and Stockman, George C., (2001),Computer Vision,
Prentice-Hall, Inc, New Jersey, hal 96-97).
2.10 Precision Versus Recall
Dalam aplikasi pengambilan dokumen atau pengambilan citra, objektif
mengambil objek penting class C1 dan tidak terlalu banyak objek yang tidak penting
class C2 menurut fitur yang disediakan dalam citra query. Sebagai contoh, pengguna
mungkin tertarik dalam pengambilan citra matahari terbenam, atau mungkin kuda- kuda.
Pertunjukkan seperti sebuah sistem dikarakteristikan oleh precision dan recall.
33
Precision dari sebuah sistem pengambilan citra adalah sejumlah citra relevan
(true C1) yang diambil dibagi dengan total citra yang diambil (true C1 ditambah false
positive yang sebenarnya dari C2).
Recall dari sebuah sistem pengambilan citra adalah sejumlah citra relevan
yang diambil dari sistem yang dibagi total citra relevan dalam database. Disamakan,
ini adalah sejumlah true C1 citra yang diambil dibagi dengan total true C1 citra yang
diambil dan false negative.
Sebagai contoh, dugaan database citra berisi 200 citra matahari terbenam
yang akan membuat pengguna tertarik dan yang pengguna harapkan akan cocok dengan
query. Dugaan sistem mengambil 150 dari 200 relevan citra dan 100 citra lainnya dari
citra yang tidak menarik bagi pengguna. Precision dari operasi pengambilan
(klasifikasi) adalah 150/250 = 60% dan recall adalah 150/200 = 75%. Sistem dapat
berisi 100% recall jika ia mengembalikan semua citra dalam database, tetapi kemudian
precision –nya akan menjadi sangat buruk. Alternatifnya, jika klasifikasi dengan rapat
diatur untuk tingkat false positive yang rendah, kemudian precision akan menjadi tinggi,
tetapi recall akan menjadi rendah. (Referensi : Shapiro, Linda G., and Stockman, George
C., (2001),Computer Vision, Prentice-Hall, Inc, New Jersey, hal 97-98).