Download pdf - BAB 2 KAJIAN PUSTAKA 2.1 Citra - library.binus.ac.id fileuntuk intensitas di setiap titik spasial (x,y). 2.1.1.2 Citra Digital Citra digital ialah citra dua dimensi I[r,c] yang diwakilkan

7

BAB 2

KAJIAN PUSTAKA

2.1 Citra

Citra atau image (Referensi : Kulkarni, Arun D., 2001, Computer Vision and

Fuzzy-Neural Systems, Prentice-Hall, Inc., New Jersey, hal. 9) adalah representasi

spasial dari suatu objek yang sebenarnya dalam bidang dua dimensi yang biasanya

ditulis dalam koordinat Cartesian x-y, dan setiap koordinat merepresentasikan satu

sinyal terkecil dari objek. Fungsi citra adalah model matematika yang sering digunakan

untuk menganalisis dimana semua fungsi analisis digunakan untuk mempertimbangkan

citra sebagai fungsi dengan 2 variabel.

2.1.1 Macam- Macam Citra

Setiap orang bekerja dengan banyak variasi raster digital citra seperti

pewarnaan, cetakan dokumen berupa citra abu- abu, rencana pembangunan, citra

dibidang kedokteran seperti x-ray dan lain- lain. Dalam komputasi dengan citra, akan

lebih mudah untuk bekerja dengan mengerti konsep citra analog dan citra digital.

Namun, selain itu masih terdapat citra skala abu- abu (grayscale image). (Referensi :

Burger, Wilhem dan Burge, Mark James, (2008), Digital Image Processing: An

Algorithmic Introduction using Java, edisi pertama, Springer Science+Business

Media,LLC, New York)

8

2.1.1.1 Citra Analog

Secara matematika, citra analog ialah citra dua dimensi F(x,y) yang memiliki

ketelitian tak terbatas di parameter spasial x dan y serta ketelitian yang tak terbatas

untuk intensitas di setiap titik spasial (x,y).

2.1.1.2 Citra Digital

Citra digital ialah citra dua dimensi I[r,c] yang diwakilkan oleh contoh

intensitas array 2 dimensi yang diskrit, yang mana setiapnya diwakilkan menggunakan

ketelitian yang terbatas. Fungsi citra ialah representasi matematik f(x,y) dari citra

sebagai fungsi dua variabel spasial x dan y yang menjelaskan nilai nyata dari citra dan

f(x,y) biasanya juga menjelaskan nilai nyata intensitas atau grayness level citra di titik

(x,y). Citra digital tersusun dalam bentuk raster (grid).

Citra digital hanya sekedar nilai diskrit array dua dimensi persegi panjang.

Baik ruang citra dan jangkauan intensitas dikuantisasi menjadi kumpulan nilai diskrit,

mengizinkan citra untuk disimpan di dalam struktur dua dimensi memori komputer.

Umumnya, intensitas direkam sebagai 8 bit (1byte) yang terdiri dari nilai 0 sampai 255.

256 tingkat yang berbeda biasanya berasal dari semua ketelitian yang disediakan dari

sensor.

Sistem koordinat harus mengalamatkan piksel- piksel individu dari sebuah

citra; untuk mengoperasikannya di program komputer, untuk melihat dalam rumus

matematika, atau mengalamatkannya berhubungan dengan koordinat peralatan.

Sayangnya, peralatan komputer yang berbeda sering menggunakan sistem yang berbeda

9

dan pengguna akan memerlukannya untuk membiasakan mereka. Beruntungnya,

konsep- konsep tersebut tidak terikat dengan sistem koordinat.

Koordinat terkecil ini biasanya disebut piksel. Setiap piksel memiliki nilai

yang menunjukkan intensitas keabuan pada piksel tersebut dan biasanya citra dianggap

sebagai sebuah matriks x-y yang berisi nilai piksel. Bentuk matriks ini kemudian diolah

menurut teori- teori tertentu yang bertujuan untuk memecahkan masalah tertentu, bentuk

matriks adalah perwujudan dari bentuk sinyal digital, sehingga proses pemecahan dan

pengolahan matriks dari citra ini biasanya disebut dengan digital image processing.

2.1.1.2.1 Citra Skala Abu- Abu

Citra skala abu- abu (Gray scale image) ialah sebuah citra digital monokrom

I[r,c] dengan nilai satu intensitas per piksel.

Gambar 2.1.1.2.1.1 citra skala abu-abu

2.1.2 Elemen Citra

Elemen- elemen pada citra adalah sebagai berikut,

- Kecerahan (Brightness )

Kecerahan pada citra ialah intensitas cahaya yang terdapat pada citra

tersebut. Semakin tinggi intensitas cahaya pada citra, maka citra akan

10

semakin tampak putih. Fungsi intensitas cahaya dapat dilihat dari fungsi

f(x,y) dimana f menunjukkan besarnya intensitas cahaya di titik (x,y).

Gambar 2.1.2.1 Brightness

Keterangan : (kiri - kanan) Citra dengan brightness rendah sampai

brightness tinggi.

- Kontras ( Contrast )

Kontras ialah sebaran terang dan gelap dalam sebuah citra. Sebuah citra

dikatakan memiliki kontras yang rendah jika citra tersebut memiliki

komposisi sebagian besar terang atau sebagian besar gelap.

Gambar 2.1.2.2 Contrast

Keterangan : (kiri - kanan) Citra dari kontras yang rendah sampai

gambar dengan kontras yang tinggi.

- Warna ( Color )

Persepsi yang dirasakan mata terhadap panjang gelombang cahaya λ yang

dipantulkan objek. Warna dengan panjang gelombang tertinggi adalah

merah dan warna dengan panjang gelombang terendah ialah ungu (violet).

11

Gambar 2.1.2.3 Color

- Bentuk ( Shape )

Pada citra yang dilihat dengan mata adalah citra 2D, namun sebenarnya

objeknya berupa 3D. Informasi bentuk objek diperoleh dari citra yang

ditangkap sistem visual atau yang disebut dengan segmentasi citra.

- Tekstur ( Texture )

Distribusi spasial dari derajat keabuan didalam sekumpulan piksel yang

bertetangga. Sistem visual manusia tidak menerima informasi per piksel,

namun yang diterima adalah sekumpulan piksel sebagai satuan.

Gambar 2.1.2.4 Texture

- Resolusi ( Resolution )

Resolusi (spasial) menunjukkan tingkat kerincian suatu citra dan dapat

dinyatakan sebagai banyak piksel per satuan panjang, contoh : 120 x 100

m (Semakin kecil ukuran, semakin tinggi resolusi) atau piksel per inci,

contoh : 72dpi (Semakin besar dpi, maka resolusi juga semakin tinggi).

12

2.1.3 Format Citra

Beberapa format berasal dari perusahaan – perusahaan yang membuat

perlengkapan pengolahan citra atau grafik; perangkat lunak dokumentasi umum dan

konversi tersedia. Rincian yang diberikan selanjutnya seharusnya memberikan bacaan

informasi praktis untuk mengatasi citra komputer. Walaupun berubah - ubah sesuai

dengan teknologi, ada beberapa konsep umum yang harus dikuasai. Berikut ini,

beberapa format citra (Referensi : Shapiro, Linda G., and Stockman, George C.,

(2001),Computer Vision, Prentice-Hall, Inc, New Jersey, hal 35-39).

2.1.3.1 PGM: Portable Gray Map

Salah satu format file paling sederhana untuk menyimpan dan menukar data

citra adalah PBM (Portable Bit Map), ini masih berhubungan dengan format

PBM/PGM,PPM. Informasi header dan pixel citra diencoding oleh ASCII.

2.1.3.2 Format file citra GIF

Graphics Interchange Format berasal dari CompuServe, Inc. Dan sudah

digunakan untuk mengencoding sejumlah besar citra di World Wide Web atau di

database di zaman sekarang. File – file GIF saling berhubungan dengan mudah untuk

digunakan, tetapi tidak dapat digunakan untuk warna dengan presisi tinggi ketika hanya

8 bit yang digunakan untuk mengencoding warna. Ada 256 nilai warna yang tersedia

yang biasanya cukup untuk menampilkan citra komputer.

13

2.1.3.3 Format file citra TIFF

Berasal dari Aldus, Corp., TIFF atau TIF sangat umum dan kompleks. Ini

digunakan untuk semua platform yang terkenal dan scanner sering menggunakan format

ini. Kepanjangan TIFF adalah Tag Image File Format, mendukung berbagai citra

dengan 1 sampai 24 bit warna per piksel. Pilihan- pilihan disediakan untuk kompresi

penuh atau kompresi rusak.

2.1.4.4 Format untuk foto : JPEG

JPEG (JFIF/ JFI/ JPG) adalah standar paling terakhir dari Joint Photographic

Experts Group; tujuan utamanya menyediakan kompresi praktis dari kualitas warna

yang tinggi bagi citra. Citra dapat memiliki 64K x 64K piksel dari setiap 24 bit,

walaupun hanya ada satu citra per file. JPEG tidak bergantung dengan sistem koding

pewarnaan, sebuah keuntungan baginya. Untuk mendapatkan kompresi yang tinggi,

skema koding yang rusak dan kompleks, namun flexibel digunakan yang mana sering

dapat mengkompres citra dengan kualitas tinggi dengan degradasi nyata 20:1. Kompresi

bekerja dengan baik ketika daerah yang besar memiliki warna yang hampir sama dan

ketika variasi frekuensi tinggi di daerah terinci tidak terlalu penting bagi pengguna.

Skema kompresi menggunakan transformasi kosinus diskrit yang diikuti oleh koding

Huffman. JPEG tidak didesain untuk video.

2.2 Computer Vision

Computer vision (Referensi : Kulkarni, Arun D., 2001, Computer Vision and

Fuzzy-Neural Systems, Prentice-Hall, Inc., New Jersey, hal. 1) didefinisikan sebagai

sebuah proses mengenal objek- objek penting dari sebuah citra dan dapat digambarkan

14

sebagai properti deduksi logik yang otomatis objek 3 dimensi dari single image atau

multiple image. Computer vision dapat didefinisikan juga sebagai ilmu dan teknologi

mesin dimana mesin dapat mengektrasi informasi dari citra yang diperlukan untuk

menyelesaikan suatu tugas tertentu.

Computer vision sulit untuk diwujudkan karena format citra pada dasarnya

adalah many to one mapping. Tugas- tugas seperti mengidentifikasi tanda tangan,

mengidentifikasi tumor di dalam citra resonansi magnetik, mengenal objek yang

diterima dari citra yang dihasilkan oleh satelit, mengidentifikasi wajah, menentukan

lokasi sumber mineral dari sebuah citra, dan membangun citra tiga dimensi dari

potongan citra dua dimensi dipertimbangkan sebagai lapangan subjek di Computer

Vision. Tipe sistem Computer Vision terdiri dari tingkatan seperti akuisisi citra (image

acquisition), preprocessing, ekstrasi fitur (feature extraction), menyimpan objek dengan

asosiasi, mengakses basis pengetahuan dan pengenalan.

Knowlegde Base

Input image pre‐ feature recognition output Acquisition processing extraction Assosiative Storage Keterangan : Sistem Computer Vision

Gambar 2.2.1 Bagan Sistem Computer Vision

Computer vision melibatkan pengolahan citra (image processing) dan analisa

citra (image analysis), yang mana dari setiap proses terbagi menjadi beberapa cara yang

bertujuan agar citra dapat diekstrasi dan sistem dapat menyelesaikan tugas.

15

2.2.1 Image Acquisition

(Referensi : Burger, Wilhem dan Burge, Mark James, (2008), Digital Image

Processing: An Algorithmic Introduction using Java, edisi pertama, Springer

Science+Business Media,LLC, New York) Proses dimana scene berubah menjadi citra

digital yang bervariasi dan rumit. Pada dasarnya, kebanyakan metode akuisisi citra

bervariasi bergantung pada optik kamera klasik, contohnya model kamera Pinhole yang

dikenal dengan istilah “Camera Obscura”. Kamera Pinhole terdiri dari kotak tertutup

dengan lubang kecil dibagian depan, sehingga cahaya dapat masuk dan membentuk citra

pada dinding yang berlawanan. Cahaya menjadi semakin kecil dan membalikkan citra

ke layar.

Tujuan akuisisi citra adalah memperoleh citra digital. Dari sebuah citra akan

dapat dilihat intesitas cahayanya dan dibuat dalam koordinat f(x,y). X dan y adalah

koordinat spasial dan f pada setiap titik (x,y) sebanding dengan tingkat kecerahan atau

abu- abu suatu gambar pada titik itu. Dari titik- titik tersebut dapat dibentuk matriks

yang merupakan tingkat keabu-abuan pada titik tersebut. Elemen- elemen dari array

digital disebut elemen citra atau piksel. Akuisisi citra ini berhubungan dengan sensor

yang menangkap citra dan sensor tersebut dapat berupa kamera atau scanner.

2.2.2 Preprocessing

Tujuan utama preprocessing adalah membangun deskripsi kanonikal yang

berguna dari bentuk dan permukaan citra yang diberikan. Teknik preprocessing yang

tersedia, termasuk manipulasi gray scale, edge detection, noise filtering, isolasi daerah,

koreksi geometrik, restorasi, rekonstruksi, dan segmentasi. Perubahan intensitas

16

menghasilkan petunjuk yang penting mengenai struktur dari permukaan yang terlihat.

Empat faktor utama yang memberikan nilai intensitas pixel dari sebuah citra adalah :

geometri, reflektansi permukaan yang terlihat, iluminasi scene, dan sudut pandang. Pada

citra yang diberikan, semua faktor ini tercampur aduk. Pada proses vision diawal, kita

menyelesaikan perubahan yang disebabkan oleh faktor apa dan membuat representasi

dimana keempat faktor digabungkan.

Teknik peningkatan citra dapat diklasifikasikan menjadi dua metode: domain

spasial dan domain frekuensi. Metode domain spasial berdasarkan manipulasi langsung

nilai-nilai piksel abu-abu dalam citra. Metode frekuensi domain berdasarkan modifikasi

Fourier transformasi citra. Dalam teknik manipulasi skala abu-abu, peningkatan setiap

titik pada citra tergantung pada nilai abu-abu pada titik itu, atau mungkin tergantung

pada nilai-nilai abu-abu titik dan tetangganya. Kategori pertama disebut sebagai titik

pengolahan.

Tahap preprocessing dalam sistem pengenalan mesin dapat menangani

persepsi tingkat kecerahan serta masalah seperti pemulihan citra dan

rekonstruksi. Sistem akuisisi citra dalam prakteknya tidak sempurna dan memiliki

resolusi terbatas. Metode restorasi citra berurusan dengan memperkirakan citra asli dari

citra yang rusak. Teknik restorasi mengkompensasi degradasi sistem citra yang

mungkin telah mengalami perubahan, dan baru-baru ini, jaringan syaraf tiruan dibangun

untuk restorasi citra.

Tingkat preprocessing berikutnya adalah tingkat menengah. Salah satu teknik

pengolahan terkenal tingkat menengah adalah fitur ekstraksi, yang terdiri dari pemetaan

17

suatu vektor observasi ke ruang fitur. Tujuan utama dari ekstraksi fitur adalah untuk

mengurangi data dengan mengukur fitur tertentu yang membedakan pola input. Untuk

ekstraksi ciri, orang dapat memilih subset dari vektor input yang diamati, atau salah satu

dapat mengubah vektor input pengamatan menggunakan beberapa aplikasi dasar fungsi.

Didalam banyak ortogonal, vektor observasi diperoleh dengan sampling sebuah citra

masukan yang mewakili vektor observasi yang dipetakan ke fitur domain ruang. Data

dalam domain diubah, kemudian dapat diurutkan menurut tingkat signifikansi isi dan

kualitas pola diambil.

2.2.3 Feature Extraction

Selama 30 tahun terakhir, banyak teknik telah dikembangkan untuk ekstraksi

fitur, contohnya Fourier transform, moment invariants, distribusi Wigner, Hough

transform, polymials ortogonal, fungsi gabor, dll. Banyak model jaringan neural telah

diusulkan untuk ekstraksi fitur. Masalah pengakuan invariant objek sering ditangani

pada tahap ekstraksi fitur karena, untuk mempertimbangkan translasi, rotasi, dan

perbedaan skala pada citra, sistem pengenalan harus melatih lebih dari sejumlah besar

sampel pelatihan. Untuk mendapatkan fitur invariant, sifat-sifat transformasi Fourier

sering digunakan. Fitur tekstur (texture feature) sering digunakan untuk mengenali

objek. Teksturnya umumnya diakui sebagai dasar untuk persepsi. Banyak metode

statistik dan struktural, serta model jaringan syaraf tiruan untuk menganalisis tekstur

tersedia. Metode statistik analisis tekstur didasarkan pada hubungan antara nilai-nilai

abu-abu piksel dalam gambar. Ekstraksi fitur panggung juga berkaitan dengan ekstraksi

fitur tekstur.

18

2.2.4 Assosiative Storage

Memori asosiatif adalah memori konten yang beralamat. Kemampuan untuk

mendapatkan satu representasi internal untuk yang lain atau untuk menyimpulkan

sebuah representasi yang kompleks dari pasangan asosiatif yang menyimpan pola

melalui proses mengatur dirinya sendiri dan menghasilkan pola respon yang sesuai pada

penyajian stimulus yang sesuai pola memori. Asosiatif juga berguna untuk pengenalan

objek invariant.

2.2.5 Recognition

Tahap pengenalan berhubungan dengan klasifikasi. Proses ini memberikan

label untuk suatu obyek berdasarkan informasi yang diberikan oleh

deskriptornya. Teknik klasifikasi konvensional dikelompokkan menjadi dua teknik :

diawasi dan tidak diawasi. Dalam mode diawasi, pengklasifikasi belajar dengan bantuan

pengelompokan latihan. Dalam pelatihan mode tanpa pengawasan, klasifikasi belajar

tanpa pengelompokkan pelatihan. Metode statistik dan pengklasifikasi jaringan syaraf

digunakan dengan sukses dalam pengenalan masalah. Bagaimanapun, ada banyak

masalah di dalam praktek di mana metode statistik tidak pantas digunakan dan metode

deskriptif lebih cocok. Metode deskriptif seringkali didasarkan pada aturan klasifikasi

yang memetakan vektor masukan fitur untuk kategori output. Aturan klasifikasi dalam

hal ini dapat disimpan dalam basis pengetahuan.

2.2.6 Knowledege Base

Basis pengetahuan berinteraksi tidak hanya dengan tahap-tahap ekstraksi fitur

dan pengenalan, tetapi juga dengan penyimpanan asosiatif. Pengetahuan sebelumnya

19

tentang suatu objek juga dapat dikodekan dalam basis pengetahuan. Basis pengetahuan

mungkin sederhana seperti rincian daerah dari sebuah citra di mana informasi yang

menarik diketahui berada, sehingga membatasi pencarian yang harus dilakukan dalam

mencari informasi tersebut. Dasar pengetahuan mungkin kompleks. Sistem mesin

pengenalan kebutuhan untuk mencakup semua tahap pengolahan sebelumnya.

Memori digital yang besar, transmisi bandwidth yang tinggi, dan komputer

multimedia pribadi telah memfasilitasi pengembangan database gambar. Penggunaan

yang baik dari banyak citra yang ada memerlukan metode pengambilan data yang

baik. Teknik database yang standar berlaku untuk citra yang telah ditambah dengan

tombol teks, namun, pengambilan berbasis konten diperlukan dan merupakan topik dari

banyak penelitian saat ini. Dengan menyimpan data gambar yang ada dan mesin

memberikan citra yang sama akan sangat membantu banyak pekerjaan, seperti yang

akan dibahas oleh penulis. Dengan menyimpan database citra hasil mamogram,

komputer diharapkan dapat mengambil contoh citra yang mirip dengan citra yang

ditanyakan (query image), sehingga tugas para dokter dapat diselesaikan lebih cepat dan

tepat. Fitur- fitur seperti geometrik, warna dan tekstur dapat berguna untuk membantu

menjalankan database citra yang ditanyakan.

2.3 Pengolahan Citra

Metode pengolahan citra digital berasal dari dua area aplikasi utama yakni

mengubah informasi citra untuk interpretasi manusia dan pengolahan data untuk

persepsi mesin. Pengo1alahan gambar berkaitan dengan analisis citra. Sub area utama

yang termasuk adalah digitisasi dan kompresi, peningkatan, restorasi dan rekonstruksi,

20

pencocokan, dan deksripsi dan pengenalan. Digitisasi adalah proses mengkonversi citra

ke bentuk diskrit. Kompresi berhubungan dengan efisiensi koding atau berhubungan

dengan pendekatan citra digital yang berguna untuk menghemat ruang penyimpanan

atau kapasitas saluran. Teknik peningkatan dan restorasi berkonsetrasi dengan

memperbaiki kualitas yang low- contrast (kontras rendah), blur dan noisy image.

Teknik pencocokan dan deksripsi berhubungan dengan membandingkan dan melapiskan

citra yang satu dengan yang lain, mensegmentasikan citra menjadi bagian- bagian, dan

mengukur hubungan antar bagian tersebut.

2.4 Pengenalan Pola

Pengenalan pola berhubungan dengan mengidentifikasi objek dari pola yang

diamati atau citra. Dalam pengenalan pola konvensional, suatu vektor ebservasi pertama

dipetakan ke ruang fitur. Selama 30 tahun, banyak teknik digital yang sudah dibangun

untuk memproses citra dan tugas untuk mengenal pola yang digunakan untuk aplikasi

praktis seperti penglihatan robot, pengenalan komputer, pengenalan suara, penginderaan

jauh, pengintaian militer, pengidentifikasi tanda tangan, diagnosis citra- citra medikal,

pendeteksian sumber mineral, dan survei geologi.

2.5 Metode CBIR

Content based image retrieval (CBIR) atau yang diartikan retrival citra

berbasis konten dalam bahasa indonesia adalah metode yang menggunakan fitur yang

dapat mengekstrasi citra itu sendiri. (Referensi :James C. French. Department of

Computer Science University of Virginia. Integrating Multiple Multi-Channel CBIR

System). CBIR merupakan teknik untuk mencari kemiripan sebuah citra dengan kriteria

21

citra tertentu dari sekumpulan citra. CBIR merupakan sebuah teknik yang menggunakan

ciri-ciri visual untuk mencari citra dari basis data citra yang berskala besar sesuai dengan

keinginan pengguna.

“Content-based” berarti bahwa pencarian akan menganalisis konten yang

sebenarnya atas sebuah citra. Istilah “Content” dalam konteks ini mungkin merujuk pada

warna, bentuk, tekstur, atau informasi lainnya yang terdapat pada citra tersebut. Content-

based image retrieval (CBIR) merupakan sebuah teknik yang menggunakan ciri-ciri

visual untuk mencari citra dari basis data citra yang berskala besar sesuai dengan

keinginan pengguna. Content-based image retrieval menggunakan ciri-ciri visual dari

citra seperti warna, bentuk, tekstur, dan spatial layout untuk menggambarkan dan

menunjukkan citra. Karena CBIR ini berdasarkan konten, maka dalam menyaring citra

akan memberikan hasil yang lebih akurat.

Teknik CBIR yang digunakan adalah teknik query dengan memberi contoh

yang berarti memasukkan citra query ke dalam program, kemudian menggunakan

algoritma pencarian untuk mencari citra. Algoritma pencarian yang mendasari dapat

bervariasi tergantung pada program. Hasilnya, semua citra yang akan ditest harus sesuai

atau paling tidak sangat mendekati kepada citra yang sudah masukkan ke dalam program

yang telah dibuat. Sebagai contoh, ketika hasil citra dari mamografi dimasukkan ke

dalam program, maka dengan proses CBIR akan dianalisa apakah citra tersebut sama

dengan citra normal atau merupakan citra abnormal, maka akan dicari jarak berapa jauh

dengan citra di dalam database. Biasanya sudah ditentukan batas jarak (pendekatan

kasar) sampai berapa citra yang abnormal itu dapat dikatakan normal.

22

Image Database Query

Database citra secara umum akan memiliki proses seleksi untuk menentukan

citra yang mana yang harus ditambahkan ke dalam koleksi dan proses klasifikasi untuk

menugaskan klasifikasi umum dan kata kunci lainnya untuk citra yang dipilih. Dalam

sistem database yang relasional, entitas dapat diambil berdasarkan nilai dari atibut

textualnya. Atribut yang digunakan untuk mengambil citra harus termasuk klasifikasi

umum, nama benda, nama orang, data buatan, dan sumber. Citra dapat diindeks

menurut atribut ini, sehingga dapat dengan cepat diambil ketika query diterbitkan.

Pendekatan dengan kata kunci memiliki batasan terhadap apa yang dapat dicari.

Pemrograman yang dibuat oleh manusia untuk mengambil citra berdasarkan kata kunci

sangat mahal dan terikat untuk meninggalkan beberapa istilah yang ingin

mereferensikan citra.

Query By Example (QBE)

Query by Example adalah database terminologi untuk sebuah query yang

diformulasikan dengan mengisi nilai dan pembatas di dalam sebuah tabel dan dapat

dikonversikan dengan sebuah sistem. Dalam database standar yang relasional, dimana

nilai atribut biasanya berupa text atau nilai numerik, QBE menyediakan antarmuka

(interface) yang nyaman bagi pengguna, tanpa tambahan kekuatan.

Bukan dengan mengetik kata kunci query, pengguna dapat menunjukkan

sistem sebuah citra contoh, atau menggambar salah satunya secara interaktif dari layar,

atau hanya sketsa gambaran dari sebuah objek. Sistem kemudian dapat mengambil citra

yang mirip atau citra yang mengandung objek yang sama. Ini adalah tujuan dari semua

sistem CBIR. Citra dapat berupa foto digital; contoh gambaran pengguna yang kasar;

sketsa gambar garis; ataupun kosong yang mana kasus pengambilan citra harus sesuai

23

batasan. Batasan berupa kata kunci yang harus direpresentasikan dalam beberapa sistem

indeksi atau oleh objek spesifikasi yang terdapat didalam citra dan bahkan hubungan

spasial diantaranya. Di beberapa kasus yang umum, query adalah citra digital yang

dibandingan dengan citra- citra di database menurut Pengukuran Jarak Citra (Image

Distance Measure). Ketika jarak yang dikembalikan adalah nol, citra dicocokan dengan

tepat dengan query. Semakin besar nilai dari nol mengindikasikan berbagai macam

derajat kemiripan dengan query.

2.5.1 Pengukuran Jarak Citra (Image Distance Measure)

Pertimbangan seberapa mirip citra database dengan query bergantung dengan

pengukur jarak citra mana yang digunakan untuk mempertimbangkan kemiripan. Ada 3

kelas utama dalam mengukur kemiripan, diantaranya :

- Kemiripan warna

- Kemiripan tekstur

- Kemiripan bentuk

2.5.1.1 Pengukuran Kemiripan Warna

Dalam membandingkan citra dengan konten menggunakan jarak ukuran citra

yang membandingkan jarak kesamaan antara dua citra dalam berbagai dimensi seperti

warna, bentuk, tekstur dan lainnya. Misalnya, jarak 0 menandakan persis dengan query.

Jika nilai yang didapat lebih besar dari 0, maka akan dicari berbagai tingkat kesamaan

antar citra. Dan hasil pencariannya kemudian diurutkan dengan jarak berdasarkan citra

query.

24

Pengukuran kemiripan warna membandingkan konten warna dari salah satu

citra dengan konten warna dari citra kedua atau dari spesifikasi query. Query

berdasarkan konten warna mengizinkan pengguna untuk menentukan query dalam batas

persentase warna. Pengguna memilih lima warna dari tabel warna dan menunjukkan

persentase yang diinginkan dari setiap warna.

Mengukur jarak komputasi berdasarkan kesamaan warna dicapai dengan

menghitung histogram warna untuk mengindentifikasi setiap proporsi piksel dalam

sebuah citra yang memegang nilai-nilai tertentu.

2.5.1.2 Pengukuran Kemiripan Tekstur

Tekstur merupakan tindakan mencari pola-pola visual dalam foto dan

bagaimana didefinisikan secara spasial. Tekstur adalah distribusi spasial dari keabuan di

dalam sekumpulan piksel yang dekat. Tekstur ditempatkan dalam sejumlah set yang

tergantung pada seberapa banyak tekstur yang terdeteksi dalam citra. Identifikasi tekstur

dalam citra ini diperoleh oleh pemodelan tekstur sebagai variasi tingkat dua dimensi

abu-abu. Dalam hasilnya piksel dihitung sedemikian rupa sehingga tingkat kontras,

kekasaran, dan keteraturan dapat diestimasi.

Kemiripan tektur lebih kompleks daripada kemiripan warna. Citra yang

memiliki kemiripan tektur dengan query seharusnya memiliki pengaturan spasial yang

sama dengan warna (pola abu- abu), tetapi tidak memerlukan warna yang sama (bukan

pola abu- abu). Pengukuran kemiripan tektur memiliki dua aspek :

- Representasi tekstur dan,

- Definisi kemiripan dengan memperhatikan representasinya

25

Representasi tekstur yang paling umum digunakan adalah vektor deskripsi

tekstur, yang mana vektor angka- angka yang meringkas tekstur dalam citra yang

diberikan atau bagian citra. Ketika vektor deskripsi tekstur dapat digunakan untuk

meringkas tekstur dalam semua citra, ini hanya sebuah metode yang baik untuk

menggambarkan citra tekstur single. Untuk citra yang lebih umum, vektor deskripsi

tekstur dihitung dengan setiap piksel yang mana piksel tersebut dikelompokkan oleh

algoritma clustering yang menetapkan label unik ke setiap kategori tektur yang berbeda

dengan yang ditemukan.

Untuk setiap citra database, vektor deskripsi tekstur query hanya memerlukan

untuk dibandingkan dengan vektor deskripsi tekstur dalam daftar. Pengindeksian dapat

menyediakan pengambilan citra yang lebih cepat.

2.5.1.3 Pengukuran Kemiripan Bentuk

Dengan bentuk suatu wilayah juga dapat dilihat tingkat kecocokan citra.

Bentuk sering diterapkan pada segmentasi pertama dalam mendeteksi awal sebuah citra.

Warna dan tekstur keduanya merupakan atribut global sebuah citra.

Pengukuran jarak berbasis kuantiti ini mencoba untuk menentukan dengan memberikan

citra yang memiliki warna atau tekstur yang ditentukan. Bentuk bukan merupakan

atribut citra; tidak masuk akal untuk menanyakan apa bentuk dari sebuah citra. Bentuk

lebih cenderung direferensikan sebagai bagian yang ditentukan dari sebuah citra.

Histogram bentuk adalah contoh pengukuran sederhana yang dapat mengesampingkan

bentuk yang tidak mungkin dapat dicocokkan, tetapi ini akan mengembalikan banyak

false positif, seperti yang histogram warna lakukan. Teknik- teknik batasan lebih

26

spesifik karena teknik ini bekerja dengan merepresentasikan batasan bentuk dan mencari

bentuk yang mirip dengan batasan. Pencocokan skesta bahkan dapat lebih spesifik,

tidak hanya mencari batasan objek single, tetapi untuk sekumpulan segmen citra yang

melibatkan satu atau lebih objek yang dicocokkan dengan query yang digambarkan oleh

pengguna. (Referensi :Thomas M Deserno. (2007), Ontology of Gaps in Content Based

Image Retrieval)

2.5.1.4 Ecludian Distance

d |f f | ∑ f , f , (1)

Di mana f adalah fitur query dan f adalah fitur dari database, dengan n adalah

banyaknya jumlah fitur.

Dalam bidang medis, CBIR digunakan untuk membantu ahli radiologi dalam

pengambilan citra dengan isi serupa. Metode ini umumnya dikembangkan untuk fitur

citra tertentu, dan akhirnya metode ini dapat digunakan untuk berbagai format citra

medis khususnya dalam citra mamografi. Metode ini terdiri dari dua bagian, yaitu

analisis citra dan retrival citra. Dalam analisis citra, ROI dipilih sebagai contoh untuk

semua dataset dan digunakan untuk menganalisis fitur tekstur berdasarkan tingkat

keabu-abuan (Gray Level Co-occurrance Matrices). Kemudian fitur ini dideskripsikan

lalu dimasukkan ke dalam sistem CBIR. Sehingga, dari deskripsi tersebut dapat

ditentukan yang termasuk normal dan abnormal. (Referensi : Chia-Hung Wei, Chang-

Tsun Li, and Roland Wilson. Department of Computer Science University of Warwick.

27

A General Framework for Content-Based Medical Image Retrieval with its Application

to Mammograms. )

Algoritma yang digunakan dalam sistem CBIR dibagi menjadi 3 tugas yaitu :

- Ekstrasi

mentranformasi citra yang kaya akan konten ke dalam isi berbagai fitur.

Fitur ekstrasi adalah proses menghasilkan fitur yang akan digunakan

dalam pemilihan dan klasifikasi tugas.

- Seleksi

Fitur seleksi mengurangi sejumlah fitur yang disediakan untuk tugas

klasifikasi. Fitur-fitur yang mungkin membantu dalam diskriminasi dipilih

dan digunakan dalam tugas klasifikasi. Fitur yang tidak dipilih akan

dibuang.

- Klasifikasi

Hasil akhir dari tugas klasifikasi adalah seperangkat fitur atau biasa

disebut dengan fitur vektor, yang merupakan representasi citra.

Dari ketiga aktivitas di atas, yang paling penting adalah fitur ekstrasi. Karena

fitur-fitur khusus yang tersedia untuk diskriminasi langsung mempengaruhi efektivitas

tugas klasifikasi. (Referensi : Ryszard S. Choras. Image Feature Extraction Techniques

and Their Application for CBIR and Biometrics Systems).

Pada content-based image retrieval, ciri-ciri visual pada citra diekstrak dan

digambarkan sebagai feature vector multidimensional. Feature vector pada citra- citra

yang berada di dalam basis data membentuk sebuah feature database. Untuk mencari

28

citra, pengguna memberikan contoh citra (citra query) pada sistem pencarian. Sistem

kemudian menghitung nilai-nilai feature vector pada citra query tersebut. Besarnya nilai

kesamaan atau jarak antara feature vector dari citra query dengan yang ada di dalam

basis data kemudian dihitung dan diurutkan berdasarkan jarak yang terkecil. Dengan

adanya proses pengurutan jarak akan mempermudah pengguna di dalam mencari citra

yang tersimpan di dalam basis data.

(Referensi : Isa Sani Muhamad, Juwita Elsa. (2007), Aplikasi Image Retrieval

Berdasarkan Tekstur dengan Menggunakan Transformasi Haar Wavelet.)

2.6 ROI (Region of Interest)

ROI atau Region of Interest adalah bagian yang dipilih sebagai sampel dalam

dataset yang diidentifikasi untuk tujuan tertentu. Konsep ROI biasanya digunakan dalam

pencitraan medis, oleh karena itu disini kita menggunakan konsep ini karena kita sedang

membahas tentang masalah kanker payudara. Untuk lebih mengefesiensikan sistem

CBIR, maka kita menggunakan ROI agar kita dapat memilih region of interest (ROI) dan

sistem tersebut akan mencari semua citra di dalam database untuk menemukan daerah

atau bagian yang berhubungan. (Referensi : Yung-Gi, Wu. Region of Interest Image

Indexing System by DCT and Entropy.)

2.7 GLCM (Gray Level Co-occurrence Matrix)

GLCM adalah matriks yang menjelaskan frekuensi satu level abu-abu yang

muncul dalam ruang linier tertentu yang mempunyai hubungan dengan level abu-abu

lainnya dalam bidang investigasi. Di sini, co-occurrence matrix dihitung berdasarkan

dua parameter, yaitu jarak relatif antara pasangan piksel d yang diukur dalam angka

piksel dan orientasi relatif φ. (Referensi :M.M Mokji. Gray Level Co-occurrence Matrix

Computation Based on Haar Wavelet)

o

d

d

m

e

C

G

b

b

GL

occurance d

dengan set ti

dimana d me

menunjukka

elemen-elem

Citra I pada

GLCM did

bertetangga

bernilai 1 da

GLCM meru

dari fitur tek

ingkat keabu

P(i,j

(x

f(x

enunjukkan j

an orientasi j

men di dalam

G

a gambar 2.7

dapat denga

pada citra I

an di sampin

upakan meto

kstural. Misa

u-abuan Ng, m

,j,d, φ) = car

x2,y2) =(x1,y1)

(x1,y1) = i, f(x

jarak antara

ajaran (x1,y1)

m set.

Gambar 2.7.1

7.1 di atas di

an mengkal

I dengan jara

ngnya bernil

ode statistik

alkan diberik

menetapkan

rd { ((x1,y1),

) + (d cos Ɵ

x2,y2) = j,,0 ≤

piksel (x1,y1)

) dan (x2,y2),

1 GLCM (su

iubah menja

lkulasikan

ak d. Contoh

lai 1, kemud

k untuk m

kan citra den

matriks p(i,j

(x2,y2)) ∈ (L

Ɵ, d sin Ɵ),

≤ i,j < Ng}

1) dan (x2,y2)

, dan card {

mber: www.

adi matriks G

jumlah set

h di atas nil

dian dihitung

menghitung

ngan f(x,y) b

j,d,�) sebag

Lr × Lc) x (Lr

di dalam ga

⋅} menunjuk

.mathworks.

GLCM, di m

tiap pasang

ai piksel pad

g banyaknya

probabilitas

berukuran Lr

gai

r × Lc) |

ambar, φ

kkan nomor

com)

mana nilai m

gan nilai p

da sudut kir

a pasangan p

29

s co-

r × Lc

dari

atriks

piksel

ri atas

piksel

30

yang bernilai [1 1]. Dimensi matriks GLCM adalah sebesar n x n, di mana n adalah nilai

piksel terbesar citra I. Berdasarkan contoh di atas, pasangan nilai piksel [1 1] berjumlah

1, lalu dibuat matriks GLCM pada titik (1, 1) dengan nilai 1. Demikian pula titik (1,2)

yang berasal dari jumlah pasangan [1 2] bernilai 2.

Fitur tekstur yang dapat di ekstraksi dari gray level co-occurrence matrices adalah :

Angular Second Moment (ASM) = ∑ ∑ p i, j (2)

Contrast = ∑ n ∑ ∑ p i, jN

| |

NN (3)

Correlation = ∑ ∑ , μ μ

σ σ (4)

Variance = ∑ ∑ i j i, j (5)

Inverse Difference Moment (ID_Mom) = ∑ ∑ i, j (6)

Sum Average (Sum_Aver) = ∑ iN (7)

Sum Variance (Sum_Var) = ∑ i Sum_Entro iN (8)

Sum Entropy (Sum_Entro) = ∑ p i log iN (9)

Entropy = ∑ ∑ p i, j log i, j (10)

Different Variance (Diff_Vari) = variance of px,y (11)

Different Entropy (Diff_Entro) = ∑ p i log iN (12)

Untuk mengembangkan deskriptor yang disesuaikan dijelaskan di bagian

selanjutnya, maka diperlukan untuk menganalisis fitur dari mamografi. Dalam studi ini,

matriks GLCM dibangun untuk menghitung ROI di masing-masing arah 00, 450, 900, dan

1350. (Referensi : Chia-Hung Wei, Chang-Tsun Li, and Roland Wilson. Department of

31

Computer Science University of Warwick. A General Framework for Content-Based

Medical Image Retrieval with its Application to Mammograms. )

2.8 Analisis Diskriminan

Analisis diskriminan merupakan suatu proses analisis dengan fungsi diskriminan (regresi

linear berganda) yang secara umum dinotasikan sebagai berikut:

(13)

di mana konstanta bn , n= 0,1,2,...,p dicari dengan persamaan berikut,

(14)

(15)

(16)

dalam hal ini, Yi adalah variabel output yang dihendaki untuk membedakan kategori

normal dan abnormal. Pada penelitian ini untuk kategori normal Yi bernilai 1 dan

bernilai 0 untuk kategori abnormal, sedangkan X1,X2, ... ,Xp adalah variabel bebas yang

terdiri dari seluruh fitur yang digunakan.

2.9 False Positive dan False Negative

Beberapa masalah yang khusus two-class problems dimana arti class bisa

menjadi : (a) objek baik versus objek buruk; (b) objek yang muncul di citra versus objek

yang tidak muncul; atau (c) orang memiliki penyakit D versus orang yang tidak

memiliki penyakit D. Disini, kesalahan mengambil arti khusus dan tidak simetris.

∑ ∑∑∑ =++++ ikikii YXbXbXbnb ...22110

∑ ∑∑∑∑ =++++ iikiikiiii YXXXbXXbXbXb 112122

1110 ...

∑ ∑∑∑∑ =++++ ikikikikiikiki YXXbXXbXXbXb 222110 ...

32

Kasus (c) lebih edukatif : jika sistem dengan salah mengatakan bahwa orang yang

memiliki penyakit D, kemudian kesalahan ini disebut false alarm atau false positive;

dimana jika sistem dengan salah mengatakan bahwa orang tersebut tidak memiliki

penyakit D, kemudian kesalahan ini disebut false dismissal atau false negative Dalam

kasus false positive, mungkin berarti bahwa orang tersebut akan menjalani lebih banyak

test, atau mengambil obat yang tidak diperlukan. Dalam kasus false negative, diagnosa

terlewatkan dan orang tersebut tidak dapat dirawat, mungkin dapat menyebabkan

kematian. Karena akibat kesalahan yang sangat hebat, adalah masuk akal untuk

membuat prasangka keputusan tersebut dalam usaha untuk meminimalkan false negative

sebagai akibat dari peningkatan sejumlah false positive. Kasus (b) dapat berarti

membuang- buang energi dengan menyalakan lampu ketika benar- benar tidak ada

gerakan dalam layar atau menghitung mobil di jalan raya ketika ada satu yang tidak

lewat; false negative dalam kasus (b) juga memiliki konsekuensi yang penting.

(Referensi : Shapiro, Linda G., and Stockman, George C., (2001),Computer Vision,

Prentice-Hall, Inc, New Jersey, hal 96-97).

2.10 Precision Versus Recall

Dalam aplikasi pengambilan dokumen atau pengambilan citra, objektif

mengambil objek penting class C1 dan tidak terlalu banyak objek yang tidak penting

class C2 menurut fitur yang disediakan dalam citra query. Sebagai contoh, pengguna

mungkin tertarik dalam pengambilan citra matahari terbenam, atau mungkin kuda- kuda.

Pertunjukkan seperti sebuah sistem dikarakteristikan oleh precision dan recall.

33

Precision dari sebuah sistem pengambilan citra adalah sejumlah citra relevan

(true C1) yang diambil dibagi dengan total citra yang diambil (true C1 ditambah false

positive yang sebenarnya dari C2).

Recall dari sebuah sistem pengambilan citra adalah sejumlah citra relevan

yang diambil dari sistem yang dibagi total citra relevan dalam database. Disamakan,

ini adalah sejumlah true C1 citra yang diambil dibagi dengan total true C1 citra yang

diambil dan false negative.

Sebagai contoh, dugaan database citra berisi 200 citra matahari terbenam

yang akan membuat pengguna tertarik dan yang pengguna harapkan akan cocok dengan

query. Dugaan sistem mengambil 150 dari 200 relevan citra dan 100 citra lainnya dari

citra yang tidak menarik bagi pengguna. Precision dari operasi pengambilan

(klasifikasi) adalah 150/250 = 60% dan recall adalah 150/200 = 75%. Sistem dapat

berisi 100% recall jika ia mengembalikan semua citra dalam database, tetapi kemudian

precision –nya akan menjadi sangat buruk. Alternatifnya, jika klasifikasi dengan rapat

diatur untuk tingkat false positive yang rendah, kemudian precision akan menjadi tinggi,

tetapi recall akan menjadi rendah. (Referensi : Shapiro, Linda G., and Stockman, George

C., (2001),Computer Vision, Prentice-Hall, Inc, New Jersey, hal 97-98).