20
벡벡 벡벡벡벡 벡벡 벡벡벡벡벡 벡벡벡 벡벡 벡벡 벡벡 전전 전전전 전전 전전 전전전 전전전 전전 전전전 전전전 2001. 8. 24

벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

  • Upload
    risa

  • View
    274

  • Download
    7

Embed Size (px)

DESCRIPTION

벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축. 전북 대학교 전자 정보 공학부 컴퓨터 비젼 연구실 김영원. 2001. 8. 24. 목차. 1. 서론 2. 유전 알고리즘과 LBG 알고리즘을 이용한 벡터 양자화 2.1 벡터 양자화 2.2 유전 알고리즘 2.3 LBG 알고리즘 2.4 혼합형 유전 알고리즘 3. 문서 영상 압축을 위한 알고리즘 3.1 부분 영상 코드북 설계 3.2 압축률 분석 4. 결론. 1. 서론. 영상의 처리 , 전송 , 저장 등 증가 추세 - PowerPoint PPT Presentation

Citation preview

Page 1: 벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

전북 대학교 전자 정보 공학부컴퓨터 비젼 연구실 김영원

2001. 8. 24

Page 2: 벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

전북대학교 컴퓨터 비젼실 2

목차1. 서론2. 유전 알고리즘과 LBG 알고리즘을 이용한 벡터 양자화

2.1 벡터 양자화2.2 유전 알고리즘2.3 LBG 알고리즘2.4 혼합형 유전 알고리즘

3. 문서 영상 압축을 위한 알고리즘3.1 부분 영상 코드북 설계3.2 압축률 분석

4. 결론

Page 3: 벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

전북대학교 컴퓨터 비젼실 3

1. 서론 영상의 처리 , 전송 , 저장 등 증가 추세 - 영상 압축의 필요성 급증 - 압축방법 : JPEG, MPEG, 벡터 양자화 (Vector Quantization),

유전 알고리즘과 LBG 알고리즘을 결합한 알고리즘 Zheng–Julstrom-Cheng, 1997

e-book, 전자 도서관 등의 사업 - 문서 영상 압축의 필요성 대두 - 문서 영상 특성 • 정형화된 모양을 갖는 획들로 구성 • white 영역 넓음

연구내용 - 문서 영상의 특성을 이용한 효율적인 압축 - Zheng–Julstrom-Cheng 의 알고리즘 도입

Page 4: 벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

전북대학교 컴퓨터 비젼실 4

2. 유전 알고리즘과 LBG 알고리즘을 이용한 벡터 양자화 2.1 벡터 양자화 : 원 영상을 mⅩm 크기의 블록들로 분할한 후 , 그 블록들을 이용하여

적은 수의 대표 블록들을 생성하여 원 영상을 그 대표 블록들로 표현하는 방법

……041

112341

2

3

.

.

.

.

S

원영상(N 개의 블록)

m

m

m

m

… …

.

.

.

.

압축영상과 코드북

Vector Quantization

……041

112341

2

3

.

.

.

.

S

원영상(N 개의 블록)

m

m

원영상(N 개의 블록)

m

m

m

m

… …

.

.

.

.

압축영상과 코드북

Vector Quantization

그림 1. 벡터 양자화를 이용한 압축의 원리

코드워드

Page 5: 벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

전북대학교 컴퓨터 비젼실 5

- 두 가지 주요 문제 • 코드북 설계 • 설계된 코드북으로 원영상을 가장 유사하게 표현

1

2

2 2 1 12 2 1 1 1 1 2 21 1 2 2

코드북 설계

매핑원 영상

압축영상그림 2. 벡터 양자화 예

Page 6: 벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

전북대학교 컴퓨터 비젼실 6

2.2 유전 알고리즘 (Genetic Algorithm) : 임의의 개체 집단이 세대를 거듭 하는 동안 교차와 돌연변이라는

유전 연산에 의해서 최적 해에 가깝도록 진화하는 알고리즘이다 .

유전 알고리즘 { t 0; 초기 유전개체 집단 P(t) 생성 ; 초기 유전개체 집단 P(t) 평가 ; while ( not 종료조건 ) do { t t+1; // 다음 세대로 진화 P(t-1) 에서 P(t) 선택 ; P(t) 변형 ; // 교차 (crossover), 변이 (mutation) 연산자 P(t) 평가 ; } }

Page 7: 벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

전북대학교 컴퓨터 비젼실 7

3 3 1 1 2 1 2 2 2 123

유전개체 1

1 2 1 3 2 1 2 3 2 123

유전개체 20

• • • • • •

평균

코드북

원 영상

코드북 평가 우수 유전개체 선택 교차와 돌연변이 코드북 평가

세대증가

그림 3. 유전알고리즘을 이용한 벡터 양자화

Page 8: 벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

전북대학교 컴퓨터 비젼실 8

2.3 LBG (Linde-Buzo-Gray) 알고리즘 : suboptimal 해를 구하기 위한 대표적인 지역탐색 알고리즘

Algorithm LBG { 블럭들을 k 개의 집합으로 분할한다 ; // 초기 코드북 각 집합에 대응되는 블럭들의 평균값을 코드워드로 삼는다 ; do { 각 블럭을 가장 가까운 코드워드로 대응시킨다 ; 대응되는 블럭이 하나도 없는 코드워드 Ci 가 존재하면 가장 많은 블럭이 대응되는 코드워드을 찾아 해당 블럭들을 두 그룹으로 나눈 다음 그 중 한 그룹을 Ci 에 대응시킨다 ; 변화가 있는 코드워드들을 다시 계산한다 ; } while ( 종료 조건 ) }

Page 9: 벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

전북대학교 컴퓨터 비젼실 9

3 3 1 1 2 1 2 2 2 123

유전개체

평균

코드북

원 영상

원 영상

123

코드북

1 2 1 3 2 1 3 1 2 유전개체

그림 4. 유전 알고리즘 후 LBG 알고리즘 적용

유전 알고리즘

LBG 알고리즘

Page 10: 벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

전북대학교 컴퓨터 비젼실 10

2.4 혼합형 유전 알고리즘 최적의 코드북 생성을 위해 Zheng-Julstrom-Cheng 은 유전 알고리즘에

LBG 알고리즘을 적용하였다 .

혼합형 유전 알고리즘 { t = 0; // 첫 세대 임의의 N 개의 코드북 초기화 ; 코드북 평가 ; while ( not 종료조건 ) do { t = t+1; // 다음 세대로 진화 우수 코드북 선택 ; // 다음세대 집단을 만든다 . 코드북 변형 ; // 유전연산자 ( 교차 , 돌연변이 ) LBG; // 최적의 코드북 탐색 . 코드북 평가 ; } }

Page 11: 벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

전북대학교 컴퓨터 비젼실 11

3. 문서 영상 압축을 위한 유전 알고리즘 3.1 부분 영상 코드북 설계 1) 문서 영상의 특성 - 획이라는 비교적 정형화된 패턴 요소들로 구성 2) 문서 영상의 특성을 이용한 벡터 양자화 - 부분 영상에서 코드북을 설계하고 전체 영상에 유사 블록

으로 매핑

혼합 형유전 알고리즘

코드북완성

코드북 매핑

전체영상전체영상

부분영상

혼합 형유전 알고리즘

코드북완성

코드북 매핑

전체영상전체영상

부분영상

그림 2. 문서 영상의 벡터 양자화 과정

Page 12: 벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

전북대학교 컴퓨터 비젼실 12

- 유전 알고리즘의 반복 횟수 : 100 회 - 코드북 평가 함수 * MSE(Mean Square Error)

: 원 영상과 압축 영상의 차이를 재는 함수 * PSNR : 원 영상과 왜곡 정도를 나타내는 측도

range-of-value : 원 영상에서 픽셀 값의 범위

픽셀값코드워드의매핑된픽셀값원영상의 :, :

),(0

2

i

i

xi

k

ixi

Cx

cxdMSE

MSE

valueimageofrangePSNR e

log10

Page 13: 벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

전북대학교 컴퓨터 비젼실 13

3) 실험 결과 - 부분영상의 코드북으로 전체 영상 표현

원 영상 (900 1200)Ⅹ

부분 영상 (120 60)Ⅹ코드워드 : 3 3 Ⅹ코드북크기 : 64

코드북으로 표현한 압축 영상 (900 1200)Ⅹ

Page 14: 벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

전북대학교 컴퓨터 비젼실 14

- 코드워드 크기가 커질수록 압축률은 높으나 화질에 부정적인 영향을 준다 . ( 코드북 크기 : 128 )

매칭 time

Quality

44.243

753.143

402.566

원 영상과압축된 영상

속의 부분 글자

비교

전체영상(900Ⅹ1200)코드북 매칭

부분영상 (120Ⅹ60)코드북 작성 소요시간 ( 초 )

코드워드 크기 5Ⅹ54Ⅹ43Ⅹ3

712.925

398.423

43.853

689.943

395.816

43.152

표 1. 코드워드 크기와 문서 영상 압축

Page 15: 벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

전북대학교 컴퓨터 비젼실 15

- 코드북 크기가 커질수록 화질은 개선되나 압축 시간이 길어지는 단점이 생긴다 . ( 코드워드 크기 : 3Ⅹ3 )

표 2. 코드북 크기와 문서 영상 압축

매칭 time

Quality

44.243

753.143

402.566

원 영상과압축된 영상

속의 부분 글자

비교

전체영상(900Ⅹ1200)코드북 매칭

부분영상 (120Ⅹ60)코드북 작성 소요시간 ( 초 )

코드북 크기 3264128

388.478 205.475

23.103 12.478

400.477401.146

Page 16: 벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

전북대학교 컴퓨터 비젼실 16

- 부분영상 코드북 설계에 비해 전체 영상 매핑의 소요시간이 상대적으로 적다 .

- 코드북 재사용성을 이용하면 많은 양의 문서 영상 압축에 효율적이다 .

부분영상 (120Ⅹ60)코드북 생성소요시간

( 초 )

전체영상 (900Ⅹ1200)코드북 매칭소요시간( 초 )

753.143 44.243

388.478

205.475

23.103

12.478

••

• •••

표 3. 부분 영상 코드북 설계 시간과 전체 영상 매핑 시간

Page 17: 벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

전북대학교 컴퓨터 비젼실 17

3.2 압축률 분석

예 ) 900Ⅹ1200 grayscale 문서영상을 크기 3Ⅹ3 인 코드워드 32 개로 표현하였다고 할 때 압축률

• 원영상의 크기 8bitsⅩ900Ⅹ1200 = 1080,000bytes • 코드북의 크기 3 Ⅹ3 Ⅹ 8bits Ⅹ 32 = 288bytes • 압축영상의 크기 120,000 Ⅹ 5bits = 75,000bytes

따라서 압축률은 이다 .

코드북크기압축영상크기영상크기원

압축률

34.1428875000

1080000

Page 18: 벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

전북대학교 컴퓨터 비젼실 18

3 Ⅹ 3

Gray 영상(900Ⅹ1200)

압축률

128코드북 크기

코드워드 크기64 32

4 Ⅹ 4

5 Ⅹ 5

10.17 11.92 14.34

17.67 20.91 25.29

28.57 31.76 38.84

표 4. 코드워드 크기와 코드북 크기에 따른 압축률

Page 19: 벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

전북대학교 컴퓨터 비젼실 19

- 바탕면이 차지하는 비율이 매우 높다는 특성을 이용하여 허프만 코드 등을 사용한다면 압축률을 더 높일 수 있다 .

.

.

.

0.5698

0.6797

0.7876

1.01243

1.21476

1.72072

2.32850

85.4102525

백분율(%)

코드워드카운트

.

.

.

그림 5. 900Ⅹ1200 문서영상

표 5. 코드북 인덱스의 히스토그램

Page 20: 벡터 양자화와 유전 알고리즘을 이용한 문서 영상 압축

전북대학교 컴퓨터 비젼실 20

4. 결론 1. 문서 영상의 벡터 양자화 기법을 구현 2. 부분 영상 코드북으로 전체 문서 영상 표현 3. 합리적인 코드워드 크기와 코드북의 크기 제시