47

국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,
Page 2: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,
Page 3: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

포스윈의 통합검색 솔루션은 타사 대비 차별화된 역량을 보유하고 있으며,

국내 통합검색엔진 기업 중 최고의 안정성을 확보하고 있습니다.

또한 MIR-Search 검색엔진은 동급 타 업체의 제품과 비교하여 안정성,

확장성, 가용성, 성능 및 관리 측면에서 뛰어난 통합검색엔진 입니다.

고객사에 최적화된 기능, 역시 MIR-Search

회사소개 - 포스윈의 특징

Page 4: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

회사명 주식회사포스윈 대표자 김재중

사업분야 소프트웨어 개발및공급

주소 서울시구로구 구로3동 197-7 에이스테크노타워2차 701호

전화번호 TEL : 070-4633-2500 / FAX : 070-4015-2500

회사 설립년도 2004년 03월 02일

해당부문 종사기간 2004년 03월 ~ 현재

제안사 일반현황

제안사 주요연혁 및 인증

Ⅰ. 회사소개 1. 일반현황

2006

2005

2007

2004

2009

2012

2010

2011

12월 행정안전부 행정업무용 SW인증 7월 IT산업경쟁력 강화사업 선정

12월 MIR-Clipper for Win 출시 7월 MIR-Search 신SW상품 대상, 신SW 추천작 선정 6월 직접생산확인 업체(중소기업중앙회)

6월 MIR-SNS Collector 출시 8월 Uni-SNS 소셜 분석 솔루션 출시

12월 MIR-Pharos(온톨로지)’ 출시

12월 대학평가 핵심지표 다차원분석 솔루션 UNI-One 출시

12월 MIR-Search 아시아눅스 호환 인증 5월 MIR-Search V-280 출시

7월 MIR-Search V-260 출시

9월 MIR-Search V-260 출시 3월 ㈜포스윈 법인 설립

12월 행정안전부 행정업무용 SW인증 10월 기업부설연구소(지식플랫폼연구소) 정식인가 7월 기술혁신형 중소기업(INNO-BIZ)

5월 MIR-Collector 출시 3월 MIR-Biganal 출시

2013

2008

포스윈은 2004년 3월 설립하여 검색엔진 전문기업으로 시장에 처음 선보였습니다.

2014

7월 MIR-Classify(자동분류기) 출시 5월 유니원 Stand-Cloud 출시 1월 유니원 Stand-Alone 출시 1월 MIR-Search v2.8.0 Enterprise 출시

1/38

Page 5: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅰ. 회사소개 2. 주요사업 내용

빅데이터 솔루션 및 통합검색 기반 솔루션

▶ Qlik View

▶ CMS, KMS, EDMS, 그룹웨어 등

▶ 기록관리 시스템, 전자도서관(DL)

정보시스템 통합 및 검색시스템 기획

▶ 검색시스템 기획, 모델링

▶ 검색시스템 성능 진단

▶ 정보 처리 응용프로그램 개발

▶ 시스템 통합 등

빅데이터 분석 및 통계

▶ 대학평가 핵심지표 다차원 분석

▶ 소셜 분석(Uni-SNS)

기업 내`외부 통합검색 솔루션

▶ 내부 기간계 시스템 통합검색

▶ 외부 포털 통합검색

▶ 자연어 처리, 감성분석 등

2/38

Page 6: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅰ. 회사소개 3. 인증 및 수상

기술 인증 내역

품질 인증 및 확인서

3/38

Page 7: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

국내 유일의 4대 핵심 역량 보유

• Majorupgrade (년4회) 검색엔진 각종 인증 획득• 30개 BMT 모두 성능1위 핵심기술 특허 보유

• 긴급 대응팀에 의한 30분 이내 조기조치 24×365 대응체계 제공• 콜센터-긴급대응-기술지원-연구소의 입체적인 지원체계(업계유일)

• 전문가 그룹에 의한 입체적인 상시 지원 유관 수행경험 100%• 5년 이상 장기근속 80% 300회 이상 SI 협업경험 보유

• 매출액 증가율 1위 매출액 영업이익율 1위• 부채비율 업종 최하위 R&D 투자비율 업종 최상위 (32%)

기술역량

지원역량

수행역량

재무역량

업체 최고의안정성

업체 최고의기술자 숙련도

업체 최고의안정성 및성장성지표

포스원

동종업체

80%

50%

100%

55%

25%12%

자기자본비율 부채비율 매출액증가율

장기 근속기술자

80%

검증된 지표와 타 업체와의 차별화된 역량으로 본 사업의 성공을 보장

Ⅰ. 회사소개 4. 사업파트너 측면의 비교 우위점

4/38

Page 8: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅰ. 회사소개 5. 조달청 나라장터 정식 등록

조달청 나라장터 정식 등록!“포스윈의 MIR-Search 검색엔진은 국내 유일의 검색분야

조달청 나라장터 쇼핑몰 등록 제품입니다.”

조달 나라장터 쇼핑몰 등록 제품

5/38

Page 9: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

MIR-Search는, 2003년 개발 이후 자체 브랜드를 통한 400여개 이상의

통합검색시스템 구축과 100여개 이상의 수집엔진 구축을 포함하여

400여 공공기관 및 기업 통합검색시스템 구축 노하우를 집대성한

국내 대표 통합검색 솔루션 입니다.

통합검색솔루션의 역사..

MIR-Search 개요

Page 10: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅱ. MIR-Search 개요 1. MIR-Search 개요

제품 구성

제 품 명 MIR-Search 2.8.0

제 조 사

제품 이미지

•솔루션 “MIR-Search”는 통합포탈시스템의 통합검색 기능을 제공하는

소프트웨어로 최고의 검색속도와 함께 시스템 리소스를 최소한으로 활용하고,

통합포털시스템 운영에 최적의 환경을 제공합니다.

㈜포스윈

제품 개요

구분 주요내용

유연한 엔진 구성 Plug-In 방식의 동적확장(Dynamic Extension Engine) 구성의 유연하면서 강력한 아키텍처로 구성

최소의 서버자원 사용으로 최상의 검색성능을 통한 서비스 효율성을 제공

신뢰도 높은 검색서비스제공

필드별 중요도 자동인지에 의한 Relevance Ranking 알고리즘과 자연어처리 기술에 의한 신뢰성 있는 검색결과

검색결과에 대한 사용자별, 문서별 접근 제어 후통제 처리 기능 제공

검색서비스의 모니터링 및 자동복구 기능 제공

Boolean, Proximity, Fuzzy 등 다양한 검색연산자를 지원하며, 완벽한 언어처리로 자연어 검색 지원

최적의 검색성능 및효율적인 정보접근성

제공

엔진 자체 Cache 사용 및 자동관리 기능, 다양한 검색 가속기능을 통한 최적의 검색속도 제공

인기검색어, 검색어 자동완성, 검색 히스토리, 카테고리 검색 등 다양한 검색 기법 제공을 통한 정보 접근성 향상

기술지원력

로그 분석 및 통계 관리용 웹기반 관리자 페이지 제공

색인DB 및 검색서버 관리 및 모니터링 기능 제공

로그분석을 통한 다양한 정보제공

세부사양

6/38

Page 11: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅱ. MIR-Search 개요 2. 통합검색솔루션 특장점

플랫폼

다양한 구축 사례를 통한 검증된 플랫폼

- 금융기관/공공기관 구축을 통해 검증된 플랫폼

- 접속정보의 기록을 통한 보안성 강화

안정성/신뢰성

데이터처리 안정성과 신뢰성 제공

- 1만명 이상의 동시 사용자를 통해 검증된 시스템 안정성

- 로그를 통한 각종 통계정보 생성 및 관리

- 각종 규격 및 표준에 대한 지원

생산성

사용자 생산성 및 관리성 향상

- 검색엔진을 통한 신속한 업무처리 및 효율성 증대

- 빠른 조회 및 처리성능

- 상태 모니터링을 통산 시스템 관리 향상

확장성

부가서비스 모듈 및 시스템의 유연한 확장

- 컴포넌트 기반의 독립 구조에 의한 높은 확장성 제공

- 중앙집중 / 분산 시스템 등 다양한 방식으로 적용 가능

- OS에 종속되지 않으므로 다양한 H/W 지원

보안성

보안성 향상

- 일관성 있는 사용자에 대한 접근 기록관리

- 시스템 보안 및 데이터 보안

편의성

사용자 편의성 강화

- 단일한 뷰지원과 사용자에 맞는 레이아웃을 통한 편의성 향상

- 멀티 노드 구성 시, 트랜잭션 Dead Lock 방지

7/38

Page 12: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

MIR-Search 검색엔진은 동급 타 업체의 제품과 비교하여 월등한 성능의 통합검색엔진 입니다.

구분 포스윈 MIR-Search W사 S제품 K사 D제품국가 표준제품에 대한 공인 인증 보유여부 : GS인증(Good

Software)○ ○ ○

표준기록관리시스템(RMS) 인증 ○ Ⅹ Ⅹ

정부시책에 따른 오픈소스 기반 시스템으로의 확장을 위한Linux진영 (Redhat,Asianux 등) 인증 보유여부

○ Ⅹ ○

결과내 재검색 ○(Sessoin 방식) △(AND연산자방식) △(AND연산자방식)

검색 결과 필터링 ○(Sifter모듈에 의함) △(중복문서제거) △(중복문서제거)

온라인 색인 ○ Ⅹ ○

DEE(Dynamic Engine Extension) ○ Ⅹ ○

자체 개발한 형태소분석기 보유 ○ ○ ○

원문 대비 색인 크기 중 대(동일한 색인DB2개) 중

검색속도 1~2초 2~3초 2~3초

불리안, 인접 검색 ○ ○ ○

비교, 절단, 필드 검색 ○ ○ ○

검색결과 조절 ○(ECMA Script제공) ○ X

엔진 자체 캐쉬 보유여부 ○ ○ ○

유사문서 검색 ○ △ ○

과다 데이터의 제한 ○ △ ○

원문 대비 색인 크기 중 대 중

다국어 지원 ○ ○ ○

대용량 Data 처리 능력 ○ ○ ○

Multi-Thread 지원 ○ △ △

프로그램 확장성 ○ △ △

제공되는 검색 API JAVA, COM, C/C++,

C#, PHP, ASP.NET

JAVA, COM, C/C++,

ASP.NET, PHPJAVA, COM, C/C++, NET, PHP

8/38

Ⅱ. MIR-Search 개요 3. 타사제품 비교

Page 13: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

통합검색을 기반으로 내부 기간계 시스템 통합검색, 외부 포털 통합검색,

자연어 처리, 감성분석 등으로 구성된 제품입니다.

빠른 인덱싱을 위한 대용량 분산 색인 엔진(로드밸런싱 및 멀티쓰레드)으로

각각 기능이 모듈화 된 구성으로 확장 및 타 시스템 연동이 용이하며,

스마트한 통합검색시스템 환경을 구축할 수 있습니다.

사용자 중심의 기능과 디자인, 역시 MIR-Search

MIR-Search 주요기능

Page 14: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

커넥터

옵저버

문서필터

보안필터

화면처리

관리 에이전트(모니터링,스케쥴링)

검색어 자동완성

실시간/주간 인기검색어

사용자별 검색 히스토리

검색서비스 모듈

MIR-Search v2.8 검색엔진

분산기

검색기

색인기

언어처리기

검색API

부가모듈

데이터소스

DBMS

Domino Notes

SharePoint

Exchange

Documentum

SAP

WEB

File System

WEB

통합관리기

시스템 구성도

9/38

Ⅲ. MIR-Search 주요기능 1. 검색엔진 아키텍쳐

공공기관, 기업 등의 기능 요구사항을 모두 제공하여 만족도 향상 및 사용자들의 정보접근성 향상

Page 15: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅲ. MIR-Search 주요기능 2. 분산구조 아키텍쳐

무한 확장성

안정된 시스템

무 정지 시스템

다양한 분산 검색 기법 적용

분산 색인

어플리케이션 통합 용이성 (C, PHP, Java, .NET)

분산기#1

검색기#3

D

검색기#2

CA

검색기#1

BA

검색기#N

검색기#N-N

F

G H

분산기#2검색요청

대용량 데이터 처리를 위한 분산 아키텍쳐로 설계 되어 무한한 확장이 가능

10/38

분산구조 아키텍쳐

Page 16: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

형태소 분석 / 사전 색인 / 검색

형태소 분석 미적용 시 검색결과 형태소 분석 적용 시 검색 결과

국회 검색

철새 겨울철새

이동 이동경로

경로 두루미

이동철새이동경로경로

철새이동경로

※ 자연어 검색 지원

형태소 분석과정

언어처리 요청

Y

N

단위 신조어

신조어 탐색

시스템사전 / 문법규칙 탐색

색인어 추출

불용어 처리

※ 자체 개발 형태소 분석기 사용

사전 제공/관리

등록, 수정, 삭제, 출력

사전 관리

※ 시스템 사전 300만 단어 제공철새이동경로

색인어

추출

키워드

검색

사용자사전

동의어사전

복합명사사전

불용어/특수어 사전

색인DB

색인DB

철새이동경로

추출된 색인어:

국회의원 /법률지식 /

해양수산부 /공무원 /국…

추출된 색인어:

국회

자체개발 형태소 분석 사전을 활용하여 검색결과의 정확도가 높습니다.

Ⅲ. MIR-Search 주요기능 3. 형태소 분석기

11/38

Page 17: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅲ. MIR-Search 주요기능 4. 색인 배포기능

색인배포 기능으로 무중단 동적색인이 가능하여 안정적인 검색기능 제공

색인기의 색인 배포 기능으로 검색서버 간 색인 컬렉션 동기화

색인기의 색인 동기화 기능으로 변경된 색인의 실시간성 동기화

수집기의 데이터 동기화 기능을 통해 데이터베이스와 색인 컬렉션 동기화

색인기

검색서버 #2

색인기

검색서버 #N

색인기

검색서버 #1

색인배포(압축파일 형태로 색인전송)

수집기

A

DB서버 #1 DB서버 #2

데이터 동기화

동기화 동기화

A A

색인A 색인B 색인A 색인B색인A 색인B

12/38

Page 18: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅲ. MIR-Search 주요기능 5. 동적/정적 색인 기능

실시간 감시기능을 이용하여 변경된 데이터에 대한 색인 반영으로 데이터 최신성을 유지

검색서버

Time-Schedule에 의한자동 수행

관리기스케쥴러

수집기 / 감시기능

데이터 작성,수정

색인반영

색인기 / 최적화툴

색인DB

색인DB

정보동기화

DB

데이터변경정보를

감시

검색서비스의중단없는색인반영 다양한정보동기화기법 지원

- Trigger를 이용한 변경정보감지- 수정일자기준의변경정보 감지- 기간계시스템과의 API 연계등

수집기 / 변경데이터 감시

-검색대상 데이터상태관찰및감지

-데이터수집 및동적색인호출

관리기스케쥴러

-컬렉션동기화(동적색인)

-색인컬렉션 최적화또는백업

-자동스케쥴 작업실행

13/38

Page 19: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅲ. MIR-Search 주요기능 6. 색인복구 지원

실시간 또는 주기적인 동적색인 및 콜렉션 최적화, 백업을 수행하여 최적의 검색성능을 유지

색인전파일보존 기능을통하여빠른색인복구 가능

신뢰성 있는 시스템 운영

색인DB(데이터)에대한 정상화

프로세스 재기동

Mirserver 관리기(데몬)

실시간 모니터링

색인프로세스 감시

사용자프로세스 감시

Rep. 서버감시

스케쥴러감시

검색서버감시

색인동기화프로세스 감시

실시간 서비스중단 감시

14/38

Page 20: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅲ. MIR-Search 주요기능 7. 유니코드를 통한 다국어 처리

Chinese Finnish Hungarian Korean Romanian Swedish

Danish French Italian Norwegian Russian Turkish

English German Japanese Portuguese SpanishAmerican

질의 API

검색기

색인기

수집기

색인파일

사용자인터페이스에서UTF-8 지원 (언어권별 질의)

색인어추출

질의어분석

시스템 연동

텍스트추출

파일필터

시스템연동기

수집대상데이터(다국어데이터)

시스템사전

다국어형태소분석기

글로벌 환경에 맞는 한국어, 영어, 일본어, 중국어 등 세계 주요 국가들의 다국어 검색 지원

15/38

Page 21: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅲ. MIR-Search 주요기능 8. 자동 키워드 추천기능

MIR-Suggester기능으로 자소단위 순방향 및 역방향 추천검색어를 제공

자소단위 검색어 추천 한영 자판 오류 수정 및 추천

Locale

Ranker

언어별 처리(한글: 자소단위 분리)

Indexer에 의해 색인작업을통하여 색인DB 구축

Ajax를 통하여 검색어와 전방,역방으로일치하는 키워드 목록을 출력

형태소 분석 작업

사용자 인터페이스

Collection

MIR-Suggester

Locale Indexer

Query 목록

Suggester에 의한 검색어 처리 및검색결과 출력

16/38

Page 22: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅲ. MIR-Search 주요기능 9. 다양한 검색 연산자

불린검색, 동의어 확장, 자연어 검색 등으로 검색품질의 향상과 정확한 검색결과 제공

AND 검색 : AND검색을 위해 검색어 사이에 * 를 사용

아파트 * 분양

아파트 + 분양

OR 검색 : OR검색을 위해 검색어 사이에 + 를 사용

NOT 검색 : 제외하고 싶은 색인어가 있다면 – 를 사용

아파트 - 분양

우선순위 : 적용 순위를 지정하기 위해서 괄호를 사용

아파트 * (분양 + 임대)

검색대상 선택 검색

AND/OR/NOT 조건 / 불린 연산자

이용한 검색

정렬 조건 검색

필드 선택 검색

날짜 선택 검색

17/38

Page 23: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅲ. MIR-Search 주요기능 10. 다양한 종류의 색인 방식

띄어쓰기,글자수,품사등 다양한 기준의 색인 처리로 정밀한 검색결과 보장

데이터 별 최적의 색인!

검색의 정확도 향상!

all token like

형태소 분석 후(동사/형용사 포함)

색인어 가능성 있는 모든 결과 추출

띄어쓰기 단위로 색인어 추출 데이터베이스의 Like 검색과

유사하게 색인어추출

(uni-gram 포함)

bi-gram/tri-gram

두/세 글자씩 끊어 색인어 추출

noun

형태소 분석 결과 중 명사만

색인어로 추출

색인 방식 별 예제

색인어 대상 단어 forcewin

all 색인 결과 : 옵션 설정에 따라 결과 달라짐

bi-gram 색인 결과: fo / or / rc / ce / ew / …

cf) tri-gram 색인(세 글자씩 끊어 색인어 추출)도

지원 가능

noun 색인 결과 : forcewin(∵고유명사)

token 색인 결과 : forcewin (∵띄어쓰기 없음)

18/38

Page 24: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅲ. MIR-Search 주요기능 11. 다양한 DB 및 비정형 문서 색인

자체보유 형태소 분석기를 통해 다양한 DB 및 비정형 문서 전문검색 제공

Oracle 전체 버전

Informix 전체 버전

Sybase 전체 버전

MS-SQL 전체 버전

Relation scheme 연계 색인 지원

첨부 파일의 LOB type의 색인 지원

첨부 파일의 로컬/ 리모트 디스크 경로를 포함시해당 경로의 파일을 다운받아 색인 지원

이미지/ 동영상 등의 멀티미디어는 메타정보를색인하여 검색 지원

DB Gateway

문서필터링

통합색인

...

2014

2013

날짜

...............

/data/부동산.doc임꺽정부동산 법률부동산 법률정보2

/data/주택.pdf홍길동다세대 주택다세대 주택 모집안내1

파일경로작성자요약정보제목번호

① 메타정보 색인

② 연계 첨부문서 확인

검색대상 Table

통합색인

19/38

Page 25: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅲ. MIR-Search 주요기능 12. 다양한 문서내용 검색

검색결과에 대해 동적 요약문 출력 및 검색어 하이라이팅으로 사용자 중심의 검색기능 제공

하이라이팅

동적/정적 요약문

MS Word, PowerPoint, Excel

한글과 컴퓨터 아래한글

Adobe Acrobat (PDF)

Rich Text Format (RTF)

핸디소프트 아리랑 (HWD)

일태랑 (JTD)

Microsoft Document Imaging

Microsoft Outlook Message

Microsoft Access DB

Open Office

워드퍼펙트 (WPD)

Autodesk Drawing File (DWG)

Flash Movie File (SWF)

압축파일 (ZIP, TAR, RAR 등)

XML/SGML/HTML 문서

MHT 문서, CHM 문서,

EML 문서, MIME 문서, MP3 TAG

니코드 텍스트 파일

이미지파일(BMP,JPEG,GIF등)메타정보

처리 가능한 문서 형식

파일

서버

검색

서버

Collection

DB

서버

MIR-Repository Server(Background Service Daemon)

Accessor & Get-Method

MIR-Modifier

Indexer

문서의 텍스트내용 추출

Indexer를 이용색인어 추출

첨부파일 요청/ 다운로드

JDBC API

20/38

Page 26: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅲ. MIR-Search 주요기능 13. 통합된 가상 컨텐츠 수집

메인 컨텐츠 및 분산된 관련 정보들을 이기종, 다중저장소 연계모듈을통해 통합된 View로 검색

분산된 저장소의 데이터 수집 및 색인

- 수집된 정보를 가상문서로 구성

- 가상문서 통합검색 및 뷰 생성

분산환경 시스템 통합 검색

- 원격지 기관별 자료 통합검색

- 복잡한 DB구조에 대한 가상화 수집

문서번호: 1234

제목: 다중 저장소 연계

내용: 가상 컨텐츠 생성

관련자료: http://abc.com

첨부: a.pdf

글쓴이: hong03 홍길동

가상 문서 색인

MIR-File Getmethod

MIR-MySQL Accessor

MIR-Oracle Getmethod

MIR-Web Getmethod

Windows

File Server

World WideWeb

AIXLinux

Transparent

21/38

Page 27: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅲ. MIR-Search 주요기능 14. 다양한 운영환경 연동

다양한 CPU Type과 OS종류의 서버를 지원하며, 각종 상용DBMS 및 솔루션 등의 연계모듈을 제공

MIR-Search 호환성

호환 CPU : Intel-X86/X64, Intel-Itanium, IBM-PPC HP-PA, SUN-Sparc 등

호환 운영체제 : 윈도우 NT계열, Linux(Redhat/Fedora/Asianux), HPUX, AIX. SunOS 등

호환 DB / 시스템 : DB2, UniSQL, 오라클, MS-SQL, Sybase, MySQL, Domino-Notes 등

호환 어플리케이션 : C, COM, PHP, Java, JEUS, WebLogic, WebSphere, OAS, .NET 등

MIR-Search

다양한 CPU, OS, DB와어플리케이션에 호환

운영체제 CPU타입

어플리케이션 / API DBMS / 시스템

호환

호환

호환

호환

22/38

Page 28: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

15. 다양한 시스템/콘텐츠 연계 및 연동

다양한 시스템/콘텐츠에 대한 효과적, 효율적 연계/연동

확장성을 고려한

엔진 구조

(3-tier)

시스템, 콘텐츠 별

맞춤형 수집기 제공

JSON/XML 파일을 통한

효율적 연동/확장 제어

소스 색인서버 검색서버

색인배포기

색인배포기

수집기(Connector)

색인기(Indexer)DBMS 색인DB

수집기(Connector)

색인기(Indexer)그룹웨어 색인DB

수집기(Connector)

색인기(Indexer)EDMS 색인DB

수집기(Connector)

색인기(Indexer)

기타콘텐츠

색인DB

검색기(Searcher)색인DB

검색기(Searcher)색인DB

검색기(Searcher)색인DB

검색기(Searcher)색인DB

검색기(Searcher)색인DB

검색기(Searcher)색인DB

연계가 필요한 다양한 개별 시스템/콘텐츠에 대한 효과적이고 효율적 처리를 지원

23/38

Ⅲ. MIR-Search 주요기능

Page 29: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅲ. MIR-Search 주요기능 16. 웹 기반의 관리자 도구

웹 기반의 그래픽 인터페이스를 이용한 사용자 중심의 편리한 관리도구 제공

통합관리기를 통한 다수의 서버관리

시스템 모니터링

검색엔진 관리 및 제어- 원격 데몬 시작/중지- 분산기/검색기/색인기 리소스 관리- 컬렉션 관리 및 배포

- 사전관리(사용자, 불용어, 동의어, 복합명사)- 불필요한 검색결과 제거

작업 스케쥴링

통계 관리 및 제어- 인기검색어 서비스 관리- 통계정보 분석

24/38

Page 30: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅲ. MIR-Search 주요기능 17. 검색엔진 S/W 성능시험

대용량 데이터베이스 색인/검색 수행에서 CPU/Memory/검색속도 효율성 입증

색인 시, CPU/Memory 사용량 검색 시, CPU/Memory 사용량

검색속도

25/38

Page 31: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅲ. MIR-Search 주요기능 18. 반응시간 및 평균 검색엔진 성능

한국정보통신기술협회의 SW 시험 인증인 TTA Good Software 인증

0 20 User 40 User 60 User 75 User

100만건 34% 53% 62% 70%

500만건 60% 63% 67% 70%

1,000만건 65% 67% 67% 71%

20 User 40 User 60 User 75 User

100만건 64MB 95MB 138MB 182MB

500만건 202MB 344MB 422MB 578MB

1,000만건 522MB 702MB 834MB 948MB

20 User 40 User 60 User 75 User

100만건 0.01MB 0.01MB 0.01MB 0.01MB

500만건 2.8MB 3.2MB 3.6MB 3.6MB

1,000만건 5.5MB 6.1MB 6.1MB 6.1MB

평균 성능

Windows Linux

10만건 DB데이터색인 시 최대 6.5% 5.4%

3만건의 웹데이터색인 시최대 4.0% 3.2%

100만건의 문서파일색인시 최대 17.5% 15.1%

100만건 색인데이터질의어조회 시 평균 0.4% 1.2%

1000만건 색인데이터질의어조회 시평균 0.4% 1.2%

공인 시험 인증 S/W성능

CPU 사용량

Memory 사용량

Disk I/O

조건 별 CPU 사용량

26/38

Page 32: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

통합 검색서비스는 고객 요구사항을 분석하여 사용자 별 업무에 맞는 개인화

를 고려하여 구현합니다.

사용자 중심의 통합검색엔진 , 역시 MIR-Search

MIR-Search구축방안

Page 33: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅳ. MIR-Search 구축방안 1. 검색엔진 구축방안(서버이중화)

사용자증가해 쿼리가급증하는경우적용

L4 Switch를 통해추가된검색기들로 쿼리를분산시킴

수집대상소스(데이터)가 급증하는 경우적용

색인된데이터들은 분산기를통해부분별로 나눠추가된검색기로 분산

검색서버구조도정상작동시

쿼리및데이터증가

검색서버 #1 검색서버 #2

L4 스위치

L4 스위치

검색기 A

색인기

수집기

관리기

데이터 증가검색기 B

색인기

수집기

관리기

데이터 증가

L4 스위치

검색서버 #1 검색서버 #2

색인A 색인B 색인A 색인B

관리기의 모니터링 서비스를 활용하여 서버이중화 구성함으로써 무정지 서비스를 안정적으로 제공

27/38

Page 34: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅳ. MIR-Search 구축방안 2. 검색엔진 구축방안(색인이중화)

색인 배포 및 색인 동기화 기능을 통해 분산 구성된 서버간 색인 컬렉션 동기화로 안정적인 구성

색인기

검색서버 #2

색인기

검색서버 #N

색인기

검색서버 #1

색인배포(압축파일 형태로색인전송)

수집기

A

DB서버 #1 DB서버 #2

데이터동기화

동기화 동기화

A A

색인A 색인B 색인A 색인B색인A 색인B

색인기의색인 배포기능으로검색서버 간색인컬렉션동기화

색인기의색인 동기화기능으로변경된 색인의실시간성동기화

수집기의데이터 동기화기능을통해데이터베이스와 색인컬렉션 동기화

28/38

Page 35: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅳ. MIR-Search 구축방안 3. 검색화면 구축방안

검색하고자 하는 항목만을 대상으로 검색이 가능하며, 등록일, 첨부파일 제목, 첨부파일 내용, 첨부파일 확장자 별 검색이 가능하도록 구현

검색결과 화면

등록일 설정

상세

검색

결과

상세검색통합검색 초기화면

검색범위

등록일

첨부파일

상세검색결과

주요기능

사용자가원하는세부 항목을선택하여 검색할수 있어검색의정확도가 높습니다.

첨부파일의경우파일명, 내용, 확장자에따라검색이가능하므로원하는 문서만을검색할수있습니다.

효과

상세검색더보기

“상세검색더보기”를 클릭하면 하단에

상세검색조건 레이어펼쳐집니다.

상세검색조건

검색영역은검색범위를설정하는기능으로

전체, 제목,내용, 작성자, 첨부파일명,

첨부파일내용을대상으로하여선택한 항목에

대해서만검색을할 수 있습니다.

등록일은전체, 1주일 이내, 30일 이내, 기간

선택기능을 지원합니다.

첨부파일은문서전체와문서의확장자별검색

기능을지원합니다.

29/38

Page 36: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

포스윈은 통합검색엔진 구축 이후 안정적인 서비스를 제공하기 위하여 고객

맞춤형 기술이전 및 교육훈련을 제공합니다. 또한 안정적인 시스템 운영의 연

속성을 확보하기 위해 문제발생 및 장애발생시 실시간 복구지원 및 효과적인

예방정비를 통해 발생 가능한 위험요소를 사전에 해결합니다.

안정적인 운영 환경 제공 , 역시 MIR-Search

서비스 및 사후 지원

Page 37: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅴ. 서비스 및 사후 지원 1. 기능학습 용이성

사용자를 위한 온라인 매뉴얼, 개발자와 운영자 도움말 등 다양한 매뉴얼 제공으로 빠르고 쉽게 학습

통합검색 매뉴얼 구성

통합검색 화면및통합관리기내도움말기능 소프트웨어매뉴얼책자

도움말

도움말링크 클릭

통합검색 화면 통합관리기

30/38

Page 38: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅴ. 서비스 및 사후 지원 2. 사업관리 방안

철저한 사업관리 수행을 위하여 5+3 중점관리영역에 대하여 통합관리 합니다.

• 요구사항 및 산출물 파악• 기준선(Baseline) 관리

• 예산확인 및 통제• 예산확보 절차 관리

• 계약사항 추적관리• 결과추적 및 점검

• 조기완료에 의한 시범기간 확보

• 사업 단계별 실적 모니터링을통한 철저한 진척관리

• 사업 단계별 세분화된 일정관리

• 실무협의회를 통한 신속·정확한 의사결정• 정기, 비 정기 진척상황 보고 및 검토 실시

• 분석/설계/개발/시험/운영단계에 걸친 철저한품질관리 수행

• 독립된 내부/외부조직에의한 품질감리 실시

• 사업진행 실적 관리로 일정지연위험 조기 식별

• 사업단계 대상 업무들의 위험 및이슈 발생시 조기대응

조달관리

비용관리

범위관리

• 사업수행일정에 맞춘 인적, 물적 자원 배치

• 사업진행 상황에 따라 자원도입 및 재배치

관리책임자에 의한 통제 및 관리

31/38

Page 39: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

Ⅴ. 서비스 및 사후 지원 3. 교육훈련 / 기술지원

효율적 시스템 운영 및 업무적응 기간 최소화를 위한 실질적인 지원 체계를 제공합니다.

유지보수 수행 내역 신속한 지원체계 보장

지속적인 기술이전 제공철저한 교육 훈련 실시

• 개발자, 운영자, 업무담당자 대상 맞춤형 교육 실시

• 운영자, 업무 담당자 실습위주 집체 교육 실시

• 개발자 실습위주 1:1 교육 실시

• 교육에 필요한 개발, 운영, 업무 매뉴얼 제공

• 시스템 운영 및 유지보수 Know-How 기술 이전

• 프로젝트 산출물 및 관련 자료 제공

• 이슈 및 장애 공동대처를 통한 문제해결 능력 배양

• 안정적인 시스템 운영을 위한안정화기간 1개월간 전담인원 상주 배치

• 기 운영 시스템에 대한 운영 지원

• 검수 후 1년간 하자보증 및 무상보수정비 수행

• 서비스 장애 발생시 4시간 이내 복구적극적인 유지보수 및

장애처리대응 체계 지원

예방정비

유지보수

지원팀

장애처리

본사 기술지원

지원사항

32/38

Page 40: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

포스윈의 통합검색 솔루션은 국내 공공기관, 교육, 금융 분야에 400여개의 레퍼런스를 보유하고 있습니다.

고객사에 최적화된 기능, 역시 MIR-Search

Reference

Page 41: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

대검찰청 – 형사사법통합 대국민 포탈 (www.kics.go.kr )

•시스템명 : 대검찰청 – 형사사법통합 대국민포탈

•시스템개요

-사건진행정보, 온라인 민원처리및안내, 벌과금 납부조회등

각종 형사사법정보를신속 정확하게제공하는대국민서비스

포털

•도입솔루션

- MIR-Search 2.8.0

- MIR-Accessor, MIR-Modifier, MIR-Observer

•운영체계 : UNIX (AIX)

•연계시스템

- DBMS: Oracle

- WAS: JEUS (JSP)

•홈페이지 URL: www.kics.go.kr

•특이사항

- 2008년 1차검색엔진도입이후 지속적인고도화사업으로

검색엔진 고도화

대검찰청 – 형사사법통합 대국민 포탈

Ⅵ . MIR-Search Reference

구축사례

33/38

Page 42: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

경찰청 – 공조조회 포탈(내부시스템)

•시스템명 : 경찰청 – 공조조회포탈

•시스템개요

-경찰청산하기관들의 공조체계를마련하기 위한시스템으로

공조관련정보와“범죄정보관리시스템(CIMS)”의 각 기관별

정보들을통합하여 검색함.

•도입솔루션

- MIR-Search 2.8.0

- MIR-Accessor, MIR-Modifier, MIR-Observer

•운영체계 : UNIX (AIX)

•연계시스템

- DBMS: Oracle, DB2

- WAS: Websphere (JSP)

•홈페이지 URL: 내부시스템

•특이사항

-다우포털솔루션과 연계

-권한검색 (ACL : Access Control Lists) 적용

경찰청 – 공조조회 포탈

구축사례

34/38

Ⅵ . MIR-Search Reference

Page 43: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

교육과학기술부 – 교육 행재정시스템(내부시스템)

•시스템명 : 교육과학기술부 – 교육 행∙재정시스템( 에듀파인 )

•시스템개요

-교육과학기술부(구 교육인적자원부)에 주관하여 국내 16개시도

교육청의교육재정 관련정보및각종지식 정보들에대한통합검색

서비스제공

•도입솔루션

- MIR-Search 2.8.0

- MIR-Accessor, MIR-Modifier, MIR-Observer

•운영체계 : UNIX (AIX)

•연계시스템

- DBMS: Oracle

- WAS: JEUS (JSP)

•홈페이지 URL: 내부시스템

•특이사항

- 16개시도교육청에개발 시스템구축

- 16개시도교육청의정보를 통합하여검색할수있도록 시스템구축

교육과학기술부 – 교육 행재정시스템 (에듀파인)

구축사례

35/38

Ⅵ . MIR-Search Reference

Page 44: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

한국무역보험공사 – 동일국외 기업검색(내부시스템)

•시스템명 : 한국무역보험공사 – 동일국외 기업검색

•시스템개요

-국외기업의상황을 실시간으로 파악하여해당 업체에대한

공사 업무에사용

•도입솔루션

- MIR-Search Pro 2.8.0

- MIR-Accessor, MIR-Modifier, MIR-Observer

•운영체계 : Windows Server 2008 R2

•연계시스템

- DBMS: Oracle 9g

- WAS: JEUS (JSP)

•홈페이지 URL: 내부시스템

•특이사항

-매시간증분색인을 통한최신화

-매일풀색인및검색 2중화시스템에의한안정성

-약 40만건의데이터에대한 신속한검색지원

한국무역보험공사 – 동일국외 기업검색

구축사례

36/38

Ⅵ . MIR-Search Reference

Page 45: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

출입국관리사무소 – Hi Korea(www.hikorea.go.kr)

•시스템명 : 외국인을 위한전자정부(G4F)

•시스템개요

-외국인들을위한 정부의대외국인서비스로서 민원정보와출입국정보

및각종투자, 고용 등의정보들을한,중,일,영문의 정보들을제공하며

이들을통합검색함.

•도입솔루션

- MIR-Search 2.8.0

- MIR-Accessor, MIR-Modifier, MIR-Observer

•운영체계 : UNIX (HP-UX)

•연계시스템

- DBMS: Oracle

- WAS: JEUS (JSP)

•홈페이지 URL: http://www.hikorea.go.kr

•특이사항

-유니코드(UTF8) 코드체계로 구축

-한글문서뿐만아니라영문, 일문, 중문에대한통합검색 서비스

제공

출입국관리사무소 – Hi Korea

구축사례

37/38

Ⅵ . MIR-Search Reference

Page 46: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

주요고객 및 파트너 (공공기관 300여 기관)

38/38

Ⅵ . MIR-Search Reference

Page 47: 국내통합검색엔진기업중최고의안정성을확하고 있습니다 · 2015-03-26 · 무정지시스템 다양한분산검색기법적용 분산색인 어플리케이션통합용이성(c,

㈜포스윈 / www.forcewin.com152-766 서울특별시 구로구 구로3동 에이스테크노타워2차 701호TEL 070-4633-2500 / FAX 070-4015-2500

담당자 : 김선기 Tel : 070-4633-2511C.P : 010-8473-3003