Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
국가RampD인력정보데이터 정제 지침 및 매뉴얼
(Ver 30)
2010 11
저자 소개
손강렬한국과학기술정보연구원 NTIS사업단
RampD정보구축팀 책임연구원 팀장
윤영준한국과학기술정보연구원 NTIS사업단
RampD정보구축팀 선임연구원
신성호한국과학기술정보연구원 NTIS사업단
RampD정보구축팀 선임연구원
양명석한국과학기술정보연구원 NTIS사업단
RampD정보구축팀 선임연구원
김진만한국과학기술정보연구원 NTIS사업단
RampD정보구축팀 선임연구원
김재수한국과학기술정보연구원
NTIS사업단 단장
목 차
Ⅰ 인력정보 데이터 정제 지침 1
1 국가RampD참여인력 및 평가위원 데이터 정제 지침 1
11 정제 필요성 1
12 정제 내용 1
13 정제 대상 2
14 정제 수준 3
15 정제 작업 방식 5
16 검수 확인 6
17 데이터 이관 7
2 인력정보 영문이력 입력 지침 8
21 영문이력 DB 구축 필요성 8
22 영문이력 DB 구축 대상 8
23 영문이력 DB 구축 항목 8
24 영문이력 DB 수집 방법 10
25 영문이력 DB 입력 방법 11
26 영문이력 DB 번역 방법 11
27 검수 확인 12
Ⅱ 인력정보 데이터 정제 매뉴얼 13
1 참여인력 데이터 정제 매뉴얼 13
11 개요 13
12 데이터 정제 목록 및 범위 13
13 데이터 분석 내역 18
14 데이터 정제 기준 26
15 데이터 정제 절차 및 작업 지침 49
16 데이터 검수 86
17 데이터 이관 92
2 인력정보 영문이력 입력 매뉴얼 101
21 개요 101
22 DB 구축 대상 및 범위 102
23 데이터 분석 내역 104
24 DB 구축 절차 및 작업 지침 105
25 DB 구축 검수 123
3 평가위원 데이터 최신성 유지 매뉴얼 129
31 최신성 유지 업무 개요 129
32 대상 인력(평가위원) 정보 수집 방법 131
33 최신성 유지 작업 지침 132
34 최신성 업무 대상 134
35 입력 항목별 QampA(처리 방법 및 사례) 140
첨부1 NTIS 코드 표준 146
- 1 -
Ⅰ 인력정보 데이터 정제 지침
1 국가RampD 참여인력 및 평가위원 데이터 정제 지침
11 정제 필요성
인력정보 데이터는 연구관리전문기관에서 수집하여 통합 구축하므로 여러 기관에 중복으로 입력되어
있을 수 있음
따라서 데이터 정제를 하지 않을 경우 현 재직기관의 중복 논문실적 이중등록 등 통계현황 및 검
색결과에 많은 문제가 발생할 수 있음
또한 각 기관별로 고유의 코드 및 항목체계를 활용하거나 코드가 필요한 항목에 코드를 사용하지
않는 등 NTIS 표준 코드 및 항목에 대한 매핑 필요
NTIS 인력정보의 현황정보 서비스 제공시 누락항목으로 인해 현황정보가 정확하지 않음
12 정제 내용
수집된 인력 정보를 등록하기 위한 데이터 분류 및 분석
여러 기관에 중복 입력된 인력정보에 대한 중복제거 및 데이터 취합
중복제거 후 취합 된 데이터는 확인 정정
- 학력사항 경력사항 등의 정보 이중 등록
- 기관별 인력정보 중 재직기관 상이
각 기관별 코드 및 항목에 대해 통합 인력DB의 코드 및 항목에 맞게 매핑
- 각 기관 고유의 코드 및 항목을 표준 코드 및 항목과 매핑 작업 필요
- 재직기관 전공 등 코드가 필요한 항목에 코드를 활용하지 않는 기관의 데이터는 표준 코드에 맞
게 데이터 변환 필요
기본정보 경력정보 실적정보 등 인력정보에 대한 오류데이터 정정
- 각 항목의 데이터 내용을 검토하여 오류 정정
예) 학력사항의 데이터 내용 중 입학일이 졸업일 보다 나중일 경우 등
인력정보의 누락항목에 대한 보완
- 수집 가능한 범위 내에서 6개 주요항목기준(인력구분 우편번호 주소 소속기관명 전공 학위 등)
보완
- 2 -
구분 항목 세부항목
참여인력정보(42개)
기본정보(9개)주민등록번호 성명 인력구분 자택주소 자택우편번호 자
택전화번호 핸드폰번호 부처(기관)분류코드 E-mail
소속기관사항(6개)소속기관명 부서명 직위명 사무실전화번호 기관주소
최초임용일
학력사항(10개)전공 취득대학 학위 입학일 졸업일 학과 취득국가 지
도교수명 학위논문명 학위취득일
경력사항(3개) 근무처명 직위명 근무기간
자격사항(3개) 자격발행처 자격증명 자격취득일
논문실적(8개)논문발표일 국문논문명 영문논문명 저자역할구분 발
행처 학술지구분 학술지명 SCI여부
지식재산권(3개) 지식재산권명 출원_등록번호 특허구분
평가위원(10개)
소속학협회현황(3개) 담당업무 직위 학협회사항
훈포장사항(3개) 수상년월 수여기관명 훈포장명
저역서실적(4개) 국문저서명 발행년 발행처 저역서구분
13 정제 대상
정제 대상 범위
- 정보연계를 통해 수집되는 참여인력정보의 정제
정제 대상 항목 정의
주요 정제 대상 정의
구분 항목 세부항목
참여인력정보(12개)
기본정보(6개)주민등록번호 성명 인력구분 핸드폰번호 E-mail 부
처(기관)분류코드
소속기관사항(4개) 소속기관명 기관주소 사무실전화번호 직위명
학력사항(2개) 전공 학위
주요 정제 대상 항목이란 인력정보 서비스를 위해 기본적으로 필요한 최소한의 서비스 항목 Not
null값은 아니지만 최대한 많은 자료 수집이 필요한 항목
- 3 -
코드 대상 항목 정의
구분 항목 세부항목
참여인력정보(16개)
기본정보(3개) 자택우편번호 부처(기관)분류코드
소속기관사항(3개) 인력구분 소속기관명 직위명 기관우편번호
학력사항(4개) 전공 학위 학과 취득국가 취득대학
경력사항(2개) 직위명
논문실적(3개) 저자역할구분 학술지구분 SCI여부
지식재산권(1개) 특허구분
평가위원(1개)
저역서실적(1개) 저역서구분
코드 대상 항목이란 데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목
14 정제 수준
데이터 특성 및 정제 지침
- lsquo속성값 전체 존재rsquo 데이터
공통사항 오류 데이터 정정 및 코드 매핑
① 중복 자료 중 데이터 신뢰성에 근거하여 통합 필수 항목 누락 확인 및 보충 선별(성명 주
민등록번호) 형식 확인(주소 전화번호 및 E-Mail)
② 중복 자료 중 최신 자료 선정 및 확인 형식 확인 (주소 전화번호)
③ ⑤~⑪ 중복 자료 중 데이터 신뢰성에 근거하여 통합
번호는 lsquo정제 대상 항목 정의rsquo 표에서 각 항목에 붙여진 번호
- lsquo일부 또는 6개 미만rsquo 데이터
데이터 누락 정도를 판단하여 필요한 경우 해당 기관에 보완 요청
데이터 보완 후 lsquo속성값 전체 존재rsquo 데이터와 같은 방식으로 정제
오류 유형 정의 및 정제 형태
- 발생 가능한 오류 유형
주요 항목 중 데이터가 존재하지 않는 경우
데이터의 Type(문자형 숫자형)에 위배되는 값이 들어있는 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
정해진 법칙에 따른 번호가 아닌 경우
실제로 존재하지 않는 부점(구분자) 등이 입력되어 있는 경우
- 4 -
오류 유형 세부 정제 지침 비고
주요 항목 중 데이터가 null- 정제가 불가능하므로 정보 재수집
(해당 기관에 정보 제공 재요청)
데이터 Type 오류
- 적합한 Type으로 수정 가능한 정도(의미상으로는
유효한 경우)의 오류는 수정하고 그렇지 않은 데
이터는 삭제
데이터 형식 오류- 데이터들 중 가장 많은 유형을 정규 형식 정고 형
식에 위배되는 데이터들은 정규 형식으로 변환
부점(구분자) 오류
- 실제 서비스 되는 데이터값과 비교하여 변환 과정
에서 발생한 오류면 실제 데이터값으로 변환하고
원시 데이터 자체가 오류인 경우에는 삭제 처리
코드값 오류
- 일치 유사한 코드값으로 변환
- 유사 가장 적합한 코드값으로 변환
- 상이 lsquo기타rsquo코드값으로 분류 또는 삭제
논문제목 오류 - 논문제목1은 반드시 필수 입력으로 처리
중복 데이터들의 데이터 값
상충 오류
- 변경될 수 없는 기본정보(이름 주민번호)의 경우는
기존 데이터 우선
- 변경 가능한 정보(기관명 논문 등)의 경우 최신 업
데이트된 정보를 우선
코드의 값이 정해진 범위를 벗어나는 경우
ex) 기관 코드와 인력시스템 사용 코드와의 매핑 오류
기관 데이터의 코드 항목 값이 잘못 입력되어 있는 경우
국문과 영문으로 구분되는 동일 데이터 항목에 잘못된 위치에 항목 값이 입력되어 있는 경우
ex) 논문실적정보의 국문제목에 영문제목이 입력되어 있는 경우
데이터가 복수로 존재하며 서로 상충되는 경우
ex) 유효하지 않은 주민등록번호의 중복
- 조치 가능한 데이터 정제 형태
재수집 데이터를 제공한 기관에 재요청하여 부족한 데이터 내용을 재수집
수정 데이터 내용은 수정하지 않고 데이터 형태 및 특수문자 수정 정도의 정제
삭제 데이터 값 삭제(Garbage 처리) 또는 레코드 삭제
위의 경우 원시 데이터 값은 관리를 위해 따로 보관
정제 제외 데이터 값이 누락이거나 오류로 판단되지만 정확한 데이터 내용을 알 수 없는 경
우 기준 데이터가 없으므로 정제 대상에서 제외 또한 별다른 오류로 보이지 않는 경우도 정
제 대상에서 제외
오류 유형별 세부 정제 지침
~은 lsquo발생 가능한 오류 유형rsquo 내용 참조
~은 lsquo조치 가능한 데이터 정제 형태rsquo 내용 참조
- 5 -
구분 비고
기본정보 이메일 기존 수집 데이터를 통해 보완
소속기관사항 있으나필드가 null인것
인력구분 기관명이형전거DB 생성 완료 후 적용함
소속기관 우편번호주소가 있는 경우 우편번호 찾기를 통해 보완주소가 없는 경우 기존 수집 데이터를 통해 보완
소속기관 주소 기존 수집 데이터를 통해 보완
소속기관명기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
학력사항 있으나 필드가null인것
전공기존 수집 데이터를 통해 보완하고 기관명이형전거DB로 매핑함
학위기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
소속기관사항 없는것 기존 수집 데이터를 통해 보완
학력사항 없는것 기존 수집 데이터를 통해 보완
인력정보의 누락항목에 대한 보완(기존 서비스 데이터 기준)
기타 (정보 식별자 부여)
- 데이터 정제 최종 단계에서 식별자 부여 체계에 따라 정보식별자(번호) 삽입
- 정보식별자(번호)는 식별체계 API에 의해 자동으로 부여 되며 식별 부여 체계는 사업단 내 식별
체계 담당자가 마련하여 제공
고려 사항
- 정확한 항목매핑 후 작업이 진행되어야 함
- 정제데이터 관리는 임시테이블을 통해서 관리되며 다양한 에러 유형별로 체계적인 관리가 되어야 함
15 정제 작업 방식
중복 확인 기계작업
- 정제 도구에서 제공하는 중복 확인 기능을 이용하여 중복 항목의 리스트 작성(기계작업)
데이터 통합 기계작업 + 수작업
- 중복으로 확인된 항목들의 리스트를 비교하여 통합
- 기계적으로 필드간의 충돌이 없음을 확인할 수 있는 항목은 자동 통합하고 기계적으로 충돌을
- 6 -
확인할 수 없는 경우는 수작업으로 필드별 데이터 통합을 수행
- 최신 또는 최종 여부를 확인하여 통합해야 하는 경우 해당 데이터에 포함된 일자 데이터를 감안
하여 선별 통합(일자 및 기간의 충돌이 없는 경우 기계작업 충돌이 있는 데이터는 리스트 업
후 수작업)
필수 데이터 누락 확인 및 보충 선별 기계작업 + 수작업
- 소속기관명 E-mail 등과 같이 누락되지 말아야 할 항목을 설정하고 기계적으로 누락된 항목의
리스트를 추출(기계작업)
- 이 리스트에 대하여 보충 가능한 데이터는 보충하고 보충이 불가능한 경우 서비스 불가 리스트
로 따로 추출(수작업)
형식 확인 기계작업 + 수작업
- E-Mail 주소 전화번호와 같은 형식이 어느 정도 정의된 데이터의 경우 기본 형식을 템플릿으
로 지정
- 정형화되지 않은 데이터의 리스트를 추출하여 이 중 기계적으로 형식을 일치시키고(기계작업)
일치되지 않은 데이터를 수작업으로 확인하여 수정하거나 형식 불량 데이터 리스트로 따로 추
출(수작업)
16 데이터 검수
161 데이터 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
- 7 -
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
17 데이터 이관
171 NTIS 참여인력 DB 현황 및 데이터 흐름
NTIS 참여인력 DB는 물리적으로 각 연계기관과 NTIS의 데이터 연계를 위해 각 연계기
관에 구성된 연계기관 공동활용 DB와 RampD 참여인력을 관리하기 위한 인력DB RampD참여
인력 서비스 DB로 구성되어 있다
그림 3 NTIS DB 현황 및 데이터 흐름
172 NTIS DB 간 테이블 매핑
NTIS 참여인력 DB가 기능별로 분리되어 있음으로 인해 연계DB에서 인력 관리DB 간
항목 매핑 정의가 필요하다 DB 간 항목 매핑은 아래와 같다
정보구분 테이블명 수집DB 관리DB
인력정보
인력 기본정보 MP_BASIC THR_BASE
소속기관사항 HOFF_ORG THR_JAEJIK
학력사항 SCRE THR_SCHOOL
경력사항 CAREER THR_CAREER
논문실적 PAPER_OUT THR_PAPER
자격사항 CERT THR_LICENSE
지식재산권실적 IPR_OUT THR_PATENT
소속학협회현황 BLNG_INSTIT THR_ACTIVE
저역서실적 TRNSWRT_OUT THR_BOOK
훈포장사항 AWARD THR_MEDAL
- 8 -
항 목 세 부 항 목
기본
기본정보 영문성명 휴대전화 E-mail 개인홈페이지
전문분야 전문(연구)분야
재직기관 기관명 부서명 직위 주소 전화 팩스
학력 최종학위 학위 학위취득일 학교명 전공명
경력 경력사항 시작년월 종료년월 재직기관명 직위
실적
논문실적 논문명 저널명 게제(권)집 페이지 게제년월 공동저자명
연구실적 시작년월 종료년월 발주기관 참여구분(역할) 연구명
특허출원등록구분 출원등록번호 출원등록국가 특허출원명 출
원등록일자
173 데이터 이관
수집 DB에 전송되는 인력정보는 중복 인력이 존재 하며 동일인물의 정보일 지라도 각
기관별 보유 항목이 다르므로 관리DB로 이관을 위해 각 항목별 이관 방안이 필요하다 따
라서 별도의 방안을 마련하여 데이터 이관을 실시하도록 한다
2 인력정보 영문이력 입력 지침
21 영문이력 DB 구축 필요성
해외의 연구자 혹은 외국의 연구기관등에게 관련분야의 연구자문에 필요한 국내 연구전
문가 혹은 국제 공동연구활동 등을 지원하기 위한 국내 인물에 대한 영문검색 체널제공
인물정보에 대하여 영문DB구축을 수행하고 웹을 통한 영문검색을 지원함으로써 국제공
동연구를 지원하기 위한 기반을 조성
기존 개인정보 공동활용에 동의한 연구자들을 대상으로 파악한 영문이력DB 구축방법을
통해 인력정보에 대하여 영문화 작업을 수행
22 영문이력 DB 구축 대상
기본정보 학력사항 경력사항 논문실적 연구실적 특허실적 등
23 영문이력 DB 구축 항목
영문이력서 제공가능 인력에 대해 영문이력서를 제공받아 이를 바탕으로 영문 DB를 구
축하고 번역 요청자를 대상으로 번역을 통한 영문DB구축
- 9 -
항 목 세 부 항 목 영문명 비고
기본(BasicInformation)
기본정보 영문성명 English Name - 한글이력정보와 공동 사용- 전문분야는lsquo08 개정 분류코드 영문명 활용
휴대전화(국가번호)
Cellular PhoneNumber
E-mail E-mail
개인홈페이지 Homepage
전문분야 전문(연구)분야 Research Field 1
Research Field 2
Research Field 3
검색키워드 전문분야명
재직기관(organization)
기관명 Organization Name - 현재 재직기관사항 1개 입력
부서명 Department
직위 Job title(position)
우편번호 Postal Code
주소 Address
전화(국가번호) Telephone
팩스(국가번호) Fax
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) Degree Code
학위취득일 GraduationDate
학교명 School
전공명 Major
경력(Career)
경력사항(CAREER)
시작년월 Start Date - 재직 경력으로 주요 경력입력 현 재직정보제외
종료년월 End Date
재직기관명 Organization Name
직위 Position(Job Title)
실적ResearchResult
논문실적(paper)
논문명 Title - 최근 5년 이내만 입력저널명 Journal Name
게제(권)집 Volume
게제호 Number
시작페이지 Start Page
종료페이지 End Page
게제년월 Date of Publication
공동저자명 Co-Author
비고 Etc
연구실적ResearchProject
시작년월 Start Date
종료년월 End-Date
발주기관 Funding organization
참여구분(역할)-코드
Role
연구실적명 title
영문이력 구축 대상 항목 정의
- 10 -
특허(patent)
출원등록구분-코
드
appliedregistered
출원등록번호 number
출원등록국가-코
드
National Code
특허출원명 Patent name
출원등록일자 Date
코드 대상 항목(데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목)
코드 대상 항목 정의
항목 세부항목 코드
전문분야(3개) 전문(연구)분야NTIS 표준코드(국가과학기술
표준분류) 활용
학력사항(1개) 최종학위
2(학사)
5(석사)
8(박사)
연구실적(1개) 참여구분(역할)A(연구책임자)
B(참여연구원)
특허실적(2개)특허구분(출원등록)
01(출원)
02(등록)
등록국가 NTIS 표준코드 활용
코드 대상 항목이란 데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목
daggerNTIS 표준코드에 영문명을 포함하여 사용
24 영문이력 DB 수집 방법
E-mail을 통한 영문이력서 제공 요청 메일 발송
- 영문이력 DB 구축에 동의하고 영문이력서 제공이 가능한 연구자 대상
전화연락을 통한 이력서 수집
- 영문이력서 제공 요청 메일과 병행하여 영문이력서 제공동의자를 대상으로 영문이력
입력자들이 전화를 통하여 이력서 수집 요청
E-mail을 통한 영문이력서 번역 대행 안내 메일 발송
- 영문이력 DB 구축에 동의한 번역 요청 동의자를 대상으로 메일 발송
이력정보(한글)는 poolkistirekr을 통해 파일형태로 수집 관리함
이력정보(한글)는 메일을 통해서 파일형태(HWP MS-WORD PDF 등)로만 수집함
- 11 -
항 목 선처리 항목
기본 재직기관 기관명 직위
학력 최종학위 학교명 전공명
경력 경력사항 재직기관명 직위
실적논문실적 저널명
연구실적 발주기관
구분 선처리 방법
기관명
기관명(재직기관)
학교명(학력사항)
재직기관명(경력사항)
발주기관(연구실적)
- 웹검색(예 NAVER 백과사전 및 기관 홈페이지)
웹검색시는 출처 기록
- 웹검색 불가는 직접번역
직위직위(재직기관)
직위(경력사항)
- 직위에 대한 영문 코드표 참조
영문 코드표의 출처 기록
전공명 전공명(학력사항)- 전공명에 대한 영문 코드표 참조
영문 코드표의 출처 기록
저널명 저널명(논문실적)- 웹검색(예 httpsocietykistirekr)
웹검색시는 출처 기록
25 영문이력 DB 입력 방법
영문이력 입력
- 수집된 영문이력서는 입력자들이 등록수정 화면을 통해 직접 입력
영문이력 입력결과 확인
- 입력 완료된 영문이력서의 확인은 다른 입력자에 의해 입력결과를 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 본인확인
- 영문이력서의 입력 확인 완료 후 영문이력 본인에게 안내메일을 발송하여 확인
- 본인확인에 의해 수정 가능
26 영문이력 DB 번역 방법
영문이력 선처리 작업
- 영문이력 번역 수행 전 공통적인 항목에 대해 선처리 작업 수행
영문이력 번역
- 인력DB의 번역 대상자 및 수집된 이력서는 영문이력 관리 기능을 통해 번역 수행
- 12 -
영문이력 번역확인
- 번역 완료된 영문이력정보의 확인은 다른 번역자에 의해 번역결과를 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 전문가검수
- 번역확인 완료된 영문이력정보의 검수는 전문가에 의해 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 본인확인
- 영문이력정보의 번역 번역확인 전문가검수 완료 후 영문이력 본인에게 안내메일을
발송하여 확인
- 본인확인에 의해 수정 가능함
KISTI 검수
- KISTI 검수 절차를 거쳐 영문이력에 대해 서비스 제공
27 검수 확인
입력 및 번역 결과 보고
- 주간보고 영문이력 번역에 대한 현황을 매 주 보고
- 이슈사항보고 이슈사항 발생 시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 데이터(전체 항목 필드 기준)의 01 이하(품질목표 999)
- 오류 체크 방식 전체 데이터에서 본인확인 미완료 대상 중 무작위로 30 샘플링
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상
데이터건수) 항목가중치의 합산 결과가 01 이하
- 전문가검수는 모든 번역대상자를 대상으로 수행
- 번역확인 및 전문가검수 단계에서 자체적으로 품질 활동 수행
오류율 산정 기준
- 인력정보 영문이력에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며
오류율 산정에서 제외함
- 13 -
구분 항목 세부항목 세부항목 설명
참여인력정보(42개)
기본정보(8개)
주민등록번호 인력 고유의 주민등록번호
성명 인력 한글 영문 한자 성명
자택주소 인력 본인의 자택 주소
자택우편번호 인력 본인의 자택 우편번호
자택전화번호 인력 본인의 자택 전화번호
핸드폰번호 인력 본인의 핸드폰 번호
E-mail 인력 본인의 E-mail
부처(기관)분류코
드인력 본인의 부처(기관)분류코드
Ⅱ 인력정보 데이터 정제 매뉴얼
1 참여인력 데이터 정제 매뉴얼
11 개요
111 정제 목표
인력데이터는 연구관리전문기관에서 수집하여 통합 구축하므로 여러 기관에 중복으로 입력되어 있
는 경우에 이중등록 데이터가 존재할 수 있어 이를 NTIS에서 활용하기 위해서 정의된 중복기준에
따라 이중등록 확인 및 제거하는 데이터 정제를 절차에 따라 수행
연구관리전문기관의 인력정보관리시스템의 미비 또는 관리체계의 미흡으로 인해 발생된 누락데이
터 및 입력된 데이터의 오류를 수행 가능한 범위 내에서 작업자 및 시스템에 의한 오류 수정
연구관리전문기관별로 각각의 고유의 코드 및 항목체계를 활용하거나 코드가 필요한 항목에 코드
를 사용하지 않고 있는 실정이며 이러한 연구관리전문기관 인력데이터를 NTIS에서 활용하기 위
해서는 NTIS 통합 표준 코드 및 항목으로의 매핑
12 데이터 정제 목록 및 범위
121 데이터 정제대상 및 항목 정의
- 14 -
구분 항목 세부항목 세부항목 설명
소속기관사항(7개)
소속기관명 인력 본인의 현재 소속기관명칭
학과부서명 인력 본인의 소속기관 내 소속학과부서명
직위명 인력 본인의 소속기관 내 직위명칭
사무실전화번호 인력 본인의 소속기관 내 전화번호
기관주소 현재 소속기관의 우편번호 및 상세주소
인력구분 인력구분(대학교 연구소 산업계 기타)
최초임용일 현재 소속중인 기관에 최초 임용(근무)일
학력사항(10개)
전공 인력의 학위별 전공명
취득대학 인력의 학위별 출신 대학교명
학위학력정보의 학위종류예) 학사이하 석사 박사수료 박사
입학일 인력의 학위별 입학년월
졸업일 인력의 학위별 졸업년월
학과 인력의 학위별 출신 대학교 학과명
취득국가 인력의 학위별 출신 대학교 소재지(국가)
지도교수명 인력의 각 학위별 지도교수명
학위논문명 인력의 최종학위취득시 제출한 논문명
학위취득일 인력의 최종학위취득일
경력사항(3개)
근무처명인력의 전ㆍ현재 직업 및 교육과정의 기관명 및세부사항(학과 부서 등)
직위명인력의 전ㆍ현재 직업 및 교육과정의 직급 또는직위명
근무기간인력의 전ㆍ현재 직업 및 교육과정의 시작년월및 종료년월
자격사항(3개)
자격발행처 인력이 발급받은 자격증 등의 발급기관명
자격증명 인력이 발급받은 자격증 등의 자격명
자격취득일 인력이 발급받은 자격증 등의 발급년월
논문실적(8개)
논문발표일 인력이 저술한 논문을 게재하거나 발표한 년월
논문제목1 인력이 저술한 논문의 논문제목1
- 15 -
구분 항목 세부항목 세부항목 설명
논문제목2 인력이 저술한 논문의 논문제목2
저자역할구분
인력이 저술한 논문에 있어서의 역할정도예) 단독공동제1주저자공저자교신(책임)저자
발행처인력이 저술한 논문이 실린 간행물을 발행한 발행처
학술지구분
인력이 저술한 논문의 게재 및 발표형태와 장소에 관련하여 학술지구분예) 국외전문학술지 국외학술대회발표논문집 국내전문학술지 국내학술대회발표논문집 기타논문집
학술지명 인력이 저술한 논문이 실린 간행물의 명칭
SCI여부인력이 저술한 논문이 실린 간행물이 SCI에 수록된 간행물 구분
지식재산권(3개)
지식재산권명 인력이 출원하거나 등록한 지식재산권명
출원_등록번호인력이 출원하거나 등록한 지식재산권의 출원등록번호
특허구분
인력이 출원하거나 등록한 지식재산권의 종류예) 특허 실용신안 디자인 상표 기타 프로그램(SW)저작권 신기술 인증 신제품 인증 국제출원(PCT) 서비스
평가위원(11개)
소속학협회현황(3개)
담당업무인력의 전ㆍ현재 소속 학회 및 협회 내에서의 담당업무
직위 인력의 전ㆍ현재 소속 학회 및 협회 내에서의 직위
학협회사항 인력의 전ㆍ현재 소속 학회 및 협회명
훈포장사항(3개)
수상년월 인력이 훈장 포장 등을 수상한 년월
수여기관명 인력이 수상한 훈장 포장 등을 수여한 기관명
훈포장명 인력이 수상한 훈장 포장 등의 수상명
저역서실적(5개)
저서명1 인력이 저술하거나 역술한 도서의 제목1
저서명2 인력이 저술하거나 역술한 도서의 제목2
발행년 인력이 저술하거나 역술한 도서를 발행한 년도
발행처 인력이 저술하거나 역술한 도서를 발행한 장소
저역서구분 인력이 저술하거나 역술한 도서에 대한 구분 예) 저서 역서
- 16 -
구분 항목 세부항목 현행 DB 항목식별
항목비고
참여
인력
정보
(56개)
기본정보
(12개)
주민등록번호
인물ID NTIS 식별체계 생성
인물관리번호(KOI) 시스템 생성
주민등록번호 lsquo-rsquo포함 14자리
성명
성명-한글
성명-영문
성명-한자
자택주소기본주소(주소1) 우편번호 내 주소를 참조
상세주소(주소2)
자택우편번호 우편번호
자택전화번호 전화번호
핸드폰번호 핸드폰번호
E-mail E-mail
소속기관
사항
(11개)
소속기관명소속기관코드 소속기관명 기준 매핑
기관명이형전거DB 활용소속기관명
부서명 근무부서명
직위명직위코드 직위명 기준 매핑
NTIS 직위코드직위명
사무실전화번
호사무실전화
기관주소
우편번호
기본주소(주소1) 우편번호 내 주소를 참조
상세주소(주소2)
인력구분
인력유형구분
(대학교 연구소 산업
계 기타)
NTIS 인력구분코드
기관명이형전거DB 활용
최초임용일 최초임용일
학력사항
(14개)
전공전공분야 전공명 기준 매핑
NTIS 전공코드전공명
취득대학학위취득대학코드 학위취득대학명 기준 매핑
기관명이형전거DB 활용학위취득대학명
학위 학위코드 NTIS 학위코드
입학일 입학년월
졸업일 졸업년월
학과학과코드 학과명 기준 매핑
NTIS 학과코드학과명
취득국가 취득국가코드 NTIS 국가코드
지도교수명 지도교수명
정제 대상 항목
공동활용정보를 포함하는 현행 DB 구성 기준 69개 항목
- 17 -
구분 항목 세부항목 현행 DB 항목식별
항목비고
학위논문명최종학위논문명1
최종학위논문명2
학위취득일 최종학위취득일
경력사항
(5개)
근무처명 근무처명
직위명직위코드 직위명 기준 매핑
NTIS 직위코드직위명
근무기간근무시작일
근무종료일
자격사항
(3개)
자격발행처 자격발행처
자격증명 자격증명
자격취득일 자격취득일
논문실적
(8개)
논문발표일 논문발표일
논문제목1 논문제목1
논문제목2 논문제목2
저자역할구분 저자역할구분 NTIS 저자역할구분 코드
발행처 발행처명
학술지구분 학술지구분 NTIS 학술지구분코드
학술지명 학술지명
SCI여부 SCI여부 NTIS SCI 여부구분 코드
지식
재산권
(3개)
지식재산권명 지식재산권명
출원_등록번호 출원등록번호
특허구분 특허구분 NTIS 특허구분 코드
평가
위원
(13개)
소속학협
회
현황
(5개)
담당업무 담당업무
직위 직위 직위명
학협회사항
학협회명
활동시작일
활동종료일
훈포장
사항
(3개)
수상년월 수상년도
수여기관명 수여기관명
훈포장명 수상명
저역서
실적
(5개)
저역서명1 저역서명1
저역서명2 저역서명2
발행년 발행년도
발행처 발행처명
저역서구분 저역서구분 NTIS 저역서 구분 코드
- 18 -
구분 항목 세부항목 정제항목 오류유형 비고
참여
인력
정보
(56개)
기본정보
(12개)
주민등록번호
인물ID
-인물ID이 발급되지 않는 경우
예) 외국인 주민등록번호 유효하
지 않거나 중복된 경우
인물관리번호(KOI)1 포맷 오류
예) 자리수 lsquo-rsquo가 있는 경우
주민등록번호
-주민등록번호가유효하지않는경우
예) lsquo-rsquo포함한 14자리가 아닌경우
주민등록번호규칙에맞지않은경우
-중복되는 주민등록번호의 경우
-공란 및 특수문자가 있는 경우
이관 후 서비
스대상에서
제외
성명
성명-한글
-Null인 경우
-공란 및 특수문자 숫자가 있는
경우
-한글이 아닌 경우이관 후 성명
없으면 서비
스대상에서
제외
성명-영문
-공란 및 특수문자 숫자가 있는
경우
-영문성명의 범위를 벗어나는 경
우
예) Lee KHS
성명-한자
-공란 및 특수문자 숫자가 있는
경우
-한자가 아닌 경우
자택주소
기본주소(주소1)
-우편번호 존재하고 Null의 경우
-우편번호의 주소와 상이한 경우
-주소지 정보가 아닌 경우
상세주소(주소2)
-우편번호 및 기본주소 Null의
경우
-주소정보가 아닌 경우
자택우편번호 우편번호-우편번호 Null인 경우
-우편번호가 old data인 경우
자택전화번호 전화번호 -전화번호 Null인 경우
13 데이터 분석 내역
131 세부 항목별 오류 패턴유형 분석
인력데이터
항목별 정해진 규칙에 위배되는 값이 들어있는 경우
- 19 -
구분 항목 세부항목 정제항목 오류유형 비고
-전화번호가 표준 형식이 아닌
경우
-전화번호 데이터가 아닌 경우(지
역번호 없는 경우 포함)
-핸드폰번호인 경우
핸드폰번호 핸드폰번호
-핸드폰번호 Null인 경우
-핸드폰번호가 표준 형식이 아닌
경우
-핸드폰번호 데이터가 아닌 경우
(지역번호 없는 경우 포함)
-전화번호인 경우
E-mail E-mail
-E-mail Null인 경우
-표준 이메일 형식이 아닌 경우
-구분자가 잘못된 경우
-가베지 성 데이터 존재
소속기관
사항(11개)
소속기관명
소속기관코드 NA코드 오류
유형 참조
소속기관명-소속기관명이 기관명이형전거DB
내 대표기관명이 아닌 경우
대표기관명으
로 갱신
부서명 근무부서명 -근무부서명 Null인 경우
직위명
직위코드 NA코드 오류
유형 참조
직위명
-직위명 Null인 경우
-직위명이 직위코드 내 명칭이
아닌 경우
사무실전화번호 사무실전화
-전화번호 Null인 경우
-전화번호가 표준 형식이 아닌
경우
-전화번호 데이터가 아닌 경우(지
역번호 없는 경우 포함)
-핸드폰번호인 경우
기관주소
우편번호-우편번호 Null인 경우
-우편번호가 old data인 경우
기본주소(주소1)
-우편번호 존재하고 기본주소
Null의 경우
-우편번호의 주소와 상이한 경우
-주소지 정보가 아닌 경우
상세주소(주소2) -우편번호 및 기본주소 Null의
- 20 -
구분 항목 세부항목 정제항목 오류유형 비고
경우
-주소정보가 아닌 경우
인력구분 인력유형구분 NA코드 오류
유형 참조
최초임용일 최초임용일 NA날짜 오류
유형 참조
학력사항
(14개)
전공전공분야 NA 코드 오류
유형 참조전공명 -전공명 Null인 경우
취득대학
학위취득대학코드 NA코드 오류
유형 참조학위취득대학명 -학위취득대학명 Null인 경우
학위 학위코드 NA코드 오류
유형 참조
입학일 입학년월 NA날짜 오류
유형 참조
졸업일 졸업년월 NA날짜 오류
유형 참조
학과
학과코드 NA코드 오류
유형 참조학과명 -학과명 Null인 경우
취득국가 취득국가코드 NA코드 오류
유형 참조
지도교수명 지도교수명 -지도교수명 Null인 경우
학위논문명
최종학위논문명1 -가베지 데이터인 경우
최종학위논문명2 -가베지 데이터인 경우
학위취득일 최종학위취득일 NA날짜 오류
유형 참조
경력사항
(5개)
근무처명 근무처명-근무처명 Null인 경우
-가베지 데이터인 경우
직위명
직위코드 NA 코드 오류
유형 참조직위명 1 직위명 Null인 경우
근무기간
근무시작일 NA날짜 오류
유형 참조
근무종료일 NA날짜 오류
유형 참조
- 21 -
구분 항목 세부항목 정제항목 오류유형 비고
자격사항
(3개)
자격발행처 자격발행처-자격발행처 Null인 경우
-가베지 데이터인 경우
자격증명 자격증명-자격증명 Null인 경우
-가베지 데이터인 경우
자격취득일 자격취득일 NA날짜 오류
유형 참조
논문실적
(8개)
논문발표일 논문발표일 NA날짜 오류
유형 참조
논문명1 논문제목1 -가베지 데이터인 경우
논문명2 논문제목1 -가베지 데이터인 경우
저자역할구분 저자역할구분 NA코드 오류
유형 참조
발행처 발행처명-발행처명 Null인 경우
-가베지 데이터인 경우
학술지구분 학술지구분 NA코드 오류
유형 참조
학술지명 학술지명-학술지명 Null인 경우
-가베지 데이터인 경우
SCI여부 SCI여부 NA코드 오류
유형 참조
지식
재산권
(3개)
지식재산권명 지식재산권명-지식재산권명 Null인 경우
-가베지 데이터인 경우
출원_등록번호 출원등록번호-출원등록번호 Null인 경우
-가베지 데이터인 경우
특허구분 특허구분 NA코드 오류
유형 참조
평가
위원
(13개)
소속학
협회
현황
(5개)
담당업무 담당업무-담당업무 Null인 경우
-가베지 데이터인 경우
직위 직위-직위 Null인 경우
-가베지 데이터인 경우
학협회사항
학협회명
-학협회명 Null인 경우
-직위명이 포함된 경우
-가베지 데이터인 경우
활동시작일 NA날짜 오류
유형 참조
활동종료일 NA날짜 오류
유형 참조
- 22 -
구분 항목 세부항목 정제항목 오류유형 비고
훈포장
사항
(3개)
수상년월 수상년도 NA날짜 오류
유형 참조
수여기관명 수여기관명-수여기관명 Null인 경우
-가베지 데이터인 경우
훈포장명 수상명-수상명 Null인 경우
-가베지 데이터인 경우
저역서
실적
(5개)
저역서명
저역서명1 -가베지 데이터인 경우
저역서명2 -가베지 데이터인 경우
발행년 발행년도 NA날짜 오류
유형 참조
발행처 발행처명-발행처명 Null인 경우
-가베지 데이터인 경우
저역서구분 저역서구분 NA코드 오류
유형 참조
구분 항목 세부항목 정제항목 오류내역 비고
참여
인력
정보
(11개)
소속기관사항(1개) 최초임용일최초임용일
YYYYMMDD
-YYYY가 없는 경우(누락)
-MM이 없는 경우
-DD가 없는 경우
-YYYYMMDD이 유효하지
않은 경우
학력사항(3개)
입학일입학년월
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
졸업일졸업년월
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-입학년월보다 같거나 작
은 경우
학위취득일최종학위취득일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
- 23 -
구분 항목 세부항목 정제항목 오류내역 비고
경력사항(2개) 근무기간
근무시작일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
근무종료일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-근무시작일보다 같거나
작은 경우
자격사항(1개) 자격취득일자격취득일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
논문실적(1개) 논문발표일논문발표일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
소속학협회현황(2개) 학협회사항
활동시작일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
활동종료일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-활동시작일보다 같거나
작은 경우
훈포장사항(1개) 수상년월수상년도
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우평가
위원
(1개)
저역서실적(1개) 발행년발행년도
YYYY
-YYYY이 없는 경우(누락)
-YYYY이 유효하지 않은
경우
시작일보다 종료일이 같거나 작은 경우 종료일을 삭제
날짜의 경우 본인의 생년월일보다 작을 수 없음
- 24 -
구분 항목 세부항목 정제항목 오류유형 비고
참여
인력
정보
(14개)
기본
정보
(1개)
자택우편번호 우편번호-Null 경우
-우편번호와 주소정보가 불일치
외국주소는
유지
소속
기관
사항
(4개)
소속기관명소속기관코드
소속기관명
-소속기관명만 존재하는 경우
-소속기관코드가 기관명이형전거
DB의 이형기관코드가 아닌 경우
-소속기관명이 기관명이형전거DB
의 대표기관명이 아닌 경우
직위명직위코드
직위명
-직위명만 존재하는 경우
-직위명 직위코드가 존재하지 않
는 경우
기관주소 우편번호-Null의 경우
-우편번호와 주소정보가 불일치
인력구분 인력유형구분-기관명이형전거DB의 기관유형구
분과 불일치
학력
사항
(4개)
전공전공분야
전공명
-전공명만 존재하는 경우
-전공명 전공분야코드가 Null인 경우
취득대학학위취득대학코드
학위취득대학명
-학위취득대학명만 존재하는 경우
-학위취득대학코드가 기관명이형
전거DB의 이형기관코드가 아닌
경우
-학위취득대학명이 기관명이형전
거DB의 대표기관명이 아닌 경우
학위 학위코드
-학위코드가 Null인 경우
-학위코드가 구분 코드내 표함되
지 않는 경우
학과학과코드
학과명
-학과명만 존재하는 경우
-학과명 학과코드가 존재하지 않
는 경우
취득국가 취득국가코드
-Null인 경우
-기관 국가코드와 NTIS 국가코드
매핑 오류
경력
사항
(1개)
직위명직위코드
직위명
-직위명만 존재하는 경우
-직위명 직위코드가 Null인 경우
코드의 값이 정해진 범위를 벗어난 경우
- 25 -
구분 항목 세부항목 정제항목 오류유형 비고
논문
실적
(3개)
저자역할구분 저자역할구분
-Null인 경우
-저자역할구분이 구분 코드 내 포
함되지 않은 경우
학술지구분 학술지구분
-학술지구분이 Null인 경우
-학술지구분이 구분 코드내 포함
되지 않은 경우
SCI여부 SCI여부
-Null인 경우
-SCI여부가 구분코드 내 포함되지
않은 경우
지식
재산
권
(1개)
특허구분 특허구분
-Null인 경우
-특허구분이 구분 코드내 포함되
지 않은 경우
평가
위원
(1개)
저역
서
실적
(1개)
저역서구분 저역서구분
-Null인 경우
-저역서구분이 구분 코드 내 포함
되지 않은 경우
구분 항목 이중등록 검사 항목 기준 비고
참여인력
기본정보 주민등록번호() 주민등록번호는 유일해야 함
소속기관사항 소속기관명()소속기관명(대표기관명) 유일
해야 함
학력사항
1 취득대학() 학위() 입학일
2 취득대학() 학위() 졸업일
3 취득대학() 학위() 전공
4 취득대학() 학위() 학과
5 취득대학() 학위() 학위취득일
취득대학은 대표기관명으로
비교 함
경력사항1 근무처명() 직위명 근무시작일
1 근무처명() 직위명 근무종료일
논문실적
1 논문명() 논문발표일 학술지명
2 논문명() 논문발표일 ISSN
3 논문명() ISSN 게재권집 게재호
4 논문명() 학술지명 게재권집 게재호
132 이중등록 유형 분석
이중등록 정제 기준 정의( 주키)
- 26 -
구분 항목 이중등록 검사 항목 기준 비고
지식재산권
1 출원_등록번호()
2 지식재산권명() 출원등록구분() 특허구분
() 출원국가
저역서실적1 ISBN
2 저역서명() 저역서구분() 발행년 발행처
평가위원
소속학협회현황1 학협회명() 직위 시작일
1 학협회명() 직위 종료일
훈포장사항 훈포장명() 수상년월 수여기관명
자격사항 자격증명() 자격발행처 자격취득일
이중등록 데이터 분석 방법
- 데이터 정제 결과 데이터를 대상으로 기본정보는 주민등록번호 이외의 정보는 이중등록 검사 항
목을 기준으로 하여 시스템 정제를 통해 인력별 동일한 데이터가 존재하는지를 파악함
14 데이터 정제 기준
141 정제 지침
정제 내용
수집된 인력 정보를 등록하기 위한 데이터 분류 및 분석
여러 기관에 중복 입력된 인력정보에 대한 중복제거 및 데이터 취합
중복제거 후 취합 된 데이터는 확인 정정
- 학력사항 경력사항 등의 정보 이중 등록
- 기관별 인력정보 중 소속기관 상이
각 기관별 코드 및 항목에 대해 통합 인력DB의 코드 및 항목에 맞게 매핑
- 각 기관 고유의 코드 및 항목을 표준 코드 및 항목과 매핑 작업 필요
- 소속기관 전공 등 코드가 필요한 항목에 코드를 활용하지 않는 기관의 데이터는 표준 코드에
맞게 데이터 변환 필요
기본정보 경력정보 실적정보 등 인력정보에 대한 오류데이터 정정
- 각 항목의 데이터 내용을 검토하여 오류 정정
예) 학력사항의 데이터 내용 중 입학일이 졸업일 보다 나중일 경우 등
인력정보의 누락항목에 대한 보완
- 수집 가능한 범위 내에서 6개 주요항목기준(인력구분 우편번호 주소 소속기관명 전공 학위
등) 보완
- 27 -
구분 항목 세부항목
참여인력정보(41개)
기본정보(7개)주민등록번호 성명 자택주소 자택우편번호 자택전화번호
핸드폰번호 E-mail
소속기관사항(7개)소속기관명 부서명 직위명 사무실전화번호 기관주소 인
력구분 최초임용일
학력사항(10개)전공 취득대학 학위 입학일 졸업일 학과 취득국가 지도
교수명 학위논문명 학위취득일
경력사항(3개) 근무처명 직위명 근무기간
자격사항(3개) 자격발행처 자격증명 자격취득일
논문실적(8개)논문발표일 국문논문명 영문논문명 저자역할구분 발행처
학술지구분 학술지명 SCI여부
지식재산권(3개) 지식재산권명 출원_등록번호 특허구분
평가위원(11개)
소속학협회현황(3개) 담당업무 직위 학협회사항
훈포장사항(3개) 수상년월 수여기관명 훈포장명
저역서실적(5개) 국문저서명 영문저서명 발행년 발행처 저역서구분
정제 대상 정의
정제 대상 범위
- 연계시스템을 통해 등록변경되는 참여인력정보의 정제
정제 대상 항목
정제 수준 설정
lsquo속성값 전체 존재rsquo 데이터
- 공통사항 오류 데이터 정정 및 코드 매핑
- ① 중복 자료 중 데이터 신뢰성에 근거하여 통합 항목 누락 확인 및 보충 선별(성명 주민등록
번호) 형식 확인 (주소 전화번호 및 E-Mail)
- ② 중복 자료 중 최신 자료 선정 및 확인 형식 확인 (주소 전화번호)
- ③ ⑤~⑪ 중복 자료 중 데이터 신뢰성에 근거하여 통합
lsquo일부 또는 6개 미만rsquo 데이터
- lsquo속성값 전체 존재rsquo 데이터와 같은 방식으로 정제
오류 유형 정의 및 정제 형태
- 발생 가능한 오류 유형
- 28 -
오류 유형 세부 정제 지침 비고
데이터 내용 데이터 Type 오류
- 적합한 Type으로 수정 가능한 정도(의미상으
로는 유효한 경우)의 오류는 수정하고 그렇
지 않은 데이터는 삭제
데이터 형식 오류
- 데이터들 중 가장 많은 유형을 정규 형식으
로 보고 형식에 위배되는 데이터들은 정규
형식으로 변환
부점(구분자) 오류
- 실제 서비스 되는 데이터값과 비교하여 변환
과정에서 발생한 오류면 실제 데이터값으로
변환하고 원시 데이터 자체가 오류인 경우
에는 삭제 처리
데이터 코드 코드값 오류
- 일치 유사한 코드값으로 변환
- 유사 가장 적합한 코드값으로 변환
- 상이 lsquo기타rsquo코드값으로 분류 또는 삭제
데이터(not null)가 존재하지 않는 경우
데이터의 Type(문자형 숫자형)에 위배되는 값이 들어있는 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
정해진 법칙에 따른 번호가 아닌 경우
실제로 존재하지 않는 부점(구분자) 등이 입력되어 있는 경우
코드의 값이 정해진 범위를 벗어나는 경우
ex) 기관 코드와 인력시스템 사용 코드와의 매핑 오류
기관 데이터의 코드 항목 값이 잘못 입력되어 있는 경우
국문과 영문으로 구분되는 동일 데이터 항목에 잘못된 위치에 항목 값이 입력되어 있는 경우
ex) 논문실적정보의 국문제목에 영문제목이 입력되어 있는 경우
데이터가 복수로 존재하며 서로 상충되는 경우
ex) 유효하지 않은 주민등록번호의 중복
- 조치 가능한 데이터 정제 형태
수정 데이터 내용은 수정하지 않고 데이터 형태 및 특수문자 수정 정도 정제
삭제 데이터 값 삭제(Garbage 처리) 또는 레코드 삭제
위의 경우 원시 데이터 값은 관리를 위해 따로 보관
정제 제외 데이터 값이 누락이거나 오류로 판단되지만 정확한 데이터 내용을 알 수 없는 경
우 기준 데이터가 없으므로 정제 대상에서 제외 또한 별다른 오류로 보이지 않는
경우도 정제 대상에서 제외
오류 유형별 세부 정제 지침
- 29 -
논문제목 오류 - 논문제목1은 반드시 필수 입력으로 처리
중복 데이터들의 데이
터 값 상충 오류
- 변경될 수 없는 기본정보(이름 주민번호)의
경우는 기존 데이터 우선
- 변경 가능한 정보(기관명 논문 등)의 경우
최신 업데이트된 정보를 우선
구분 명(누락) 비고
기본정보 이메일 22719 기존 수집 데이터를 통해 보완
소속기관사항 있으나필드가 null인것
인력구분 15217 기관명이형전거DB 생성 완료 후 적용함
소속기관 우편번호
15977주소가 있는 경우 우편번호 찾기를 통해 보완주소가 없는 경우 기존 수집 데이터를 통해 보완
소속기관 주소
13512 기존 수집 데이터를 통해 보완
소속기관명 428기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
학력사항 있으나 필드가null인것
전공 38915기존 수집 데이터를 통해 보완하고 기관명이형전거DB로 매핑함
학위 34373기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
소속기관사항 없는것 22502 기존 수집 데이터를 통해 보완
학력사항 없는것 31952 기존 수집 데이터를 통해 보완
~은 lsquo발생 가능한 오류 유형rsquo 내용 참조
~은 lsquo조치 가능한 데이터 정제 형태rsquo 내용 참조
인력정보의 누락항목에 대한 보완
기타 (정보 식별자 부여)
- 데이터 정제 최종 단계에서 식별자 부여 체계에 따라 정보식별자(번호) 삽입
- 정보식별자(번호)는 식별체계 API에 의해 자동으로 부여 되며 식별 부여 체계는 사업단 내 식별
체계 담당자가 마련하여 제공
정제 작업 방식
중복 확인 기계작업
- SQL Query를 활용하여 중복 확인하며 중복된 데이터 중 1건을 제외하고 나머지를 표시함(기계
작업)
- 30 -
구분 항목 세부항목 정제항목 오류유형 정제지침
참여
인력
정보
(56개)
기본
정보
(12
개)
주민등록
번호
인물ID인물ID이 발급되지 않
는 경우
인물 중복확인이 가능한 기본 항목(주민등록
번호 성명)이 존재하지 않으면 정제대상에서
제외
식별체계로부터 정제 수행 후 일괄발급 입력
인물관리
번호
(KOI)
NA
정제이전 인물관리번호 일괄 생성하여 key로
활용
Null 여부만 확인하고 정제대상에서 제외
주민등록
번호
Null인 경우 정제대상에서 제외
중복되는 주민등록
번호의 경우
인물관리번호 성명이 상이하면 현행 데이터
를 유지
모두 정제대상에서 제외
유효하지 않은 주민등
록번호의 경우
자리수가 lsquo-rsquo포함한 14자리가 아닌 데이터는
정제대상에서 제외
이관 후 서비스대상에서 제외
데이터 통합 기계작업 + 수작업
- 중복으로 확인된 항목들의 리스트를 비교하여 통합
- 기계적으로 필드간의 충돌이 없음을 확인할 수 있는 항목은 자동 통합하고 기계적으로 충돌을 확
인할 수 없는 경우는 수작업으로 필드별 데이터 통합을 수행
- 최신 또는 최종 여부를 확인하여 통합해야 하는 경우 해당 데이터에 포함된 일자 데이터를 감안
하여 선별 통합(일자 및 기간의 충돌이 없는 경우 기계작업 충돌이 있는 데이터는 리스트 업 후
수작업)
형식 확인 기계작업 + 수작업
- E-Mail 주소 전화번호와 같은 형식이 어느 정도 정의된 데이터의 경우 기본 형식을 템플릿으로
지정
- 정형화되지 않은 데이터의 리스트를 추출하여 이 중 기계적으로 형식을 일치시키고(기계작업)
일치되지 않은 데이터를 수작업으로 확인하여 수정하거나 형식 불량 데이터 리스트로 따로 추출
(수작업)
142 오류 유형별 정제 지침
오류 유형별 정제 지침은 lsquo131 세부 항목별 오류 패턴유형 분석rsquo 을 대상으로 정제지침을 정의
인력데이터
항목별 정해진 규칙에 위배되는 값이 들어있는 경우
- 31 -
구분 항목 세부항목 정제항목 오류유형 정제지침
외국인 및 임시주민번호의 경우 lsquo-rsquo포함한 14
자리가 아닌 데이터는 정제대상에서 제외
표준 포맷으로 구성되
어 있지 않은 경우
lsquo년(2)월(2)일(2)-성별(1)고유번호(6)lsquo 14자 숫자
로 구성되도록 변경
공란 및 특수문자를 제거
성명
성명-한글
Null의 경우
성명-영문 성명-한자가 존재하면 해당 필드
로 이동성명-한글 영문 한자 모두 Null이면 정제대
상에서 제외
이관 후 서비스대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
공란 및 특수문자 숫자 이름이 아닌 경우 제거
예) 이름이 아닌 경우 oo - --
예) 공란의 경우 홍 길동 홍길 동
예) 숫자의 경우 홍길동2 -gt 숫자만 제거
성명-영문
Null의 경우 정제대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
특수문자 숫자 이름이 아닌 경우 제거
예) Lee HS =gt Lee HS영문성명의 범위를 벗어난 경우
예) Lee KHS영문성명이 아닌 경우 해당 필드로 이동하거
나 제거
성명-한자
Null의 경우 정제대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
공란 및 특수문자 숫자 이름이 아닌 경우 제거
예) 金鉉- 洙 =gt 金鉉洙
한문이 아닌 경우 해당 필드로 이동하거나 제거
자택주소기본주소
(주소1)
Null의 경우
우편번호가 존재하면 우편번호로 검색된 주
소 입력 단 우편번호 유효검사를 거친 우편번호만
대상으로 함
우편번호가 존재하지 않으면 정제대상에서 제외
우편번호의 주소와 상
이한 경우
가베지 데이터가 아닌 경우에는 정제대상에서 제외
예) 외국 주소는 유지
가베지 데이터인 경우
기존 데이터는 삭제하고 우편번호가 존재하
면 우편번호로 검색된 주소 입력
우편번호가 존재하지 않으면 기존 데이터 삭
제만 수행
- 32 -
구분 항목 세부항목 정제항목 오류유형 정제지침
상세주소
(주소2)
Null인 경우 정제대상에서 제외
주소정보가 아닌 경우주소정보가 아닌 가베지 데이터는 삭제
예) test 042-123-1234 등
자택우편
번호우편번호
Null인 경우
기본 주소지로 검색하여 입력
기본 주소가 오류데이터이거나 없는 경우는
정제대상에서 제외
우편번호 표준 형식이
아닌 경우
표준 포맷 시도군 구분(3자리)+lsquo-rsquo+지역구분(3
자리)
표준 포맷이 아닌 경우는 표준 포맷으로 변경
예) 300100=gt300-100
300 100=gt300-100
300100 =gt300-100
자리 수가 6자 이하이거나 가베지 데이터인
경우는 제거
우편번호가 old data
인 경우
현재 우편번호가 아닌 경우는 이전 우편번호
주소지를 기준으로 검색하여 입력하고 매핑되
지 않는 데이터의 경우는 삭제
자택전화
번호전화번호
Null인 경우
핸드폰번호가 존재할 경우 복제하여 입력 단 핸드폰 번호의 오류를 정제한 이후 처
리
전화번호가 표준 형식
이 아닌 경우
표준 포맷 국번(2~3자리)-지역전화번호(34자
리)-전화번호(4자리)포준 포맷으로 변경
예) 02-6746-1234 or 041-567-6789
국번은 지역별 국번 참조
내선번호는 유지
지역번호 없는 경우
국번 Null인 경우 자택 주소지의 시도 지역
번호를 입력
예) 6746-1234 이면서 서울 지역의 예
-gt 02-6746-1234
국가번호가포함된경우
(+)국가번호-국번-지역전화번호-전화번호의
형식으로 변경
예) +82-02-6746-1234
가베지 데이터의 경우
자리수가 작거나 크면 제거
예) 02-64-123 or 02-6746-123
숫자(특수문자 포함)가 아닌 문자이면 제거
전화번호 데이터가 아닌 경우 제거
핸드폰번호인 경우 전화번호핸드폰번호 표준포맷으로 변경
- 33 -
구분 항목 세부항목 정제항목 오류유형 정제지침
핸드폰번호 핸드폰번호
Null인 경우 정제 대상에서 제외
핸드폰번호가 표준 형
식이 아닌 경우
이동통신구분번호(3자리)-지역구분번호(34자
리)-전화번호(4자리)로 변경
예) 011-6746-1234 or 019-789-1234
이동통신구분번호는 이동통신사별 구분번호
참조 SK(011 017) KTF(016 018) KG(109)
010(공통)
국가번호가 포함된
경우
(+)국가번호-이동통신구분번호-지역구분번호-
전화번호의 형식으로 변경
예) +82-010-6746-1234
이동통신구분번호가
없는 경우
이동통신구분번호가 없는 경우는 가베지 데이
터으로 판단하여 제거
예) 672-1234의 경우
전화번호인 경우 전화번호핸드폰번호 표준포맷으로 변경
E-mail E-mail
Null인 경우 정제 대상에서 제외
표준 이메일 형식이
아닌 경우
표준 포맷 ID메일서버URI로 구성
예)admin1234daumnet kisti4530kistirekr
구분자 lsquorsquo lsquorsquo으로 변경 및 공란 제거
예) admindaumnet =gt admindaumnet
두 개이상의 이메일이 존재할 경우 앞에 것을
우선으로 유지함
예)admin1234daumnet kisti4530kistirekr
=gt admin1234daumnet
E-mail 데이터가 아닌
경우
E-mail 주소 데이터가 아닌 경우와 가베지 데
이터는 삭제
예) wwwkistirekr -- adminkisti 1 lsquorsquo
공란 등
소속
기관
사항
(11
개)
소속
기관명
소속기관
코드NA 코드 오류 유형 참조
소속
기관명
Null인 경우
소속기관코드가 존재하는 경우에는 해당 소속
기관코드의 명을 검색하여 입력하고 소속기관
코드가 존재하지 않으면 정제대상에서 제외
소속기관명이 NTIS
코드 내 명칭이 아
닌 경우
기관명이형전거DB의 대표기관명으로 변경
예) 서울대 -gt 서울대학교
- 34 -
구분 항목 세부항목 정제항목 오류유형 정제지침
단 기관명이형전거DB에 존재하지 않는 소속
기관명은 신규발급 요청하여 소속기관명을 유
지함
소속기관명이 아닌
경우
소속기관코드가 존재하는 경우에는 해당 소속
기관코드의 명을 검색하여 입력하고 소속기관
코드가 존재하지 않으면 정제대상에서 제외
부서명근무
부서명
Null인 경우 정제대상에서 제외
근무부서명이 아닌
경우
가베지 데이터인 경우만 삭제하고 이외의 경
우는 정제대상에서 제외
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
직위명
직위코드 NA 코드 오류 유형 참조
직위명
Null인 경우
직위코드가 존재하는 경우에는 해당 직위코드
의 명을 검색하여 입력하고 직위코드가 존재
하지 않으면 정제대상에서 제외
직위명이 직위코드 내
명칭이 아닌 경우
직위명이 직위코드내 존재하지 않으면 직위명
은 그대로 유지하고 직위코드는 기타(lsquo999rsquo)로
매핑함
직위명이 아닌 경우
직위코드가 존재하는 경우에는 해당 직위코드
의 명을 검색하여 입력하고 직위코드가 존재
하지 않으면 삭제
사무실
전화번호
사무실
전화
Null인 경우 정제대상에서 제외
전화번호가 표준 형식
이 아닌 경우
표준 포맷 국번(2~3자리)-지역전화번호(34자
리)-전화번호(4자리)포준 포맷으로 변경
예) 02-6746-1234 or 041-567-6789
국번은 지역별 국번 참조
내선번호는 유지
지역번호 없는 경우
국번 Null인 경우 소속기관 주소지의 시도
지역번호를 입력
예) 6746-1234 이면서 서울 지역의 예
-gt 02-6746-1234
국가번호가 포함된
경우
(+)국가번호-국번-지역전화번호-전화번호의
형식으로 변경
예) +82-02-6746-1234
- 35 -
구분 항목 세부항목 정제항목 오류유형 정제지침
가베지 데이터의 경우
자리수가 적거나 크면 제거
예) 02-64-123 or 02-6746-123
숫자(특수문자 포함)가 아닌 문자이면 제거
전화번호 데이터가 아닌 경우 제거
핸드폰번호인 경우 기본정보의 핸드폰번호로 이동
기관주소
기본주소
(주소1)
Null의 경우
우편번호가 존재하면 우편번호로 검색된 주
소 입력
단 우편번호 유효검사를 거친 우편번호만
대상으로 함
우편번호의 주소와 상
이한 경우
가베지 데이터가 아닌 경우에는 정제대상에서
제외
가베지 데이터인 경우기존 데이터는 삭제하고 우편번호가 존재하
면 우편번호로 검색된 주소 입력
상세주소
(주소2)
Null인 경우 정제대상에서 제외
주소정보가 아닌 경우주소정보가 아닌 가베지 데이터는 삭제
예) test 042-123-1234 등
우편번호
Null인 경우
기본 주소지로 검색하여 입력
기본 주소가 오류데이터이거나 없는 경우는
정제대상에서 제외
우편번호 표준 형식이
아닌 경우
표준 포맷 시도군 구분(3자리)+lsquo-rsquo+지역구분(3
자리)
표준 포맷이 아닌 경우는 표준 포맷으로 변경
예) 300100=gt300-100
300 100=gt300-100
300100 =gt300-100
자리 수가 6자 이하 이거나 가베지 데이터인
경우는 제거
우편번호가 old data
인 경우
현재 우편번호가 아닌 경우는 이전 우편번호
주소지를 기준으로 검색하여 입력하고 매핑되
지 않는 데이터의 경우는 삭제
인력
구분
인력
구분NA 기관명이형전거DB에 의해 매핑
최초
임용일
최초
임용일NA 날짜 오류 유형 참조
학력
사항전공
전공분야 NA 코드 오류 유형 참조
전공명 Null인 경우 정제대상에서 제외
- 36 -
구분 항목 세부항목 정제항목 오류유형 정제지침
(14
개)
전공명이 아닌 경우
가베지 데이터인 경우만 삭제하고 이외의 경
우는 정제대상에서 제외
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
취득대학
학위취득
대학코드NA 코드 오류 유형 참조
학위취득
대학명
Null인 경우
학위취득대학코드가 존재하는 경우에는 해당
학위취득대학코드의 명을 검색하여 입력하고
학위취득대학코드가 존재하지 않으면 정제대
상에서 제외
학위취득대학명이 학
위취득대학코드 내 명
칭이 아닌 경우
기관명이형전거DB의 대표기관명으로 매핑하
고 존재하지 않는 경우 신규 발급 요청하여
학위취득대학명을 유지함
학위취득대학명이 아
닌 경우
학위취득대학코드가 존재하는 경우에는 해당
학위취득대학코드의 명을 검색하여 입력하고
학위취득대학코드가 존재하지 않으면 삭제
학위 학위코드 NA 코드 오류 유형 참조입학일 입학년월 NA 날짜 오류 유형 참조졸업일 졸업년월 NA 날짜 오류 유형 참조
학과
학과코드 NA 코드 오류 유형 참조
학과명
Null인 경우 정제대상에서 제외
학과명이 학과코드내
명칭이 아닌 경우학과코드의 명으로 변경
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등
취득국가취득국가
코드NA 코드 오류 유형 참조
지도
교수명
지도
교수명
Null인 경우 정제대상에서 제외
이름이 아닌 경우 삭제하고 정제대상에서 제외
학위
논문명
최종학위
논문명1
Null인 경우 정제대상에서 제외
논문명1이 Null인경우논문제목1이 Null인 경우 논문제목2에서 이동
함
- 37 -
구분 항목 세부항목 정제항목 오류유형 정제지침
가베지 데이터인 경우
삭제
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
최종학위
논문명2
Null인 경우 정제대상에서 제외
논문명1이 Null인경우 논문제목1이 Null인 경우 논문제목1로 이동함
가베지 데이터인 경우
삭제
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터 문자열이지만 특정 문자가
반복된 데이터
학위
취득일
최종학위
취득일NA 날짜 오류 유형 정제지침 참조
경력
사항
(5개)
근무처명 근무처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
직위명
직위코드 NA 코드 오류 유형 정제지침 참조
직위명
Null인 경우 정제대상에서 제외
직위명이 직위코드내
명칭이 아닌 경우
직위명이 직위코드내 존재하지 않으면 직위명
은 그대로 유지하고 직위코드는 기타(lsquo999rsquo)로
매핑함
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
근무기간
근무
시작일NA 날짜 오류 유형 정제지침 참조
근무
종료일NA 날짜 오류 유형 정제지침 참조
자격
사항
(3개)
자격
발행처
자격
발행처
Null인 경우 정제대상에서 제외
가베지 데이터인 경우특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
- 38 -
구분 항목 세부항목 정제항목 오류유형 정제지침
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
자격증명 자격증명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
자격
취득일
자격
취득일NA 날짜 오류 유형 정제지침 참조
논문
실적
(8개)
논문
발표일
논문
발표일NA 날짜 오류 유형 정제지침 참조
국문
논문명
논문제목
국문
Null인 경우 정제대상에서 제외
필수
논문제목국문이 Null이고 논문제목영문이 Null
이 아닐 경우 논문제목영문을 논문제목국문으
로 이동시키고 논문제목영문은 Null로 갱신
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
영문
논문명
논문제목
영문
Null인 경우 정제대상에서 제외
필수
논문제목국문이 Null이고 논문제목영문이 Null
이 아닐 경우 논문제목영문을 논문제목국문으
로 이동시키고 논문제목영문은 Null로 갱신
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
저자역할
구분
저자역할
구분NA 코드 오류 유형 정제지침 참조
발행처 발행처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
- 39 -
구분 항목 세부항목 정제항목 오류유형 정제지침
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터학술지
구분
학술지구
분NA 코드 오류 유형 정제지침 참조
학술지명 학술지명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
SCI여부 SCI여부 NA 코드 오류 유형 정제지침 참조
지식
재산
권
(3개)
지식
재산권명
지식
재산권명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
출원_등
록번호
출원등록
번호
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
특허구분 특허구분 NA 코드 오류 유형 정제지침 참조
평가
위원
(13개)
소속
학협
회
현황
(5개)
담당업무 담당업무
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
직위 직위
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
- 40 -
구분 항목 세부항목 정제항목 오류유형 정제지침
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
학협회
사항
학협회명
Null인 경우 정제대상에서 제외
직위명이 포함되어 있
는 경우
직위명이 존재하지 않으면 직위명 항목에 복
사하고 직위명칭에 관련된 부분은 삭제 존재
한다면 관련 부분을 삭제
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
활동시작
일NA 날짜 오류 유형 정제지침 참조
활동종료
일NA 날짜 오류 유형 정제지침 참조
훈포
장
사항
(3개)
수상년월 수상년도 NA 날짜 오류 유형 정제지침 참조
수여
기관명
수여기관
명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
훈포장명 수상명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저역
서
실적
(5개)
저서명1 저서명1
Null인 경우 정제대상에서 제외
저서명1이 Null인 경
우저서명2를 저서명1로 저장
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저서명2 저서명2
Null인 경우 정제대상에서 제외
저서명1이 Null인 경
우저서명2를 저서명1로 저장
가베지 데이터인 경우 특수문자 숫자로만 구성되거나 그 외의 가베
- 41 -
구분 항목 세부항목 정제항목 오류유형 정제지침
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
발행년 발행년도 NA 날짜 오류 유형 정제지침 참조
발행처 발행처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저역서
구분
저역서
구분NA 코드 오류 유형 정제지침 참조
- 42 -
구분 항목 세부항목 정제항목 오류내역 정제지침
참여인력정보(11개)
소속기관사항(1개)
최초임용일최초임용일
YYYYMMDD
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
DD가 없는 경우 01일로 갱신
YYYYMMDD가 유
효하지 않은 경우
년도가 유효하면 월-gt01월 일-gt01
일로 갱신하고 년도 자체가 유효하
지 않으면 삭제
학력사항(3개)
입학일입학년월
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 03월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt03월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
졸업일졸업년월
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 02월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt02월로 갱신
하고 년도 자체가 유효하지 않으면
삭제입학년월보다 같
거나 작은 경우데이터 삭제
학위취득일
최종학위
취득일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효
하지 않은 경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
경력사항(2개)
근무기간근무시작일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
날짜로서 유효한 형태를 갖고 있지 않은 경우
- 43 -
구분 항목 세부항목 정제항목 오류내역 정제지침
제
근무종료일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
근무시작일보다
같거나 작은 경우
근무시작일에서 YYYYMM이 동일하
면 삭제하고 근무시작일에서 YYYY
은 동일하나 MM이 작을 경우에만
삭제
자격사항(1개)
자격취득일자격취득일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
논문실적(1개)
논문발표일논문발표일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효
하지 않은 경우
년도가 유효하면 월-gt01월로 갱신하고
년도자체가유효하지않으면삭제
소속학협회현황(2개)
학협회사항
활동시작일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경
우데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭제
활동종료일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하고
년도자체가 유효하지않으면 삭제
- 44 -
구분 항목 세부항목 정제항목 오류내역 정제지침
활동시작일보다
같거나 작은 경우
활동시작일에서 YYYYMM이 동일하
면 삭제하고 활동시작일에서 YYYY
은 동일하나 MM이 작을 경우에만
삭제
훈포장사항(1개)
수상년월수상년도
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 변경하고
년도자체가 유효하지않으면 삭제
평가위원(1개)
저역서실적(1개)
발행년발행년도
YYYY
Null인 경우 정제대상에서 제외
YYYY이 유효하지
않은 경우유효하지 않으면 삭제
구분 항목세부항목
정제항목 오류유형 정제지침
참여
인력
정보
(15개)
기본정보
(1개)
자택
우편번호
우편번호
기본주소
Null의 경우주소가 존재하면 주소지로 우편번호 검색
하여 우편번로를 입력(정제작업자)
우편번호와주소
정보가불일치
middot 기본 주소가 가베지 데이터가 아니고 상
세주소가 존재한다면 그대로 유지하고
가베지 데이터이면 우편번호 상 주소를
기본주소에 입력
상세주소가 존재하면서 오류 데이터가 아
닌 경우에는 기본주소의 변경은 하지 않으
며 기존의 우편번호를 주소지에 맞게 주소
검색하여 변경
소속기관
사항(4개)소속기관명
소속기관코드
소속기관명
Null인 경우 정제대상에서 제외
소속기관명만
존재하는 경우
기관명이형전거DB에서 검색하여 이형기관
코드 대표기관명으로 매핑하고 존재하지
않는 경우 신규 발급 요청하여 그대로 유
지함
시작일보다 종료일이 같거나 작은 경우 종료일을 삭제
날짜의 경우 본인의 생년월일보다 작을 수 없음
코드의 값이 정해진 범위를 벗어난 경우
- 45 -
구분 항목세부항목
정제항목 오류유형 정제지침
소속기관코드만
존재하는 경우
해당 소속기관코드를 기관명이형전거DB에
서 검색하여 소속기관명을 갱신하며 매핑
되지 않는 소속기관코드는 삭제
직위명직위코드
직위명
Null인 경우 정제대상에서 제외
직위명만 존재
하는 경우
직위명으로 동일 또는 유사한 직위코드를
검색하여 입력하고 직위코드 내 존재하지
않는 직위명칭이면 lsquo기타rsquo로 매핑
[직위코드] NTIS 직위코드 참조
직위코드만 존
재하는 경우
해당 직위코드를 NTIS 직위코드의 직위명
으로 검색하여 갱신하며 매핑되지 않는 직
위코드는 삭제
[직위코드] NTIS 직위코드 참조
기관주소 우편번호
Null의 경우
주소가 존재하면 주소지로 우편번호 검색
하여 입력
단 우편번호 내 기본주소만 가능
우편번호와 기
본주소가 불일
치
기본 주소가 가베지 데이터가 아니고 상세
주소가 존재한다면 그대로 유지하고 가베
지 데이터이면 우편번호 상 주소를 기본주
소에 입력상세주소가 존재하면서 오류 데이터가 아
닌 경우에는 기본주소의 변경은 하지 않으
며 기존의 우편번호를 주소지에 맞게 주소
검색하여 변경
인력(직업)
구분인력유형구분
Null인 경우 정제대상에서 제외인력유형구분
코드 범위를
벗어나는 경우
[인력구분코드] 대학교 연구소 산업계 기
타 등 구분코드 범위를 벗어나는 데이터는
Null로 갱신
학력사항
(5개)
전공전공코드
전공명
Null인 경우 정제대상에서 제외전공명만 존재
하는 경우
전공명으로 NTIS 전공코드를 검색하여 입
력
[전공코드] NTIS 전공코드 참조
전공코드만 존
재하는 경우
해당 전공분야코드를 NTIS 전공코드에서
전공명을 검색하여 갱신하며 매핑되지 않
는 전공코드는 삭제
[전공코드] NTIS 전공코드 참조
취득대학
학위취득대학
코드
학위취득대학명
Null인 경우 정제대상에서 제외
학위취득대학
명만 존재하는
경우
기관명이형전거DB에서 검색하여 이형기관
코드 대표기관명으로 매핑하고 존재하지
않는 경우 신규 발급 요청하여 그대로 유
지함
- 46 -
구분 항목세부항목
정제항목 오류유형 정제지침
학위취득대학
코드가 존재하
는 경우
해당 학위취득대학코드를 기관명이형전거
DB에서 검색하여 학위취득대학명을 갱신하
며 매핑되지 않는 학위취득대학코드는 삭
제
학위 학위코드
Null인 경우 정제대상에서 제외
학위코드 범위
를 벗어나는
경우
존재하는 학위코드가 NTIS 학위코드와 매
핑되는지 확인하고 멥핑되지 않는 학위코
드는 삭제
[학위코드] NTIS 학위코드 참조
학과학과코드
학과명
Null인 경우 정제대상에서 제외
학과명만 존재
하는 경우
학과명으로 동일 또는 유사한 NTIS 학과코
드를 검색하여 입력하고 NTIS 학과코드 내
존재하지 않는 학과명이면 기타 코드로 매
핑함
[학과코드] NTIS 학과코드 참조
학과코드만 존
재하는 경우
해당 학과코드를 NTIS 학과코드의 학과명
을 검색하여 갱신하며 매핑되지 않는 학과
코드는 삭제
[학과코드] NTIS 학과코드 참조
취득국가 취득국가코드
Null인 경우 정제대상에서 제외
취득국가코드
의 범위를 벗
어나는 경우
존재하는 국가코드가 NTIS 국가코드와 매
핑되는지 확인하고 멥핑되지 않는 국가코
드는 삭제
[국가코드] NTIS 국가코드 참조
경력사항
(2개)직위명
직위코드
직위명
Null인 경우 정제대상에서 제외
직위명만 존재
하는 경우
직위명으로 동일 또는 유사한 직위코드를
검색하여 입력하고 직위코드 내 존재하지
않는 직위명칭이면 lsquo기타rsquo로 매핑
[직위코드] NTIS 직위코드 참조
직위코드만 존
재하는 경우
해당 직위코드를 NTIS 직위코드의 직위명
으로 검색하여 갱신하며 매핑되지 않는 직
위코드는 삭제
[직위코드] NTIS 직위코드 참조
논문실적
(3개)
저자역할
구분저자역할구분
Null인 경우 정재 대상에서 제외
저자역할구분존재하는저자역할구분가 NTIS 저자역할구
- 47 -
구분 항목세부항목
정제항목 오류유형 정제지침
코드의 범위를
벗어나는 경우
분코드와 매핑되는지 확인하고 멥핑되지
않는 국가코드는 삭제
[역할구분코드] NTIS 저자역할구분코드 참
조
학술지
구분학술지구분
Null인 경우 정재 대상에서 제외
학술지구분코
드의 범위를
벗어나는 경우
존재하는 학술지구분코드가 NTIS 학술지
구분코드와 매핑되는지 확인하고 멥핑되지
않는 학술지구분코드는 삭제
[학술지구분코드] NTIS 저자역할구분코드
참조
SCI여부 SCI여부
Null인 경우 정재 대상에서 제외
SCI여부구분코
드의 범위를
벗어나는 경우
존재하는 SCI여부구분코드가 lsquo01 또는
02가 아닌 데이터는 Null로 갱신
[SCI여부구분코드] NTIS SCI여부구분코드
참조
지식
재산권
(1개)
특허구분 특허구분
Null인 경우 정제대상에서 제외
특허구분코드
의 범위를 벗
어나는 경우
존재하는 특허구분코드가 NTIS 특허구분
코드와 매핑되는지 확인하고 멥핑되지 않
는 특허구분코드는 삭제
[특허구분코드] NTIS 특허구분코드 참조
평가위원(1개)
저역서실적(1개)
저역서구분 저역서구분
Null인 경우 정제대상에서 제외
저역서구분코
드의 범위를
벗어나는 경우
존재하는 저역서구분코드가 NTIS 저역서
구분코드와 매핑되는지 확인하고 멥핑되지
않는 저역서구분코드는 삭제
[저역서구분코드] 1저서 2역서 中 택일
공통사항
- 매핑하고자 하는 기존 코드명(공란 및 특수문자 제거)으로 NTIS 표준 코드 內 한글코드명을 대
상으로 검색하여 동일한 코드명(11의 경우)은 시스템(SQL App 등)을 통해 미리 매핑하고 유사
한 코드명(1N의 경우)은 정제작업자가 선택한 코드로 입력하여 매핑 처리
- 코드 종류가 소수(3개 미만)인 경우 Source 데이터 내 등록되어 있는 코드 또는 코드명칭을 대
상으로 동일한 패턴별로 일괄 변환(SQL Query Excel)처리한 후 변환되지 않은 데이터는 삭제
- 코드가 가베지 데이터인 경우는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 영숫자가 아닌 특수문자로만 구성된 데이터 특정 문자가 반복된 코드와
관련되지 않은 데이터
- 48 -
구분 항목 이중등록검사항목 정제지침 비 고
참여
인력
정보
기본
정보주민등록번호()
주민등록번호가 동일한 인력데이
터가 2개 이상이면 시스템으로
추출하여 이중등록검사를 수행함
시스템 정제
소속기
관사항소속기관명()
인력별 동일한 소속기관사항 데이
터가 2개 이상이면 시스템으로
추출하여 1개만 남겨 놓고 나머지
는 오류 체크 필드에 표시함
시스템 정제
학력
사항
1 취득대학() 학위() 입학일
2 취득대학() 학위() 졸업일
3 취득대학() 학위() 전공
4 취득대학() 학위() 학과
5 취득대학() 학위() 학위취득일
인력별 동일한 학력사항 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
경력
사항
1 근무처명() 직위명 근무시작일
1 근무처명() 직위명 근무종료일
인력별 동일한 경력사항 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
논문
실적
1 논문명() 논문발표일 학술지명
2 논문명() 논문발표일 ISSN
3 논문명() ISSN 게재권집 게재
호
4 논문명() 학술지명 게재권집
게재호
인력별 동일한 논문실적 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
지식
재산권
1 출원_등록번호()
2 지식재산권명() 출원등록구분
특허구분() 출원국가
인력별 동일한 지식재산권 데이터
가 2개 이상이면 시스템으로 추
출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
시스템 정제
저역서
실적
1 ISBN
2 저역서명() 저역서구분() 발행
인력별 동일한 저역서실적 데이터
가 2개 이상이면 시스템으로 추시스템 정제
143 이중등록 유형별 정제지침
이중등록 정제 지침
- 이중등록에 대한 정제는 오류 유형 정제 및 코드 매핑 처리 후 수행함
- 이중등록에 대한 데이터는 최신 데이터를 우선으로 유지함
- 이중등록검사항목의 문자Type의 데이터는 공란제거 제거 후 이중등록검사를 수행함
- 대상데이터의 이중등록검사항목 중 1개 이상 항목이 Null인 경우 이외의 항목이 동일하
여도 이중등록 정제 대상에서 제외함
- 49 -
구분 항목 이중등록검사항목 정제지침 비 고
년 발행처출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
평가
위원
소속학
협회
현황
1 학협회명() 직위 시작일
2 학협회명() 직위 종료일
인력별 동일한 소속학협회현황
데이터가 2개 이상이면 시스템으
로 추출하여 1개만 남겨 놓고 나
머지는 오류 체크 필드에 표시함
시스템 정제
훈포장
사항훈포장명() 수상년월 수여기관명
인력별 동일한 훈포장사항 데이터
가 2개 이상이면 시스템으로 추
출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
시스템 정제
자격
사항
자격증명() 자격발행처 자격취득
일
인력별 동일한 데이터가 2개 이상
이면 시스템으로 추출하여 1개만
남겨 놓고 나머지는 오류 체크 필
드에 표시함
시스템 정제
15 데이터 정제 절차 및 작업지침
151 데이터 정제 절차
- 50 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
데이터
정제
준비
초기
데이터
구축
연계기관기반 정보취합
연계기관 인력데이터 구조(스키마 엔터티 정의)코드정보 등 통합 인력DB로의 이관을 위한 연계기관 제공 정보 취합
기관 협의 정보 제공 기반정보 분석
연계대상기관데이터 취합
통합하고자 하는 연계기관 인력데이터를 제공받아 Temp DB(연계기관데이터 구조와 동일)에등록
기관 협의 데이터제공 데이터 생성
연계기관
데이터 이관
준비
NTIS 표준 코드정보를KISTI로부터 제공받음 표준 코드 제공 코드 분석
기존 코드별 NTIS 표준코드 매핑 정의 표준코드매핑 작성
플래그성 매핑기준작성
기존 데이터에 표준 코드 반영 표준코드 매핑처리
표준 코드 적용결과 검토 데이터 확인
연계기관
데이터 분석
및 매핑계획
수립
연계기관 데이터 분석 데이터 분석 데이터 분석
연계기관 코드매핑 정의 기관 코드매핑 작성플래그성 매핑 기준 작성
테이블매핑 정의테이블 매핑정보확정
테이블 매핑(안) 작성
데이터
정제 기준
및
계획 수립
과학기술 인력정보 데이터 분석
정제 대상 RampD참여인력데이터 분석
정제 대상 항목 및 기준에 대한 정의
데이터 정제 내역검토
데이터 분석
데이터정제 내역작성
데이터 정제기준 및 절차협의
정제 대상 데이터 건수및 연계 기관 인력데이터 포함 범위 정제 항목 선정 정제 공정(정제 1차 검증 최종 확인) 확정
정제 범위 대상 확정 협의 진행
데이터 정제매뉴얼 작성
데이터정제매뉴얼구성내용
데이터정제개요및절차정의
정제대상정의및정제범위
정제항목별기준및예시
정제검증도구사용법
전환코드표
표준양식
정제매뉴얼 검토및 확정
정제매뉴얼 초안작성
상세일정계획수립
정제 량을 분석하여 투입인력대비 주월별 데이터 정제 계획대비 실적 산정
일정 검토 및 확정 일정계획 작성
152 정제 단계별 작업 지침
- 51 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
데이터 정제 작업 환경 구축
작업 환경 및작업자 구성 데이터 정제 환경 구성
작업자 모집
작업장 환경 구축(월평동)
데이터정제 작업교육실시
정제작업자 및 정제관리자를 대상으로 교육 실시 및교육결과서작성
작업자 정제작업교육 실시
데이터정제진행
정제 작업수행
데이터 정제및 검증 데이터 정제 추진결과
데이터 정제
정제결과 검증(작업자별 검증)
정제추진현황보고 실적 보고
실적 확인 및 이슈사항 협의
주별진척보고
이슈사항 및 문제점 보고
데이터정제완료
데이터 이관 및 검수
데이터 이관정제된 데이터를 작업DB에서 서비스DB 로이관
이관 확인 데이터 이관
데이터 검수(최종 확인)
RampD 참여인력 데이터(정제 결과물) 검사 (샘플링 검수)
검수(샘플링)검수 데이터 추출제공
153 항목별 정제작업 세부지침
공통사항 및 시스템정제
공통사항
1 정보유형별로 주요항목이 존재하지 않는 경우라도 기본 학력 소속기관사항은 삭제하지
않고 실적정보는 삭제 처리함
가 정보유형별로 경력정보 실적정보의 주요항목이 Null인 데이터는 삭제
나 기존데이터의 경우 학력 소속기관사항은 주요항목이 Null이지만 현황정보 제공 필드가
존재하면 유지함
학력사항 학위 전공 등 존재하면 유지
소속기관사항 우편번호 직위 등 존재하면 유지
2 코드 항목 값을 NTIS 코드정보 내 명칭으로 갱신함
가 소속기관명 학위취득대학명 학과명 전공명 직위명 등을 NTIS 표준코드로 매핑하여
코드값을 넣고 각 항목에 NTIS 코드정보 내 코드명으로 변환하여 갱신함
- 52 -
No원본데이터 정제 후
정제요령 비고코드 명 코드 명
1 한국타이어(주) AAB6793 (주)한국타이어
기관명이형전거DB에서
대표기관명과
이형기관코드로 매핑
2 연구원 B06 연구원 직위코드 매핑
3 가베지 데이터의 값을 삭제 처리함
가 정보유형별 각 항목에서 가베지 데이터에 대해 삭제 처리함
No원본데이터 정제 후
정제요령 비고데이터 데이터
1 test 가베지 처리
2 가베지 처리
3 - 가베지 처리
4 가베지 처리
5 blank 가베지 처리
6 가베지 처리
7 서울대학교 서울대학교 정제 처리
시스템정제
1 비교대상이 존재하지 않는 항목에 대해서는 시스템정제(Null처리) 한다
가 시스템정제 항목
항목 세부항목 비고소속기관 인력구분
학력사항취득국가학위
지식재산권 특허구분
저역서실적 저역서구분
논문실적저자역할구분학술지구분SCI여부
비 고
shy 날짜 데이터의 경우 생성일이 완료일보다 후에 있는 경우 생성일을 남
겨놓고 완료일 삭제
shy 년도 포맷의 경우 1900년도~현재(정제시점)을 기준으로 이전이나 이후는
Null 로 갱신
shy 날자 데이터의 경우 생년월일보다 빠른 경우는 삭제
기본정보
기본정보_주민등록번호 정제지침
1 주민등록번호가 null인 경우 정제대상에서 제외
- 53 -
2 주민등록번호가 유효하지 않은 lsquo-rsquo포함한 14자가 아닌경우 정제대상에서 제외
No원본데이터 정제 후
정제요령 비고주민번호 이름 주민번호 이름
1 090166-471ORHAN
NALCIOGLU090166-471
ORHAN
NALCIOGLU정제대상에서 제외
2 000000-1111111 홍길동 000000-1111111 홍길동 lsquo-rsquo포함 14자리는 유지
3 194912-100001F 요이치로스즈키 194912-100001F 요이치로스즈키주민번호에 영문자
포함(F) 데이터 유지
4 1234561234567 홍길동 123456-1234567 홍길동 lsquo-rsquo 추가
3 기타사항
가 주민번호에 특수문자 포함시 가베지 데이터 처리(삭제)
기본정보_성명 정제지침
1 각 항목(한글영문한자)에 맞는 데이터 값 확인
2 성명 이외의 가베지 데이터는 삭제
3 한글한자영문이름이 모두 null인 경우 데이터 유지(서비스 제외)
4 한글한자영문이름이 가베지 데이터인 경우 가베지 값 삭제 데이터 유지(서비스 제외)
5 한글한자영문 이름을 각 항목에 맞게 값을 이동(한글성명은 한글 영문성명은 영문 한
자성명은 한자)
6 한글한자영문 이름이 기업명 또는 법인명인 경우 데이터 삭제
No원본데이터 정제 후
정제요령 비고한글이름 영문이름 한글이름 영문이름
1 SK LEE SK LEE 맞는 항목으로 값을 이동
2 test -- 삭제
3홍길동
(영구참여제한자)HONG GD 홍길동 HONG GD
이름 외 가베지 데이터
삭제
영문성명이 성+이니셜은
유지
4 성진기계 기업 법인명 삭제
5 홍 길 동 HGD 홍길동 영문성명 삭제
공란 제거
기본정보_주소 우편번호 정제지침
1 우편번호와 주소 모두 null인 경우 정제대상에서 제외
2 우편번호가 표준 형식이 나닌 경우 표준 포맷으로 변경(lsquo-rsquo포함한 7자리)
- 54 -
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302230 302-230 표준 포맷으로 변경
3 우편번호는 null 이지만 주소는 존재하는 경우 주소를 검색하여 우편번호 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 대전 서구 정림동 302-230 대전 서구 정림동우편번호에서 검색하여
매핑한다
4 우편번호는 존재하나 주소가 null인 경우 우편번호에 해당하는 주소 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302-230 302-230 대전 서구 정림동우편번호에서 검색하여
기본주소까지 입력한다
5 우편번호와 주소 값이 가베지 데이터인 경우 가베지 처리
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 111-1 대구 수성구 가베지 처리
2 111 대전 서구 정림동 302-230 대전 서구 정림동
기존 가베지 우편번호
대신에 주소를 가지고
새로운 우편번호를
검색하여 매핑한다
6 우편번호 체계가 OLD 데이터인 경우 현 주소로(NTIS 우편번호체계) 검색하여 매핑
No원본데이터 정제 후
정제요령 비고우편번호 주소1 우편번호 주소
1 449-981경기도 용인시 수지읍 성복리
LG2차아파트201~208동448-981
경기 용인시 수지구 성복동
LG2차빌리지
우편번호에서 검색하여
현재 우편번호로 매핑함
7 기타사항
가 외국주소 데이터 유지 원칙
(1) 우편번호가 국내우편번호인 경우는 우편번호만 가베지 처리
(2) 기본주소에 국가명만 존재해도 데이터 유지
나 주소가 2개 이상인 경우 세부주소를 포함한 주소로 정제
다 기본주소와 상세주소 구분(우편번호 기준 원칙)
(1) 기본주소 우편번호를 검색하여 나온 해당 주소
(2) 상세주소 우편번호를 검색하여 나온 해당 주소 이외의 주소
- 55 -
No원본데이터 정제 후
정제요령 비고우편번호 주소1 주소2 우편번호 주소1 주소2
1
11 schlundt
annex columbia
mo 65211 usa
11 schlundt annex
columbia mo
65211 usa
외국주소는 유지
2 USA USA기본주소에 국가명만
존재해도 데이터 유지
3 137-764
서울 서초구
반포2동
반포주공아파트
0동 0호
137-764
서울 서초구
반포2동
반포주공아파트
0동 0호 기본주소와 상세주소 구분
기본정보_전화번호 핸드폰번호 정제지침
1 전화번호가 null인 경우 정제대상에서 제외
2 전화번호 기본포멧 유지
가 지역번호-국번-전화번호
나 +국가번호-지역번호-국번-전화번호
다 이동통신구분번호(3자리)-지역구분번호(34자리)-전화번호(4자리)
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 042)123-4567 010-1234567 042-123-4567 010-123-4567 기본포맷으로 변경
2 015-123-1234
SK(011 017) KTF(016
018) KG(109) 010(공통)
만 유지
3 +1-125-123-1234 +1-111-123-1215 +1-125-123-1234 +1-111-123-1215 외국전화번호는 유지
3 지역번호 없는 경우 주소지의 시도 지역번호를 입력
No원본데이터 정제 후
정제요령 비고자택 전화번호 주소 자택 전화번호 주소
1 6746-1234 서울 강남구 서초동 02-6746-1234 서울 강남구
서초동
주소지의 시도 지역번호를
입력
2 6746-1234 주소정보 없으므로 삭제
4 국가번호가 포함된 경우 ldquo(+)국가번호-국번-지역전화번호-전화번호ldquo 형태로 변경
No원본데이터 정제 후
정제요령 비고자택 전화번호 자택 전화번호
1 +82)02-6746-1234 +82-02-6746-1234
ldquo(+)국가번호-국번-지역전
화번호-전화번호ldquo 형태로
변경
5 전화번호 외 가베지 데이터는 삭제
- 56 -
가 텍스트 최소자릿수 미달(3자리 미만)등
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 02-64-123 010-111-111 자리수가 작으면 제거
6 데이터를 각 항목에 맞도록 이동 정제
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 010-2353-0416 042-123-0416 042-123-0416 010-2353-0416전화번호와 핸드폰 번호를
각 항목에 맞게 이동
7 기타사항
가 내선번호 및 과거지역번호 데이터 유지
나 전화번호가 2개 이상인 경우 앞의 전화번호를 우선으로 유지함
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 0431-123-1234 0431-123-1234 예전 지역번호는 유지
2 042-123-1234(100) 042-123-1234(100) 내선번호 유지
3 0431-123-1234 1235 0431-123-1234 앞의 전화번호를 우선으로
유지
기본정보_e-mail 정제지침
1 이메일 기본포멧 오류 및 내용상 무의미한 값 가베지 처리
No원본데이터 정제후
정제요령 비고e-mail e-mail
1 123123com 가베지 처리
2 1111111com 가베지 처리
3 123 가베지 처리
4 wwwkistirekr 가베지 처리
5 --- 가베지 처리
2 E-mail 2개 이상 존재 가베지 삭제 후 이상없는 값은 모두 유지
No원본데이터 정제후
정제요령 비고e-mail e-mail
1chhyangmdhanmailnet
chhyangdumcorkrrchhyangmdhanmailnet
앞의 이메일을 우선으로
유지함
2 abcdaumnet abcdaumnet이메일의 구분자가 누락된
경우 구분자 추가함
- 57 -
소속기관사항
소속기관_주소 우편번호 정제지침 ( 기본정보_주소 우편번호 정제지침 참조)
1 우편번호와 주소 모두 null인 경우 - 정제대상에서 제외
2 우편번호는 null 이지만 주소는 존재하는 경우 주소를 검색하여 우편번호 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 대전 서구 정림동 302-230 대전 서구 정림동우편번호에서 검색하여
매핑한다
3 우편번호는 존재하나 주소가 null인 경우 우편번호에 해당하는 주소 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302-230 302-230 대전 서구 정림동우편번호에서 검색하여
기본주소까지 입력한다
4 우편번호와 주소 값이 가베지 데이터인 경우 가베지 처리
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 111-1 가정교육학 가베지 처리
2 111 대전 서구 정림동 302-230 대전 서구 정림동기존 가베지 우편번호 대신에 주소를 가지고
새로운 우편번호를 검색하여 매핑한다
5 우편번호 체계가 OLD 데이터인 경우 현 주소로 검색하여 매핑
6 기타사항
가 외국주소 데이터 유지 원칙
(1)우편번호가 국내우편번호인 경우는 우편번호만 가베지 처리
(2)기본주소에 국가명만 존재해도 데이터 유지
나 주소가 2개 이상인 경우 소속기관명을 기준으로 정제(소속 기관이 소재한 주소만 유
지하고 그 외 주소는 가베지 처리)
다 기관 주소로 적합하지 않은 주소(자택주소)인 경우 유효한 주소로 정제(주소가 둘 이
상일 경우)
소속기관_사무실전화번호 팩스번호 정제지침 ( 기본정보_전화번호 핸드폰번호 정제지침 참조)
1 전화번호가 null인 경우 정제대상에서 제외
2 전화번호 기본포멧 유지
가 지역번호-국번-전화번호
- 58 -
나 +국가번호-지역번호-국번-전화번호
3 전화번호 외 가베지 데이터는 삭제
가 텍스트 최소자릿수 미달(3자리 미만)등
4 데이터를 각 항목에 맞도록 이동 정제
No원본데이터 정제 후
정제요령 비고사무실 전화번호 기본정보핸드폰 번호
1 010-2353-0416 010-2353-0416
사무실전화번호에
핸드폰번호 형태의
데이터가 있을 경우
삭제하고 기본정보의
핸드폰번호가 널일
경우에만 이동함
5 기타사항
가 내선번호 및 과거지역번호 데이터 유지
나 지역번호 누락시 주소항목에서 유추 기입(유추 불가시 널처리)
다 전화번호가 2개 이상인 경우 기존 데이터 유지
라 기준에 명시되지 않은 사항은 추후 사업주관기관과 협의하여 진행
소속기관_기관 부서명 직위 정제지침
1 기관 부서명 직위 모두 null인 경우 정제대상에서 제외
2 기관 직위는 NTIS 코드값에서 검색하여 매핑
3 인력구분은 기관명이형전거DB에 의해 자동 매핑함
No원본데이터 정제 후
정제요령 비고기관코드 기관명 기관코드 기관명
1 한국타이어(주) AAB6793 (주)한국타이어
기관명이형전거DB에서
대표기관명과
이형기관코드로 매핑
No원본데이터 정제 후
정제요령 비고직위코드 직위명 직위코드 직위명
1 교수 A01 교수NTIS 직위코드에서
검색하여 매핑한다
2 항해사 999 항해사
직위코드에 매핑되지
않으면 직위코드는 lsquo999rsquo로
매핑하고 직위명은 유지함
4 필드내 중복데이터가 존재할 경우 가베지 처리하고 각 필드와 부합하지 않는 데이터는
해당 필드로 이동
5 해당 필드내 부합되지 않는 데이터는 해당필드로 옮기고 가베지 처리
- 59 -
No원본데이터 정제 후
정제요령 비고직위코드 직위명 직위코드 직위명
1 비정규직 가베지 처리
6 기타사항
가 소속기관이 2개 이상인 경우
(1)주소 데이터를 참고하여 해당 기관명만 유지하고 이외의 데이터는 가베지 처리
(2)주소 데이터가 없는 경우에는 대학교 연구소 산업계 기타 기관 순으로 정제
나 항목별 값이 2개 이상인 경우 해당 필드에 기 입력된 값을 우선하여 유지하고 이외
의 데이터는 가베지 처리
다 기관명이형전거DB에 존재하지 않는 기관은 신규발급 요청 후 매핑
라 기준에 명시되지 않은 사항은 사업주관기관과 협의하여 진행
소속기관_최초임용일 정제지침
1 날짜 오류 유형 정제
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMMDD
No원본데이터 정제 후
정제요령 비고생년월일 최초임용일 생년월일 최초임용일
1 19500310 19451011 19500310날짜는 생년월일 보다
작을수 없으므로 삭제
2 19500310 20101010 19500310날짜는 현재보다 클수
없으므로 삭제
3 19500310 19000101 19500310 1900년 이전은 삭제
학력사항
학력사항_전공 정제지침
1 전공분야코드와 전공명 모두 null인 경우 정제대상에서 제외
2 전공명은 있으나 전공분야코드가 null인 경우 전공명을 검색하여 전공분야코드 입력
가 전공명과 정확히 일치하는 전공분야코드가 존재하는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 정보통신 D130700 정보통신 정보통신전공명과 일치하는
코드값을 매핑한다
나 전공명에 공백이 있는 경우
- 60 -
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 무기 화학 C060300 무기화학 무기화학공백제거후 일치하는
값을 찾아 매핑한다
다 정확히 일치하는 전공명이 검색되지 않는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 농생물학 F010300 농생물학 농생물근사치의코드값으로매
핑한다
2 생물 C070000 생물 생물학
3 화학전공 C060000 화학전공 화학
4 컴퓨터학과 D130000 컴퓨터학과 컴퓨터학
5 물리전공 C040000 물리전공 물리학
라 전공명이 영문일 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 Medicinal Chemistry C060519Medicinal
Chemistry의약화학
영문을 번역하여
코드값을 찾아
매핑한다
마 전공명칭의 중간에 구분기호 ( - () amp
및 등) 가 포함되어 있는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 미생물계통분류 C070901 미생물계통분류 미생물분류계통
구분기호와 낱말의
순서를 무시하고
매핑한다
2 동물학유전학 C071000 동물학유전학 동물학
구분기호를 기준으로
앞부분 부터 일치하는
순으로 매핑한다
3 병리학 폐암병리 E050000 병리학 폐암병리 병리학
4 환경생태생리 D110800 환경생태생리 환경생태
5 의약화학-약리 C060519 의약화학-약리 의약화학
6 전기공학(컴퓨터공학) D090000전기공학(컴퓨터공학
)전기공학
7 원격탐사amp지구물리 D140900 원격탐사amp지구물리 원격탐사
8 물리화학및 무기화학 C060300물리화학및
무기화학무기화학
바 상기 방법으로 매핑이 불가능한 경우
- 61 -
No
원본데이터 정제 후
코드매핑 결과 정제요령 비고학위취득대학코드
(코드값 없을경우)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 서울대학교 7006431 서울대학교 서울대학교 기관명이형전거DB를
이용하여
학위취득대학코드에는
이형기관코드
학위취득대학명에는
대표기관명을 매핑함
2 서울대학교
공과대학ZD13063 서울대학교 서울대학교
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 발사체 공력 해석 D049900 발사체 공력 해석 기타항공우주공학
전공명을 포괄하는
상위 코드값으로
매핑한다
2 SOLID
MECHANICSD020299
SOLID
MECHANICS기타고체및구조역학
사 원본데이터의 코드값이 오류인 경우(전공분야코드가 아닌 경우)
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 0160 건축공학 D150000 건축공학 건축공학
원문의 코드값을
가베지 처리 후
재매핑한다
3 전공명이 오류인 경우(전공명이 아닌 경우)
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고직위코드 직위명 직위코드 직위명
1 訣廢点뼈膀갹쳬窩 가베지 처리
2 석사학위 없음 가베지 처리
학력사항_취득대학 정제지침
기관명이형전거DB를 이용하여 학위취득대학코드 및 학위취득대학명 정제
1 학위취득대학코드와 학위취득대학명 모두 null인 경우 정제대상에서 제외
2 학위취득대학명은 존재하나 학위취득대학코드가 null인 경우 기관명이형전거DB에서 검
색하여 학위취득대학코드 입력
3 학위취득대학명 풀네임이 아닐때 학위취득대학코드가 null인 경우 - 기관명이형전거DB에
- 62 -
No
정제전 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(()내용이 모두
없을경우)
학위취득대학명학위취득대학코드
(검색코드입력)코드학위취득대학명
1 연세대학교(원주) ZD13266 연세대학교 연세대학교
기관명이형전거DB를
이용하여
학위취득대학코드에는
이형기관코드
학위취득대학명에는
대표기관명을 매핑함
No
정제전 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(기존 코드값)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 114800 서울대학교 7006431 서울대학교 서울대학교
학위취득대학명 검색
기존데이터 가베지
처리 후 검색된 코드
입력
No
정제전(표준대학명 설정) 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(표준대학명
기준설정)
학위취득대학명학위취득대학코드
(검색코드입력)학위취득대학명
1 가톨릭대학교가톨릭대학교(본
부)7001337 가톨릭대학교 가톨릭대학교
신규 발급 요청 후
코드 입력
No
정제전(개칭 외국취득대학명) 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(검색된값)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 부경대학교 부산수산대학교 7003010 부경대학교 부경대학교
인터넷
학위취득대학명
검색하여 검색된 코드
입력
2 東京大學 도쿄대학 JA0122 도쿄대학 東京大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
3 東京工業大學Tokyo Institute
of TechnologyJA0114
Tokyo Institute
of Technology東京工業大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
서 검색하여 학위취득대학코드 입력
4 기존 학위취득대학코드가 있는 경우 NTIS 코드값으로 변경
5 취득대학명 검색 후 취득대학코드가 없을 경우 학위취득대학명 신규 발급 요청 후 코드
기입
6 취득대학명이 개칭 혹은 외국취득대학명일 경우 검색해서 학위취득대학코드 기입함
- 63 -
4 早稻田大學(일본)와세다
대학JA0319 (일본)와세다 대학 早稻田大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
5 서울산업대학교 경기공업전문대학 7002623 경기공업전문대학 서울산업대학교
인터넷
학위취득대학명
검색하여 검색된 코드
입력
오탈자 정제요령
서울대하교 서울대학교 (오탈자 수정)
7 가베지값
가베지 정제요령
111ㄴㄴㄴ amp 김정구 없슴 등등 가베지 처리
8 오탈자
학력사항_학과 정제지침
1 학과코드와 학과명 모두 null인 경우 정제대상에서 제외
2 학과코드는 존재하나 학과명이 null인 경우 학과코드를 검색하여 학과명 입력
No원본데이터 정제 후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 0015 0015 가정 가정코드표에서 학과코드로
검색하여 매핑한다
3 학과명은 존재하나 학과코드가 null인 경우 학과명을 검색하여 학과코드 입력
가 학과코드표에 학과명과 정확히 일치하는 값을 찾아 매핑
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가정 0015 가정 가정코드표에서 학과명으로
검색하여 매핑한다
나 정확히 일치하는 학과명이 검색되지 않는 경우 근사값으로 매핑
- 64 -
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가축번식학번식공
학 전공명칭
전공필드가 Null인 경우
전공필드로 이동한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 건설공학대학원
박사후기9475
건설공학대학원박사
후기대학원
대학원의 경우 일치하는
값이 없으면 상위 개념으로
검색하여 매핑한다
2 이과대학
단과대학의 경우 일치값이
없으면 가베지 처리한다 -
학과명 삭제
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가정교육학 0040 가정교육학 가정교육 근사 값으로 매핑한다 유사
2 기계설계학전공 1260 기계설계학전공기계설계
기계설계학
검색값이 여러 개인 경우
일치도가 높은 값으로
매핑한다
유사
3 건축공학계열 0160 건축공학계열
건축공학
건축공학과
건축공학부
건축공학교육
일치도가 같은 여러 개의
값이 검색된 경우 글자수가
가장 적은 값으로
매핑한다
유사
일치도 높은 값을 매핑 한다하여 ldquo건축공학rdquo을 ldquo건축rdquo의 형태와 같이 학과 자체가 바뀔
수 있는 매핑을하지 않도록 주의한다
다 학과명칭의 중간에 구분기호(쉼표() 마침표() slash() and(amp) 등)가 있으면서 정확히
일치하는 학과명이 검색되지 않는 경우
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 전기 및
컴퓨터공학과0073
전기 및
컴퓨터공학과전기컴퓨터공학과
구분기호를 무시하고
매핑한다
2 생화학세포학 및
분자생물학과3240
생화학세포학 및
분자생물학과생화학
No 1의 결과가 없는 경우
구분기호를 기준으로
각각의 데이터를 검색하여
매핑한다
3 곡류과학식품공학 3715 곡류과학식품공학 식품공학구분기호를 기준으로
두번째의 값이 검색된 경우
라 학과코드가 Null 이고 학과명 필드에 전공명칭이 입력된 경우
(1) 전공필드가 Null인 경우 전공필드로 데이터를 이동하여 매핑하고 학과명 필드의 데이
터는 삭제한다
마 상기 방법으로 매핑이 불가능한 경우
- 65 -
3 요업공업 9999 요업공업 기타유사코드를 찾지 못한
경우 기타로 분류한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 명예박사 가베지 처리한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 공교 공업교육
공예교육
추정된 값이 하나일 때는
그 값으로 매핑 둘
이상이면 가베지 처리한다
2 IHE(Delft)
영문 약어의 경우 추정이
어려운 값은 가베지
처리한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 工學系硏究 가베지 처리한다
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1 추후입력 test 가베지 가베지 처리
2 미정 PH D 가베지 가베지 처리
3 기억안남 NA 가베지 가베지 처리
4 졸업시험으로 대체 null 가베지 가베지 처리
5 국문없음 no data 가베지 가베지 처리
6
공학박사(지능형
소프트웨어 전공)
or 공학사
(자동차기술사)
학위 및 기타정보 가베지 처리
7 박사 학위 가베지 처리
4 가베지 처리
가 학과명이 아닌 경우
나 약어인 경우
다 학과명인지 판단하기 난해한 한문 명칭의 경우
학력사항_학위논문명 정제지침
1 최종학위국문논문명과 최종학위영문논문명이 모두 null인 경우 정제대상에서 제외
2 논문명 필드에 기타 정보나 가베지 데이터가 존재하는 경우
- 66 -
8 영문참조 none 가베지 가베지 처리
9 aa 0 가베지 가베지 처리
10 가 x 가베지 가베지 처리
11 디지털경제학 Chemistry 학과 또는 전공정보 가베지 처리
12
학사학위시설계PR
OJECT날개2001-
gt청소년수련원테마
로 설계함
졸업 작품에 대한
정보가베지 처리
13
교회 건축물의
계획 및
설계(설계작품)
졸업 작품에 대한
정보가베지 처리
14압축기 관련
기술연수 연수 정보 가베지 처리
15
광통신 부품용
소재 연구관련
논문을 준비중임
준비중인 논문 가베지 처리
16 KISTI 영문 약어 가베지 처리
17 CFD 영문 약어 가베지 처리
18
H Atoms in
Photodissociations
and Chemical
Reactions(수소원자
의 광화학반응)
H atoms in
Phtodissociation
and Chemical
Reactions
H Atoms in
Photodissociation
s and Chemical
Reactions(수소원
자의 광화학반응)
H atoms in
Phtodissociation
and Chemical
Reactions
()안에기타정보가표
기됨
-유효데이터의표기
언어는동일하나내용
상다소의차이를보이
는경우
데이터 유지
19
김휘택김승욱김정
일서근택서정탁유
총일대퇴골
근위부의
방사선학적 형태-
정상 고관절과
대퇴골두 무혈성
괴사가 있는
고관절에서의 비교
대한정형외과학회
지
33(1)177-1851998
김휘택김승욱김
정일서근택서정
탁유총일대퇴골
근위부의
방사선학적 형태-
정상 고관절과
대퇴골두 무혈성
괴사가 있는
고관절에서의
비교
대한정형외과학회
지
33(1)177-185199
8
유효 데이터 전후에
기타 정보가 표기된
경우
데이터 유지
20
친환경
도시건축계획에
관한 연구
Oekologisch
orientierte
Stadtplanung in
Seoul
Suedkorea(독문
명)
친환경
도시건축계획에
관한 연구
Oekologisch
orientierte
Stadtplanung in
Seoul Suedkorea
국문영문논문명
필드에 모두
데이터가 있고
영문논문명 필드에
한글로 (언어)
표기가 되어 있는
경우
(언어) 부분만 가베지
처리
21
ZFS symmetry
and parameters
in MR(임시등록)
임시등록데이터의
경우가베지 처리
3 논문명의 후반부가 잘린 경우
- 67 -
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1 합성과 논문명의 남은 부분이
극히 짧음가베지 처리
2 경영통계에 관련 논문명의 남은 부분이
극히 짧음가베지 처리
3
계층구조를
이용한 문서
클러스터 제목의
자동생성 기법
cluster
계층구조를
이용한 문서
클러스터 제목의
자동생성 기법
논문명의 남은 부분이
극히 짧음(영문논문명)
영문논문명
가베지 처리
4암호화된 위상
마스크를 이용한
New visual
cryptography
method based on
optical
interference
암호화된 위상
마스크를 이용한
New visual
cryptography
method based on
optical interference
논문명이
어느정도(2단어 이상)
남아 있음(국문논문명)
데이터 유지
5
metathesis
polymerization of
~
metathesis
polymerization of
~
논문명이
어느정도(2단어 이상)
남아 있음
데이터 유지
6 보편형식On universal
forms보편형식
On universal
forms
가베지 여부를
판단하기 난해함데이터 유지
7
점성유동장내에서
의 최대양력 익형
설계
The Optimal
Design
점성유동장내에서
의 최대양력
익형 설계
The Optimal
Design
영문 논문명에
데이터의 일부 -
두단어 이상 남아 있음
데이터 유지
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문명
최종학위영문논
문명최종학위국문논문명 최종학위영문논문명
1
석사순니켈의수소
취성에미치는Fe및B
의영향에관한연구
박사기계적합금화
에의해제조된ABA
B2형금속수소화물
의전극특성에관한연
구
기계적 합금화에
의해 제조된 AB
AB2 형
금속수소화물의
전극 특성에 관한
연구
석사논문 박사논문이
동시에 입력
최종(박사)
논문명만
유지한다
2
초임계이산화탄소를
이용한 마늘로부터
지방산 추출에 관한
연구(석사)
식품저장기간을연장
할수있는기능성필름
개발을위한항균성물
질추출및흡착에관한
연구
식품저장 기간을
연장 할수있는
기능성 필름 개발을
위한 항균성 물질
추출및 흡착에 관한
연구
석사논문 추정불가
논문이 동시에 입력
후반부의
논문명만
유지한다
3
GIS를 이용한
대학캠퍼스
공간분석(석사논문)
현재 인터넷 GIS를
이용한 경관평가
논문 준비중
GIS를 이용한
대학캠퍼스
공간분석
후반부가 준비중인
논문인 경우
준비중인 논문
가베지 처리
4 논문명이 두개 이상인 경우
- 68 -
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문명
최종학위영문논
문명최종학위국문논문명 최종학위영문논문명
1
(영)A Shift-first
Strategy for
Generalized LR
Parsing
A Shift-first
Strategy for
Generalized LR
Parsing
A Shift-first
Strategy for
Generalized LR
Parsing
()안의 언어표기만
제외하고 동일한
데이터
국문논문명만
유지하고
영문논문제
삭제 처리
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1
3d 전자계에 대한
NMR 이동
계산(Theoretical
calculations of
NMR shifts for
3dⁿsystems)
3d 전자계에
대한 NMR 이동
계산
Theoretical
calculations of
NMR shifts for
3dⁿsystems
한쪽의 필드에
데이터가 모두
입력된 경우
해당 필드로 이동
3
AStudyonLandslid
eofCuttingandBank
ingSlopeKFRI
Road 林道
盛土面의
崩괴에關한硏究
AStudyonLandsli
deofCuttingandBa
nkingSlopeKFRI
Road 林道
盛土面의
崩괴에關한硏究
국문 영문 구분없이
유지함데이터 유지
9
家庭用電氣製品
の親環境設計過
程への畵像流體
計測の適用に關
する硏究(A
Study on the
Design of Home
Appliances for
Energy Saving
Using PIV)
家庭用電氣製品の
親環境設計過程へ
の畵像流體計測の
適用に關する硏究
(A Study on
the Design of
Home Appliances
for Energy
Saving Using
PIV)
한쪽의 필드에
영문과 기타외국어
논문명이 모두
입력된 경우
데이터를 구분할
기준이 없으므로
데이터를 유지하고
국문논문명 필드로
이동
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1中韓兩國外銷美國
主要商品之比較硏
중한양국
대미수출
中韓兩國外銷美國主
要商品之比較硏究
논문명 필드 내
논문의 언어를해당 필드로 이동
5 국문영문논문명이 동일하나 (언어)가 표기 되어 있는 경우
6 국문영문 필드에 데이터가 뒤섞여 있는 경우
가 국문 영문을 구분하지 않고 국문논문명은 널이 아니어야 함
나 국문논문명(필수)이 널이고 영문논문명이 널이 아닐 경우 국문논문명으로 영문논문명
을 이동
다 중국어 논문명은 명확히 구분이 되는 경우만 정제하여 영문논문명 필드로 이동 - 일문
논문명 국문 논문명과의 구분 난해
- 69 -
究(중한양국
대미수출
주요상품의
비교연구) [1991년
경영학석사 논문
중국어]
주요상품의
비교연구
표기하여 명확한
구분 가능
No원본데이터 정제 후
데이터 유형 정제요령 비고취득국가코드 취득국가코드
1 KZ NTIS 국가코드와 불일치 널처리
2 오류 데이터 널처리
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 Takashi Tsuruo PhD Takashi Tsuruo PhD
2 유영면(자동차 부품연구원) 유영면(자동차 부품연구원) (기타정보)가 표기된 경우 데이터 유지
3 신현경 김정회 (공동) 신현경 김정회 (공동) 2명 이상인 경우 데이터 유지
4高橋照男(TAKAHASHI
TERUO)
高橋照男(TAKAHASHI
TERUO)(병음)이 표기된 경우 데이터 유지
5 송지복 박사 송지복 박사
교수명 앞뒤에 호칭이 붙은 경우 데이터 유지
6 이와바교수 이와바교수
7 Dr HT Hahn Dr HT Hahn
8 ProfDr NWiberg ProfDr NWiberg
9 C S George Lee aaaaa C S George Lee지도교수명 뒤에 의미없이
알파벳이 반복 나열된 경우
반복 나열된 알파벳 가베지
처리
10J Desmaism aaaaa
DBernacheJ Desmaism DBernache
2인의 지도교수명 사이에
의미없는 알파벳의 반복이 온 경우aaaaa 를 로 치환한다
11 김해구 김해구지도교수명 전후에 의미없는
특수문자나 파자가 존재하는 경우
의미없는 문자 가베지 처리
- 단 성명이 완전하지 않은
학력사항_취득국가 정제지침
1 취득국가코드가 NTIS 코드가 아닐 경우
가 취득국가코드가 NTIS코드가 아니면 널처리함
학력사항_지도교수명 정제지침
1 Null인 경우 정제대상에서 제외
2 필드내 지도교수명 외 기타 정보가 표기된 경우
가 필드내 유효 데이터의 존재 유무만을 중요시 함 유효 데이터가 존재하는 경우 데이
터의 형식 등에 큰 의미를 두지 않음
- 70 -
상황에서 성명이 들어갈
부분에 나 특수문자가
표기된 경우 데이터 유지
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 주강 주강
이름이 정확한지 불확실한 경우올바른 데이터인지 판단이
불가능 하므로 데이터 유지
2 김양 김양
7 공란 공란
3 홍길동 홍길동
4 Hiroyuki KIDO Hiroyuki KIDO
5 DH Youn DH Youn
한국 사람인데
영어(미국식)_이니셜로 표기된
경우
데이터 유지
6 Liu Hung Wen Liu Hung Wen한국 사람인데 영어(한국식)로
표기된 경우데이터 유지
7 이인원이상수 이인원이상수 지도교수가 2인 이상인 경우의
구분기호데이터 유지
8 오정무김상돈 오정무김상돈
9 庄子哲雄 庄子哲雄
일본식 이름의 표기법 데이터 유지
10 가네꼬 준이찌 가네꼬 준이찌
11 Kajiuchi Toshio Kajiuchi Toshio
12 대림성행 대림성행
일본 한자를 한글로 표기 데이터 유지
13 장욕천선대삼 장욕천선대삼
14 목도정부 목도정부
15 불상 불상 유효 데이터 여부 판단 난해 데이터 유지
16 지반 자바 지반 자바 외국어 이름을 한글로 표기 데이터 유지
17 Luo Luo
한국 교수의 성만을 표기한
것인지 외국인 교수의 이름인지
판단 난해
데이터 유지
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 N 가베지 데이터 데이터 가베지 처리
2 NA
3 필드내 데이터가 유효 값인지 판단하기 난해한 경우
가 유효 값인가 유효하지 않은 값인가 판단 자체가 불가능한 경우가 대부분 이므로 데이
터 유지를 기본으로 함
4 필드내에 기타 정보나 가베지 데이터가 존재하는 경우
- 71 -
3 none
4 해당없음
5 알수없음
6 모름
8 김교수 호칭하는 대상이 포괄적인 경우 데이터 가베지 처리
9 농과대학 근무처 또는 전공 정보 데이터 가베지 처리
10 대학원 학위 또는 학과 정보 데이터 가베지 처리
11 교수님 직위 정보 데이터 가베지 처리
12 지도교수명 가베지 데이터 데이터 가베지 처리
11 Kajiuchi Toshio Kajiuchi Toshio
12 대림성행 대림성행 일본 한자를 한글로 표기 데이터 유지
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 19871801 198702 월(MM)이 유효하지 않은
경우 - 졸업년월02월로 갱신
2 19871301 198703 월(MM)이 유효하지 않은
경우 - 입학년월03월로 갱신
3 19871301 198701월(MM)이 유효하지 않은
경우 - 최종학위취득일01월로 갱신
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 10780301 년도(YYYY)가 유효하지
않은 경우 - 공통
데이터 가베지
처리
No 원본데이터 정제 후 오류사항 정제요령 비고
학력사항_날짜유형(입학일졸업일학위취득일)
1 기본 지침
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMM
다 날짜 데이터가 유효하지 않은 경우
(1) 년도(YYYY)가 유효하며 월(MM)이 유효하지 않는 경우 졸업월(MM)은 02로 입학월
(MM)은 03으로 그리고 최종학위취득일(MM)은 01로 갱신
(2) 년도(YYYY)가 유효하지 않은 경우 데이터 가베지 처리
(3) 년도(YYYY)의 유효 범위
rarr 졸업일 입학일 최종학위취득일 1900 lt 졸업일 입학일 최종학위취득일 lt 현재
라 MM(월)이 없는 경우 졸업년월은 02월로 입학년월은 03월로 갱신
- 72 -
졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 1987 198702 월(MM)이 없는 경우 -
졸업년월02월로 갱신
2 1987 198703 월(MM)이 없는 경우 -
입학년월03월로 갱신
3 1987 198701월(MM)이 없는 경우 -
최종학위취득일01월로 갱신
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 19820301 19820301 19820301 입학년월과 졸업년월이
동일입학년월 유지
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 0201
년도가 없음 년도로
간주하더라도 유효하지
않은 데이터
데이터 가베지
처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
1한성대학교
산업시스템공학부한성대학교 정제 정제 처리
2(주)한정화학
총무과부장(주)한정화학 부장 정제 정제 처리
3연세대학교 공과대학
화학공학전공
연세대학교
공과대학정제 정제 처리
4연합철강공업(주) 입사
(국제그룹공채)연합철강공업 정제 정제 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
마 [입학년월 gt= 졸업년월]인 경우 입학년월 유지 졸업년월 가베지 처리
바 YYYY(년도)가 없는 경우 데이터 가베지 처리 정제대상에서 제외
경력사항
경력사항_근무처명 정제지침
1 근무처명이 null인 경우 정제대상에서 제외
2 근무처명에 직위 전공값이 있는 경우
3 가베지 데이터
- 73 -
1 중학교 총무처 군복무 현역 등
가베지 데이터 가베지 처리
2 가 나 다 몰라 가베지 처리 등
3 00 제2청사 (주)ㅇㅇ건설 000공무원 등
4 111163년10년1년106866 등
5 WHO COO aaa dkff saa 등
6 미국 일본 등
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
1 日本産業技術合究所 日本産業技術合究所
오류
가베지 처리
2 고려대학교 보건대학원 역학 I 보건정보학과 고려대학교 보건대학원 정제 처리
3 환경공학 국가기술개발 선도사업 (G-7 연구환경공학 국가기술개발
선도사업 (G-7 연구가베지 처리
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 교수 A01 교수 교수직위명과 일치하는 코드값을
찾아 매핑
2 위촉연구원 B07 위촉연구원 위촉연구원
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 조교수부교수교
수A01
조교수부교수
교수교수
완전일치gt 일치도가 높은
직위명 순으로 매핑
2 시간강사연구조
교A05
시간강사연구조
교시간강사
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
4 기타
경력사항_직위명 정제지침
1 직위코드와 직위명 모두 null인 경우 정제대상에서 제외
2 직위명은 있으나 직위코드가 null인 경우 직위명 검색하여 직위코드 입력
가 직위명과 정확히 일치하는 직위코드값이 존재하는 경우
나 직위명에 직위가 복수인 경우
다 정확히 일치하는 직위명이 검색되지 않는 경우
- 74 -
1 주임교수 A01 주임교수 교수 근사치의 코드값으로 매핑
2 시간강의 A05 시간강의 시간강사
이형정의
표 첨부
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 Professor A01 Professor 교수영문을 번역하여 이형정의표에
의거 코드값을 찾아 매핑
이형정의
표 첨부
2 Research Fellow B20 Research Fellow 전문위원
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 간호사 999 간호사 기타직위명과 일치하는 코드명이
없을경우 기타코드값으로 매핑
2 계장 999 계장 기타
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 36 연구원 B06 연구원 연구원기존의 직위코드를 NTIS
직위코드로 대체
2 13 조교수 A03 조교수 조교수
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 등재 직위명은 가베지 처리
2 ㅁㅁㅁ
라 직위명이 영문일 경우
마 상기 방법으로 매핑이 불가능한 경우
3 직위명과 코드가 모두 존재하는 경우
4 직위명이 오류인 경우(직위명 가베지)
- 75 -
No NTIS코드 코드명(생성) 이형정의(원본데이터) 비고
1 A01 교수
Professor
Prof
Faculty
(대학의)Teacher
Teaching
TeachingFellowship
학장 학장보
부학장 학과주임
학과장 학부장
학생처장
대학원장대학원장보
(대학의)교직원(대학의)교원
총장부총장
2 A02 부교수
AssociateProfessor
AssociateResearchProfessor
AssociateVisitingProfessor
3 A03 조교수AssistantProf
AssistantProfessor
4 A04 전임강사FullTimeLecturer
Instructor
전문강사 전담강사
강의전임 강의전담
전임대우
5 A05 시간강사
시간강의
PartTimeLecturer
PartTimeInstructor
6 A06 강사(기타) 강의 출강
7 A10 명예교수Honorary[Emeritus]Professor
HonoraryVisitingProfessor
8 A11 석좌교수 Chair Professor
9 A12 강의교수
10 A13 겸임교수
겸직교수
adjunctprofessor
adjunctprof
AdjunctFaculty
11 A14 계약교수
12 A15 기금교수
13 A16 대우교수
14 A17 연구교수
ResearchProfessor
ResearchFaculty
FacultyResearch
teachingresearcher
15 A18 초빙교수
초청교수
InvitedProfessor
ProfessorInvite
16 A19 객원교수
Visitingfaculty
visitingprofessor
aprofessorextraordinary
17 A20 조교
조수
Tutor
Assistant
UniversityAssistant
GraduateAssistant
GraduateAssociate
Teachingfellow
TeachingAssistant
TeachingAssociate
FacultyAssociate
TA RA GRA GSRA
18 A21 대학원생박사과정
석사과정
별첨 이형정의표
- 76 -
postgraduate
19 A22 POST-DOC
연수과학자
연수연구원
포스트닥터
포닥
박사후연수
박사후과정
박사후연구원
Post-Dr
Postdoctor
postdoctoral
visitingscholar
visitingfellow
Researchassistant
ResearchAssociate
20 A23 POST_MAS
21 B01 수석연구원 Principal Research Engineer
22 B02 책임연구원
연구책임자
SeniorResearchEngineer
SeniorResearch
SeniorResearcher
SeniorResearchStaff
SeniorInvestigator
23 B03 주임연구원
연구주임
AssistantResearchEngineer
AssistantResearcher
assitantInvestigator
24 B04 전임연구원AssociateResearchEngineer
AssociateResearcher
25 B05 선임연구원 선임-연구소의
26 B06 연구원
연구소장 연구보조원
연구원보연구생
연구개발원연구조원
연구주임연구조수
연구부담당자연구자
연구실장연구보조
연구팀장연구요원
연구센터장연구부처장
연구부문장연구대리
연구단장연구연구진
연구회원연구활동
방문연구 연구수
(연구소연구원연구센터연구실의)-
실장팀장원장부원장소장부소장
선임단장그룹장본부장계장인턴
장장 등
GraduateFellow
(연구소의)-Fellow
Research
Researcher
ResearchStaff
ResearchEngineer
Investigator
27 B07 위촉연구원
VisitingResearcher
VisitingResearchEngineer
VisitingInvestigator
GuestResearcher
GuestInvestigator
28 B10 수석연구위원
29 B11 책임연구위원
30 B12 주임연구위원
31 B13 전임연구위원
32 B14 선임연구위원
33 B15 연구위원
34 B20 전문위원ResearchFellow
ReserchFellowship
35 B30 책임기술원책임기사
기술책임자
SeniorEngineer
ChiefEngineer
- 77 -
PrincipalEngineer
SeniorTechnical
36 B31 선임기술원 선임기사 선임엔지니어
37 B32 기술원
(주식회사의)-기사
엔지니어기술사
기술팀장기술센터장
기술직기술주임
기술담당기술처장
기술직사원
Engineer
Technician
TechnicalStaff
TechnologyStaff
38 C01 공무원
연구사연구관
주사주사보
보좌관기좌
기사보사무관
군무원서기관
이사관조사원
청장차관
자문관비서관
장관행정관
담당관기원
경찰분석관
서서서기보조무원
보건지소장보건소장
보건소영양사보건진료원
보건진료소장지도관
지도사보
(행정기관의)-토목급
(행정기관의)-심사관
(행정기관의)-지도원
(행정기관의)-지도사
(공공기관)-기사
(공사의)-급
39 C02 법조인
심판관변리사
재판관검찰관
변호사법무조정위원
법제이사법의관
법의학감식관
40 C03 의사
전문의전임의
전담의담당의
인턴레지던트
객원의공중보건의
수련의임상의
전공의주치의
의사보일반의
상담의인정의
지도의병원장봉직의
(병원의)-과장부장처장등
Clinician
Intern
Resident
Doctor
Attending
41 C04 교사 (초~고교의)-교원
42 C05 군인
(군관련)-교관소대장
병장교소령
소위대위
군의관의무관
군하사중위
중대장보충역
제대소령
참모의무자문관
기무사기무사보
기무관
43 D01 대표이사
CEO대표
사장법인장
President
44 D02 이사
부사장이사보이사대우
Director
viceDirector
associateDirector
VicePresident
SeniorExecutiveVicePresident
45 D03 전무SeniorManagingDirector
CFO
- 78 -
46 D04 상무 상무보
47 D05 부장
부장대리
DepartmentManager
GeneralManager
48 D06 차장
DeputyGeneralManager
DeputyDirectorGeneral
AssistantDirector
AssistantDirectorvice-chiefManager
49 D07 과장
Manager
GeneralManager
DepartmentManager
DeputyManager
50 D08 대리 Assistant Manager
51 D09 사원 회사원직원
52 999 기타
53 회원(삭제)
No원본데이터 정제 후
오류사항 정제요령 비고근무시작일 근무종료일 근무시작일 근무종료일
1 2005 2007 20050101 20070101 월 없음 월에 01 입력
No원본데이터 정제 후
오류사항 정제요령 비고생년월일 근무시작일 근무종료일 근무시작일 근무종료일
1 19500101 19000101 19400101 유효 범위 오류 삭제처리함
경력사항_날짜유형(근무시작일 근무종료일) 정제지침
1 기본 지침
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMM
다 날짜 데이터가 유효하지 않은 경우
(1) 년도(YYYY)가 유효하며 월(MM)이 유효하지 않는 경우 01로 입력
(2) 년도(YYYY)가 유효하지 않은 경우 데이터 가베지 처리
(3) 년도(YYYY)의 유효 범위
rarr 근무시작일 근무종료일 1900 lt 근무시작일 근무종료일 lt 현재
rarr 근무시작일 근무종료일 생년월일lt근무시작일 근무종료일
라 [근무시작일 gt= 근무종료일]인 경우 근무시작일 유지 근무종료일 가베지 처리
- 79 -
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1한국산업인력
관리공단
건설기계기
사1급1994-12-01
건설기계기사
1급
한국산업인
력관리공단1994-12-01 오류 해당필드로 이동
2치과의사면허
증1993-01-01 보건복지부
치과의사면허
증보건복지부 1993-01-01 오류 해당필드로 이동
3중등 2급
정교사자격증 문교부
중등 2급
정교사자격증문교부 오류 해당필드로 이동
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1워드 프로세서
2급
워드
프로세서
2급
1999-06-01워드
프로세서 2급 1999-06-01 중복 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 발행처 2004-03-01 가베지 가베지 처리
NO원본데이터(가베지) 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 111 222 0000 가베지 가베지 처리
2 상동
No원본데이터 정제 후
오류사항 정제요령 비고근무시작일 근무종료일 근무시작일 근무종료일
1 20050501 20040601 20050501 [근무시작일 gt=
근무종료일]인 경우
근무종료일 가베지
처리
자격사항
자격사항 정제지침
1 자격증명 자격발행처 자격취득일이 모두 null인 경우 정제대상에서 제외
가 자격증명값이 NULL인 경우 나머지 데이터(자격발행처 자격취득일) 모두 가베지 처
리
2 자격증명 자격발행처 자격취득일 각 필드값이 뒤바뀐 경우 처리방법
3 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값이 나올 경우 처리방법
4 자격증명 필드값이 NULL인 경우 처리방법
5 가베지값 처리방법
- 80 -
3 일본
4 없음
NO원본데이터(오탈자) 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 화공기사1급ssssssssssssss 화공기사1급
오탈자데이터 수정 및
가베지 처리
2 충북졍찰청
3 박물관amp8228미술관 정학예사 3급미술관
정학예사 3급
4초경U항공기조종사면허1111111111111
111111111111111111111증
초경량항공기
조종사면허증
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
1 1루프캐리어
이송장치
루프캐리어
이송장치1
루프캐리어
이송장치중복 가베지 처리
2 1 1019990060031101999006003
1 가베지 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
1 1특허등록 제
0290068호 가베지 가베지 처리
2 1 1313131 아자차카 가베지 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
6 기타 처리방법
지식재산권
지식재산권 정제지침
1 특허구분 출원등록번호 지식재산권명이 모두 null인 경우 정제대상에서 제외
가 지식재산권명이 NULL인 경우 나머지 데이터 모두 가베지 처리
2 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값 상이값이 나올 경우 처리방법
3 지식재산권명 필드값이 NULL 가베지값인 경우 처리방법
4 가베지값 처리방법가 출원등록번호 지식재산권명으로 볼 수 없는 데이터는 가베지 처리
- 81 -
1 3자리 이하의
숫자특허
가베지 가베지 처리
2 한국 드릴
3 완료 국제
4 미정 마바
5 이름 사아
6 출원중 파하
7 경상현 가나
8 미지정 다라
9 공개중 카타
10 미입수 혜천
NO원본데이터 정제 후
데이터 유형 정제요령 비고지식재산권명 지식재산권명
1 光微粒子の製造方法 光微粒子の製造方法 오탈자 가베지 처리
2 양자우물amp8228세선의 제작방법 양자우물amp8228세선의 제작방법 오탈자 가베지 처리
3 94-26592 94-26592 오탈자 가베지 처리
NO원본데이터 정제 후 데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 총무
아태물리학회(Associati
on of Asia-Pacific
Physical Societies)
아태물리학회(Associa
tion of Asia-Pacific
Physical Societies)
총무 오류 데이터 이동
2 ASG 없음 Member ASG Member 가베지 가베지 처리
NO원본데이터 정제 후 데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
5 기타 처리방법
소속학협회
소속학협회현황 정제지침
1 학협회명 직위 담당업무 모두 null인 경우 정제대상에서 제외
가 학협회명값이 NULL인 경우 나머지 데이터 모두 가베지 처리
2 학협회명 직위 담당업무 각 필드값이 뒤바뀐 경우
3 해당 필드에 이미 유효 값이 존재하는데 다른 필드값도 나올 경우
- 82 -
1대한병리학회
임상병리학회
대한병리학회
경남(부산)회장
대한병리학회
임상병리학회
대한병리학회
경남(부산)회장 중복 데이터 유지
명칭포함
유지
2한국자원공학회
이사 한국자원공학회 이사 오류 데이터 이동
3여성생명과학기
술포럼 회원운영위원 학술위원
여성생명과학기술
포럼운영위원 학술위원 중복 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 편집위원 가베지 가베지 처리
2 종신회원 명예회장 가베지 가베지 처리 학협회명 아님
3 회원 해당없음 가베지 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 ㄴㄴㄴ 111 eee 20 q 등
가베지 가베지 처리
2 없음 해당없슴 등재
3 화공기사 1 급 덕있으마
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 일본 학회 기타 가베지 처리
NO 원본데이터 정제 후 데이터 정제요령 비고
4 학협회명 필드값이 NULL값인 경우
5 가베지값
6 기타
훈포장사항
훈포장사항 정제지침
1 수여기관명 훈포장명이 모두 null인 경우 - 정제대상에서 제외
가 훈포장명이 NULL인 경우 나머지 데이터 모두 가베지로 처리
2 수여기관명 훈포장명 각 필드값이 뒤바뀐 경우
- 83 -
수여기관명 훈포장명 수여기관명 훈포장명 유형
1 장영실상 과학기술부 과학기술부 장영실상 오류 해당필드로 이동
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 대통령 대통령 대통령 대통령 중복 데이터 유지 대통령 상
2우수논문발표상 -
포스터 부문
우수논문발표상 -
포스터 부문
우수논문발표상 -
포스터 부문중복
데이터 가베지
처리
3 국무총리 표창 국무총리 표창 국무총리 국무총리 표창 중복데이터 가베지
처리
4 광혜학술상 광혜학술상 광혜학술상 중복데이터 가베지
처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 대한민국 정부 오류데이터 가베지
처리
훈포장명 데이터
null값
2 한국물리학회 한국물리학회 오류데이터 가베지
처리
훈포장명 데이터가
가베지값
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 222 111데이터 가베지 처리
2 회원 등재등
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 제어amp8228자동화amp8228시스템공학회 제어amp8228자동화amp8228시스템공학회오탈자
데이터 유지 수정
및 가베지 처리
파일생성 형식에
따른 오류
2 ㅈ조선대총장 조선대총장
3 해당 필드에 이미 유효 값이 존재하는데 다른 필드에서 동일값이 나올 경우
4 훈포장명 필드값이 NULL값인 경우
5 가베지값
6 기타
저역서실적
저역서실적 정제지침
- 84 -
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 3차원
인체해부도1 UBCare
3차원
인체해부도 1 UBCare 오류
해당필드로
이동
2신흥인터내
셔날
소아
청소년치과학1
소아
청소년치과학 1 신흥인터내셔날 오류
해당필드로
이동
3 動力學Engineering
Mechanics2 普文堂 動力學
Engine
ering
Mechan
ics
2 普文堂 한자명 그대로 유지
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1고분자
공학 II
고분자 공학
II1 희중당
고분자 공학
II 1 희중당 중복 가베지 처리
2 주조응고일본금속학회
[주조응고]2
반도출판
사
일본금속학회
[주조응고] 2 반도출판사 오류
해당필드로
이동
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 1
가베지전체 데이터
삭제
2물리강의(20
9쪽)일서 2 대웅
3 wjswktkdrjfo
qhdks rltnf1 생능출판사
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 Polymer Surface
Dynamics 공동저서
Polymer Surface
Dynamics 공동저서 이동 데이터 이동
2
The Handbook of
Groundwater
Engieering-지하수공학에
있어서 지리정보시스템
The Handbook of
Groundwater
Engieering-지하수공
학에 있어서
지하수공학에
있어서
지리정보시스템
The Handbook of
Groundwater Engieering중복 데이터 수정
1 국문저서명 영문저서명 저역서 구분 발행처명이 모두 null인 경우 - 정제대상에서 제외
가 국문저서명 영문저서명 둘 다 NULL인 경우 나머지 데이터 모두 가베지 처리
2 국문저서명 영문저서명 저역서구분 발행처명 각 필드값이 뒤바뀐 경우
3 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값 상이값 나올 경우
4 국문저서명 영문저서명 필드값이 NULL값이거나 가베지값인 경우
5 국문저서명이 널이고 영문저서명이 널일 아닐 경우 국문저서명으로 이동함
- 85 -
지리정보시스템
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 ㅁ 기지이전사업 기획서 YRPMPKOREA 기지이전사업 기획서 YRPMPKOREA 오자 가베지 처리
2 최신 EDICALS 최신 EDI CALS 오자 데이터 유지
3 보호 야동식물 보호 야생 동식물 오자
가능한
범위에서
수정
4 ISBN 1-59033-891-XInequality Theory and
Applications (III)
Inequality Theory and
Applications (III)가베지
가베지 처리
ISBN 필드로
이동
5 NHealth Insurance
Reform In Korea
Health Insurance
Reform In Korea가베지 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 1111 2 골든벨
가베지 가베지 처리
2
곽수동
고필옥
김무강
범문사
3 ㄷㄷㅁㅁ 1
4 (주)지학사 1 (주)지학사
6 오탈자
7 가베지 데이터
논문실적
논문실적 정제지침
1 최종학위국문논문명과 최종학위영문논문명이 모두 null인 경우 정제대상에서 제외
2 논문명 필드에 기타 정보나 가베지 데이터가 존재하는 경우
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 추후입력 가베지 가베지 처리
2 미정 가베지 가베지 처리
3 가베지 가베지 처리
- 86 -
구분 항목 세부항목 항목수단위별
가중치()
참여
인력
정보
기본정보
주민등록번호 성명 자택주소 자택
우편번호 자택전화번호 핸드폰번호
7 31
소속기관사항
소속기관명 부서명 직위명 사무실
전화번호 기관주소 최초임용일 인
력(직업)구분
7 185
학력사항
전공 취득대학 학위 입학일 졸업
일 학과 취득국가 지도교수명 학위
논문명 학위취득일
10 21
16 데이터 검수
161 데이터 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
162 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 87 -
구분 항목 세부항목 항목수단위별
가중치()
경력사항 근무처명 직위명 근무기간 3 45
자격사항 자격발행처 자격증명 자격취득일 3 25
논문실적
논문발표일 국문논문명 영문논문명
저자역할구분 발행처 학술지구분
학술지명 SCI여부
8 105
지식재산권 지식재산권명 출원_등록번호 특허구분 3 25
계 소계 41 905
평가
위원
소속학협회현황 담당업무 직위 학협회사항 3 3
훈포장사항 수상년월 수여기관명 훈포장명 3 25
저역서실적국문저서명 영문저서명 발행년 발
행처 저역서구분5 4
소계 11 95
계 52 100
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
150 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
성명 100자택주소 10자택우편번
호
20
자택전화번 10
항목별 오류율 산정 기준 정의
- 88 -
호
핸드폰번호 10E-mail 10소계 310
소속기
관사항
(7개)
소속기관명 100
부서명 05
직위명 20
사무실전화
번호
10
기관주소 30
인력(직업)구
분
10
최초임용일 10
소계 185
학력사
항
(10개)
전공 20
취득대학 100
학위 20
입학일 10
졸업일 10
학과 15
취득국가 15
지도교수명 05
학위논문명 05
학위취득일 10
소계 210
경력사
항
(3개)
근무처명 20
직위명 15
근무기간 10
소계 45
자격사
항
(3개)
자격발행처 05
자격증명 10
자격취득일 10
소계 25
논문실
적
(8개)
논문발표일 10논문명1 10
논문명2 05저자역할구
분
05
발행처 05학술지구분 05학술지명 10
SCI여부 05
소계 105
지식재
산권
지식재산권
명
10
- 89 -
(3개)
출원_등록번
호
05
특허구분 10소계 25
평가 소속학
협회현
황
(3개)
담당업무 05
위원 직위 05
(11개) 학협회사항 20
소계 30
훈포장
사항
(3개)
수상년월 10
수여기관명 05
훈포장명 10
소계 25
저역서
실적
(5개)
저역서명1 10
저역서명2 05
발행년 10
발행처 05
저역서구분 10
소계 40
계 1000
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 03
품질지표기준점수산정(데이터1
건기준)=오류유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 005
계 6개 오류유형 1
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
- 90 -
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
3000 3 055 150 000825
성명 10 2 035 100 000350자택주소 3 0 000 10 000000자택우편번
호
3 2 035 20 000233
자택전화번
호
4 0 000 10 000000
핸드폰번호 6 0 000 10 000000E-mail 9 0 000 10 000000소계 45 7 125 310 001408
소속기
관사항
(7개)
소속기관명 1000 20 100 000000부서명 80000 200 05 000000직위명 80000 200 20 000000사무실전화
번호
80000 200 10 000000
기관주소 80000 200 30 000000인력(직업)구
분
80000 200 10 000000
최초임용일 80000 200 10 000000소계 481000 1220 000 185 000000
계 1000 01
주민등록번호 한글성명 영문성명 한문성명자택우편번
호
630421-0000000 백중환Joong hwan
Baek
412220
(형식 015)
630421-0000000 백종석Baek Jong
Seok
6304210000000
(형식 015)백인열 Baek IN Youl 白寅烈 711-822
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
국가RampD참여인력 100000건 100000건 3000건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
검사물량 집계표 예시
오류율산정표 예시
검수데이터 예시
- 91 -
630421-0000000 백승호
(오기 02)백제훈
630421-0000000 백종완
630421-
(오기 02)백장선 Jangsun Baek
白壯선
(형식 015)
502-
(오기 02)
630421-0000000 백승호1213132
(오기 02)
630421-0000000 백석형
630421-0000000 백석형
품질지표별
기준점수의
합
055 035 035
데이터별 품질지표 기준 점수
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 03
품질지표기준점수산정(데이
터1건기준)=오류유형별점수
의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 005
계 6개 오류유형 1
- 92 -
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수
기관마다 다름
hurims에 각 기관별 인력관리번호와 NTIS 인력관리번호매핑표관리함
RNO 주민등록번호 필수
-포함한 14자리 일 경우만 연계함
주민등록번호는 기관마다 유일해야 하는데 특정기관은주민등록번호 1개 당 n개의 인력관리번호 존재하는 경우 있음
=gt 연계기관에 연락해서 주민번호 중복되지않게 요구해서 처리
=gt 현재는 맨 처음 해당 데이터의 인력관리번호만 유지
KOR_PSN_NM 한글성명 필수
한글성명은 처음 hurims에 insert될때만 반영하고 update될때는반영하지 않음
기관마다 실명인증을 안 하는 곳이 있기 때문에 같은주민번호인데 성명이 다른 경우가 있음
CHN_PSN_NM 한문성명(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
ENG_PSN_NM 영문이름(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
ZIP_CD 우편번호
(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
hurims에 우편번호||주소1||주소2가 널일 경우만 반영ADDR1 주소1ADDR2 주소2
HOME_TEL_NO 집전화(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
CP_NO 핸드폰번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
EMAIL E-mail(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
MSTR_CLS_CD1 부처(기관)코드1
123에 대중소의 코드를 넣는게 아니라 각각의 분류를 넣어야함
매핑정보가 없으면 반영 못함
1n으로 매핑되는 경우 처음 select 되는 최하위 분류로 매핑함
현재 ntis에는 분류명을 저장하는 필드가 없음=gt분류명은 반영안함
MSTR_CLS_NM1부처(기관)분류명1
MSTR_CLS_CD2부처(기관)분류코드2
MSTR_CLS_NM2부처(기관)분류명2
MSTR_CLS_CD3부처(기관)분류코드3
MSTR_CLS_NM3부처(기관)분류명3
17 데이터 이관
참여인력 기본정보 이관 방안
- 93 -
MP_TYPE 평가위원구분Y일 경우 평가위원 pool Db에 자동 등록함
=gt N 또는 Null일 경우 기존에 평가위원 이면 반영 안함
GENDER_DIV_CD 성별구분 없을 경우 주민번호로 판별
BDT 생년월일 없을 경우 주민번호로 판별INFO_OPEN_SLCT 정보공개구분 없을 경우 비공개로 저장
PINFO_OFR_USE_APR_YN
개인정보제공활용동의여부
N일 경우 최종수정일을 기준으로 기존 동의에서 비동의로변경함
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG 데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
HM_ID 인물ID 인물아이디는 기관에서 넣지 않아도 됨
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
ORG_NM 기관명 필수
hurims에 기관이형DB에 존재하면 대표기관명이형기관코드를 저장하고 없을 경우에는 기관명을그대로 hurims에 저장하고 정제 및 신규 발급을 통해매핑해야함
WORK_DEPT_NM 근무부서명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
POSITION_NM 직위명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
직위명으로 자동코드 매핑하고 직위코드가 없으면 기타999코드로 저장하고
직위명필드에는 연계기관의 직위명 그대로 저장함
ZIP_CD 우편번호
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
hurims에 우편번호||주소1||주소2가 널일 경우만 반영ADDR1 주소1ADDR2 주소2OFFICE_TEL_NO 사무실전화
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
중복체크 기준
- 주민등록번호(주민등록번호 성명이 없으면 반영하지 않음)
소속기관 사항 이관
- 94 -
FIRST_EMP_DT 최초임용일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MP_TYPE 인력구분기관에서 넣지 않아도 되고 기관이형DB에 의해 자동매핑됨
HOFF_DIV_CD 재직구분코드
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일경우에는 재직중으로 인정함
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장
ORD_NO 순번 필수 hurims의 순번으로 저장
DEGREE_ACQ_UNIV_NM 학위취득대학명 필수
hurims에 기관이형DB에 존재하면 대표기관명이형기관코드를 저장하고 없을 경우에는 기관명을그대로 hurims에 저장하고 정제 및 신규 발급을 통해매핑해야함
SDEPT_NM 학과명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
학과명으로 코드매핑하고 매핑안되면 학과명필드만반영함
매핑안된 학과명은 나중에 정제 작업에 의해 매핑함
MAJOR_NM 전공명 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
전공명으로 코드매핑하고 매핑안되면 전공명필드만반영함
매핑안된 전공명은 나중에 정제 작업에 의해 매핑함
GRAD_DT 졸업일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함ENT_DT 입학일 필수 날짜가 1900년 이전이거나 현재보다 크면 삭제함DEGREE_CD 학위구분 필수
ACQ_NAT_CD 취득국가코드(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
DEGREE_ACQ_DT 학위취득일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
소속기관명이 없을 경우 반영하지 않음
학력 사항 이관
- 95 -
ADVISOR_NM 지도교수명기관에서 넣지 않아도 되고 기관이형DB에 의해 자동매핑됨
KOR_THESIS_NM
학위논문제목국문
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일경우에는 재직중으로 인정함ENG_THESIS_NM
학위논문제목영문
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장
ORD_NO 순번 필수 hurims의 순번으로 저장
WORK_ORG_NM 근무처명 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
POSITION_NM 직위명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
WORK_START_DT 근무시작일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
WORK_END_DT 근무종료일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
학위취득대학명 학위가 없을 경우 반영하지 않음
경력 사항 이관
- 96 -
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
INSTIT_LST 학협회명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
POSITION_NM 직위 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용INSTIT_JOB_NM 담당업무
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
INSTIT_ACT_START_DT 학회활동시작일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
INSTIT_ACT_END_DT 학회활동종료일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
CERT_NM 자격증명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
CERT_ISSUE_ORG_NM 자격증발행처 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
CERT_ACQ_D 자격취득일 필수 중복 체크하는 기준에만 쓰임
근무처명이 없을 경우 반영하지 않음
소속 학협회 사항 이관
학협회명이 없을 경우 반영하지 않음
자격 사항 이관
- 97 -
Tinsert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
KOR_PAPER_NM 논문제목국문 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
ENG_PAPER_NM 논문제목영문
중복 체크하는 기준에만 쓰임
insert 할때만 적용
PAPER_PUB_DT 논문발표일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ROLE_SLCT 역할구분(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_ORG_NM 발행처명(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
JRNL_NM 학술지명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
JRNL_SLCT 학술지구분 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용SCI_TYPE_SLCT SCI여부
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
ISSN ISSN번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_BK 게재권집(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_ISSUE 게재호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
START_PG 시작페이지(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
END_PG 종료페이지 (최종수정일이 최신이고 널이 아님) 또는 (hurims가
자격증명이 없을 경우 반영하지 않음
논문실적 이관
- 98 -
널일)때 update에 반영CO_AUTHOR_NM 공동저자명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
PTAPP_SLCT 특허구분 필수(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PTAPP_REGIST_NO 출원등록번호 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
IPR_NM 지식재산권명 필수(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
ACQ_DT 취득일 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ACQ_SLCT 취득구분
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
공동활용항목에 없는데 널일경우 무엇으로 봐야하나(확인요)
PTAPP_REGIST_NAT_CD
출원등록국가코드
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일 경우에는 대한민국으로 자동 반영함(확인요)MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
논문명이 없을 경우 반영하지 않음
지식재산권실적 이관
- 99 -
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
TRNSWRT_SLCT 저역서구분 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
KOR_TRNSWRT_NM 국문저역서명 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
PUB_ORG_NM 발행처명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
PUB_YR 발행년도 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ISBN ISBN번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
AWARD_NM 수상명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
AWARD_ACQ_YM 수상년월 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
AWARD_GRANT_ORG_NM 수여기관 필수 중복 체크하는 기준에만 쓰임
지식재산권명 출원등록구분 특허구분 출원등록번호가 없을 경우 반영하지 않음
저역서실적 이관
저역서명 저역서구분이 없을 경우 반영하지 않음
훈포장실적 이관
- 100 -
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드 훈포장명이 없을 경우 반영하지 않음
- 101 -
2 인력정보 영문이력 입력 매뉴얼
21 개요
211 목표
연구자 이력정보 영문 번역을 통한 DB 구축(1000건)
- 영문이력 번역 대상 항목 선정
기본정보 재직기관 최종학위 경력사항 논문실적 연구실적 특허
- 영문이력정보 관리 기능 개발 및 영문이력DB 구축
- 영문이력DB에 대한 본인확인 안내메일 발송
인물정보에 대한 영문 검색서비스 제공
212 DB구축 공정
- 102 -
항 목 세 부 항 목 영문명 비고
기본(BasicInformation)
기본정보 영문성명 English Name - 한글이력정보와 공동 사용- 전문분야는lsquo08 개정 분류코드 영문명 활용
휴대전화(국가번호)
Cellular PhoneNumber
E-mail E-mail
개인홈페이지 Homepage
전문분야 전문(연구)분야 Research Field 1
Research Field 2
Research Field 3
검색키워드 전문분야명 입력
재직기관(organization)
기관명 Organization Name - 현재 재직기관사항 1개 입력
부서명 Department
직위 Job title(position)
우편번호 Postal Code
주소 Address
전화(국가번호) Telephone
팩스(국가번호) Fax
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) Degree Code
학위취득일 GraduationDate
학교명 School
전공명 Major
22 DB구축 목록 및 범위
221 DB구축대상 및 항목 정의
DB구축대상 수집된 영문 이력서 번역 및 희망자에 대한 이력정보 번역
- 수집된 이력서 번역
middot 수집된 한글이력서 반영하여 번역 수행
middot 수집된 영문이력서 입력
- 이력서 번역 대상자
middot 참여인력 또는 평가위원 서비스 대상자
middot 논문실적 경력사항 등의 데이터가 충실한 인력
DB구축 대상 항목 정의
- 103 -
경력(Career)
경력사항(CAREER)
시작년월 Start Date - 재직 경력으로 주요 경력입력 현 재직정보제외
종료년월 End Date
재직기관명 Organization Name
직위 Position(Job Title)
실적ResearchResult
논문실적(paper)
논문명 Title - 최근 5년 이내만 입력
저널명 Journal Name
게제(권)집 Volume
게제호 Number
시작페이지 Start Page
종료페이지 End Page
게제년월 Date of Publication
공동저자명 Co-Author
비고 Etc
연구실적ResearchProject
시작년월 Start Date
종료년월 End-Date
발주기관 Funding organization
참여구분(역할)-코드
Role
연구실적명 title
특허(patent)
출원등록구분-코
드
appliedregistered
출원등록번호 number
출원등록국가-코
드
National Code
특허출원명 Patent name
출원등록일자 Date
- 104 -
항 목 세 부 항 목 비고
기본(BasicInformation)
기 본정보
영문성명 - 각각 형태가 다른 영문성명을ldquoGilDong Hong 형태로 변경 필요
T
휴대전화(국가번호)
- 휴대전화를 표준형태로 변경 필요(외국 휴대전화만 국가번호 표시)middot 대한민국 010--middot 외국 +국가번호---
T
E-mail abctestcom 형태 T
개인홈페이지
입력 시 http을 제외하고 입력T
전 문분야
전문(연구)분야
- 전문분야는 lsquo08 개정 분류코드 영문명 활용
- 본인 확인에 의해 본인이 직접 선택하도록 함
- 검색키워드 필드에 전문분야명을 입력
재 직기관(organization)
기관명 - 대표기관명- 기관명이 주소정보에 포함되어 있는경우 존재
부서명 - 부서명이 주소정보에 포함되어 있는경우 존재
직위 - 여러개의 직위 존재우편번호 - 주소정보에 기관명 부서명 포함되어
있는 경우 존재- 영문우편번호DB를 이용 가능
주소
전화(국가번호)
- 전화번호를 표준형태로 변경 필요(외국 전화만 국가번호 표시)middot 대한민국 042--middot 외국 +국가번호---
T팩스(국가번호)
학력(Academiccarrer)
최 종학위(FinalDegree)
학위(코드) - 8 박사- 5 석사- 2 학사
C
학위취득일 - YYYY-MM-DD형태 D학교명 - 대표기관명전공명
경력(Career)
경 력사항(CAREER)
시작년월 - YYYY-MM형태 D종료년월 - YYYY-MM형태 D
재직기관명 - 부서명 포함직위 - 여러개의 직위 존재
실적ResearchResul
논 문실적(paper
논문명 - 영문제목 일부 존재저널명
23 데이터 분석 내역
231 세부 항목별 영문이력정보 분석
번역을 위한 영문이력정보 분석
∙ D 날짜형태변환 C 코드화 T 표준형태변환
- 105 -
t ) 게제(권)집
게제호시작페이지종료페이지게제년월 - YYYY-MM형태 D공동저자명 - 공동저자명이 구분자로 N명이상 존
재연 구실적ResearchProject
시작년월 - YYYY-MM형태 D
종료년월 - YYYY-MM형태 D발주기관참여구분(역할)-코드
A 연구책임자B 참여연구원
C
연구실적명 - 영문제목 일부 존재특허(patent)
출원등록구분
-코드C
출원등록번호출원등록국가
-코드C
특허출원명출원등록일자
- YYYY-MM-DD형태D
항 목 세 부 항 목
기본(BasicInformation)
기본정보 영문성명
휴대전화(국가번호)
개인홈페이지
전문분야 전문(연구)분야
재직기관(organization)
기관명
부서명
24 DB구축 절차 및 작업 지침
241 DB구축 지침
DB구축 내용
수집된 연구자 영문 이력서 입력을 통한 DB 구축
연구자 이력정보 영문 번역을 통한 DB 구축
DB구축 항목
DB구축 대상 항목
- 106 -
직위
우편번호
주소
전화(국가번호)
팩스(국가번호)
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드)
학위취득일
학교명
전공명
경력(Career)
경력사항(CAREER)
시작년월
종료년월
재직기관명
직위
실적ResearchResult
논문실적(paper)
논문명
저널명
게제(권)집
게제호
시작페이지
종료페이지
게제년월
공동저자명
비고
연구실적ResearchProject
시작년월
종료년월
발주기관
참여구분(역할)-코드
연구실적명
특허(patent)
출원등록구분-코드
출원등록번호
출원등록국가-코드
특허출원명
출원등록일자
- 107 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
DB구축
준비
계획 수립
번역대상자분석 번역대상자 데이터 분석 대상자 선정 분석 내역 작성
절차 협의선처리 번역 번역확인전문가검수 본인확인KISTI검수
DB구축 대상 확정
매뉴얼 작성
입력 매뉴얼 구성내용
DB구축 개요 및 절차정의
DB구축 대상정의 및 범위
입력 항목별 기준 및 예시
입력프로그램 사용법
전환 코드표
표준 양식
입력 매뉴얼 검토및 확정
입력 매뉴얼 초안작성
상세일정계획수립
입력 량을 분석하여 투입인력대비 주월별 입력 계획대비 실적 산정
일정 검토 및 확정 일정계획 작성
작업 환경구축
작업 환경 및번역자 구성 입력 환경 구성
번역자 선정
영문이력정보 관리기능 개발
입력 교육 실시
번역자를 대상으로 교육실시 및 교육결과서 작성
입력작업 교육 실시
DB구축진행
선처리번역번역확인전문가검수
선처리번역번역확인전문가검수
DB구축 추진결과번역 및 품질활동수행
추진현황보고 실적 보고실적 확인 및 이슈사항 협의
주별진척보고
이슈사항 및 문제점 보고
DB구축완료
서비스DB이관 검수및 납품
서비스DB이관
완료된 영문이력DB의서비스화 이관 확인 데이터 이관
데이터 검수(최종 확인)
영문이력 DB 검사 (샘플링 검수) 검수(샘플링)
검수 데이터 추출제공
242 DB구축 단계별 작업 지침
243 DB구축 항목별 세부지침(선처리)
공통사항
Ⅰ 공통사항
1 기존에 존재하는 영문명은 입력된 그대로 유지하되 일부 정제 필요
- 108 -
원본데이터 입력데이터 입력요령
H20 A2 H20 A2
- 서식에 의한 특수문자는 텍
스트 형태 그대로 입력함
k- iexcl k - ε
- 수식도구에 의한 특수문자는
특수문자표를 참조하여 호환되
는 경우에만 입력하고 그렇지
않으면 수식만 제외하고 입력
참고3 특수문자표
원본데이터 번역데이터 입력요령
문장의 첫 단어
이름장소 등 고유명사
직함칭호의 축약형
1인칭 주어
도시이름월요일휴일시대 등
단어의 시작글자 대문자 표기
책글노래영화제목 등
a an and at by for in
of로 시작할경우
a an and at by for in of
를 제외한 시작문자 대문자로
표기
장소를 지칭하는 고유명사
internet 등Internet 시작문자 대문자 표기
국가언어등을 지칭하는 단어
(고유명사 일반명사의 개념)시작문자 대문자 표기
교과 과목명 시작문자 소문자로 표기
외국기관명 외국대학명 논문제목 연구제목 등
2 한글영문 이외의 표기된 외국어는 그대로 유지
(단 한글영문을 일부 포함한 외국어는 번역 시행)
3 모든 항목은 좌우의 공백을 제거하고 입력
가 줄바꿈 문자나 좌우의 공백문자를 제거하고 입력
나 데이터 사이에 공백문자가 두 개 이상인 경우에는 공백문자를 한 개로 입력
4 휴대전화 및 전화번호는 대한민국의 경우에는 국가번호를 표시하지 않고 외국의 경우에
만 국가번호(+국가번호)를 표시함
5 특수문자의 입력
6 대소문자 규칙
가 번역의 경우 대소문자 표준 준수
해당 기관홈페이지에 표기되어있는 공식영문명칭의 대소문자에 따라 선처리 및 번역
단 번역 시 단어 시작글자만 대문자료 표기
- 109 -
사이트명 url 비고
NAVER 백과사전 http100navercom 기관명 홈페이지 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr기관명 홈페이지 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 기관명 검색서비스
KIS-Report httpwwwkisreportcom한국신용평가정보 기업보고서
국내일반기업 영문명 기재
KJTRANS httpwwwkjtranscokr학교 및 연구기관 분야별 검
색가능
영문표기kr httpwww영문표기kr 기관학교연구기관 검색가능
학위논문 원문 공동이용협의회 httpthesisorkr협의회 대학기관 목록
(연구 발주기관)
NDSL 연구실적 검색 httpscholarndslkrindexdo연구실적 검색 가능
(연구 발주기관)
Paper Searchnet httpwwwpapersearchnet논문 및 저널명 검색서비스
(연구 발주기관)
기관명
Ⅰ 소속기관사항(기관명) 학력사항(학교명) 경력사항(재직기관명) 연구실적(발주기관
명)
1 선처리 작업 수행 시 고려 사항
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
선처리 작업 시 기관명이 Full name 과 약어 기재를 원칙으로 함
단 약어가 존재하지 않을 경우 기재하지 않음
부서직위명을 포함하고 있을 경우 포함하여 선처리
단 소요시간이 길어질 경우 부서직위명 한글 그대로 입력)
업무명이나 업무설명이 포함된 경우 한글 그대로 입력 (추후 번역시 정제)
웹 검색 시 해당기관 홈페이지에 기재되어있는 영문을 우선순위로 선처리
웹 검색 및 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
2 기관명 웹 검색 url 목록
- 110 -
원문 번역 비고
상호명 ldquo(주)rdquo의 번역
상호명 ldquo(사)rdquo의 번역
상호명 ldquo(유)rdquo의 번역
상호명 ldquo(일)rdquo의 번역
상호명 ldquo(재)rdquo의 번역
Co LTd
Association
INC
Foundation
영국식 주식회사 표기 번역
기관명 약어의 경우
기관명(약어)
기관명
약어로 번역
Full name(약어) 번역
Full name 번역
약어가 존재하지 않을 경우
Full name만으로 번역
원문 번역 비고
((주)한일합섬Hanil Synthetic Fiber Co
Ltd
- 오탈자 정제
웹검색
원문DB의(rarr정제
(system2010)산자부과기부
(system2010)Ministry of
Commerce Industry and
EnergyMinistry of Science
and Technology
- 기관명n 괄호명칭 ()
웹검색
n개의 기관명 모두 선처리
()괄호안의 표기내용 기재
(주)부일건화(주)아해BUIL KEON WHA Co
LtdAhae Co Ltd
- 기관명n
웹검색
n개의 기관명 모두 선처리
(주)비츠로테크 공장장VITZRO TECH Co Ltd
Plant Manager
- 직위명 포함
웹검색
직위명 번역 선처리 기재
(재)전북생물산업진흥원Jeonbuk Bioindustry
Development Institute
-상호명 (재)
웹검색
해당기관 홈페이지 영문명기
검색 가능한 url은 추후 추가 가능
3 번역 시 고려사항
상호명 번역 지침
번역 시 고려사항
4 선처리 예
- 111 -
재
(캐나다) 오타와 대학교 (Canada)University of Ottawa
-괄호()
웹검색
괄호()내용 번역 선처리 기재
강원대학교 의과대학Kangwon National University
College of Medicine
-학과명
웹검색
학과명 번역 선처리 기재
국립 지바대학교(일본) National Chiba University(Japan)
-괄호()
웹검색
국립 번역 선처리 기재
괄호()내용 번역 선처리 기재
미국 Cornell대학교 Section of
Molecular Biology
USA Cornell College Section
of molecular Biology
-한글영문명
웹검색
미국 번역 선처리 기재
영문명 그대로 기재
엔에스(Natural Science Co) 공
동설립
NS(Natural Science Co
Ltd)
-괄호() 업무설명
웹검색
괄호() 영문명 그대로 유지
업무설명 ldquo공동설립rdquo 제거
웅진출판(주) 편집국 생태전집
부 - lsquo한국의 자연탐험rsquo 제작 참
여
Woongin Publications Co Ltd
Editorial ecological Colledted
Works
-부서명 업무설명
웹검색
부서명 번역 선처리 기재
업무설명 ldquolsquo한국의 자연탐험rsquo
제작참여rdquo 제거
11 국제산학연 공동기술개발지
원사업
Korea Association of Industry
Academy and Research
Institute(KAIARI) Business
support for academic-industrial
common technology
development
-괄호()
웹검색
국립 번역 선처리 기재
괄호()내용 번역 선처리 기재
기관명 코드 참조 첨부7 기관명 코드
- 112 -
사이트명 url 비고
NAVER 백과사전 http100navercom 통합 검색 서비스
NAVER 사전 httpendicnavercom 표준 영문직위 검색가능
KJTRANS httpwwwkjtranscokr학교 및 연구기관 분야별 검
색가능
영문표기kr httpwww영문표기kr 직위명 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr통합 검색 서비스
원문 번역 비고
교수 (학부장) Professor(Dean)
-직위명n 괄호() 직위명
웹 검색 및 직위표 코드참조
모두 번역 및 선처리
교학부장 겸 학과장 Dean Chair
-직위명n
웹 검색 및 직위표 코드참조
모두 번역 및 선처리
사원(전장설계부)Employee(Department of Wiring
Harness Design)
-직위명 부서명포함
웹 검색 및 직위표 코드참조
부서명 포함 번역 및 선처리
선임연구원(고주파제어시스템)Senior Researcher(High-Frequency
Wave)
-직위명 업무명
웹 검색 및 직위표 코드 참조
직위명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
직위가 n개의 경우 n개로 선처리
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당기관 홈페이지에 기재되어있는 직위 영문을 우선순위로 선처리
웹 검색 불가시 영문 직위명을 참조하여 번역
번역 작업 시 영문 직위명은 표준 영문 직위 표기에 따라 번역
웹 검색 및 영문직위표 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
2 직위명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
3 영문직위 번역 코드 참조
4 선처리 예
- 113 -
사이트명 url 비고
NAVER 백과사전 http100navercom 통합 검색 서비스
KJTRANS httpwwwkjtranscokr학교 및 전공명 검색가능
(자료실영어표현 강좌실)
영문표기kr httpwww영문표기kr 전공명 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr통합 검색 서비스
NAVER 사전 httpendicnavercom 표준 영문직위 검색가능
원문 번역 비고
전기전자전자통신공학Electrical Electronics Communications
Engineering
-전공명n
웹검색 및 코드표 참조
전공명n개 n갯수만큼 선처리
하수도 Sewerage-전공명
웹검색 및 코드표 참조
업무명 번역 및 선처리
연 구 원 ( R E S E A R C H
ASSORIATE)Research Associate
-직위명 영문명 포함 정제
웹 검색 및 직위표 코드참조
정제 AssocraterarrAssociate
괄호() 제거(동일한 영문명
전공명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
전공이 n개의 경우 n개로 선처리
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당학교 홈페이지에 기재되어있는 전공 영문을 우선순위로 선처리
웹 검색 및 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
ldquoOO학과rdquo 항목의 경우 동일한 ldquoOO학rdquo으로 선처리 번역으로 입력
동일한 한글명에 대한 학문 분야별 영문표기명이 다를 경우 표준명칭으로 선처리
2 전공명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
3 선처리 예
- 114 -
사이트명 url 비고
NDSL 논문실적 검색 httpscholarndslkrindexdo 논문검색시 저널명 발췌
과학기술학회마을httpsocietykistirekrmainht
ml학술지검색 메뉴 검색
KJTRANS httpwwwkjtranscokr 자료실
DBpiahttpwwwdbpiacokrpublicati
onview_resultasp저널명 및 논문 검색가능
구글httpwwwgooglecokr
httpscholargooglecokr저널명 및 논문 검색가능
국회도서관httpsu-libnanetgokrdlSear
chIndexphp논문 및 저널명 검색가능
휴리스틱알고리듬 Heuristuc Algorithm
-원문 정제
웹검색 및 코드표 참조
정제 ldquo알고리듬rdquorarrlsquo알고리즘ldquo
면역학(면역학) Immunology
-전공명n 괄호()명
웹검색 및 코드표 참조
괄호()명 제거(동일한용어)
19C영미시19C British and American
Poetry
-숫자영문명
웹검색 및 코드표 참조
19Crarr그대로 유지(19세기 표
현방식)
저널명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당 논문게재지 홈페이지의 영문 표기로 선처리
동일한 논문명으로 여러개의 저널명이 검색될 경우 게재권(게재호) 게재페이지 게재년
월 등을 확인후 선처리
웹 검색 시 영문명이 존재하지 않을 경우 번역
2 저널명 웹 검색 url 목록
- 115 -
NAVER 전문정보httpacademicnavercommain
nhn논문 및 저널명 검색서비스
Paper Searchnet httpwwwpapersearchnet 논문 및 저널명 검색서비스
SpringerLinkhttpwwwspringerlinkcomho
memainmpx논문 및 저널명 검색서비스
원문 번역 비고
Proc 대한조선학회 추계연구발
표회
Proc International Journal of
Naval Architecture and Ocean
Engineering(JNAOE) Fall
Conference
-원문 영문 포함 일부번역
웹검색
영문명 유지
일부번역 ldquo추계연구발표회rdquo
대한건축학회논문집제20권Journal of the Architectural
Institute of Korea
-부서명 업무설명
웹검색
부서명 번역 선처리 기재
업무설명 ldquolsquo한국의 자연탐험rsquo
제작참여rdquo 제거
대한두개안면성형외과학회Korean Cleft Palate-Craniofacial
Association
-공식 영문저널명 특수문자
웹검색
저널홈페이지에 기재된 특수
문자 포함 선처리
대한두개안면성형외과학회지
Journal of the Korean Cleft
Palate-Craniofacial Association(J
Korean Cleft Palate-Craniofac
Assoc)
-약어 저널명
웹검색
저널홈페이지에 기재된약어
선처리
대한토목학회 학술발표회 논문
집 CD-ROM
Proceedings of the Korean Society of
Civil Engineers(KSCE) Conference
Technical Journal CD-ROM
-약어 원문영문
웹검색
약어기재 영문명그대로 유지
표준
지침
Proceedings of
Journal of The 회차 Journal Name Conference 계절 년도(날짜) 개최지
예)Proceedings of
Journal of The 7th Journal Name Conference Fall 2009 09 12 Tokyo Japan
저널명
없음저널명이 없을 경우 원문 순서 그대로 번역
검색 가능한 url은 추후 추가 가능
3 선처리 예
4 저널명 번역시 표준 지침
5 저널명 번역시 유의 사항
- 116 -
원본데이터 번역데이터 입력요령
학술발표학술발표회
학술연구발표학술연구발표회
번역
Journal Name Conference 저널명 뒤에 기재
논문집요약집초록집논문
초록집 번역Proceedings of Journal Name 저널명 앞에 기재
OO학OO학회OO학회지 Journal of Journal name 저널명 앞에 기재
회차 계절 날짜 개최지OOth Journal Name Spring
2010 Seoul Korea
회차 저널명 앞에 기재
계절날짜개최지 저널명 다음
구신 저널명 선처리번역 웹으로 검색된 저널명을 기준 존재하지 않을 경우 신 저널명
6 저널명 대소문자 표기 지침
middot 단어의 첫글자 대문자 표기
244 DB구축 항목별 세부지침(번역)
기본정보
Ⅰ 영문성명
1 영문성명의 입력포맷 홍길동 =gt GilDong Hong
원본데이터 입력데이터 입력요령
HONGGILDONG
Gil-Dong Hong
Hong Gil-Dong
GilDong Hong - 영문성명 입력표준으로 변경
2 영문성명 번역시 고려사항
기존에 존재하는 영문명은 유지
논문실적의 영문명이 존재할 경우 영문명 입력
- 단 논문실적 항목의 공동저자명에 약어 축약어의 경우 영문성명은 Full name기재
번역시 로마자 표기법에 준수하여 번역
참고 로마자 표기법
- 117 -
원본데이터 입력데이터 입력요령
017)- 017-- - ldquo-rdquo구분자로 변경
+82-10-2497- 010-2497-
- 대한민국은 국가번호 제외하
고 입력
- 휴대폰구분번호 앞에 ldquo0rdquo표
시
1-11-- +1-11--- 외국의 휴대전화는 +국가번
호 붙여서 입력
011-123 입력하지 않음- 휴대전화번호가 완전하지 않
은 형태는 입력하지 않음
Ⅱ 휴대전화
1 휴대전화의 입력포맷
대한민국 휴대폰구분번호-국번-전화번호 (대한민국은 국가번호 제외하고 입력)
외국 +국가번호-휴대폰구분번호-국번-전화번호
Ⅲ E-mail
1 E-mail의 입력포맷 abctestcom
Ⅳ 개인홈페이지
1 개인홈페이지의 입력포맷 wwwhomepageurlcom (http 제외하고 입력)
2 한글 도메인의 경우 영문 도메인을 찾아 입력
Ⅴ 전문(연구)분야
1 전문(연구)분야의 코드 입력은 이력서 본인에 의해 과학기술표준분류별 전문분야를 선택
하도록 함
재직기관
Ⅰ 기관명(선처리 작업)
- 118 -
부서명 표현 항목 표현여부
Department of경력사항부서명 기재
전공명(학력사항) 삭제
College of경력사항부서명 기재
전공명(학력사항) 삭제
Ⅱ 부서명
1 번역 수행
번역 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
번역 작업 해당 기관홈페이지의 영문명을 우선순위로 번역
공식화된 영문명이 존재하지 않을 경우 부서명 참조
참조 부서명 코드
기관홈페이지 및 공식화된 영문명이 존재하지 않을 경우 번역수행
부서 영문명은 Department of 등으로 시작하며 약어 및 축약어 기재는 불가하며 모두
Full name 번역을 원칙으로 번역수행
Ⅲ 직위(선처리 작업)
Ⅳ 우편번호 주소
1 영문 우편번호DB 참조
2 주소의 기본주소와 상세주소를 합침
3 우편번호 및 영문 번역주소 검색
httpwwwkoreapostgokrservletkpppostPostInfo (우정사업본부)
4 검색된 번역 영문 주소 입력(단 기관명과 영문주소와 동일하지 않을 경우 기관명을기준)
5 존재하지 않는 상세주소의 경우 로마자 표기법에 준수하여 번역
참고 로마자 표기법
6 우편번호 입력시 웹검색과 원본이 다른 경우 원본그대로 우편번호 유지
(영문주소는 웹검색 그대로 번역 및 입력)
Ⅴ 전화 팩스
1 전화의 입력포맷
대한민국 지역번호-국번-전화번호(내선번호) lt= 대한민국은 국가번호 제외하고 입력
- 119 -
원본데이터 입력데이터 입력요령
042)- 042-- - ldquo-rdquo구분자로 변경
+82-31-2497- 031-2497-
- 대한민국은 국가번호 제외하
고 입력
- 지역번호 앞에 ldquo0rdquo 표시
1-11-- +1-11--- 외국의 전화번호는 +국가번
호 붙여서 입력
061-123 입력하지 않음- 전화번호가 완전하지 않은
형태는 입력하지 않음
02-123-1234(12) 02-123-1234(12) - 내선번호는 그대로 입력
외국 +국가번호-지역번호-국번-전화번호(내선번호)
학력사항
Ⅰ 학위취득일
1 학위취득일 입력포맷
ldquoYYYY-MM-DDrdquo 형태
Ⅱ 학교명(선처리 작업)
Ⅲ 전공명(선처리 작업)
경력사항
Ⅰ 시작년월 종료년월
1 시작년월 종료년월 입력포맷
ldquoYYYY-MMrdquo 형태
시작년월은 종료년월보다 작거나 같아야 함
- 120 -
사이트명 url 비고
NDSL 논문실적 검색 httpscholarndslkrindexdo 논문검색시 저널명 발췌
과학기술학회마을httpsocietykistirekrmainht
ml학술지검색 메뉴 검색
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr저널명 및 논문 검색가능
Ⅱ 재직기관명 직위(선처리 작업)
Ⅲ 직위(선처리 작업)
논문실적
Ⅰ 논문실적 형태
보통 논문제목 저널명 게재권 (게재호) 게재페이지 게재년월 공동저자명으로 작성
volume (Vol) ( 정기 간행물 1년분의 ) 권
issue(ISS)또는 No또는 (숫자) 게제호 예) Vol9 ISS 4 또는 v9 no4 또는 9(4)- 9
권 4호
Ⅱ 공동저자명
웹 검색을 통한 원문 출처의 번역 방식에 따라 입력
저자명과 저자명은 ldquo rdquo으로 구분자(마지막 입력 후 ldquo rdquo 입력)
번역 시 Full name으로 입력하며 로마자 표기법을 준수함
Ⅲ 논문명
1 번역 작업 수행
번역 작업 시 기존 논문 영문명은 그대로 유지하되 일부 정제 필요
웹 검색 시 해당 논문게재지 홈페이지의 영문 표기로 선처리
동일한 논문명으로 여러개의 저널명이 검색될 경우 게재권(게재호) 게재페이지 게재년
월 등을 확인 후 선처리
웹 검색 시 영문명이 존재하지 않을 경우 번역
2 논문명 웹 검색 url 목록
- 121 -
국회도서관httpsu-libnanetgokrdlSear
chIndexphp논문 및 저널명 검색가능
NAVER 전문정보httpacademicnavercommain
nhn논문 및 저널명 검색서비스
Paper Searchnet httpwwwpapersearchnet 논문 및 저널명 검색서비스
DBpiahttpwwwdbpiacokrpublicati
onview_resultasp저널명 및 논문 검색가능
SpringerLinkhttpwwwspringerlinkcomho
memainmpx논문 및 저널명 검색가능
검색 가능한 url은 추후 추가 가능
Ⅳ 저널명(선처리 작업)
연구실적
Ⅰ 시작년월 종료년월
1 시작년월 종료년월 입력포맷
ldquoYYYY-MMrdquo 형태
시작년월은 종료년월보다 작거나 같아야 함
Ⅱ 발주기관(선처리 작업)
Ⅲ 참여구분
1 참여구분 입력지침
연구책임자 참여연구원 중에서 선택하여 입력함(구분 불가능시 선택 안함)
Ⅳ 연구실적명
1 번역 작업수행
번역 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
번역 작업 시 웹검색을 통하여 정확한 연구실적명을 검색
웹 검색 시 공식화되어있는 영문을 우선순위로 번역
웹 검색 및 공식적으로 사용하는 연구실적명이 존재하지 않을 경우 번역
- 122 -
사이트명 url 비고
한국특허정보원httpwwwkiprisorkrkormai
nmainjsp국내특허실적 분야별 검색
구글 특허정보 검색서비스 httpwwwgooglecompatents해외 특허정보 검색서비스
(7백만개 이상 검색가능)
PCT 특허정보 검색서비스 httpwwwwipointpctdben PCT 특허 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 특허정보 검색서비스
사이트명 url 비고
NDSL 연구실적 검색 httpreportndslkrindexdo 연구실적 검색 가능
KJTRANS httpwwwkjtranscokr학교 및 연구기관 검색가능
(자료실영어표현 강좌실)
구글 httpwwwgooglecokr
NAVER 전문정보httpacademicnavercommain
nhn네이버 연구실적명 검색
Paper Searchnet httpwwwpapersearchnet 연구실적명 검색서비스
2 연구실적명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
특허실적
Ⅰ 출원등록구분
출원 등록 중에서 선택함
같은 특허에 대해 출원과 등록 모두 존재하면 등록정보만 입력함
출원 등록이 미구분시에는 선택하지 않음
Ⅱ 출원등록번호
특허 출원등록번호 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
Ⅲ 출원등록국가
- 123 -
사이트명 url 비고
한국특허정보원httpwwwkiprisorkrkormai
nmainjsp국내특허실적 분야별 검색
구글 특허정보 검색서비스 httpwwwgooglecompatents해외 특허정보 검색서비스
(7백만개 이상 검색가능)
PCT 특허정보 검색서비스 httpwwwwipointpctdben PCT 특허 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 특허정보 검색서비스
1 출원등록국가 입력지침
출원등록국가 코드를 찾아 입력
Ⅳ 특허출원명
1 특허출원명 번역지침
특허출원명 입력시 웹 검색을 우선으로 시행
웹 검색 후 영문명이 존재할 경우 그대로 입력
영문명이 존재하지 않을 경우 번역 시행
2 특허출원명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
Ⅴ 출원등록일자
1 출원등록일자 입력포맷
ldquoYYYY-MM-DDrdquo 형태
25 DB구축 검수
251 DB구축 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
- 자체적인 품질활동 점검표 작성등의 수행결과를 주기적으로 측정하여 품질목표를 달성
하도록 함
- 124 -
항 목 세 부 항 목 항목수 단위별가중치()
기본(BasicInformation)
기본정보 영문성명 5 15휴대전화(국가번호)E-mail개인홈페이지
전문(연구)분야-본인입력검색키워드
재직기관(organization)
기관명 7 20부서명직위우편번호
주소전화(국가번호)
검수 기준
- 에러율 전체 데이터(전체 항목 필드 기준)의 01 이하(품질목표 999)
- 에러 체크 방식 전체 데이터에서 본인확인 미완료 대상 중 무작위로 30 샘플링 하
여 검수
- lsquo10년도 10월 DB구축완료단계에 최종 검수 실시
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침
및 매뉴얼에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며
오류율 산정에서 제외함
검수방식 및 기준
- 수집된 영문이력서 원본 파일(hwp doc pdf 등)과 입력 완료된 영문이력DB를 육안검
사 함
- 오류 판단 기준은 KISTI가 작성한 DB구축 작업 지침서를 참조함
252 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 125 -
팩스(국가번호)
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) 4 15학위취득일학교명전공명
경력(Career)
경력사항(CAREER)
시작년월 4 15종료년월
재직기관명직위
실적ResearchResult
논문실적(paper)
논문명 9 15저널명게제(권)집게제호
시작페이지종료페이지게제년월공동저자명비고
연구실적ResearchProject
시작년월 5 10
종료년월발주기관참여구분(역할)-코드연구실적명
특허(patent)
출원등록구분-코드 5 10
출원등록번호
출원등록국가-코드
특허출원명출원등록일자
계 38 100
항 목 세부항목 검수대상
데이터수
오류데이터건
수
품질지표별
기준점수의 합
항목가중치
()
오류율산정
기본(BasicInformation)
기본정보(5개)
영문성명 30 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
단위별 가중치는 KISTI와 협의하여 결정함
항목별 오류율 산정 기준 정의
- 126 -
휴대전화(국가번호)
30
E-mail 30개인홈페이지
30
검색키워드
30
소계 150재직기관(o r gan ization)(7개)
기관명 40부서명 30
직위 30우편번호 10주소 30전화 (국가번호)
30
팩스(국가번호)
30
소계 200
학력(Academiccarrer)
최종학위(FinalDegree)(4개)
학위 (코드)
10
학위취득일
15
학교명 80전공명 45소계 150
경력(Career)
경력사항( C AREER)(4개)
시작년월 15
종료년월 15재직기관명
80
직위 40소계 150
실적ResearchResult
논문실적(paper)(9개)
논문명 40저널명 20
게제(권)집
20
게제호 20시작페이지
10
종료페이지
10
게제년월 10공동저자명
10
비고 10소계 150
연구실적(Researc
시작년월 15종료년월 15발주기관 20
- 127 -
hProject)(5개)
참여구분(역할 ) -코드
10
연구실적명
40
소계 100특허(patent)(5개)
출원등록구 분 - 코
드
10
출원 등록번호
20
출원등록국 가 - 코
드
35
특허 출원명
20
출원 등록일자
15
소계 100계 100
- 128 -
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형구분
오류요형별점수 비고
완전성
누락 - 코드 누락 02
품질지표기준점수산정(데이터1건기준)=오류
유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 01
유효성형식 - 패턴의 오류 02
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 02
계 6개 오류유형 1
기본정보
영문성명 휴대전화 E-mail 개인홈페이지 계
Hong Gil Dong
(형식 02)010-111- testcom
GilDong Hong+82-011-111-
(형식 02)
testcokr
(오기 02)
testcom
(오기 02)
(누락 02) 019-111_ testcokr testcokr
품질지표별
기준점수의 합04 02 02 02 1
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
국가RampD참여인력
영문이력DB
3000건 3000건 3000건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
검사물량 집계표 예시
검수데이터 예시
- 129 -
3 평가위원 데이터 최신성 유지 매뉴얼
31 최신성 유지 업무 개요
311 개요
평가위원 데이터 최신성 유지란 lsquo기 구축된 평가위원 DB 내의 각 데이터들이 가장 마지막
으로 업데이트된 시점을 기준으로 그 시점부터 현재까지의 기간 동안 누락된 대상 인력들
의 변경사항들을 해당데이터에 추가입력 및 수정해주는 것rsquo을 의미
또한 대상 인력의 변경사항 반영이외에도 기 입력된 데이터들의 내용을 검토하고 발견된
오류 및 누락정보에 대한 수정ㆍ보완 작업 역시 평가위원 데이터 최신성 유지의 일환
최신성 유지를 위해 먼저 대상 인력에 대한 정보 수집이 요구됨
- 130 -
312 최신성 유지 업무 절차
최신성 유지 업무 절차는 관리자와 담당자의 역할로 구분가능
관리자는 담당자의 업무할당 데이터 검수 업무보고 등을 수행하며 담당자는 할당된 대
상인력에 대한 데이터 수정 및 보완 작업 수행
최신성 유지 업무 절차를 순서별로 나열하면 다음과 같음
- 관리자는 대상인력에 대한 전체리스트를 작성하고 이를 각 담당자들에게 일정량씩 할당
- 담당자는 할당된 대상인력에 대한 정보를 수집하고 기 입력된 데이터와의 비교를 통해
변경사항에 대한 수정 및 추가입력
- 담당자는 대상인력에 대한 정보를 수집한 출처 및 기타 비고사항에 대한 의견 등을 작
성하여 할당량에 대한 작업 완료시 관리자에게 보고
- 관리자는 보고된 작업결과물을 취합하여 정리하고 대상인력에 대한 정보가 잘 수집되고
입력되었는지 검토하여 수정 및 보완
- 관리자는 일일별 완료된 작업 결과 및 비고사항을 작성된 양식에 따라 담당 책임자에게 보고
- 131 -
32 대상 인력(평가위원) 정보 수집 방법
대상 인력의 정보를 수집하기 위한 방법은 크게 3가지로 구분
- 대상 인력에게 이력파일 요청
- 웹검색(기관홈페이지 개인홈페이지 및 각종 포털사이트)
- 신문기사의 인사ㆍ동정 모니터링
321 대상 인력에게 이력파일 요청
E-Mail 등을 통해 대상 인력에게 본인의 데이터에 대한 직접 업데이트 또는 입력대행을
위한 이력파일의 전송 요청
정보의 수신 방법은 E-Mail 우편 등이며 가장 신뢰성 높은 정보
입력이 완료된 이력파일은 개인정보보호를 위해 별도로 보관되며 E-Mail 및 기타 인쇄
물 이외의 형태로 수신되었을 경우 반드시 출력하여 관리
입력 완료시 해당인력에게 연락하여 결과에 대한 확인 요청
322 웹검색(홈페이지 및 각종 포털사이트)
대상 인력의 가장 최신의 연락정보(전화번호 E-Mail FAX 등) 재직정보 등을 수집하기
위해 웹상에 공개되어 있는 정보를 수집하여 데이터에 반영
대상 인력의 데이터 내 소속기관사항 및 기본정보의 홈페이지 주소 등을 통하여 해당 기
관 홈페이지 및 개인 홈페이지에 접근하여 연락정보 경력정보 실적정보 등에 관한 정보
수집
이직(移職) 등으로 대상 인력의 현재 소재지 재직기관 등에 관한 정보가 누락되어 있을
시 각종 포털사이트를 활용하여 해당인력의 소재정보 수집 및 접근
인물정보제공사이트를 통해 대상 인력의 기본정보 경력정보 실적정보에 대한 수정ㆍ보
완
323 신문기사의 인사ㆍ동정 모니터링
대부분의 신문에서 주요 인물에 대한 인사ㆍ동정에 관한 정보를 매일 싣고 있음
주기적으로 인사ㆍ동정란의 모니터링을 통해 평가위원 데이터에 변경사항 반영
- 132 -
33 최신성 유지 업무 작업 지침
331 언론을 통해 발표 되는 인사동정 수정
평가위원만 해당
교육과학기술부
- 참여인력을 포함하여 인사동정 수정
- 직급은 장관 차관 국장 팀장 사무관 서기관 까지 수정
- 특히 교육과학기술부장관 제2차관 정책보좌관 국장은 꼼꼼하고 세심하게 수정할 것
332 현행화 작업 내용
수정은 기본정보 소속기관 학력사항 초중고학력 경력사항 소속학협회 논문 실적 연구
실적 저역서실적 훈포장사항 지식재산권 주요업적사항 자격사항 사진관리 등 전 항
목에 걸쳐 작업 함
해당 인물의 개인 홈페이지를 최우선으로 보고 그 다음으로 기관 홈페이지를 참고
해당 기관 홈페이지에서 정확히 알 수 없을 경우에는 코셉 조인스 로마켓 동아일보를
참고 할 것
경력사항은 경력의 년도와 날짜가 없더라도 신규 입력 함
기본정보
e-mail에서 (dot)가 아닌 (comma) 로 표기된 경우 변경
e-mail 주소가 2개일 때는 개인홈페이지에 적힌 메일주소가 우선 판단이 안 될 경우는
소속기관에서부여된 e-mail 주소로 기입
인적사항의 홈페이지정보에서 lsquohttprsquo 는 빼고 입력
소속기관
산학협력단
- 소속기관에서 제외(삭제)하고 경력사항에만 기입
- 산학협력단이 주소로 되어있는 기업은 소속기관에 그대로 두거나 기입해 줌
평가위원이 의과대학의 교수이자 병원의 교수(의사)인 경우는 소속기관을 의과 대학
의 교수로 기입하고 병원 근무사항은 경력사항에 기입
(ex 관동대학교 의과대학 정형외과학교실 교수 소속기관
관동대학교 명지병원 정형외과 전문의 경력사항)
소속기관이 대학과 병원 모두 입력되어 있는 경우 수정하지 않고 pass
소속기관은 의과대학이나 주소가 병원일 경우 수정하지 않고 pass
평가위원의 재직기관 홈페이지에서 해당 인물이 검색 되지 않을 경우
- 학교의 교수 명예교수 등은 pass
- 회사의 대표이사 회장 등은 직급은 공란으로 바꾸고 재직중으로 변경
( 대표이사 인사말 회장 인사말 등의 인물 이름이 다를 경우를 뜻함)
- 133 -
평가위원이 학sdot협회에 재직중인 경우
- 소속기관이 하나이고 학sdot협회라면 소속기관에 그대로 둠
- 소속기관이 2개 이상이고 그 중 한 곳이 학sdot협회일 때
학sdot협회를 제외한 소속기관에서 인물이 검색 되는 경우 학sdot협회 내역으로 옮김
학sdot협회를 제외한 소속기관에서 인물이 검색 되지 않고 학sdot협회에서만 검색 되는 경
우 학sdot협회를 제외한 소속기관 내역은 경력사항으로 옮김
학sdot협회를 제외한 소속기관과 학sdot협회 모두 인물이 검색 되지 않는 경우 수정하지
않고 pass
기타
- 직장주소에 집주소가 되어있으면 변경하고 집주소란에 직장주소가 되어있으면 그냥 둠
- 겸임교수직은 경력사항에 입력
소속기관에 기입된 경우 경력사항으로 이동
소속기관이 한 개이고 겸임교수일 경우 pass
- 인물의 직급이 모두 시간강사인 경우 담당자에게 인물key 전송
- 퇴직한 교수로 그 이후의 소속기관이 없는 사람은 재직여부를 lsquo퇴직rsquo으로 변경 후 저장
- 전화번호가 2개인 경우 (comma)로 구분
- 교수의 경우 학과부서 탭엔 단과대 아래의 레벨 모두 기입
(ex 생명과학부 생명공학전공 or 의학과 내과학교실)
학력사항
박사후과정(Post-Doc)은 생략 단 경력사항의 Post-Doc은 기입
논문실적
2006~2010년도 논문sdot연구실적만 입력
현재 HuRIMs에 저장된 가장 최근 년도부터 템플릿에 작업
(ex 개인홈페이지에는 2000년~2009년까지 논문사항이 입력되어있고 HuRIMs에는 2007
년 2월까지만 입력되어 있다면 2007년의 논문은 중복체크를 한 후 입력되지 않은 논문
들과 2008 2009년도 논문을 템플릿에 넣는다)
기타논문집은 학술논문으로 판단되는 것들만 기입
- 판단기준 대학 연구소 학회에서 발행한 논문들
동일한 제목으로 다른 발행처에 중복 기재된 경우
- 발행처 두 곳이 모두 학회일 때 중복하여 기입
- 발행처 두 곳이 학회amp연구소 학회amp대학 일 때 학회의 논문실적만 기입
출판중인 논문은 기재하지 않음
학회sdot협회sdot대학 등에서 발간된 저서 중 일부만 담당한 경우
- 일부 chap theme 만 담당했더라도 저역서실적에 기입
- 일부 작성한 부분의 제목이 논문의 형태를 띄고 있을 때(~에 관한 연구 고찰 등)는 논문
실적에 기입
- 134 -
훈포장사항
세계인명사전등재 내용 기입
감사장 감사패는 기입하지 않음
경력업적학협회 유형 정리
향우회 민방위 동창회 성직자협의회 등은 제외함
lsquoooo위원회rsquo가 들어가는 내용은 직급에 상관없이 업적사항으로 기입 단 기초기술 연구
회와 산업기술연구회는 정부조직이므로 경력사항에 기입
(ex 기록관리혁신전문위원회 회장 정보통신위원회 고문 rarr 업적)
위원회를 제외한 lsquo회rsquo는 직급에 상관없이 학sdot협회 활동사항으로 기입
(ex 한국원예치료협회 상임이사 한국화훼장식학회 편집위원 한국양액재배연구회 이사
한국화훼환경디자인교수연합회 이사 전국대학정보화협의회 이사 rarr 학sdot협회)
활동내역 중 자문 심의는 업적사항에 기입 단 협회 학회 연구회 등의 자문sdot심의는
학sdot협회 활동사항에 기입
활동내역 중 기업sdot학교의 고문은 경력사항에 기입
34 최신성 업무 대상
341 대상 및 범위
평가위원후보추천서비스에서 서비스 중인 평가위원 전체
평가위원 기본정보 경력정보 갱신 및 실적정보 추가입력 및 갱신
추가 입력 및 갱신을 위한 기초자료는 웹사이트에 공개된 정보 신문의 인물 동정기사
평가위원 본인이 제공하는 이력정보 임
342 검수 기준
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
- 최신성 유지 관리를 수행한 전체 데이터 중 3를 샘플링하여 출처별 내용이 최신성 유
지 관리 매뉴얼 기준으로 추가 입력 및 갱신되었는지 여부를 확인
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 135 -
구분 항목 세부항목 항목수단위별
가중치()
참여
인력
정보
기본정보
주민등록번호 성명 자택주소 자택
우편번호 자택전화번호 핸드폰번호
7 31
소속기관사항
소속기관명 부서명 직위명 사무실
전화번호 기관주소 최초임용일 인
력(직업)구분
7 185
학력사항
전공 취득대학 학위 입학일 졸업
일 학과 취득국가 지도교수명 학위
논문명 학위취득일
10 21
경력사항 근무처명 직위명 근무기간 3 45
자격사항 자격발행처 자격증명 자격취득일 3 25
논문실적
논문발표일 국문논문명 영문논문명
저자역할구분 발행처 학술지구분
학술지명 SCI여부
8 105
지식재산권 지식재산권명 출원_등록번호 특허구분 3 25
계 소계 41 905
평가
위원
소속학협회현황 담당업무 직위 학협회사항 3 3
훈포장사항 수상년월 수여기관명 훈포장명 3 25
저역서실적국문저서명 영문저서명 발행년 발
행처 저역서구분5 4
소계 11 95
계 52 100
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
343 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 136 -
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
150 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
성명 100자택주소 10자택우편번
호
20
자택전화번
호
10
핸드폰번호 10E-mail 10소계 310
소속기
관사항
(7개)
소속기관명 100
부서명 05
직위명 20
사무실전화
번호
10
기관주소 30
인력(직업)구
분
10
최초임용일 10
소계 185
학력사
항
(10개)
전공 20
취득대학 100
학위 20
입학일 10
졸업일 10
학과 15
취득국가 15
지도교수명 05
학위논문명 05
학위취득일 10
소계 210
항목별 오류율 산정 기준 정의
- 137 -
경력사
항
(3개)
근무처명 20
직위명 15
근무기간 10
소계 45
자격사
항
(3개)
자격발행처 05
자격증명 10
자격취득일 10
소계 25
논문실
적
(8개)
논문발표일 10논문명1 10
논문명2 05저자역할구
분
05
발행처 05학술지구분 05학술지명 10
SCI여부 05
소계 105
지식재
산권
(3개)
지식재산권
명
10
출원_등록번
호
05
특허구분 10소계 25
평가 소속학
협회현
황
(3개)
담당업무 05
위원 직위 05(11개) 학협회사항 20
소계 30
훈포장
사항
(3개)
수상년월 10
수여기관명 05
훈포장명 10
소계 25
저역서
실적
(5개)
저역서명1 10
저역서명2 05
발행년 10
발행처 05
저역서구분 10
소계 40
계 1000
- 138 -
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 및
출처 비교 오류03
품질지표기준점수산정(데이터1
건기준)=오류유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 맵핑 오류 005
계 6개 오류유형 1
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
3000 3 055 150 000825
성명 10 2 035 100 000350자택주소 3 0 000 10 000000
자택우편번
호
3 2 035 20 000233
자택전화번
호
4 0 000 10 000000
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
평가위원 Pool DB 23000건 23000건 690건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
출처 비교는 작업대상별 출처 리스트 참조
검사물량 집계표 예시
오류율산정표 예시
- 139 -
핸드폰번호 6 0 000 10 000000
E-mail 9 0 000 10 000000소계 45 7 125 310 001408
소속기
관사항
(7개)
소속기관명 1000 20 100 000000부서명 80000 200 05 000000직위명 80000 200 20 000000사무실전화
번호
80000 200 10 000000
기관주소 80000 200 30 000000인력(직업)구
분
80000 200 10 000000
최초임용일 80000 200 10 000000소계 481000 1220 000 185 000000
계 1000 01
주민등록번호 한글성명 영문성명 한문성명자택우편번
호
630421-0000000 백중환Joong hwan
Baek
412220
(형식 015)
630421-0000000 백종석Baek Jong
Seok
6304210000000
(형식 015)백인열 Baek IN Youl 白寅烈 711-822
630421-0000000 백승호
(오기 02)백제훈
630421-0000000 백종완
630421-
(오기 02)백장선 Jangsun Baek
白壯선
(형식 015)
502-
(오기 02)
630421-0000000 백승호1213132
(오기 02)
630421-0000000 백석형
630421-0000000 백석형
품질지표별
기준점수의
합
055 035 035
검수데이터 예시
- 140 -
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 및
출처 비교 오류03
품질지표기준점수산정(데이
터1건기준)=오류유형별점수
의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 맵핑 오류 005
계 6개 오류유형 1
데이터별 품질지표 기준 점수
35 입력 항목별 QampA (처리 방법 및 사례)
기본정보
- 정보공개여부
구 분 내 용
상황 및 질문ㆍ데이터 신규입력 시 정보공개여부 설정(공개 기본인적사항만 공
개 비공개)을 어떻게 해야 하는지
처리 방법
및 사례
- 대상인력의 입력대행요청에 의한 정보입력 시 정보공개여부는 해당인
력이 요청한 대로 설정
- 최신성 유지팀 자체 내에서 수집한 정보를 바탕으로 대상인력 데
이터를 신규생성 할 경우에는 lsquo기본인적사항만 공개rsquo로 설정
- 과학기술표준분류
구 분 내 용
상황 및 질문ㆍ데이터 입력 시 과학기술표준분류에 대한 처리는 어떻게 해야 하
는지
처리 방법
및 사례
- 과학기술표준분류는 정보관리자가 임의로 선택하거나 수정하지 않
음
- 141 -
소속기관사항
- 재직여부
번호 구 분 내 용
1
상황 및 질문
ㆍ대상인력이 이직(移職)하여 재직기관이 변경된 경우 전 재직기
관 정보의 재직여부를 퇴직으로 변경하고 현 재직기관 정보를
추가입력해야 하는지
처리 방법
및 사례
- 대상인력의 재직기관이 변경되었을 경우 전 재직기관 항목은 삭제
후 경력사항에 반영함
- 현 재직기관 정보 신규입력 후 이를 경력사항에 반영
2
상황 및 질문ㆍOO연구원에 재직중인 홍길동씨가 현재 과학기술부에서 파견근
무 중일 경우 이를 어떻게 처리해야 하는지
처리 방법
및 사례
- 먼저 원 소속인 OO연구원 소속기관사항의 재직여부에 lsquo재직중rsquo
에서 lsquo파견중rsquo으로 변경
- 또한 소속기관사항 항목을 추가시켜 파견기관인 lsquo과학기술부rsquo 직위
등의 정보 입력 후 재직여부를 lsquo재직중rsquo으로 선택
3
상황 및 질문ㆍ대상인력이 정년 등의 이유로 퇴직한 상태인 경우 소속기관사
항을 삭제해야 하는지
처리 방법
및 사례
- 대상인력이 퇴직한 상태이고 현재 다른 직업이 없는 경우 소속
기관사항은 삭제 시키지 않고 재직여부를 lsquo퇴직rsquo으로 변경
- 경력사항 항목에 퇴직일자 포함된 정보 추가
- 142 -
학력사항
- 전공명
구 분 내 용
상황 및 질문ㆍ대상인력의 학력정보를 수집하였으나 학과명만 표기 있는 경우 전
공명은 공란으로 두는지
처리 방법
및 사례
- 대상인력의 학과정보만 발견된 경우 일반적으로 전공명은 우선 학
과명과 동일하게 입력
ex) 학과명 경영학과 rarr 전공명 경영학
경력사항주요업적사항
- 경력사항주요업적사항 일반
구 분 내 용
상황 및 질문 ㆍ경력사항과 주요업적사항은 어떤 기준으로 구분하는지
처리 방법
및 사례
- 일반적으로 웹상 및 타기관 인력정보데이터를 통해 수집된 정보에
는 경력사항과 주요업적사항을 따로 구분하지 않은 경우가 대다수
- 본 시스템에서는 경력사항과 주요업적사항을 구분하여 입력
- 경력사항은 대상인력의 직업과 관련된 사항으로 구분
- 주요업적사항은 대상인력의 직업 이외의 대외적인 활동 즉 평가
자문위원 등 각종 위원활동 설계 시공 기술지도 등의 사항으로
구분
예외적으로 학위 이외의 교육과 관련된 사항은 경력사항에 입력
ex) OO대학 OO교육과정 수료이수
- 143 -
소속학협회
- 직위담당업무
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 소속학협회정보에 학회명 이외에 다른 사항이
기재되지 않은 경우 직위 및 담당업무 항목은 어떻게 처리하는지
처리 방법
및 사례
- 활동시작년월 및 학회종료년월에 관한 정보가 없을 시 이는 공란처
리하며 직위의 경우 다른 정보가 없는 경우 lsquo회원rsquo으로 입력
논문실적
- 학술지구분
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 논문실적 정보만으로 학술지구분(국내 및 국외
전문학술지 국내 및 국외 학술대회발표논문집 기타논문집)에 대
한 구분은 어떻게 하는지
처리 방법
및 사례
- 수집된 대상인력의 논문실적 정보의 상당수가 국내 및 국외 전문학
술지 및 학술대회발표논문집에 관한 구분이 되어 있지 않기 때문
에 학술지구분에 어려움을 겪을 수 있음
- 이에 대한 구분기준은 명확하게 한정짓기 어려운 부분이 있어 이
러한 경우 최신성 유지 업무 담당 책임자가 판단하여 처리하고 있
음
- 이에 대한 몇 가지 팁을 제시하자면 먼저 lsquoOO학회지rsquo lsquoJournal
ofrsquo 등의 용어가 해당정보에 삽입되어 있는 경우 대부분 전문학
술지로 구분할 수 있으며 lsquo학술대회rsquo lsquo발표대회rsquo lsquoProceeding
Conference Seminar Workshop등의 용어가 해당정보에 삽입되
어 있는 경우 이는 대부분 rsquo학술대회발표논문집으로 구분할 수 있
음
- 또한 학술대회발표논문집 중 국내와 국외의 구분은 해당 학술대회
가 열린 장소를 기준으로 함
ex) lsquoThe Internation Conference in Seoulrsquo의 경우 학술대회가 열린
장소가 대한민국의 서울이므로 국내 학술대회발표논문집으로
구분함
- 144 -
- 역할
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 논문실적 정보에 역할(단독 공동(제1) 공동(참
여) 공동(책임))이 구분되어 있지 않은 경우 이를 어떻게 처리해야
하는지
처리 방법
및 사례
- 현재 대상 인력의 연구실적과 관련하여 역할구분이 되어 있지 않은 정
보를 입력할 시 해당 연구의 특성을 고려하여 역할을 lsquo단독rsquo 혹은 lsquo공
동(제1)rsquo으로 임시 구분해 줌
- 공동저자명
구 분 내 용
상황 및 질문ㆍ수집된 대상 인력의 논문실적 정보 중 공동저자명 입력 시 10명 이
상이 넘어가는 공동저자명을 모두 넣어주어야 하는지
처리 방법
및 사례
- 공동저자명의 경우 한 연구실적에서 무수히 발생될 수 있는 공동저
자명을 일일이 입력을 해주고 있지는 않음
- 예를 들어 공동저자명이 15명일 경우 공동저자명에는 lsquo홍길동 김순희
이명수 박영희 등rsquo으로 한정시키고 전체저자수 항목에 저자를 포
함한 16명을 입력해 줌
- 논문실적 일반
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 논문실적 정보가 논문명만 있는 경우 이를 입
력해야 하는지
처리 방법
및 사례
- 대상인력의 논문실적 정보에 대한 추가 입력 기준은 아직 명확하
게 정해지지는 않은 상태
- 현재(2007년 7월 18일 기준)는 개재년월 및 논문명의 두 가지 정보 이
상이 존재할 시에만 추가입력을 해주고 있음
- 145 -
연구실적
- 연구기간
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 연구실적 정보에서 연구기간 항목이 종료년월
만 나와 있는 경우는 어떻게 처리하는지
처리 방법
및 사례
- 연구기간에 관한 정보가 종료년월만 나와 있는 경우 임시로 1년의
기간을 책정하여 시작년월을 입력
ex) lsquo2005년 8월 OO에 관한 연구rsquo라는 연구실적의 입력 시 연구기간
에서 시작년월은 2004년 9월 종료년월은 2005년 8월로 입력
- 참여구분
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 연구실적 정보에서 참여구분(연구책임자 공동연
구자)의 경우 이를 어떻게 구분하는지
처리 방법
및 사례
- 연구실적에 관한 정보에서 참여구분이 되어 있지 않은 경우에는 해
당인력의 다른 연구실적 등을 감안하여 참여구분을 하여야 하나
대상이 평가위원인 경우 lsquo연구책임자rsquo로 임시 구분하여 줌
지식재산권
- 취득구분
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 지식재산권 정보에서 취득구분(출원 등록)이
구분되어 있지 않은 경우 어떻게 처리하는지
처리 방법
및 사례
- 수집된 지식재산권 정보에서 취득구분이 되어 있지 않은 경우 임
시로 lsquo등록rsquo으로 선택하여 입력
- 특허구분
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 지식재산권 정보에서 특허구분(특허 실용신안
의장 상표 소프트웨어)이 구분되어 있지 않은 경우 어떻게 처리
하는지처리 방법
및 사례
- 수집된 지식재산권 정보에서 특허구분이 되어 있지 않은 경우 임
시로 lsquo특허rsquo로 선택하여 입력
- 146 -
첨부1 NTIS 코드 표준
NTIS 표준코드
정보공개구분
코드값 코드값 의미
1 공개
2 기본인적사항만공개3 비공개
인력(직업)구분
코드값 코드값 의미
1 대학교2 연구소
3 산업계9 기타
소속구분코드
코드값 코드값 의미
1 재직중2 퇴직
3 해외연수6 파견중
학위코드
코드값 코드값 의미
2 학사이하5 석사
7 박사수료8 박사
- 147 -
학술지구분
코드값 코드값 의미 비고
01 국외전문학술지 발표 학술지가 국외전문학술지에 게재
02 국외학술대회발표논문집 발표 학술지가 국외학술대회발표논문집에 게재
03 국내전문학술지 발표 학술지가 국내전문학술지에 게재
04 국내학술대회발표논문집 발표 학술지가 국내학술대회발표논문집에 게재
05 기타논문집 발표 학술지가 기타논문집에 게재
역할구분
코드값 코드값 의미
1 단독2 공동제1 주저자3 공저자4 교신(책임)저자
참여구분
코드값 코드값 의미
A 연구책임자B 참여연구원
저역서구분
코드값 코드값 의미
1 저서2 역서
발행지구분
코드값 코드값 의미
1 국내2 국외
취득구분
코드값 코드값 의미
01 특허출원02 특허등록
- 148 -
코드값 코드값 의미
9511 조경middot지역시스템공학부
특허구분
코드값 코드값 의미 비고
01 특허 산업재산권이 특허에 해당하는 경우
02 실용신안 산업재산권이 실용신안에 해당하는 경우
03 디자인 산업재산권이 디자인에 해당하는 경우
04 상표 산업재산권이 상표에 해당하는 경우
05 기타 산업재산권이 기타에 해당하는 경우06 프로그램(SW) 산업재산권이 프로그램에에 해당하는 경우07 저작권 산업재산권이 저작권에 해당하는 경우08 신기술 인증 산업재산권이 신기술 인증에 해당하는 경우09 신제품 인증 산업재산권이 신제품 인증에 해당하는 경우10 국제출원(PCT) 산업재산권이 국제출원(PCT)에 해당하는 경우11 서비스 산업재산권이 서비스에 해당하는 경우
업적구분
코드값 코드값 의미
1 평가위원
2 위원회활동3 자문4 설계5 시공6 기술지도9 기타
기관코드(기관명이형전거DB)
코드값 코드값 의미
ZE02400 엘에스엠트론(주)ZE02378 (주)지앤시바이오ZE02376 (주)하나아이엔씨ZE02374 센게이지러닝코리아(주)ZE02373 (주)루켄테크놀러지스ZE02372 (주)디투알컨설팅
ZE02367 (주)대흥이엔지ZE02366 (사)한국벤처산업연구원ZE02365 CSG(주)ZE02364 국제상사(주)전자기술연구소
학과코드
- 149 -
9510 생물정보학과
9509 나노과학기술학부9508 지능기계공학과9507 생명과학기술학부9506 의과학과9505 부동산정보9495 보건정보관리
9999 기타9475 대학원
코드값 코드값 의미 코드값 코드값 의미
A01 교수 B32 기술원A02 부교수 C01 공무원A03 조교수 C02 법조인A04 전임강사 C03 의사
A05 시간강사 C04 교사A06 강사(기타) C05 군인A10 명예교수 D01 대표이사A11 석좌교수 D02 이사A12 강의교수 D03 전무A13 겸임교수 D04 상무
A14 계약교수 D05 부장A15 기금교수 D06 차장A16 대우교수 D07 과장A17 연구교수 D08 대리A18 초빙교수 D09 사원A19 객원교수 D10 부사장
A20 조교 D11 상임이사A21 대학원생 Z01 위원A22 POST-DOC Z02 의원A23 POST_MAS Z03 실장A24 초청교수 Z04 학과장A25 외래교수 Z05 주임
B01 수석연구원 Z06 단장B02 책임연구원 Z07 팀장B03 주임연구원 Z08 회장B04 전임연구원 Z09 본부장B05 선임연구원 Z10 처장B06 연구원 Z11 학장
B07 위촉연구원 Z12 센터장B10 수석연구위원 Z13 소장B11 책임연구위원 Z14 부처장B12 주임연구위원 Z15 국장B13 전임연구위원 Z16 연구주임
직위코드
- 150 -
B14 선임연구위원 Z17 연구소장
B15 연구위원 Z18 원장B20 전문위원 Z19 부원장B30 책임기술원 999 기타B31 선임기술원
코드값 코드값 의미 비고
AD 안도라 ANDORRA
AE 아랍에미리트 UNITED ARAB EMIRATESAF 아프가니스탄 AFGHANISTANAG 앤티가 바부다 ANTIGUA AND BARBUDAAI 안길라 ANGUILLAAL 알바니아 ALBANIAAM 아르메니아 ARMENIA
전공분야코드
코드값 코드값 의미
E340600 구강해부학E340601 육안일반해부학E340602 신경해부학E340603 육안두경부일반해부학
E340604 두경부신경해부학E340605 두경부응용해부학E340700 치아형태학E340701 영구치치아형태학E340702 유치치아형태학E340703 치아교합학
국가코드
개인정보활용동의구분
코드값 코드값 의미
Y 동의N 비동의
저자 소개
손강렬한국과학기술정보연구원 NTIS사업단
RampD정보구축팀 책임연구원 팀장
윤영준한국과학기술정보연구원 NTIS사업단
RampD정보구축팀 선임연구원
신성호한국과학기술정보연구원 NTIS사업단
RampD정보구축팀 선임연구원
양명석한국과학기술정보연구원 NTIS사업단
RampD정보구축팀 선임연구원
김진만한국과학기술정보연구원 NTIS사업단
RampD정보구축팀 선임연구원
김재수한국과학기술정보연구원
NTIS사업단 단장
목 차
Ⅰ 인력정보 데이터 정제 지침 1
1 국가RampD참여인력 및 평가위원 데이터 정제 지침 1
11 정제 필요성 1
12 정제 내용 1
13 정제 대상 2
14 정제 수준 3
15 정제 작업 방식 5
16 검수 확인 6
17 데이터 이관 7
2 인력정보 영문이력 입력 지침 8
21 영문이력 DB 구축 필요성 8
22 영문이력 DB 구축 대상 8
23 영문이력 DB 구축 항목 8
24 영문이력 DB 수집 방법 10
25 영문이력 DB 입력 방법 11
26 영문이력 DB 번역 방법 11
27 검수 확인 12
Ⅱ 인력정보 데이터 정제 매뉴얼 13
1 참여인력 데이터 정제 매뉴얼 13
11 개요 13
12 데이터 정제 목록 및 범위 13
13 데이터 분석 내역 18
14 데이터 정제 기준 26
15 데이터 정제 절차 및 작업 지침 49
16 데이터 검수 86
17 데이터 이관 92
2 인력정보 영문이력 입력 매뉴얼 101
21 개요 101
22 DB 구축 대상 및 범위 102
23 데이터 분석 내역 104
24 DB 구축 절차 및 작업 지침 105
25 DB 구축 검수 123
3 평가위원 데이터 최신성 유지 매뉴얼 129
31 최신성 유지 업무 개요 129
32 대상 인력(평가위원) 정보 수집 방법 131
33 최신성 유지 작업 지침 132
34 최신성 업무 대상 134
35 입력 항목별 QampA(처리 방법 및 사례) 140
첨부1 NTIS 코드 표준 146
- 1 -
Ⅰ 인력정보 데이터 정제 지침
1 국가RampD 참여인력 및 평가위원 데이터 정제 지침
11 정제 필요성
인력정보 데이터는 연구관리전문기관에서 수집하여 통합 구축하므로 여러 기관에 중복으로 입력되어
있을 수 있음
따라서 데이터 정제를 하지 않을 경우 현 재직기관의 중복 논문실적 이중등록 등 통계현황 및 검
색결과에 많은 문제가 발생할 수 있음
또한 각 기관별로 고유의 코드 및 항목체계를 활용하거나 코드가 필요한 항목에 코드를 사용하지
않는 등 NTIS 표준 코드 및 항목에 대한 매핑 필요
NTIS 인력정보의 현황정보 서비스 제공시 누락항목으로 인해 현황정보가 정확하지 않음
12 정제 내용
수집된 인력 정보를 등록하기 위한 데이터 분류 및 분석
여러 기관에 중복 입력된 인력정보에 대한 중복제거 및 데이터 취합
중복제거 후 취합 된 데이터는 확인 정정
- 학력사항 경력사항 등의 정보 이중 등록
- 기관별 인력정보 중 재직기관 상이
각 기관별 코드 및 항목에 대해 통합 인력DB의 코드 및 항목에 맞게 매핑
- 각 기관 고유의 코드 및 항목을 표준 코드 및 항목과 매핑 작업 필요
- 재직기관 전공 등 코드가 필요한 항목에 코드를 활용하지 않는 기관의 데이터는 표준 코드에 맞
게 데이터 변환 필요
기본정보 경력정보 실적정보 등 인력정보에 대한 오류데이터 정정
- 각 항목의 데이터 내용을 검토하여 오류 정정
예) 학력사항의 데이터 내용 중 입학일이 졸업일 보다 나중일 경우 등
인력정보의 누락항목에 대한 보완
- 수집 가능한 범위 내에서 6개 주요항목기준(인력구분 우편번호 주소 소속기관명 전공 학위 등)
보완
- 2 -
구분 항목 세부항목
참여인력정보(42개)
기본정보(9개)주민등록번호 성명 인력구분 자택주소 자택우편번호 자
택전화번호 핸드폰번호 부처(기관)분류코드 E-mail
소속기관사항(6개)소속기관명 부서명 직위명 사무실전화번호 기관주소
최초임용일
학력사항(10개)전공 취득대학 학위 입학일 졸업일 학과 취득국가 지
도교수명 학위논문명 학위취득일
경력사항(3개) 근무처명 직위명 근무기간
자격사항(3개) 자격발행처 자격증명 자격취득일
논문실적(8개)논문발표일 국문논문명 영문논문명 저자역할구분 발
행처 학술지구분 학술지명 SCI여부
지식재산권(3개) 지식재산권명 출원_등록번호 특허구분
평가위원(10개)
소속학협회현황(3개) 담당업무 직위 학협회사항
훈포장사항(3개) 수상년월 수여기관명 훈포장명
저역서실적(4개) 국문저서명 발행년 발행처 저역서구분
13 정제 대상
정제 대상 범위
- 정보연계를 통해 수집되는 참여인력정보의 정제
정제 대상 항목 정의
주요 정제 대상 정의
구분 항목 세부항목
참여인력정보(12개)
기본정보(6개)주민등록번호 성명 인력구분 핸드폰번호 E-mail 부
처(기관)분류코드
소속기관사항(4개) 소속기관명 기관주소 사무실전화번호 직위명
학력사항(2개) 전공 학위
주요 정제 대상 항목이란 인력정보 서비스를 위해 기본적으로 필요한 최소한의 서비스 항목 Not
null값은 아니지만 최대한 많은 자료 수집이 필요한 항목
- 3 -
코드 대상 항목 정의
구분 항목 세부항목
참여인력정보(16개)
기본정보(3개) 자택우편번호 부처(기관)분류코드
소속기관사항(3개) 인력구분 소속기관명 직위명 기관우편번호
학력사항(4개) 전공 학위 학과 취득국가 취득대학
경력사항(2개) 직위명
논문실적(3개) 저자역할구분 학술지구분 SCI여부
지식재산권(1개) 특허구분
평가위원(1개)
저역서실적(1개) 저역서구분
코드 대상 항목이란 데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목
14 정제 수준
데이터 특성 및 정제 지침
- lsquo속성값 전체 존재rsquo 데이터
공통사항 오류 데이터 정정 및 코드 매핑
① 중복 자료 중 데이터 신뢰성에 근거하여 통합 필수 항목 누락 확인 및 보충 선별(성명 주
민등록번호) 형식 확인(주소 전화번호 및 E-Mail)
② 중복 자료 중 최신 자료 선정 및 확인 형식 확인 (주소 전화번호)
③ ⑤~⑪ 중복 자료 중 데이터 신뢰성에 근거하여 통합
번호는 lsquo정제 대상 항목 정의rsquo 표에서 각 항목에 붙여진 번호
- lsquo일부 또는 6개 미만rsquo 데이터
데이터 누락 정도를 판단하여 필요한 경우 해당 기관에 보완 요청
데이터 보완 후 lsquo속성값 전체 존재rsquo 데이터와 같은 방식으로 정제
오류 유형 정의 및 정제 형태
- 발생 가능한 오류 유형
주요 항목 중 데이터가 존재하지 않는 경우
데이터의 Type(문자형 숫자형)에 위배되는 값이 들어있는 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
정해진 법칙에 따른 번호가 아닌 경우
실제로 존재하지 않는 부점(구분자) 등이 입력되어 있는 경우
- 4 -
오류 유형 세부 정제 지침 비고
주요 항목 중 데이터가 null- 정제가 불가능하므로 정보 재수집
(해당 기관에 정보 제공 재요청)
데이터 Type 오류
- 적합한 Type으로 수정 가능한 정도(의미상으로는
유효한 경우)의 오류는 수정하고 그렇지 않은 데
이터는 삭제
데이터 형식 오류- 데이터들 중 가장 많은 유형을 정규 형식 정고 형
식에 위배되는 데이터들은 정규 형식으로 변환
부점(구분자) 오류
- 실제 서비스 되는 데이터값과 비교하여 변환 과정
에서 발생한 오류면 실제 데이터값으로 변환하고
원시 데이터 자체가 오류인 경우에는 삭제 처리
코드값 오류
- 일치 유사한 코드값으로 변환
- 유사 가장 적합한 코드값으로 변환
- 상이 lsquo기타rsquo코드값으로 분류 또는 삭제
논문제목 오류 - 논문제목1은 반드시 필수 입력으로 처리
중복 데이터들의 데이터 값
상충 오류
- 변경될 수 없는 기본정보(이름 주민번호)의 경우는
기존 데이터 우선
- 변경 가능한 정보(기관명 논문 등)의 경우 최신 업
데이트된 정보를 우선
코드의 값이 정해진 범위를 벗어나는 경우
ex) 기관 코드와 인력시스템 사용 코드와의 매핑 오류
기관 데이터의 코드 항목 값이 잘못 입력되어 있는 경우
국문과 영문으로 구분되는 동일 데이터 항목에 잘못된 위치에 항목 값이 입력되어 있는 경우
ex) 논문실적정보의 국문제목에 영문제목이 입력되어 있는 경우
데이터가 복수로 존재하며 서로 상충되는 경우
ex) 유효하지 않은 주민등록번호의 중복
- 조치 가능한 데이터 정제 형태
재수집 데이터를 제공한 기관에 재요청하여 부족한 데이터 내용을 재수집
수정 데이터 내용은 수정하지 않고 데이터 형태 및 특수문자 수정 정도의 정제
삭제 데이터 값 삭제(Garbage 처리) 또는 레코드 삭제
위의 경우 원시 데이터 값은 관리를 위해 따로 보관
정제 제외 데이터 값이 누락이거나 오류로 판단되지만 정확한 데이터 내용을 알 수 없는 경
우 기준 데이터가 없으므로 정제 대상에서 제외 또한 별다른 오류로 보이지 않는 경우도 정
제 대상에서 제외
오류 유형별 세부 정제 지침
~은 lsquo발생 가능한 오류 유형rsquo 내용 참조
~은 lsquo조치 가능한 데이터 정제 형태rsquo 내용 참조
- 5 -
구분 비고
기본정보 이메일 기존 수집 데이터를 통해 보완
소속기관사항 있으나필드가 null인것
인력구분 기관명이형전거DB 생성 완료 후 적용함
소속기관 우편번호주소가 있는 경우 우편번호 찾기를 통해 보완주소가 없는 경우 기존 수집 데이터를 통해 보완
소속기관 주소 기존 수집 데이터를 통해 보완
소속기관명기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
학력사항 있으나 필드가null인것
전공기존 수집 데이터를 통해 보완하고 기관명이형전거DB로 매핑함
학위기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
소속기관사항 없는것 기존 수집 데이터를 통해 보완
학력사항 없는것 기존 수집 데이터를 통해 보완
인력정보의 누락항목에 대한 보완(기존 서비스 데이터 기준)
기타 (정보 식별자 부여)
- 데이터 정제 최종 단계에서 식별자 부여 체계에 따라 정보식별자(번호) 삽입
- 정보식별자(번호)는 식별체계 API에 의해 자동으로 부여 되며 식별 부여 체계는 사업단 내 식별
체계 담당자가 마련하여 제공
고려 사항
- 정확한 항목매핑 후 작업이 진행되어야 함
- 정제데이터 관리는 임시테이블을 통해서 관리되며 다양한 에러 유형별로 체계적인 관리가 되어야 함
15 정제 작업 방식
중복 확인 기계작업
- 정제 도구에서 제공하는 중복 확인 기능을 이용하여 중복 항목의 리스트 작성(기계작업)
데이터 통합 기계작업 + 수작업
- 중복으로 확인된 항목들의 리스트를 비교하여 통합
- 기계적으로 필드간의 충돌이 없음을 확인할 수 있는 항목은 자동 통합하고 기계적으로 충돌을
- 6 -
확인할 수 없는 경우는 수작업으로 필드별 데이터 통합을 수행
- 최신 또는 최종 여부를 확인하여 통합해야 하는 경우 해당 데이터에 포함된 일자 데이터를 감안
하여 선별 통합(일자 및 기간의 충돌이 없는 경우 기계작업 충돌이 있는 데이터는 리스트 업
후 수작업)
필수 데이터 누락 확인 및 보충 선별 기계작업 + 수작업
- 소속기관명 E-mail 등과 같이 누락되지 말아야 할 항목을 설정하고 기계적으로 누락된 항목의
리스트를 추출(기계작업)
- 이 리스트에 대하여 보충 가능한 데이터는 보충하고 보충이 불가능한 경우 서비스 불가 리스트
로 따로 추출(수작업)
형식 확인 기계작업 + 수작업
- E-Mail 주소 전화번호와 같은 형식이 어느 정도 정의된 데이터의 경우 기본 형식을 템플릿으
로 지정
- 정형화되지 않은 데이터의 리스트를 추출하여 이 중 기계적으로 형식을 일치시키고(기계작업)
일치되지 않은 데이터를 수작업으로 확인하여 수정하거나 형식 불량 데이터 리스트로 따로 추
출(수작업)
16 데이터 검수
161 데이터 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
- 7 -
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
17 데이터 이관
171 NTIS 참여인력 DB 현황 및 데이터 흐름
NTIS 참여인력 DB는 물리적으로 각 연계기관과 NTIS의 데이터 연계를 위해 각 연계기
관에 구성된 연계기관 공동활용 DB와 RampD 참여인력을 관리하기 위한 인력DB RampD참여
인력 서비스 DB로 구성되어 있다
그림 3 NTIS DB 현황 및 데이터 흐름
172 NTIS DB 간 테이블 매핑
NTIS 참여인력 DB가 기능별로 분리되어 있음으로 인해 연계DB에서 인력 관리DB 간
항목 매핑 정의가 필요하다 DB 간 항목 매핑은 아래와 같다
정보구분 테이블명 수집DB 관리DB
인력정보
인력 기본정보 MP_BASIC THR_BASE
소속기관사항 HOFF_ORG THR_JAEJIK
학력사항 SCRE THR_SCHOOL
경력사항 CAREER THR_CAREER
논문실적 PAPER_OUT THR_PAPER
자격사항 CERT THR_LICENSE
지식재산권실적 IPR_OUT THR_PATENT
소속학협회현황 BLNG_INSTIT THR_ACTIVE
저역서실적 TRNSWRT_OUT THR_BOOK
훈포장사항 AWARD THR_MEDAL
- 8 -
항 목 세 부 항 목
기본
기본정보 영문성명 휴대전화 E-mail 개인홈페이지
전문분야 전문(연구)분야
재직기관 기관명 부서명 직위 주소 전화 팩스
학력 최종학위 학위 학위취득일 학교명 전공명
경력 경력사항 시작년월 종료년월 재직기관명 직위
실적
논문실적 논문명 저널명 게제(권)집 페이지 게제년월 공동저자명
연구실적 시작년월 종료년월 발주기관 참여구분(역할) 연구명
특허출원등록구분 출원등록번호 출원등록국가 특허출원명 출
원등록일자
173 데이터 이관
수집 DB에 전송되는 인력정보는 중복 인력이 존재 하며 동일인물의 정보일 지라도 각
기관별 보유 항목이 다르므로 관리DB로 이관을 위해 각 항목별 이관 방안이 필요하다 따
라서 별도의 방안을 마련하여 데이터 이관을 실시하도록 한다
2 인력정보 영문이력 입력 지침
21 영문이력 DB 구축 필요성
해외의 연구자 혹은 외국의 연구기관등에게 관련분야의 연구자문에 필요한 국내 연구전
문가 혹은 국제 공동연구활동 등을 지원하기 위한 국내 인물에 대한 영문검색 체널제공
인물정보에 대하여 영문DB구축을 수행하고 웹을 통한 영문검색을 지원함으로써 국제공
동연구를 지원하기 위한 기반을 조성
기존 개인정보 공동활용에 동의한 연구자들을 대상으로 파악한 영문이력DB 구축방법을
통해 인력정보에 대하여 영문화 작업을 수행
22 영문이력 DB 구축 대상
기본정보 학력사항 경력사항 논문실적 연구실적 특허실적 등
23 영문이력 DB 구축 항목
영문이력서 제공가능 인력에 대해 영문이력서를 제공받아 이를 바탕으로 영문 DB를 구
축하고 번역 요청자를 대상으로 번역을 통한 영문DB구축
- 9 -
항 목 세 부 항 목 영문명 비고
기본(BasicInformation)
기본정보 영문성명 English Name - 한글이력정보와 공동 사용- 전문분야는lsquo08 개정 분류코드 영문명 활용
휴대전화(국가번호)
Cellular PhoneNumber
E-mail E-mail
개인홈페이지 Homepage
전문분야 전문(연구)분야 Research Field 1
Research Field 2
Research Field 3
검색키워드 전문분야명
재직기관(organization)
기관명 Organization Name - 현재 재직기관사항 1개 입력
부서명 Department
직위 Job title(position)
우편번호 Postal Code
주소 Address
전화(국가번호) Telephone
팩스(국가번호) Fax
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) Degree Code
학위취득일 GraduationDate
학교명 School
전공명 Major
경력(Career)
경력사항(CAREER)
시작년월 Start Date - 재직 경력으로 주요 경력입력 현 재직정보제외
종료년월 End Date
재직기관명 Organization Name
직위 Position(Job Title)
실적ResearchResult
논문실적(paper)
논문명 Title - 최근 5년 이내만 입력저널명 Journal Name
게제(권)집 Volume
게제호 Number
시작페이지 Start Page
종료페이지 End Page
게제년월 Date of Publication
공동저자명 Co-Author
비고 Etc
연구실적ResearchProject
시작년월 Start Date
종료년월 End-Date
발주기관 Funding organization
참여구분(역할)-코드
Role
연구실적명 title
영문이력 구축 대상 항목 정의
- 10 -
특허(patent)
출원등록구분-코
드
appliedregistered
출원등록번호 number
출원등록국가-코
드
National Code
특허출원명 Patent name
출원등록일자 Date
코드 대상 항목(데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목)
코드 대상 항목 정의
항목 세부항목 코드
전문분야(3개) 전문(연구)분야NTIS 표준코드(국가과학기술
표준분류) 활용
학력사항(1개) 최종학위
2(학사)
5(석사)
8(박사)
연구실적(1개) 참여구분(역할)A(연구책임자)
B(참여연구원)
특허실적(2개)특허구분(출원등록)
01(출원)
02(등록)
등록국가 NTIS 표준코드 활용
코드 대상 항목이란 데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목
daggerNTIS 표준코드에 영문명을 포함하여 사용
24 영문이력 DB 수집 방법
E-mail을 통한 영문이력서 제공 요청 메일 발송
- 영문이력 DB 구축에 동의하고 영문이력서 제공이 가능한 연구자 대상
전화연락을 통한 이력서 수집
- 영문이력서 제공 요청 메일과 병행하여 영문이력서 제공동의자를 대상으로 영문이력
입력자들이 전화를 통하여 이력서 수집 요청
E-mail을 통한 영문이력서 번역 대행 안내 메일 발송
- 영문이력 DB 구축에 동의한 번역 요청 동의자를 대상으로 메일 발송
이력정보(한글)는 poolkistirekr을 통해 파일형태로 수집 관리함
이력정보(한글)는 메일을 통해서 파일형태(HWP MS-WORD PDF 등)로만 수집함
- 11 -
항 목 선처리 항목
기본 재직기관 기관명 직위
학력 최종학위 학교명 전공명
경력 경력사항 재직기관명 직위
실적논문실적 저널명
연구실적 발주기관
구분 선처리 방법
기관명
기관명(재직기관)
학교명(학력사항)
재직기관명(경력사항)
발주기관(연구실적)
- 웹검색(예 NAVER 백과사전 및 기관 홈페이지)
웹검색시는 출처 기록
- 웹검색 불가는 직접번역
직위직위(재직기관)
직위(경력사항)
- 직위에 대한 영문 코드표 참조
영문 코드표의 출처 기록
전공명 전공명(학력사항)- 전공명에 대한 영문 코드표 참조
영문 코드표의 출처 기록
저널명 저널명(논문실적)- 웹검색(예 httpsocietykistirekr)
웹검색시는 출처 기록
25 영문이력 DB 입력 방법
영문이력 입력
- 수집된 영문이력서는 입력자들이 등록수정 화면을 통해 직접 입력
영문이력 입력결과 확인
- 입력 완료된 영문이력서의 확인은 다른 입력자에 의해 입력결과를 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 본인확인
- 영문이력서의 입력 확인 완료 후 영문이력 본인에게 안내메일을 발송하여 확인
- 본인확인에 의해 수정 가능
26 영문이력 DB 번역 방법
영문이력 선처리 작업
- 영문이력 번역 수행 전 공통적인 항목에 대해 선처리 작업 수행
영문이력 번역
- 인력DB의 번역 대상자 및 수집된 이력서는 영문이력 관리 기능을 통해 번역 수행
- 12 -
영문이력 번역확인
- 번역 완료된 영문이력정보의 확인은 다른 번역자에 의해 번역결과를 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 전문가검수
- 번역확인 완료된 영문이력정보의 검수는 전문가에 의해 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 본인확인
- 영문이력정보의 번역 번역확인 전문가검수 완료 후 영문이력 본인에게 안내메일을
발송하여 확인
- 본인확인에 의해 수정 가능함
KISTI 검수
- KISTI 검수 절차를 거쳐 영문이력에 대해 서비스 제공
27 검수 확인
입력 및 번역 결과 보고
- 주간보고 영문이력 번역에 대한 현황을 매 주 보고
- 이슈사항보고 이슈사항 발생 시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 데이터(전체 항목 필드 기준)의 01 이하(품질목표 999)
- 오류 체크 방식 전체 데이터에서 본인확인 미완료 대상 중 무작위로 30 샘플링
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상
데이터건수) 항목가중치의 합산 결과가 01 이하
- 전문가검수는 모든 번역대상자를 대상으로 수행
- 번역확인 및 전문가검수 단계에서 자체적으로 품질 활동 수행
오류율 산정 기준
- 인력정보 영문이력에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며
오류율 산정에서 제외함
- 13 -
구분 항목 세부항목 세부항목 설명
참여인력정보(42개)
기본정보(8개)
주민등록번호 인력 고유의 주민등록번호
성명 인력 한글 영문 한자 성명
자택주소 인력 본인의 자택 주소
자택우편번호 인력 본인의 자택 우편번호
자택전화번호 인력 본인의 자택 전화번호
핸드폰번호 인력 본인의 핸드폰 번호
E-mail 인력 본인의 E-mail
부처(기관)분류코
드인력 본인의 부처(기관)분류코드
Ⅱ 인력정보 데이터 정제 매뉴얼
1 참여인력 데이터 정제 매뉴얼
11 개요
111 정제 목표
인력데이터는 연구관리전문기관에서 수집하여 통합 구축하므로 여러 기관에 중복으로 입력되어 있
는 경우에 이중등록 데이터가 존재할 수 있어 이를 NTIS에서 활용하기 위해서 정의된 중복기준에
따라 이중등록 확인 및 제거하는 데이터 정제를 절차에 따라 수행
연구관리전문기관의 인력정보관리시스템의 미비 또는 관리체계의 미흡으로 인해 발생된 누락데이
터 및 입력된 데이터의 오류를 수행 가능한 범위 내에서 작업자 및 시스템에 의한 오류 수정
연구관리전문기관별로 각각의 고유의 코드 및 항목체계를 활용하거나 코드가 필요한 항목에 코드
를 사용하지 않고 있는 실정이며 이러한 연구관리전문기관 인력데이터를 NTIS에서 활용하기 위
해서는 NTIS 통합 표준 코드 및 항목으로의 매핑
12 데이터 정제 목록 및 범위
121 데이터 정제대상 및 항목 정의
- 14 -
구분 항목 세부항목 세부항목 설명
소속기관사항(7개)
소속기관명 인력 본인의 현재 소속기관명칭
학과부서명 인력 본인의 소속기관 내 소속학과부서명
직위명 인력 본인의 소속기관 내 직위명칭
사무실전화번호 인력 본인의 소속기관 내 전화번호
기관주소 현재 소속기관의 우편번호 및 상세주소
인력구분 인력구분(대학교 연구소 산업계 기타)
최초임용일 현재 소속중인 기관에 최초 임용(근무)일
학력사항(10개)
전공 인력의 학위별 전공명
취득대학 인력의 학위별 출신 대학교명
학위학력정보의 학위종류예) 학사이하 석사 박사수료 박사
입학일 인력의 학위별 입학년월
졸업일 인력의 학위별 졸업년월
학과 인력의 학위별 출신 대학교 학과명
취득국가 인력의 학위별 출신 대학교 소재지(국가)
지도교수명 인력의 각 학위별 지도교수명
학위논문명 인력의 최종학위취득시 제출한 논문명
학위취득일 인력의 최종학위취득일
경력사항(3개)
근무처명인력의 전ㆍ현재 직업 및 교육과정의 기관명 및세부사항(학과 부서 등)
직위명인력의 전ㆍ현재 직업 및 교육과정의 직급 또는직위명
근무기간인력의 전ㆍ현재 직업 및 교육과정의 시작년월및 종료년월
자격사항(3개)
자격발행처 인력이 발급받은 자격증 등의 발급기관명
자격증명 인력이 발급받은 자격증 등의 자격명
자격취득일 인력이 발급받은 자격증 등의 발급년월
논문실적(8개)
논문발표일 인력이 저술한 논문을 게재하거나 발표한 년월
논문제목1 인력이 저술한 논문의 논문제목1
- 15 -
구분 항목 세부항목 세부항목 설명
논문제목2 인력이 저술한 논문의 논문제목2
저자역할구분
인력이 저술한 논문에 있어서의 역할정도예) 단독공동제1주저자공저자교신(책임)저자
발행처인력이 저술한 논문이 실린 간행물을 발행한 발행처
학술지구분
인력이 저술한 논문의 게재 및 발표형태와 장소에 관련하여 학술지구분예) 국외전문학술지 국외학술대회발표논문집 국내전문학술지 국내학술대회발표논문집 기타논문집
학술지명 인력이 저술한 논문이 실린 간행물의 명칭
SCI여부인력이 저술한 논문이 실린 간행물이 SCI에 수록된 간행물 구분
지식재산권(3개)
지식재산권명 인력이 출원하거나 등록한 지식재산권명
출원_등록번호인력이 출원하거나 등록한 지식재산권의 출원등록번호
특허구분
인력이 출원하거나 등록한 지식재산권의 종류예) 특허 실용신안 디자인 상표 기타 프로그램(SW)저작권 신기술 인증 신제품 인증 국제출원(PCT) 서비스
평가위원(11개)
소속학협회현황(3개)
담당업무인력의 전ㆍ현재 소속 학회 및 협회 내에서의 담당업무
직위 인력의 전ㆍ현재 소속 학회 및 협회 내에서의 직위
학협회사항 인력의 전ㆍ현재 소속 학회 및 협회명
훈포장사항(3개)
수상년월 인력이 훈장 포장 등을 수상한 년월
수여기관명 인력이 수상한 훈장 포장 등을 수여한 기관명
훈포장명 인력이 수상한 훈장 포장 등의 수상명
저역서실적(5개)
저서명1 인력이 저술하거나 역술한 도서의 제목1
저서명2 인력이 저술하거나 역술한 도서의 제목2
발행년 인력이 저술하거나 역술한 도서를 발행한 년도
발행처 인력이 저술하거나 역술한 도서를 발행한 장소
저역서구분 인력이 저술하거나 역술한 도서에 대한 구분 예) 저서 역서
- 16 -
구분 항목 세부항목 현행 DB 항목식별
항목비고
참여
인력
정보
(56개)
기본정보
(12개)
주민등록번호
인물ID NTIS 식별체계 생성
인물관리번호(KOI) 시스템 생성
주민등록번호 lsquo-rsquo포함 14자리
성명
성명-한글
성명-영문
성명-한자
자택주소기본주소(주소1) 우편번호 내 주소를 참조
상세주소(주소2)
자택우편번호 우편번호
자택전화번호 전화번호
핸드폰번호 핸드폰번호
E-mail E-mail
소속기관
사항
(11개)
소속기관명소속기관코드 소속기관명 기준 매핑
기관명이형전거DB 활용소속기관명
부서명 근무부서명
직위명직위코드 직위명 기준 매핑
NTIS 직위코드직위명
사무실전화번
호사무실전화
기관주소
우편번호
기본주소(주소1) 우편번호 내 주소를 참조
상세주소(주소2)
인력구분
인력유형구분
(대학교 연구소 산업
계 기타)
NTIS 인력구분코드
기관명이형전거DB 활용
최초임용일 최초임용일
학력사항
(14개)
전공전공분야 전공명 기준 매핑
NTIS 전공코드전공명
취득대학학위취득대학코드 학위취득대학명 기준 매핑
기관명이형전거DB 활용학위취득대학명
학위 학위코드 NTIS 학위코드
입학일 입학년월
졸업일 졸업년월
학과학과코드 학과명 기준 매핑
NTIS 학과코드학과명
취득국가 취득국가코드 NTIS 국가코드
지도교수명 지도교수명
정제 대상 항목
공동활용정보를 포함하는 현행 DB 구성 기준 69개 항목
- 17 -
구분 항목 세부항목 현행 DB 항목식별
항목비고
학위논문명최종학위논문명1
최종학위논문명2
학위취득일 최종학위취득일
경력사항
(5개)
근무처명 근무처명
직위명직위코드 직위명 기준 매핑
NTIS 직위코드직위명
근무기간근무시작일
근무종료일
자격사항
(3개)
자격발행처 자격발행처
자격증명 자격증명
자격취득일 자격취득일
논문실적
(8개)
논문발표일 논문발표일
논문제목1 논문제목1
논문제목2 논문제목2
저자역할구분 저자역할구분 NTIS 저자역할구분 코드
발행처 발행처명
학술지구분 학술지구분 NTIS 학술지구분코드
학술지명 학술지명
SCI여부 SCI여부 NTIS SCI 여부구분 코드
지식
재산권
(3개)
지식재산권명 지식재산권명
출원_등록번호 출원등록번호
특허구분 특허구분 NTIS 특허구분 코드
평가
위원
(13개)
소속학협
회
현황
(5개)
담당업무 담당업무
직위 직위 직위명
학협회사항
학협회명
활동시작일
활동종료일
훈포장
사항
(3개)
수상년월 수상년도
수여기관명 수여기관명
훈포장명 수상명
저역서
실적
(5개)
저역서명1 저역서명1
저역서명2 저역서명2
발행년 발행년도
발행처 발행처명
저역서구분 저역서구분 NTIS 저역서 구분 코드
- 18 -
구분 항목 세부항목 정제항목 오류유형 비고
참여
인력
정보
(56개)
기본정보
(12개)
주민등록번호
인물ID
-인물ID이 발급되지 않는 경우
예) 외국인 주민등록번호 유효하
지 않거나 중복된 경우
인물관리번호(KOI)1 포맷 오류
예) 자리수 lsquo-rsquo가 있는 경우
주민등록번호
-주민등록번호가유효하지않는경우
예) lsquo-rsquo포함한 14자리가 아닌경우
주민등록번호규칙에맞지않은경우
-중복되는 주민등록번호의 경우
-공란 및 특수문자가 있는 경우
이관 후 서비
스대상에서
제외
성명
성명-한글
-Null인 경우
-공란 및 특수문자 숫자가 있는
경우
-한글이 아닌 경우이관 후 성명
없으면 서비
스대상에서
제외
성명-영문
-공란 및 특수문자 숫자가 있는
경우
-영문성명의 범위를 벗어나는 경
우
예) Lee KHS
성명-한자
-공란 및 특수문자 숫자가 있는
경우
-한자가 아닌 경우
자택주소
기본주소(주소1)
-우편번호 존재하고 Null의 경우
-우편번호의 주소와 상이한 경우
-주소지 정보가 아닌 경우
상세주소(주소2)
-우편번호 및 기본주소 Null의
경우
-주소정보가 아닌 경우
자택우편번호 우편번호-우편번호 Null인 경우
-우편번호가 old data인 경우
자택전화번호 전화번호 -전화번호 Null인 경우
13 데이터 분석 내역
131 세부 항목별 오류 패턴유형 분석
인력데이터
항목별 정해진 규칙에 위배되는 값이 들어있는 경우
- 19 -
구분 항목 세부항목 정제항목 오류유형 비고
-전화번호가 표준 형식이 아닌
경우
-전화번호 데이터가 아닌 경우(지
역번호 없는 경우 포함)
-핸드폰번호인 경우
핸드폰번호 핸드폰번호
-핸드폰번호 Null인 경우
-핸드폰번호가 표준 형식이 아닌
경우
-핸드폰번호 데이터가 아닌 경우
(지역번호 없는 경우 포함)
-전화번호인 경우
E-mail E-mail
-E-mail Null인 경우
-표준 이메일 형식이 아닌 경우
-구분자가 잘못된 경우
-가베지 성 데이터 존재
소속기관
사항(11개)
소속기관명
소속기관코드 NA코드 오류
유형 참조
소속기관명-소속기관명이 기관명이형전거DB
내 대표기관명이 아닌 경우
대표기관명으
로 갱신
부서명 근무부서명 -근무부서명 Null인 경우
직위명
직위코드 NA코드 오류
유형 참조
직위명
-직위명 Null인 경우
-직위명이 직위코드 내 명칭이
아닌 경우
사무실전화번호 사무실전화
-전화번호 Null인 경우
-전화번호가 표준 형식이 아닌
경우
-전화번호 데이터가 아닌 경우(지
역번호 없는 경우 포함)
-핸드폰번호인 경우
기관주소
우편번호-우편번호 Null인 경우
-우편번호가 old data인 경우
기본주소(주소1)
-우편번호 존재하고 기본주소
Null의 경우
-우편번호의 주소와 상이한 경우
-주소지 정보가 아닌 경우
상세주소(주소2) -우편번호 및 기본주소 Null의
- 20 -
구분 항목 세부항목 정제항목 오류유형 비고
경우
-주소정보가 아닌 경우
인력구분 인력유형구분 NA코드 오류
유형 참조
최초임용일 최초임용일 NA날짜 오류
유형 참조
학력사항
(14개)
전공전공분야 NA 코드 오류
유형 참조전공명 -전공명 Null인 경우
취득대학
학위취득대학코드 NA코드 오류
유형 참조학위취득대학명 -학위취득대학명 Null인 경우
학위 학위코드 NA코드 오류
유형 참조
입학일 입학년월 NA날짜 오류
유형 참조
졸업일 졸업년월 NA날짜 오류
유형 참조
학과
학과코드 NA코드 오류
유형 참조학과명 -학과명 Null인 경우
취득국가 취득국가코드 NA코드 오류
유형 참조
지도교수명 지도교수명 -지도교수명 Null인 경우
학위논문명
최종학위논문명1 -가베지 데이터인 경우
최종학위논문명2 -가베지 데이터인 경우
학위취득일 최종학위취득일 NA날짜 오류
유형 참조
경력사항
(5개)
근무처명 근무처명-근무처명 Null인 경우
-가베지 데이터인 경우
직위명
직위코드 NA 코드 오류
유형 참조직위명 1 직위명 Null인 경우
근무기간
근무시작일 NA날짜 오류
유형 참조
근무종료일 NA날짜 오류
유형 참조
- 21 -
구분 항목 세부항목 정제항목 오류유형 비고
자격사항
(3개)
자격발행처 자격발행처-자격발행처 Null인 경우
-가베지 데이터인 경우
자격증명 자격증명-자격증명 Null인 경우
-가베지 데이터인 경우
자격취득일 자격취득일 NA날짜 오류
유형 참조
논문실적
(8개)
논문발표일 논문발표일 NA날짜 오류
유형 참조
논문명1 논문제목1 -가베지 데이터인 경우
논문명2 논문제목1 -가베지 데이터인 경우
저자역할구분 저자역할구분 NA코드 오류
유형 참조
발행처 발행처명-발행처명 Null인 경우
-가베지 데이터인 경우
학술지구분 학술지구분 NA코드 오류
유형 참조
학술지명 학술지명-학술지명 Null인 경우
-가베지 데이터인 경우
SCI여부 SCI여부 NA코드 오류
유형 참조
지식
재산권
(3개)
지식재산권명 지식재산권명-지식재산권명 Null인 경우
-가베지 데이터인 경우
출원_등록번호 출원등록번호-출원등록번호 Null인 경우
-가베지 데이터인 경우
특허구분 특허구분 NA코드 오류
유형 참조
평가
위원
(13개)
소속학
협회
현황
(5개)
담당업무 담당업무-담당업무 Null인 경우
-가베지 데이터인 경우
직위 직위-직위 Null인 경우
-가베지 데이터인 경우
학협회사항
학협회명
-학협회명 Null인 경우
-직위명이 포함된 경우
-가베지 데이터인 경우
활동시작일 NA날짜 오류
유형 참조
활동종료일 NA날짜 오류
유형 참조
- 22 -
구분 항목 세부항목 정제항목 오류유형 비고
훈포장
사항
(3개)
수상년월 수상년도 NA날짜 오류
유형 참조
수여기관명 수여기관명-수여기관명 Null인 경우
-가베지 데이터인 경우
훈포장명 수상명-수상명 Null인 경우
-가베지 데이터인 경우
저역서
실적
(5개)
저역서명
저역서명1 -가베지 데이터인 경우
저역서명2 -가베지 데이터인 경우
발행년 발행년도 NA날짜 오류
유형 참조
발행처 발행처명-발행처명 Null인 경우
-가베지 데이터인 경우
저역서구분 저역서구분 NA코드 오류
유형 참조
구분 항목 세부항목 정제항목 오류내역 비고
참여
인력
정보
(11개)
소속기관사항(1개) 최초임용일최초임용일
YYYYMMDD
-YYYY가 없는 경우(누락)
-MM이 없는 경우
-DD가 없는 경우
-YYYYMMDD이 유효하지
않은 경우
학력사항(3개)
입학일입학년월
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
졸업일졸업년월
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-입학년월보다 같거나 작
은 경우
학위취득일최종학위취득일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
- 23 -
구분 항목 세부항목 정제항목 오류내역 비고
경력사항(2개) 근무기간
근무시작일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
근무종료일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-근무시작일보다 같거나
작은 경우
자격사항(1개) 자격취득일자격취득일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
논문실적(1개) 논문발표일논문발표일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
소속학협회현황(2개) 학협회사항
활동시작일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
활동종료일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-활동시작일보다 같거나
작은 경우
훈포장사항(1개) 수상년월수상년도
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우평가
위원
(1개)
저역서실적(1개) 발행년발행년도
YYYY
-YYYY이 없는 경우(누락)
-YYYY이 유효하지 않은
경우
시작일보다 종료일이 같거나 작은 경우 종료일을 삭제
날짜의 경우 본인의 생년월일보다 작을 수 없음
- 24 -
구분 항목 세부항목 정제항목 오류유형 비고
참여
인력
정보
(14개)
기본
정보
(1개)
자택우편번호 우편번호-Null 경우
-우편번호와 주소정보가 불일치
외국주소는
유지
소속
기관
사항
(4개)
소속기관명소속기관코드
소속기관명
-소속기관명만 존재하는 경우
-소속기관코드가 기관명이형전거
DB의 이형기관코드가 아닌 경우
-소속기관명이 기관명이형전거DB
의 대표기관명이 아닌 경우
직위명직위코드
직위명
-직위명만 존재하는 경우
-직위명 직위코드가 존재하지 않
는 경우
기관주소 우편번호-Null의 경우
-우편번호와 주소정보가 불일치
인력구분 인력유형구분-기관명이형전거DB의 기관유형구
분과 불일치
학력
사항
(4개)
전공전공분야
전공명
-전공명만 존재하는 경우
-전공명 전공분야코드가 Null인 경우
취득대학학위취득대학코드
학위취득대학명
-학위취득대학명만 존재하는 경우
-학위취득대학코드가 기관명이형
전거DB의 이형기관코드가 아닌
경우
-학위취득대학명이 기관명이형전
거DB의 대표기관명이 아닌 경우
학위 학위코드
-학위코드가 Null인 경우
-학위코드가 구분 코드내 표함되
지 않는 경우
학과학과코드
학과명
-학과명만 존재하는 경우
-학과명 학과코드가 존재하지 않
는 경우
취득국가 취득국가코드
-Null인 경우
-기관 국가코드와 NTIS 국가코드
매핑 오류
경력
사항
(1개)
직위명직위코드
직위명
-직위명만 존재하는 경우
-직위명 직위코드가 Null인 경우
코드의 값이 정해진 범위를 벗어난 경우
- 25 -
구분 항목 세부항목 정제항목 오류유형 비고
논문
실적
(3개)
저자역할구분 저자역할구분
-Null인 경우
-저자역할구분이 구분 코드 내 포
함되지 않은 경우
학술지구분 학술지구분
-학술지구분이 Null인 경우
-학술지구분이 구분 코드내 포함
되지 않은 경우
SCI여부 SCI여부
-Null인 경우
-SCI여부가 구분코드 내 포함되지
않은 경우
지식
재산
권
(1개)
특허구분 특허구분
-Null인 경우
-특허구분이 구분 코드내 포함되
지 않은 경우
평가
위원
(1개)
저역
서
실적
(1개)
저역서구분 저역서구분
-Null인 경우
-저역서구분이 구분 코드 내 포함
되지 않은 경우
구분 항목 이중등록 검사 항목 기준 비고
참여인력
기본정보 주민등록번호() 주민등록번호는 유일해야 함
소속기관사항 소속기관명()소속기관명(대표기관명) 유일
해야 함
학력사항
1 취득대학() 학위() 입학일
2 취득대학() 학위() 졸업일
3 취득대학() 학위() 전공
4 취득대학() 학위() 학과
5 취득대학() 학위() 학위취득일
취득대학은 대표기관명으로
비교 함
경력사항1 근무처명() 직위명 근무시작일
1 근무처명() 직위명 근무종료일
논문실적
1 논문명() 논문발표일 학술지명
2 논문명() 논문발표일 ISSN
3 논문명() ISSN 게재권집 게재호
4 논문명() 학술지명 게재권집 게재호
132 이중등록 유형 분석
이중등록 정제 기준 정의( 주키)
- 26 -
구분 항목 이중등록 검사 항목 기준 비고
지식재산권
1 출원_등록번호()
2 지식재산권명() 출원등록구분() 특허구분
() 출원국가
저역서실적1 ISBN
2 저역서명() 저역서구분() 발행년 발행처
평가위원
소속학협회현황1 학협회명() 직위 시작일
1 학협회명() 직위 종료일
훈포장사항 훈포장명() 수상년월 수여기관명
자격사항 자격증명() 자격발행처 자격취득일
이중등록 데이터 분석 방법
- 데이터 정제 결과 데이터를 대상으로 기본정보는 주민등록번호 이외의 정보는 이중등록 검사 항
목을 기준으로 하여 시스템 정제를 통해 인력별 동일한 데이터가 존재하는지를 파악함
14 데이터 정제 기준
141 정제 지침
정제 내용
수집된 인력 정보를 등록하기 위한 데이터 분류 및 분석
여러 기관에 중복 입력된 인력정보에 대한 중복제거 및 데이터 취합
중복제거 후 취합 된 데이터는 확인 정정
- 학력사항 경력사항 등의 정보 이중 등록
- 기관별 인력정보 중 소속기관 상이
각 기관별 코드 및 항목에 대해 통합 인력DB의 코드 및 항목에 맞게 매핑
- 각 기관 고유의 코드 및 항목을 표준 코드 및 항목과 매핑 작업 필요
- 소속기관 전공 등 코드가 필요한 항목에 코드를 활용하지 않는 기관의 데이터는 표준 코드에
맞게 데이터 변환 필요
기본정보 경력정보 실적정보 등 인력정보에 대한 오류데이터 정정
- 각 항목의 데이터 내용을 검토하여 오류 정정
예) 학력사항의 데이터 내용 중 입학일이 졸업일 보다 나중일 경우 등
인력정보의 누락항목에 대한 보완
- 수집 가능한 범위 내에서 6개 주요항목기준(인력구분 우편번호 주소 소속기관명 전공 학위
등) 보완
- 27 -
구분 항목 세부항목
참여인력정보(41개)
기본정보(7개)주민등록번호 성명 자택주소 자택우편번호 자택전화번호
핸드폰번호 E-mail
소속기관사항(7개)소속기관명 부서명 직위명 사무실전화번호 기관주소 인
력구분 최초임용일
학력사항(10개)전공 취득대학 학위 입학일 졸업일 학과 취득국가 지도
교수명 학위논문명 학위취득일
경력사항(3개) 근무처명 직위명 근무기간
자격사항(3개) 자격발행처 자격증명 자격취득일
논문실적(8개)논문발표일 국문논문명 영문논문명 저자역할구분 발행처
학술지구분 학술지명 SCI여부
지식재산권(3개) 지식재산권명 출원_등록번호 특허구분
평가위원(11개)
소속학협회현황(3개) 담당업무 직위 학협회사항
훈포장사항(3개) 수상년월 수여기관명 훈포장명
저역서실적(5개) 국문저서명 영문저서명 발행년 발행처 저역서구분
정제 대상 정의
정제 대상 범위
- 연계시스템을 통해 등록변경되는 참여인력정보의 정제
정제 대상 항목
정제 수준 설정
lsquo속성값 전체 존재rsquo 데이터
- 공통사항 오류 데이터 정정 및 코드 매핑
- ① 중복 자료 중 데이터 신뢰성에 근거하여 통합 항목 누락 확인 및 보충 선별(성명 주민등록
번호) 형식 확인 (주소 전화번호 및 E-Mail)
- ② 중복 자료 중 최신 자료 선정 및 확인 형식 확인 (주소 전화번호)
- ③ ⑤~⑪ 중복 자료 중 데이터 신뢰성에 근거하여 통합
lsquo일부 또는 6개 미만rsquo 데이터
- lsquo속성값 전체 존재rsquo 데이터와 같은 방식으로 정제
오류 유형 정의 및 정제 형태
- 발생 가능한 오류 유형
- 28 -
오류 유형 세부 정제 지침 비고
데이터 내용 데이터 Type 오류
- 적합한 Type으로 수정 가능한 정도(의미상으
로는 유효한 경우)의 오류는 수정하고 그렇
지 않은 데이터는 삭제
데이터 형식 오류
- 데이터들 중 가장 많은 유형을 정규 형식으
로 보고 형식에 위배되는 데이터들은 정규
형식으로 변환
부점(구분자) 오류
- 실제 서비스 되는 데이터값과 비교하여 변환
과정에서 발생한 오류면 실제 데이터값으로
변환하고 원시 데이터 자체가 오류인 경우
에는 삭제 처리
데이터 코드 코드값 오류
- 일치 유사한 코드값으로 변환
- 유사 가장 적합한 코드값으로 변환
- 상이 lsquo기타rsquo코드값으로 분류 또는 삭제
데이터(not null)가 존재하지 않는 경우
데이터의 Type(문자형 숫자형)에 위배되는 값이 들어있는 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
정해진 법칙에 따른 번호가 아닌 경우
실제로 존재하지 않는 부점(구분자) 등이 입력되어 있는 경우
코드의 값이 정해진 범위를 벗어나는 경우
ex) 기관 코드와 인력시스템 사용 코드와의 매핑 오류
기관 데이터의 코드 항목 값이 잘못 입력되어 있는 경우
국문과 영문으로 구분되는 동일 데이터 항목에 잘못된 위치에 항목 값이 입력되어 있는 경우
ex) 논문실적정보의 국문제목에 영문제목이 입력되어 있는 경우
데이터가 복수로 존재하며 서로 상충되는 경우
ex) 유효하지 않은 주민등록번호의 중복
- 조치 가능한 데이터 정제 형태
수정 데이터 내용은 수정하지 않고 데이터 형태 및 특수문자 수정 정도 정제
삭제 데이터 값 삭제(Garbage 처리) 또는 레코드 삭제
위의 경우 원시 데이터 값은 관리를 위해 따로 보관
정제 제외 데이터 값이 누락이거나 오류로 판단되지만 정확한 데이터 내용을 알 수 없는 경
우 기준 데이터가 없으므로 정제 대상에서 제외 또한 별다른 오류로 보이지 않는
경우도 정제 대상에서 제외
오류 유형별 세부 정제 지침
- 29 -
논문제목 오류 - 논문제목1은 반드시 필수 입력으로 처리
중복 데이터들의 데이
터 값 상충 오류
- 변경될 수 없는 기본정보(이름 주민번호)의
경우는 기존 데이터 우선
- 변경 가능한 정보(기관명 논문 등)의 경우
최신 업데이트된 정보를 우선
구분 명(누락) 비고
기본정보 이메일 22719 기존 수집 데이터를 통해 보완
소속기관사항 있으나필드가 null인것
인력구분 15217 기관명이형전거DB 생성 완료 후 적용함
소속기관 우편번호
15977주소가 있는 경우 우편번호 찾기를 통해 보완주소가 없는 경우 기존 수집 데이터를 통해 보완
소속기관 주소
13512 기존 수집 데이터를 통해 보완
소속기관명 428기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
학력사항 있으나 필드가null인것
전공 38915기존 수집 데이터를 통해 보완하고 기관명이형전거DB로 매핑함
학위 34373기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
소속기관사항 없는것 22502 기존 수집 데이터를 통해 보완
학력사항 없는것 31952 기존 수집 데이터를 통해 보완
~은 lsquo발생 가능한 오류 유형rsquo 내용 참조
~은 lsquo조치 가능한 데이터 정제 형태rsquo 내용 참조
인력정보의 누락항목에 대한 보완
기타 (정보 식별자 부여)
- 데이터 정제 최종 단계에서 식별자 부여 체계에 따라 정보식별자(번호) 삽입
- 정보식별자(번호)는 식별체계 API에 의해 자동으로 부여 되며 식별 부여 체계는 사업단 내 식별
체계 담당자가 마련하여 제공
정제 작업 방식
중복 확인 기계작업
- SQL Query를 활용하여 중복 확인하며 중복된 데이터 중 1건을 제외하고 나머지를 표시함(기계
작업)
- 30 -
구분 항목 세부항목 정제항목 오류유형 정제지침
참여
인력
정보
(56개)
기본
정보
(12
개)
주민등록
번호
인물ID인물ID이 발급되지 않
는 경우
인물 중복확인이 가능한 기본 항목(주민등록
번호 성명)이 존재하지 않으면 정제대상에서
제외
식별체계로부터 정제 수행 후 일괄발급 입력
인물관리
번호
(KOI)
NA
정제이전 인물관리번호 일괄 생성하여 key로
활용
Null 여부만 확인하고 정제대상에서 제외
주민등록
번호
Null인 경우 정제대상에서 제외
중복되는 주민등록
번호의 경우
인물관리번호 성명이 상이하면 현행 데이터
를 유지
모두 정제대상에서 제외
유효하지 않은 주민등
록번호의 경우
자리수가 lsquo-rsquo포함한 14자리가 아닌 데이터는
정제대상에서 제외
이관 후 서비스대상에서 제외
데이터 통합 기계작업 + 수작업
- 중복으로 확인된 항목들의 리스트를 비교하여 통합
- 기계적으로 필드간의 충돌이 없음을 확인할 수 있는 항목은 자동 통합하고 기계적으로 충돌을 확
인할 수 없는 경우는 수작업으로 필드별 데이터 통합을 수행
- 최신 또는 최종 여부를 확인하여 통합해야 하는 경우 해당 데이터에 포함된 일자 데이터를 감안
하여 선별 통합(일자 및 기간의 충돌이 없는 경우 기계작업 충돌이 있는 데이터는 리스트 업 후
수작업)
형식 확인 기계작업 + 수작업
- E-Mail 주소 전화번호와 같은 형식이 어느 정도 정의된 데이터의 경우 기본 형식을 템플릿으로
지정
- 정형화되지 않은 데이터의 리스트를 추출하여 이 중 기계적으로 형식을 일치시키고(기계작업)
일치되지 않은 데이터를 수작업으로 확인하여 수정하거나 형식 불량 데이터 리스트로 따로 추출
(수작업)
142 오류 유형별 정제 지침
오류 유형별 정제 지침은 lsquo131 세부 항목별 오류 패턴유형 분석rsquo 을 대상으로 정제지침을 정의
인력데이터
항목별 정해진 규칙에 위배되는 값이 들어있는 경우
- 31 -
구분 항목 세부항목 정제항목 오류유형 정제지침
외국인 및 임시주민번호의 경우 lsquo-rsquo포함한 14
자리가 아닌 데이터는 정제대상에서 제외
표준 포맷으로 구성되
어 있지 않은 경우
lsquo년(2)월(2)일(2)-성별(1)고유번호(6)lsquo 14자 숫자
로 구성되도록 변경
공란 및 특수문자를 제거
성명
성명-한글
Null의 경우
성명-영문 성명-한자가 존재하면 해당 필드
로 이동성명-한글 영문 한자 모두 Null이면 정제대
상에서 제외
이관 후 서비스대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
공란 및 특수문자 숫자 이름이 아닌 경우 제거
예) 이름이 아닌 경우 oo - --
예) 공란의 경우 홍 길동 홍길 동
예) 숫자의 경우 홍길동2 -gt 숫자만 제거
성명-영문
Null의 경우 정제대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
특수문자 숫자 이름이 아닌 경우 제거
예) Lee HS =gt Lee HS영문성명의 범위를 벗어난 경우
예) Lee KHS영문성명이 아닌 경우 해당 필드로 이동하거
나 제거
성명-한자
Null의 경우 정제대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
공란 및 특수문자 숫자 이름이 아닌 경우 제거
예) 金鉉- 洙 =gt 金鉉洙
한문이 아닌 경우 해당 필드로 이동하거나 제거
자택주소기본주소
(주소1)
Null의 경우
우편번호가 존재하면 우편번호로 검색된 주
소 입력 단 우편번호 유효검사를 거친 우편번호만
대상으로 함
우편번호가 존재하지 않으면 정제대상에서 제외
우편번호의 주소와 상
이한 경우
가베지 데이터가 아닌 경우에는 정제대상에서 제외
예) 외국 주소는 유지
가베지 데이터인 경우
기존 데이터는 삭제하고 우편번호가 존재하
면 우편번호로 검색된 주소 입력
우편번호가 존재하지 않으면 기존 데이터 삭
제만 수행
- 32 -
구분 항목 세부항목 정제항목 오류유형 정제지침
상세주소
(주소2)
Null인 경우 정제대상에서 제외
주소정보가 아닌 경우주소정보가 아닌 가베지 데이터는 삭제
예) test 042-123-1234 등
자택우편
번호우편번호
Null인 경우
기본 주소지로 검색하여 입력
기본 주소가 오류데이터이거나 없는 경우는
정제대상에서 제외
우편번호 표준 형식이
아닌 경우
표준 포맷 시도군 구분(3자리)+lsquo-rsquo+지역구분(3
자리)
표준 포맷이 아닌 경우는 표준 포맷으로 변경
예) 300100=gt300-100
300 100=gt300-100
300100 =gt300-100
자리 수가 6자 이하이거나 가베지 데이터인
경우는 제거
우편번호가 old data
인 경우
현재 우편번호가 아닌 경우는 이전 우편번호
주소지를 기준으로 검색하여 입력하고 매핑되
지 않는 데이터의 경우는 삭제
자택전화
번호전화번호
Null인 경우
핸드폰번호가 존재할 경우 복제하여 입력 단 핸드폰 번호의 오류를 정제한 이후 처
리
전화번호가 표준 형식
이 아닌 경우
표준 포맷 국번(2~3자리)-지역전화번호(34자
리)-전화번호(4자리)포준 포맷으로 변경
예) 02-6746-1234 or 041-567-6789
국번은 지역별 국번 참조
내선번호는 유지
지역번호 없는 경우
국번 Null인 경우 자택 주소지의 시도 지역
번호를 입력
예) 6746-1234 이면서 서울 지역의 예
-gt 02-6746-1234
국가번호가포함된경우
(+)국가번호-국번-지역전화번호-전화번호의
형식으로 변경
예) +82-02-6746-1234
가베지 데이터의 경우
자리수가 작거나 크면 제거
예) 02-64-123 or 02-6746-123
숫자(특수문자 포함)가 아닌 문자이면 제거
전화번호 데이터가 아닌 경우 제거
핸드폰번호인 경우 전화번호핸드폰번호 표준포맷으로 변경
- 33 -
구분 항목 세부항목 정제항목 오류유형 정제지침
핸드폰번호 핸드폰번호
Null인 경우 정제 대상에서 제외
핸드폰번호가 표준 형
식이 아닌 경우
이동통신구분번호(3자리)-지역구분번호(34자
리)-전화번호(4자리)로 변경
예) 011-6746-1234 or 019-789-1234
이동통신구분번호는 이동통신사별 구분번호
참조 SK(011 017) KTF(016 018) KG(109)
010(공통)
국가번호가 포함된
경우
(+)국가번호-이동통신구분번호-지역구분번호-
전화번호의 형식으로 변경
예) +82-010-6746-1234
이동통신구분번호가
없는 경우
이동통신구분번호가 없는 경우는 가베지 데이
터으로 판단하여 제거
예) 672-1234의 경우
전화번호인 경우 전화번호핸드폰번호 표준포맷으로 변경
E-mail E-mail
Null인 경우 정제 대상에서 제외
표준 이메일 형식이
아닌 경우
표준 포맷 ID메일서버URI로 구성
예)admin1234daumnet kisti4530kistirekr
구분자 lsquorsquo lsquorsquo으로 변경 및 공란 제거
예) admindaumnet =gt admindaumnet
두 개이상의 이메일이 존재할 경우 앞에 것을
우선으로 유지함
예)admin1234daumnet kisti4530kistirekr
=gt admin1234daumnet
E-mail 데이터가 아닌
경우
E-mail 주소 데이터가 아닌 경우와 가베지 데
이터는 삭제
예) wwwkistirekr -- adminkisti 1 lsquorsquo
공란 등
소속
기관
사항
(11
개)
소속
기관명
소속기관
코드NA 코드 오류 유형 참조
소속
기관명
Null인 경우
소속기관코드가 존재하는 경우에는 해당 소속
기관코드의 명을 검색하여 입력하고 소속기관
코드가 존재하지 않으면 정제대상에서 제외
소속기관명이 NTIS
코드 내 명칭이 아
닌 경우
기관명이형전거DB의 대표기관명으로 변경
예) 서울대 -gt 서울대학교
- 34 -
구분 항목 세부항목 정제항목 오류유형 정제지침
단 기관명이형전거DB에 존재하지 않는 소속
기관명은 신규발급 요청하여 소속기관명을 유
지함
소속기관명이 아닌
경우
소속기관코드가 존재하는 경우에는 해당 소속
기관코드의 명을 검색하여 입력하고 소속기관
코드가 존재하지 않으면 정제대상에서 제외
부서명근무
부서명
Null인 경우 정제대상에서 제외
근무부서명이 아닌
경우
가베지 데이터인 경우만 삭제하고 이외의 경
우는 정제대상에서 제외
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
직위명
직위코드 NA 코드 오류 유형 참조
직위명
Null인 경우
직위코드가 존재하는 경우에는 해당 직위코드
의 명을 검색하여 입력하고 직위코드가 존재
하지 않으면 정제대상에서 제외
직위명이 직위코드 내
명칭이 아닌 경우
직위명이 직위코드내 존재하지 않으면 직위명
은 그대로 유지하고 직위코드는 기타(lsquo999rsquo)로
매핑함
직위명이 아닌 경우
직위코드가 존재하는 경우에는 해당 직위코드
의 명을 검색하여 입력하고 직위코드가 존재
하지 않으면 삭제
사무실
전화번호
사무실
전화
Null인 경우 정제대상에서 제외
전화번호가 표준 형식
이 아닌 경우
표준 포맷 국번(2~3자리)-지역전화번호(34자
리)-전화번호(4자리)포준 포맷으로 변경
예) 02-6746-1234 or 041-567-6789
국번은 지역별 국번 참조
내선번호는 유지
지역번호 없는 경우
국번 Null인 경우 소속기관 주소지의 시도
지역번호를 입력
예) 6746-1234 이면서 서울 지역의 예
-gt 02-6746-1234
국가번호가 포함된
경우
(+)국가번호-국번-지역전화번호-전화번호의
형식으로 변경
예) +82-02-6746-1234
- 35 -
구분 항목 세부항목 정제항목 오류유형 정제지침
가베지 데이터의 경우
자리수가 적거나 크면 제거
예) 02-64-123 or 02-6746-123
숫자(특수문자 포함)가 아닌 문자이면 제거
전화번호 데이터가 아닌 경우 제거
핸드폰번호인 경우 기본정보의 핸드폰번호로 이동
기관주소
기본주소
(주소1)
Null의 경우
우편번호가 존재하면 우편번호로 검색된 주
소 입력
단 우편번호 유효검사를 거친 우편번호만
대상으로 함
우편번호의 주소와 상
이한 경우
가베지 데이터가 아닌 경우에는 정제대상에서
제외
가베지 데이터인 경우기존 데이터는 삭제하고 우편번호가 존재하
면 우편번호로 검색된 주소 입력
상세주소
(주소2)
Null인 경우 정제대상에서 제외
주소정보가 아닌 경우주소정보가 아닌 가베지 데이터는 삭제
예) test 042-123-1234 등
우편번호
Null인 경우
기본 주소지로 검색하여 입력
기본 주소가 오류데이터이거나 없는 경우는
정제대상에서 제외
우편번호 표준 형식이
아닌 경우
표준 포맷 시도군 구분(3자리)+lsquo-rsquo+지역구분(3
자리)
표준 포맷이 아닌 경우는 표준 포맷으로 변경
예) 300100=gt300-100
300 100=gt300-100
300100 =gt300-100
자리 수가 6자 이하 이거나 가베지 데이터인
경우는 제거
우편번호가 old data
인 경우
현재 우편번호가 아닌 경우는 이전 우편번호
주소지를 기준으로 검색하여 입력하고 매핑되
지 않는 데이터의 경우는 삭제
인력
구분
인력
구분NA 기관명이형전거DB에 의해 매핑
최초
임용일
최초
임용일NA 날짜 오류 유형 참조
학력
사항전공
전공분야 NA 코드 오류 유형 참조
전공명 Null인 경우 정제대상에서 제외
- 36 -
구분 항목 세부항목 정제항목 오류유형 정제지침
(14
개)
전공명이 아닌 경우
가베지 데이터인 경우만 삭제하고 이외의 경
우는 정제대상에서 제외
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
취득대학
학위취득
대학코드NA 코드 오류 유형 참조
학위취득
대학명
Null인 경우
학위취득대학코드가 존재하는 경우에는 해당
학위취득대학코드의 명을 검색하여 입력하고
학위취득대학코드가 존재하지 않으면 정제대
상에서 제외
학위취득대학명이 학
위취득대학코드 내 명
칭이 아닌 경우
기관명이형전거DB의 대표기관명으로 매핑하
고 존재하지 않는 경우 신규 발급 요청하여
학위취득대학명을 유지함
학위취득대학명이 아
닌 경우
학위취득대학코드가 존재하는 경우에는 해당
학위취득대학코드의 명을 검색하여 입력하고
학위취득대학코드가 존재하지 않으면 삭제
학위 학위코드 NA 코드 오류 유형 참조입학일 입학년월 NA 날짜 오류 유형 참조졸업일 졸업년월 NA 날짜 오류 유형 참조
학과
학과코드 NA 코드 오류 유형 참조
학과명
Null인 경우 정제대상에서 제외
학과명이 학과코드내
명칭이 아닌 경우학과코드의 명으로 변경
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등
취득국가취득국가
코드NA 코드 오류 유형 참조
지도
교수명
지도
교수명
Null인 경우 정제대상에서 제외
이름이 아닌 경우 삭제하고 정제대상에서 제외
학위
논문명
최종학위
논문명1
Null인 경우 정제대상에서 제외
논문명1이 Null인경우논문제목1이 Null인 경우 논문제목2에서 이동
함
- 37 -
구분 항목 세부항목 정제항목 오류유형 정제지침
가베지 데이터인 경우
삭제
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
최종학위
논문명2
Null인 경우 정제대상에서 제외
논문명1이 Null인경우 논문제목1이 Null인 경우 논문제목1로 이동함
가베지 데이터인 경우
삭제
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터 문자열이지만 특정 문자가
반복된 데이터
학위
취득일
최종학위
취득일NA 날짜 오류 유형 정제지침 참조
경력
사항
(5개)
근무처명 근무처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
직위명
직위코드 NA 코드 오류 유형 정제지침 참조
직위명
Null인 경우 정제대상에서 제외
직위명이 직위코드내
명칭이 아닌 경우
직위명이 직위코드내 존재하지 않으면 직위명
은 그대로 유지하고 직위코드는 기타(lsquo999rsquo)로
매핑함
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
근무기간
근무
시작일NA 날짜 오류 유형 정제지침 참조
근무
종료일NA 날짜 오류 유형 정제지침 참조
자격
사항
(3개)
자격
발행처
자격
발행처
Null인 경우 정제대상에서 제외
가베지 데이터인 경우특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
- 38 -
구분 항목 세부항목 정제항목 오류유형 정제지침
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
자격증명 자격증명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
자격
취득일
자격
취득일NA 날짜 오류 유형 정제지침 참조
논문
실적
(8개)
논문
발표일
논문
발표일NA 날짜 오류 유형 정제지침 참조
국문
논문명
논문제목
국문
Null인 경우 정제대상에서 제외
필수
논문제목국문이 Null이고 논문제목영문이 Null
이 아닐 경우 논문제목영문을 논문제목국문으
로 이동시키고 논문제목영문은 Null로 갱신
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
영문
논문명
논문제목
영문
Null인 경우 정제대상에서 제외
필수
논문제목국문이 Null이고 논문제목영문이 Null
이 아닐 경우 논문제목영문을 논문제목국문으
로 이동시키고 논문제목영문은 Null로 갱신
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
저자역할
구분
저자역할
구분NA 코드 오류 유형 정제지침 참조
발행처 발행처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
- 39 -
구분 항목 세부항목 정제항목 오류유형 정제지침
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터학술지
구분
학술지구
분NA 코드 오류 유형 정제지침 참조
학술지명 학술지명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
SCI여부 SCI여부 NA 코드 오류 유형 정제지침 참조
지식
재산
권
(3개)
지식
재산권명
지식
재산권명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
출원_등
록번호
출원등록
번호
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
특허구분 특허구분 NA 코드 오류 유형 정제지침 참조
평가
위원
(13개)
소속
학협
회
현황
(5개)
담당업무 담당업무
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
직위 직위
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
- 40 -
구분 항목 세부항목 정제항목 오류유형 정제지침
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
학협회
사항
학협회명
Null인 경우 정제대상에서 제외
직위명이 포함되어 있
는 경우
직위명이 존재하지 않으면 직위명 항목에 복
사하고 직위명칭에 관련된 부분은 삭제 존재
한다면 관련 부분을 삭제
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
활동시작
일NA 날짜 오류 유형 정제지침 참조
활동종료
일NA 날짜 오류 유형 정제지침 참조
훈포
장
사항
(3개)
수상년월 수상년도 NA 날짜 오류 유형 정제지침 참조
수여
기관명
수여기관
명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
훈포장명 수상명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저역
서
실적
(5개)
저서명1 저서명1
Null인 경우 정제대상에서 제외
저서명1이 Null인 경
우저서명2를 저서명1로 저장
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저서명2 저서명2
Null인 경우 정제대상에서 제외
저서명1이 Null인 경
우저서명2를 저서명1로 저장
가베지 데이터인 경우 특수문자 숫자로만 구성되거나 그 외의 가베
- 41 -
구분 항목 세부항목 정제항목 오류유형 정제지침
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
발행년 발행년도 NA 날짜 오류 유형 정제지침 참조
발행처 발행처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저역서
구분
저역서
구분NA 코드 오류 유형 정제지침 참조
- 42 -
구분 항목 세부항목 정제항목 오류내역 정제지침
참여인력정보(11개)
소속기관사항(1개)
최초임용일최초임용일
YYYYMMDD
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
DD가 없는 경우 01일로 갱신
YYYYMMDD가 유
효하지 않은 경우
년도가 유효하면 월-gt01월 일-gt01
일로 갱신하고 년도 자체가 유효하
지 않으면 삭제
학력사항(3개)
입학일입학년월
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 03월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt03월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
졸업일졸업년월
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 02월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt02월로 갱신
하고 년도 자체가 유효하지 않으면
삭제입학년월보다 같
거나 작은 경우데이터 삭제
학위취득일
최종학위
취득일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효
하지 않은 경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
경력사항(2개)
근무기간근무시작일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
날짜로서 유효한 형태를 갖고 있지 않은 경우
- 43 -
구분 항목 세부항목 정제항목 오류내역 정제지침
제
근무종료일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
근무시작일보다
같거나 작은 경우
근무시작일에서 YYYYMM이 동일하
면 삭제하고 근무시작일에서 YYYY
은 동일하나 MM이 작을 경우에만
삭제
자격사항(1개)
자격취득일자격취득일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
논문실적(1개)
논문발표일논문발표일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효
하지 않은 경우
년도가 유효하면 월-gt01월로 갱신하고
년도자체가유효하지않으면삭제
소속학협회현황(2개)
학협회사항
활동시작일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경
우데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭제
활동종료일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하고
년도자체가 유효하지않으면 삭제
- 44 -
구분 항목 세부항목 정제항목 오류내역 정제지침
활동시작일보다
같거나 작은 경우
활동시작일에서 YYYYMM이 동일하
면 삭제하고 활동시작일에서 YYYY
은 동일하나 MM이 작을 경우에만
삭제
훈포장사항(1개)
수상년월수상년도
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 변경하고
년도자체가 유효하지않으면 삭제
평가위원(1개)
저역서실적(1개)
발행년발행년도
YYYY
Null인 경우 정제대상에서 제외
YYYY이 유효하지
않은 경우유효하지 않으면 삭제
구분 항목세부항목
정제항목 오류유형 정제지침
참여
인력
정보
(15개)
기본정보
(1개)
자택
우편번호
우편번호
기본주소
Null의 경우주소가 존재하면 주소지로 우편번호 검색
하여 우편번로를 입력(정제작업자)
우편번호와주소
정보가불일치
middot 기본 주소가 가베지 데이터가 아니고 상
세주소가 존재한다면 그대로 유지하고
가베지 데이터이면 우편번호 상 주소를
기본주소에 입력
상세주소가 존재하면서 오류 데이터가 아
닌 경우에는 기본주소의 변경은 하지 않으
며 기존의 우편번호를 주소지에 맞게 주소
검색하여 변경
소속기관
사항(4개)소속기관명
소속기관코드
소속기관명
Null인 경우 정제대상에서 제외
소속기관명만
존재하는 경우
기관명이형전거DB에서 검색하여 이형기관
코드 대표기관명으로 매핑하고 존재하지
않는 경우 신규 발급 요청하여 그대로 유
지함
시작일보다 종료일이 같거나 작은 경우 종료일을 삭제
날짜의 경우 본인의 생년월일보다 작을 수 없음
코드의 값이 정해진 범위를 벗어난 경우
- 45 -
구분 항목세부항목
정제항목 오류유형 정제지침
소속기관코드만
존재하는 경우
해당 소속기관코드를 기관명이형전거DB에
서 검색하여 소속기관명을 갱신하며 매핑
되지 않는 소속기관코드는 삭제
직위명직위코드
직위명
Null인 경우 정제대상에서 제외
직위명만 존재
하는 경우
직위명으로 동일 또는 유사한 직위코드를
검색하여 입력하고 직위코드 내 존재하지
않는 직위명칭이면 lsquo기타rsquo로 매핑
[직위코드] NTIS 직위코드 참조
직위코드만 존
재하는 경우
해당 직위코드를 NTIS 직위코드의 직위명
으로 검색하여 갱신하며 매핑되지 않는 직
위코드는 삭제
[직위코드] NTIS 직위코드 참조
기관주소 우편번호
Null의 경우
주소가 존재하면 주소지로 우편번호 검색
하여 입력
단 우편번호 내 기본주소만 가능
우편번호와 기
본주소가 불일
치
기본 주소가 가베지 데이터가 아니고 상세
주소가 존재한다면 그대로 유지하고 가베
지 데이터이면 우편번호 상 주소를 기본주
소에 입력상세주소가 존재하면서 오류 데이터가 아
닌 경우에는 기본주소의 변경은 하지 않으
며 기존의 우편번호를 주소지에 맞게 주소
검색하여 변경
인력(직업)
구분인력유형구분
Null인 경우 정제대상에서 제외인력유형구분
코드 범위를
벗어나는 경우
[인력구분코드] 대학교 연구소 산업계 기
타 등 구분코드 범위를 벗어나는 데이터는
Null로 갱신
학력사항
(5개)
전공전공코드
전공명
Null인 경우 정제대상에서 제외전공명만 존재
하는 경우
전공명으로 NTIS 전공코드를 검색하여 입
력
[전공코드] NTIS 전공코드 참조
전공코드만 존
재하는 경우
해당 전공분야코드를 NTIS 전공코드에서
전공명을 검색하여 갱신하며 매핑되지 않
는 전공코드는 삭제
[전공코드] NTIS 전공코드 참조
취득대학
학위취득대학
코드
학위취득대학명
Null인 경우 정제대상에서 제외
학위취득대학
명만 존재하는
경우
기관명이형전거DB에서 검색하여 이형기관
코드 대표기관명으로 매핑하고 존재하지
않는 경우 신규 발급 요청하여 그대로 유
지함
- 46 -
구분 항목세부항목
정제항목 오류유형 정제지침
학위취득대학
코드가 존재하
는 경우
해당 학위취득대학코드를 기관명이형전거
DB에서 검색하여 학위취득대학명을 갱신하
며 매핑되지 않는 학위취득대학코드는 삭
제
학위 학위코드
Null인 경우 정제대상에서 제외
학위코드 범위
를 벗어나는
경우
존재하는 학위코드가 NTIS 학위코드와 매
핑되는지 확인하고 멥핑되지 않는 학위코
드는 삭제
[학위코드] NTIS 학위코드 참조
학과학과코드
학과명
Null인 경우 정제대상에서 제외
학과명만 존재
하는 경우
학과명으로 동일 또는 유사한 NTIS 학과코
드를 검색하여 입력하고 NTIS 학과코드 내
존재하지 않는 학과명이면 기타 코드로 매
핑함
[학과코드] NTIS 학과코드 참조
학과코드만 존
재하는 경우
해당 학과코드를 NTIS 학과코드의 학과명
을 검색하여 갱신하며 매핑되지 않는 학과
코드는 삭제
[학과코드] NTIS 학과코드 참조
취득국가 취득국가코드
Null인 경우 정제대상에서 제외
취득국가코드
의 범위를 벗
어나는 경우
존재하는 국가코드가 NTIS 국가코드와 매
핑되는지 확인하고 멥핑되지 않는 국가코
드는 삭제
[국가코드] NTIS 국가코드 참조
경력사항
(2개)직위명
직위코드
직위명
Null인 경우 정제대상에서 제외
직위명만 존재
하는 경우
직위명으로 동일 또는 유사한 직위코드를
검색하여 입력하고 직위코드 내 존재하지
않는 직위명칭이면 lsquo기타rsquo로 매핑
[직위코드] NTIS 직위코드 참조
직위코드만 존
재하는 경우
해당 직위코드를 NTIS 직위코드의 직위명
으로 검색하여 갱신하며 매핑되지 않는 직
위코드는 삭제
[직위코드] NTIS 직위코드 참조
논문실적
(3개)
저자역할
구분저자역할구분
Null인 경우 정재 대상에서 제외
저자역할구분존재하는저자역할구분가 NTIS 저자역할구
- 47 -
구분 항목세부항목
정제항목 오류유형 정제지침
코드의 범위를
벗어나는 경우
분코드와 매핑되는지 확인하고 멥핑되지
않는 국가코드는 삭제
[역할구분코드] NTIS 저자역할구분코드 참
조
학술지
구분학술지구분
Null인 경우 정재 대상에서 제외
학술지구분코
드의 범위를
벗어나는 경우
존재하는 학술지구분코드가 NTIS 학술지
구분코드와 매핑되는지 확인하고 멥핑되지
않는 학술지구분코드는 삭제
[학술지구분코드] NTIS 저자역할구분코드
참조
SCI여부 SCI여부
Null인 경우 정재 대상에서 제외
SCI여부구분코
드의 범위를
벗어나는 경우
존재하는 SCI여부구분코드가 lsquo01 또는
02가 아닌 데이터는 Null로 갱신
[SCI여부구분코드] NTIS SCI여부구분코드
참조
지식
재산권
(1개)
특허구분 특허구분
Null인 경우 정제대상에서 제외
특허구분코드
의 범위를 벗
어나는 경우
존재하는 특허구분코드가 NTIS 특허구분
코드와 매핑되는지 확인하고 멥핑되지 않
는 특허구분코드는 삭제
[특허구분코드] NTIS 특허구분코드 참조
평가위원(1개)
저역서실적(1개)
저역서구분 저역서구분
Null인 경우 정제대상에서 제외
저역서구분코
드의 범위를
벗어나는 경우
존재하는 저역서구분코드가 NTIS 저역서
구분코드와 매핑되는지 확인하고 멥핑되지
않는 저역서구분코드는 삭제
[저역서구분코드] 1저서 2역서 中 택일
공통사항
- 매핑하고자 하는 기존 코드명(공란 및 특수문자 제거)으로 NTIS 표준 코드 內 한글코드명을 대
상으로 검색하여 동일한 코드명(11의 경우)은 시스템(SQL App 등)을 통해 미리 매핑하고 유사
한 코드명(1N의 경우)은 정제작업자가 선택한 코드로 입력하여 매핑 처리
- 코드 종류가 소수(3개 미만)인 경우 Source 데이터 내 등록되어 있는 코드 또는 코드명칭을 대
상으로 동일한 패턴별로 일괄 변환(SQL Query Excel)처리한 후 변환되지 않은 데이터는 삭제
- 코드가 가베지 데이터인 경우는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 영숫자가 아닌 특수문자로만 구성된 데이터 특정 문자가 반복된 코드와
관련되지 않은 데이터
- 48 -
구분 항목 이중등록검사항목 정제지침 비 고
참여
인력
정보
기본
정보주민등록번호()
주민등록번호가 동일한 인력데이
터가 2개 이상이면 시스템으로
추출하여 이중등록검사를 수행함
시스템 정제
소속기
관사항소속기관명()
인력별 동일한 소속기관사항 데이
터가 2개 이상이면 시스템으로
추출하여 1개만 남겨 놓고 나머지
는 오류 체크 필드에 표시함
시스템 정제
학력
사항
1 취득대학() 학위() 입학일
2 취득대학() 학위() 졸업일
3 취득대학() 학위() 전공
4 취득대학() 학위() 학과
5 취득대학() 학위() 학위취득일
인력별 동일한 학력사항 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
경력
사항
1 근무처명() 직위명 근무시작일
1 근무처명() 직위명 근무종료일
인력별 동일한 경력사항 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
논문
실적
1 논문명() 논문발표일 학술지명
2 논문명() 논문발표일 ISSN
3 논문명() ISSN 게재권집 게재
호
4 논문명() 학술지명 게재권집
게재호
인력별 동일한 논문실적 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
지식
재산권
1 출원_등록번호()
2 지식재산권명() 출원등록구분
특허구분() 출원국가
인력별 동일한 지식재산권 데이터
가 2개 이상이면 시스템으로 추
출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
시스템 정제
저역서
실적
1 ISBN
2 저역서명() 저역서구분() 발행
인력별 동일한 저역서실적 데이터
가 2개 이상이면 시스템으로 추시스템 정제
143 이중등록 유형별 정제지침
이중등록 정제 지침
- 이중등록에 대한 정제는 오류 유형 정제 및 코드 매핑 처리 후 수행함
- 이중등록에 대한 데이터는 최신 데이터를 우선으로 유지함
- 이중등록검사항목의 문자Type의 데이터는 공란제거 제거 후 이중등록검사를 수행함
- 대상데이터의 이중등록검사항목 중 1개 이상 항목이 Null인 경우 이외의 항목이 동일하
여도 이중등록 정제 대상에서 제외함
- 49 -
구분 항목 이중등록검사항목 정제지침 비 고
년 발행처출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
평가
위원
소속학
협회
현황
1 학협회명() 직위 시작일
2 학협회명() 직위 종료일
인력별 동일한 소속학협회현황
데이터가 2개 이상이면 시스템으
로 추출하여 1개만 남겨 놓고 나
머지는 오류 체크 필드에 표시함
시스템 정제
훈포장
사항훈포장명() 수상년월 수여기관명
인력별 동일한 훈포장사항 데이터
가 2개 이상이면 시스템으로 추
출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
시스템 정제
자격
사항
자격증명() 자격발행처 자격취득
일
인력별 동일한 데이터가 2개 이상
이면 시스템으로 추출하여 1개만
남겨 놓고 나머지는 오류 체크 필
드에 표시함
시스템 정제
15 데이터 정제 절차 및 작업지침
151 데이터 정제 절차
- 50 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
데이터
정제
준비
초기
데이터
구축
연계기관기반 정보취합
연계기관 인력데이터 구조(스키마 엔터티 정의)코드정보 등 통합 인력DB로의 이관을 위한 연계기관 제공 정보 취합
기관 협의 정보 제공 기반정보 분석
연계대상기관데이터 취합
통합하고자 하는 연계기관 인력데이터를 제공받아 Temp DB(연계기관데이터 구조와 동일)에등록
기관 협의 데이터제공 데이터 생성
연계기관
데이터 이관
준비
NTIS 표준 코드정보를KISTI로부터 제공받음 표준 코드 제공 코드 분석
기존 코드별 NTIS 표준코드 매핑 정의 표준코드매핑 작성
플래그성 매핑기준작성
기존 데이터에 표준 코드 반영 표준코드 매핑처리
표준 코드 적용결과 검토 데이터 확인
연계기관
데이터 분석
및 매핑계획
수립
연계기관 데이터 분석 데이터 분석 데이터 분석
연계기관 코드매핑 정의 기관 코드매핑 작성플래그성 매핑 기준 작성
테이블매핑 정의테이블 매핑정보확정
테이블 매핑(안) 작성
데이터
정제 기준
및
계획 수립
과학기술 인력정보 데이터 분석
정제 대상 RampD참여인력데이터 분석
정제 대상 항목 및 기준에 대한 정의
데이터 정제 내역검토
데이터 분석
데이터정제 내역작성
데이터 정제기준 및 절차협의
정제 대상 데이터 건수및 연계 기관 인력데이터 포함 범위 정제 항목 선정 정제 공정(정제 1차 검증 최종 확인) 확정
정제 범위 대상 확정 협의 진행
데이터 정제매뉴얼 작성
데이터정제매뉴얼구성내용
데이터정제개요및절차정의
정제대상정의및정제범위
정제항목별기준및예시
정제검증도구사용법
전환코드표
표준양식
정제매뉴얼 검토및 확정
정제매뉴얼 초안작성
상세일정계획수립
정제 량을 분석하여 투입인력대비 주월별 데이터 정제 계획대비 실적 산정
일정 검토 및 확정 일정계획 작성
152 정제 단계별 작업 지침
- 51 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
데이터 정제 작업 환경 구축
작업 환경 및작업자 구성 데이터 정제 환경 구성
작업자 모집
작업장 환경 구축(월평동)
데이터정제 작업교육실시
정제작업자 및 정제관리자를 대상으로 교육 실시 및교육결과서작성
작업자 정제작업교육 실시
데이터정제진행
정제 작업수행
데이터 정제및 검증 데이터 정제 추진결과
데이터 정제
정제결과 검증(작업자별 검증)
정제추진현황보고 실적 보고
실적 확인 및 이슈사항 협의
주별진척보고
이슈사항 및 문제점 보고
데이터정제완료
데이터 이관 및 검수
데이터 이관정제된 데이터를 작업DB에서 서비스DB 로이관
이관 확인 데이터 이관
데이터 검수(최종 확인)
RampD 참여인력 데이터(정제 결과물) 검사 (샘플링 검수)
검수(샘플링)검수 데이터 추출제공
153 항목별 정제작업 세부지침
공통사항 및 시스템정제
공통사항
1 정보유형별로 주요항목이 존재하지 않는 경우라도 기본 학력 소속기관사항은 삭제하지
않고 실적정보는 삭제 처리함
가 정보유형별로 경력정보 실적정보의 주요항목이 Null인 데이터는 삭제
나 기존데이터의 경우 학력 소속기관사항은 주요항목이 Null이지만 현황정보 제공 필드가
존재하면 유지함
학력사항 학위 전공 등 존재하면 유지
소속기관사항 우편번호 직위 등 존재하면 유지
2 코드 항목 값을 NTIS 코드정보 내 명칭으로 갱신함
가 소속기관명 학위취득대학명 학과명 전공명 직위명 등을 NTIS 표준코드로 매핑하여
코드값을 넣고 각 항목에 NTIS 코드정보 내 코드명으로 변환하여 갱신함
- 52 -
No원본데이터 정제 후
정제요령 비고코드 명 코드 명
1 한국타이어(주) AAB6793 (주)한국타이어
기관명이형전거DB에서
대표기관명과
이형기관코드로 매핑
2 연구원 B06 연구원 직위코드 매핑
3 가베지 데이터의 값을 삭제 처리함
가 정보유형별 각 항목에서 가베지 데이터에 대해 삭제 처리함
No원본데이터 정제 후
정제요령 비고데이터 데이터
1 test 가베지 처리
2 가베지 처리
3 - 가베지 처리
4 가베지 처리
5 blank 가베지 처리
6 가베지 처리
7 서울대학교 서울대학교 정제 처리
시스템정제
1 비교대상이 존재하지 않는 항목에 대해서는 시스템정제(Null처리) 한다
가 시스템정제 항목
항목 세부항목 비고소속기관 인력구분
학력사항취득국가학위
지식재산권 특허구분
저역서실적 저역서구분
논문실적저자역할구분학술지구분SCI여부
비 고
shy 날짜 데이터의 경우 생성일이 완료일보다 후에 있는 경우 생성일을 남
겨놓고 완료일 삭제
shy 년도 포맷의 경우 1900년도~현재(정제시점)을 기준으로 이전이나 이후는
Null 로 갱신
shy 날자 데이터의 경우 생년월일보다 빠른 경우는 삭제
기본정보
기본정보_주민등록번호 정제지침
1 주민등록번호가 null인 경우 정제대상에서 제외
- 53 -
2 주민등록번호가 유효하지 않은 lsquo-rsquo포함한 14자가 아닌경우 정제대상에서 제외
No원본데이터 정제 후
정제요령 비고주민번호 이름 주민번호 이름
1 090166-471ORHAN
NALCIOGLU090166-471
ORHAN
NALCIOGLU정제대상에서 제외
2 000000-1111111 홍길동 000000-1111111 홍길동 lsquo-rsquo포함 14자리는 유지
3 194912-100001F 요이치로스즈키 194912-100001F 요이치로스즈키주민번호에 영문자
포함(F) 데이터 유지
4 1234561234567 홍길동 123456-1234567 홍길동 lsquo-rsquo 추가
3 기타사항
가 주민번호에 특수문자 포함시 가베지 데이터 처리(삭제)
기본정보_성명 정제지침
1 각 항목(한글영문한자)에 맞는 데이터 값 확인
2 성명 이외의 가베지 데이터는 삭제
3 한글한자영문이름이 모두 null인 경우 데이터 유지(서비스 제외)
4 한글한자영문이름이 가베지 데이터인 경우 가베지 값 삭제 데이터 유지(서비스 제외)
5 한글한자영문 이름을 각 항목에 맞게 값을 이동(한글성명은 한글 영문성명은 영문 한
자성명은 한자)
6 한글한자영문 이름이 기업명 또는 법인명인 경우 데이터 삭제
No원본데이터 정제 후
정제요령 비고한글이름 영문이름 한글이름 영문이름
1 SK LEE SK LEE 맞는 항목으로 값을 이동
2 test -- 삭제
3홍길동
(영구참여제한자)HONG GD 홍길동 HONG GD
이름 외 가베지 데이터
삭제
영문성명이 성+이니셜은
유지
4 성진기계 기업 법인명 삭제
5 홍 길 동 HGD 홍길동 영문성명 삭제
공란 제거
기본정보_주소 우편번호 정제지침
1 우편번호와 주소 모두 null인 경우 정제대상에서 제외
2 우편번호가 표준 형식이 나닌 경우 표준 포맷으로 변경(lsquo-rsquo포함한 7자리)
- 54 -
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302230 302-230 표준 포맷으로 변경
3 우편번호는 null 이지만 주소는 존재하는 경우 주소를 검색하여 우편번호 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 대전 서구 정림동 302-230 대전 서구 정림동우편번호에서 검색하여
매핑한다
4 우편번호는 존재하나 주소가 null인 경우 우편번호에 해당하는 주소 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302-230 302-230 대전 서구 정림동우편번호에서 검색하여
기본주소까지 입력한다
5 우편번호와 주소 값이 가베지 데이터인 경우 가베지 처리
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 111-1 대구 수성구 가베지 처리
2 111 대전 서구 정림동 302-230 대전 서구 정림동
기존 가베지 우편번호
대신에 주소를 가지고
새로운 우편번호를
검색하여 매핑한다
6 우편번호 체계가 OLD 데이터인 경우 현 주소로(NTIS 우편번호체계) 검색하여 매핑
No원본데이터 정제 후
정제요령 비고우편번호 주소1 우편번호 주소
1 449-981경기도 용인시 수지읍 성복리
LG2차아파트201~208동448-981
경기 용인시 수지구 성복동
LG2차빌리지
우편번호에서 검색하여
현재 우편번호로 매핑함
7 기타사항
가 외국주소 데이터 유지 원칙
(1) 우편번호가 국내우편번호인 경우는 우편번호만 가베지 처리
(2) 기본주소에 국가명만 존재해도 데이터 유지
나 주소가 2개 이상인 경우 세부주소를 포함한 주소로 정제
다 기본주소와 상세주소 구분(우편번호 기준 원칙)
(1) 기본주소 우편번호를 검색하여 나온 해당 주소
(2) 상세주소 우편번호를 검색하여 나온 해당 주소 이외의 주소
- 55 -
No원본데이터 정제 후
정제요령 비고우편번호 주소1 주소2 우편번호 주소1 주소2
1
11 schlundt
annex columbia
mo 65211 usa
11 schlundt annex
columbia mo
65211 usa
외국주소는 유지
2 USA USA기본주소에 국가명만
존재해도 데이터 유지
3 137-764
서울 서초구
반포2동
반포주공아파트
0동 0호
137-764
서울 서초구
반포2동
반포주공아파트
0동 0호 기본주소와 상세주소 구분
기본정보_전화번호 핸드폰번호 정제지침
1 전화번호가 null인 경우 정제대상에서 제외
2 전화번호 기본포멧 유지
가 지역번호-국번-전화번호
나 +국가번호-지역번호-국번-전화번호
다 이동통신구분번호(3자리)-지역구분번호(34자리)-전화번호(4자리)
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 042)123-4567 010-1234567 042-123-4567 010-123-4567 기본포맷으로 변경
2 015-123-1234
SK(011 017) KTF(016
018) KG(109) 010(공통)
만 유지
3 +1-125-123-1234 +1-111-123-1215 +1-125-123-1234 +1-111-123-1215 외국전화번호는 유지
3 지역번호 없는 경우 주소지의 시도 지역번호를 입력
No원본데이터 정제 후
정제요령 비고자택 전화번호 주소 자택 전화번호 주소
1 6746-1234 서울 강남구 서초동 02-6746-1234 서울 강남구
서초동
주소지의 시도 지역번호를
입력
2 6746-1234 주소정보 없으므로 삭제
4 국가번호가 포함된 경우 ldquo(+)국가번호-국번-지역전화번호-전화번호ldquo 형태로 변경
No원본데이터 정제 후
정제요령 비고자택 전화번호 자택 전화번호
1 +82)02-6746-1234 +82-02-6746-1234
ldquo(+)국가번호-국번-지역전
화번호-전화번호ldquo 형태로
변경
5 전화번호 외 가베지 데이터는 삭제
- 56 -
가 텍스트 최소자릿수 미달(3자리 미만)등
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 02-64-123 010-111-111 자리수가 작으면 제거
6 데이터를 각 항목에 맞도록 이동 정제
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 010-2353-0416 042-123-0416 042-123-0416 010-2353-0416전화번호와 핸드폰 번호를
각 항목에 맞게 이동
7 기타사항
가 내선번호 및 과거지역번호 데이터 유지
나 전화번호가 2개 이상인 경우 앞의 전화번호를 우선으로 유지함
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 0431-123-1234 0431-123-1234 예전 지역번호는 유지
2 042-123-1234(100) 042-123-1234(100) 내선번호 유지
3 0431-123-1234 1235 0431-123-1234 앞의 전화번호를 우선으로
유지
기본정보_e-mail 정제지침
1 이메일 기본포멧 오류 및 내용상 무의미한 값 가베지 처리
No원본데이터 정제후
정제요령 비고e-mail e-mail
1 123123com 가베지 처리
2 1111111com 가베지 처리
3 123 가베지 처리
4 wwwkistirekr 가베지 처리
5 --- 가베지 처리
2 E-mail 2개 이상 존재 가베지 삭제 후 이상없는 값은 모두 유지
No원본데이터 정제후
정제요령 비고e-mail e-mail
1chhyangmdhanmailnet
chhyangdumcorkrrchhyangmdhanmailnet
앞의 이메일을 우선으로
유지함
2 abcdaumnet abcdaumnet이메일의 구분자가 누락된
경우 구분자 추가함
- 57 -
소속기관사항
소속기관_주소 우편번호 정제지침 ( 기본정보_주소 우편번호 정제지침 참조)
1 우편번호와 주소 모두 null인 경우 - 정제대상에서 제외
2 우편번호는 null 이지만 주소는 존재하는 경우 주소를 검색하여 우편번호 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 대전 서구 정림동 302-230 대전 서구 정림동우편번호에서 검색하여
매핑한다
3 우편번호는 존재하나 주소가 null인 경우 우편번호에 해당하는 주소 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302-230 302-230 대전 서구 정림동우편번호에서 검색하여
기본주소까지 입력한다
4 우편번호와 주소 값이 가베지 데이터인 경우 가베지 처리
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 111-1 가정교육학 가베지 처리
2 111 대전 서구 정림동 302-230 대전 서구 정림동기존 가베지 우편번호 대신에 주소를 가지고
새로운 우편번호를 검색하여 매핑한다
5 우편번호 체계가 OLD 데이터인 경우 현 주소로 검색하여 매핑
6 기타사항
가 외국주소 데이터 유지 원칙
(1)우편번호가 국내우편번호인 경우는 우편번호만 가베지 처리
(2)기본주소에 국가명만 존재해도 데이터 유지
나 주소가 2개 이상인 경우 소속기관명을 기준으로 정제(소속 기관이 소재한 주소만 유
지하고 그 외 주소는 가베지 처리)
다 기관 주소로 적합하지 않은 주소(자택주소)인 경우 유효한 주소로 정제(주소가 둘 이
상일 경우)
소속기관_사무실전화번호 팩스번호 정제지침 ( 기본정보_전화번호 핸드폰번호 정제지침 참조)
1 전화번호가 null인 경우 정제대상에서 제외
2 전화번호 기본포멧 유지
가 지역번호-국번-전화번호
- 58 -
나 +국가번호-지역번호-국번-전화번호
3 전화번호 외 가베지 데이터는 삭제
가 텍스트 최소자릿수 미달(3자리 미만)등
4 데이터를 각 항목에 맞도록 이동 정제
No원본데이터 정제 후
정제요령 비고사무실 전화번호 기본정보핸드폰 번호
1 010-2353-0416 010-2353-0416
사무실전화번호에
핸드폰번호 형태의
데이터가 있을 경우
삭제하고 기본정보의
핸드폰번호가 널일
경우에만 이동함
5 기타사항
가 내선번호 및 과거지역번호 데이터 유지
나 지역번호 누락시 주소항목에서 유추 기입(유추 불가시 널처리)
다 전화번호가 2개 이상인 경우 기존 데이터 유지
라 기준에 명시되지 않은 사항은 추후 사업주관기관과 협의하여 진행
소속기관_기관 부서명 직위 정제지침
1 기관 부서명 직위 모두 null인 경우 정제대상에서 제외
2 기관 직위는 NTIS 코드값에서 검색하여 매핑
3 인력구분은 기관명이형전거DB에 의해 자동 매핑함
No원본데이터 정제 후
정제요령 비고기관코드 기관명 기관코드 기관명
1 한국타이어(주) AAB6793 (주)한국타이어
기관명이형전거DB에서
대표기관명과
이형기관코드로 매핑
No원본데이터 정제 후
정제요령 비고직위코드 직위명 직위코드 직위명
1 교수 A01 교수NTIS 직위코드에서
검색하여 매핑한다
2 항해사 999 항해사
직위코드에 매핑되지
않으면 직위코드는 lsquo999rsquo로
매핑하고 직위명은 유지함
4 필드내 중복데이터가 존재할 경우 가베지 처리하고 각 필드와 부합하지 않는 데이터는
해당 필드로 이동
5 해당 필드내 부합되지 않는 데이터는 해당필드로 옮기고 가베지 처리
- 59 -
No원본데이터 정제 후
정제요령 비고직위코드 직위명 직위코드 직위명
1 비정규직 가베지 처리
6 기타사항
가 소속기관이 2개 이상인 경우
(1)주소 데이터를 참고하여 해당 기관명만 유지하고 이외의 데이터는 가베지 처리
(2)주소 데이터가 없는 경우에는 대학교 연구소 산업계 기타 기관 순으로 정제
나 항목별 값이 2개 이상인 경우 해당 필드에 기 입력된 값을 우선하여 유지하고 이외
의 데이터는 가베지 처리
다 기관명이형전거DB에 존재하지 않는 기관은 신규발급 요청 후 매핑
라 기준에 명시되지 않은 사항은 사업주관기관과 협의하여 진행
소속기관_최초임용일 정제지침
1 날짜 오류 유형 정제
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMMDD
No원본데이터 정제 후
정제요령 비고생년월일 최초임용일 생년월일 최초임용일
1 19500310 19451011 19500310날짜는 생년월일 보다
작을수 없으므로 삭제
2 19500310 20101010 19500310날짜는 현재보다 클수
없으므로 삭제
3 19500310 19000101 19500310 1900년 이전은 삭제
학력사항
학력사항_전공 정제지침
1 전공분야코드와 전공명 모두 null인 경우 정제대상에서 제외
2 전공명은 있으나 전공분야코드가 null인 경우 전공명을 검색하여 전공분야코드 입력
가 전공명과 정확히 일치하는 전공분야코드가 존재하는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 정보통신 D130700 정보통신 정보통신전공명과 일치하는
코드값을 매핑한다
나 전공명에 공백이 있는 경우
- 60 -
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 무기 화학 C060300 무기화학 무기화학공백제거후 일치하는
값을 찾아 매핑한다
다 정확히 일치하는 전공명이 검색되지 않는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 농생물학 F010300 농생물학 농생물근사치의코드값으로매
핑한다
2 생물 C070000 생물 생물학
3 화학전공 C060000 화학전공 화학
4 컴퓨터학과 D130000 컴퓨터학과 컴퓨터학
5 물리전공 C040000 물리전공 물리학
라 전공명이 영문일 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 Medicinal Chemistry C060519Medicinal
Chemistry의약화학
영문을 번역하여
코드값을 찾아
매핑한다
마 전공명칭의 중간에 구분기호 ( - () amp
및 등) 가 포함되어 있는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 미생물계통분류 C070901 미생물계통분류 미생물분류계통
구분기호와 낱말의
순서를 무시하고
매핑한다
2 동물학유전학 C071000 동물학유전학 동물학
구분기호를 기준으로
앞부분 부터 일치하는
순으로 매핑한다
3 병리학 폐암병리 E050000 병리학 폐암병리 병리학
4 환경생태생리 D110800 환경생태생리 환경생태
5 의약화학-약리 C060519 의약화학-약리 의약화학
6 전기공학(컴퓨터공학) D090000전기공학(컴퓨터공학
)전기공학
7 원격탐사amp지구물리 D140900 원격탐사amp지구물리 원격탐사
8 물리화학및 무기화학 C060300물리화학및
무기화학무기화학
바 상기 방법으로 매핑이 불가능한 경우
- 61 -
No
원본데이터 정제 후
코드매핑 결과 정제요령 비고학위취득대학코드
(코드값 없을경우)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 서울대학교 7006431 서울대학교 서울대학교 기관명이형전거DB를
이용하여
학위취득대학코드에는
이형기관코드
학위취득대학명에는
대표기관명을 매핑함
2 서울대학교
공과대학ZD13063 서울대학교 서울대학교
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 발사체 공력 해석 D049900 발사체 공력 해석 기타항공우주공학
전공명을 포괄하는
상위 코드값으로
매핑한다
2 SOLID
MECHANICSD020299
SOLID
MECHANICS기타고체및구조역학
사 원본데이터의 코드값이 오류인 경우(전공분야코드가 아닌 경우)
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 0160 건축공학 D150000 건축공학 건축공학
원문의 코드값을
가베지 처리 후
재매핑한다
3 전공명이 오류인 경우(전공명이 아닌 경우)
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고직위코드 직위명 직위코드 직위명
1 訣廢点뼈膀갹쳬窩 가베지 처리
2 석사학위 없음 가베지 처리
학력사항_취득대학 정제지침
기관명이형전거DB를 이용하여 학위취득대학코드 및 학위취득대학명 정제
1 학위취득대학코드와 학위취득대학명 모두 null인 경우 정제대상에서 제외
2 학위취득대학명은 존재하나 학위취득대학코드가 null인 경우 기관명이형전거DB에서 검
색하여 학위취득대학코드 입력
3 학위취득대학명 풀네임이 아닐때 학위취득대학코드가 null인 경우 - 기관명이형전거DB에
- 62 -
No
정제전 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(()내용이 모두
없을경우)
학위취득대학명학위취득대학코드
(검색코드입력)코드학위취득대학명
1 연세대학교(원주) ZD13266 연세대학교 연세대학교
기관명이형전거DB를
이용하여
학위취득대학코드에는
이형기관코드
학위취득대학명에는
대표기관명을 매핑함
No
정제전 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(기존 코드값)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 114800 서울대학교 7006431 서울대학교 서울대학교
학위취득대학명 검색
기존데이터 가베지
처리 후 검색된 코드
입력
No
정제전(표준대학명 설정) 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(표준대학명
기준설정)
학위취득대학명학위취득대학코드
(검색코드입력)학위취득대학명
1 가톨릭대학교가톨릭대학교(본
부)7001337 가톨릭대학교 가톨릭대학교
신규 발급 요청 후
코드 입력
No
정제전(개칭 외국취득대학명) 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(검색된값)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 부경대학교 부산수산대학교 7003010 부경대학교 부경대학교
인터넷
학위취득대학명
검색하여 검색된 코드
입력
2 東京大學 도쿄대학 JA0122 도쿄대학 東京大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
3 東京工業大學Tokyo Institute
of TechnologyJA0114
Tokyo Institute
of Technology東京工業大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
서 검색하여 학위취득대학코드 입력
4 기존 학위취득대학코드가 있는 경우 NTIS 코드값으로 변경
5 취득대학명 검색 후 취득대학코드가 없을 경우 학위취득대학명 신규 발급 요청 후 코드
기입
6 취득대학명이 개칭 혹은 외국취득대학명일 경우 검색해서 학위취득대학코드 기입함
- 63 -
4 早稻田大學(일본)와세다
대학JA0319 (일본)와세다 대학 早稻田大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
5 서울산업대학교 경기공업전문대학 7002623 경기공업전문대학 서울산업대학교
인터넷
학위취득대학명
검색하여 검색된 코드
입력
오탈자 정제요령
서울대하교 서울대학교 (오탈자 수정)
7 가베지값
가베지 정제요령
111ㄴㄴㄴ amp 김정구 없슴 등등 가베지 처리
8 오탈자
학력사항_학과 정제지침
1 학과코드와 학과명 모두 null인 경우 정제대상에서 제외
2 학과코드는 존재하나 학과명이 null인 경우 학과코드를 검색하여 학과명 입력
No원본데이터 정제 후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 0015 0015 가정 가정코드표에서 학과코드로
검색하여 매핑한다
3 학과명은 존재하나 학과코드가 null인 경우 학과명을 검색하여 학과코드 입력
가 학과코드표에 학과명과 정확히 일치하는 값을 찾아 매핑
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가정 0015 가정 가정코드표에서 학과명으로
검색하여 매핑한다
나 정확히 일치하는 학과명이 검색되지 않는 경우 근사값으로 매핑
- 64 -
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가축번식학번식공
학 전공명칭
전공필드가 Null인 경우
전공필드로 이동한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 건설공학대학원
박사후기9475
건설공학대학원박사
후기대학원
대학원의 경우 일치하는
값이 없으면 상위 개념으로
검색하여 매핑한다
2 이과대학
단과대학의 경우 일치값이
없으면 가베지 처리한다 -
학과명 삭제
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가정교육학 0040 가정교육학 가정교육 근사 값으로 매핑한다 유사
2 기계설계학전공 1260 기계설계학전공기계설계
기계설계학
검색값이 여러 개인 경우
일치도가 높은 값으로
매핑한다
유사
3 건축공학계열 0160 건축공학계열
건축공학
건축공학과
건축공학부
건축공학교육
일치도가 같은 여러 개의
값이 검색된 경우 글자수가
가장 적은 값으로
매핑한다
유사
일치도 높은 값을 매핑 한다하여 ldquo건축공학rdquo을 ldquo건축rdquo의 형태와 같이 학과 자체가 바뀔
수 있는 매핑을하지 않도록 주의한다
다 학과명칭의 중간에 구분기호(쉼표() 마침표() slash() and(amp) 등)가 있으면서 정확히
일치하는 학과명이 검색되지 않는 경우
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 전기 및
컴퓨터공학과0073
전기 및
컴퓨터공학과전기컴퓨터공학과
구분기호를 무시하고
매핑한다
2 생화학세포학 및
분자생물학과3240
생화학세포학 및
분자생물학과생화학
No 1의 결과가 없는 경우
구분기호를 기준으로
각각의 데이터를 검색하여
매핑한다
3 곡류과학식품공학 3715 곡류과학식품공학 식품공학구분기호를 기준으로
두번째의 값이 검색된 경우
라 학과코드가 Null 이고 학과명 필드에 전공명칭이 입력된 경우
(1) 전공필드가 Null인 경우 전공필드로 데이터를 이동하여 매핑하고 학과명 필드의 데이
터는 삭제한다
마 상기 방법으로 매핑이 불가능한 경우
- 65 -
3 요업공업 9999 요업공업 기타유사코드를 찾지 못한
경우 기타로 분류한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 명예박사 가베지 처리한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 공교 공업교육
공예교육
추정된 값이 하나일 때는
그 값으로 매핑 둘
이상이면 가베지 처리한다
2 IHE(Delft)
영문 약어의 경우 추정이
어려운 값은 가베지
처리한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 工學系硏究 가베지 처리한다
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1 추후입력 test 가베지 가베지 처리
2 미정 PH D 가베지 가베지 처리
3 기억안남 NA 가베지 가베지 처리
4 졸업시험으로 대체 null 가베지 가베지 처리
5 국문없음 no data 가베지 가베지 처리
6
공학박사(지능형
소프트웨어 전공)
or 공학사
(자동차기술사)
학위 및 기타정보 가베지 처리
7 박사 학위 가베지 처리
4 가베지 처리
가 학과명이 아닌 경우
나 약어인 경우
다 학과명인지 판단하기 난해한 한문 명칭의 경우
학력사항_학위논문명 정제지침
1 최종학위국문논문명과 최종학위영문논문명이 모두 null인 경우 정제대상에서 제외
2 논문명 필드에 기타 정보나 가베지 데이터가 존재하는 경우
- 66 -
8 영문참조 none 가베지 가베지 처리
9 aa 0 가베지 가베지 처리
10 가 x 가베지 가베지 처리
11 디지털경제학 Chemistry 학과 또는 전공정보 가베지 처리
12
학사학위시설계PR
OJECT날개2001-
gt청소년수련원테마
로 설계함
졸업 작품에 대한
정보가베지 처리
13
교회 건축물의
계획 및
설계(설계작품)
졸업 작품에 대한
정보가베지 처리
14압축기 관련
기술연수 연수 정보 가베지 처리
15
광통신 부품용
소재 연구관련
논문을 준비중임
준비중인 논문 가베지 처리
16 KISTI 영문 약어 가베지 처리
17 CFD 영문 약어 가베지 처리
18
H Atoms in
Photodissociations
and Chemical
Reactions(수소원자
의 광화학반응)
H atoms in
Phtodissociation
and Chemical
Reactions
H Atoms in
Photodissociation
s and Chemical
Reactions(수소원
자의 광화학반응)
H atoms in
Phtodissociation
and Chemical
Reactions
()안에기타정보가표
기됨
-유효데이터의표기
언어는동일하나내용
상다소의차이를보이
는경우
데이터 유지
19
김휘택김승욱김정
일서근택서정탁유
총일대퇴골
근위부의
방사선학적 형태-
정상 고관절과
대퇴골두 무혈성
괴사가 있는
고관절에서의 비교
대한정형외과학회
지
33(1)177-1851998
김휘택김승욱김
정일서근택서정
탁유총일대퇴골
근위부의
방사선학적 형태-
정상 고관절과
대퇴골두 무혈성
괴사가 있는
고관절에서의
비교
대한정형외과학회
지
33(1)177-185199
8
유효 데이터 전후에
기타 정보가 표기된
경우
데이터 유지
20
친환경
도시건축계획에
관한 연구
Oekologisch
orientierte
Stadtplanung in
Seoul
Suedkorea(독문
명)
친환경
도시건축계획에
관한 연구
Oekologisch
orientierte
Stadtplanung in
Seoul Suedkorea
국문영문논문명
필드에 모두
데이터가 있고
영문논문명 필드에
한글로 (언어)
표기가 되어 있는
경우
(언어) 부분만 가베지
처리
21
ZFS symmetry
and parameters
in MR(임시등록)
임시등록데이터의
경우가베지 처리
3 논문명의 후반부가 잘린 경우
- 67 -
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1 합성과 논문명의 남은 부분이
극히 짧음가베지 처리
2 경영통계에 관련 논문명의 남은 부분이
극히 짧음가베지 처리
3
계층구조를
이용한 문서
클러스터 제목의
자동생성 기법
cluster
계층구조를
이용한 문서
클러스터 제목의
자동생성 기법
논문명의 남은 부분이
극히 짧음(영문논문명)
영문논문명
가베지 처리
4암호화된 위상
마스크를 이용한
New visual
cryptography
method based on
optical
interference
암호화된 위상
마스크를 이용한
New visual
cryptography
method based on
optical interference
논문명이
어느정도(2단어 이상)
남아 있음(국문논문명)
데이터 유지
5
metathesis
polymerization of
~
metathesis
polymerization of
~
논문명이
어느정도(2단어 이상)
남아 있음
데이터 유지
6 보편형식On universal
forms보편형식
On universal
forms
가베지 여부를
판단하기 난해함데이터 유지
7
점성유동장내에서
의 최대양력 익형
설계
The Optimal
Design
점성유동장내에서
의 최대양력
익형 설계
The Optimal
Design
영문 논문명에
데이터의 일부 -
두단어 이상 남아 있음
데이터 유지
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문명
최종학위영문논
문명최종학위국문논문명 최종학위영문논문명
1
석사순니켈의수소
취성에미치는Fe및B
의영향에관한연구
박사기계적합금화
에의해제조된ABA
B2형금속수소화물
의전극특성에관한연
구
기계적 합금화에
의해 제조된 AB
AB2 형
금속수소화물의
전극 특성에 관한
연구
석사논문 박사논문이
동시에 입력
최종(박사)
논문명만
유지한다
2
초임계이산화탄소를
이용한 마늘로부터
지방산 추출에 관한
연구(석사)
식품저장기간을연장
할수있는기능성필름
개발을위한항균성물
질추출및흡착에관한
연구
식품저장 기간을
연장 할수있는
기능성 필름 개발을
위한 항균성 물질
추출및 흡착에 관한
연구
석사논문 추정불가
논문이 동시에 입력
후반부의
논문명만
유지한다
3
GIS를 이용한
대학캠퍼스
공간분석(석사논문)
현재 인터넷 GIS를
이용한 경관평가
논문 준비중
GIS를 이용한
대학캠퍼스
공간분석
후반부가 준비중인
논문인 경우
준비중인 논문
가베지 처리
4 논문명이 두개 이상인 경우
- 68 -
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문명
최종학위영문논
문명최종학위국문논문명 최종학위영문논문명
1
(영)A Shift-first
Strategy for
Generalized LR
Parsing
A Shift-first
Strategy for
Generalized LR
Parsing
A Shift-first
Strategy for
Generalized LR
Parsing
()안의 언어표기만
제외하고 동일한
데이터
국문논문명만
유지하고
영문논문제
삭제 처리
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1
3d 전자계에 대한
NMR 이동
계산(Theoretical
calculations of
NMR shifts for
3dⁿsystems)
3d 전자계에
대한 NMR 이동
계산
Theoretical
calculations of
NMR shifts for
3dⁿsystems
한쪽의 필드에
데이터가 모두
입력된 경우
해당 필드로 이동
3
AStudyonLandslid
eofCuttingandBank
ingSlopeKFRI
Road 林道
盛土面의
崩괴에關한硏究
AStudyonLandsli
deofCuttingandBa
nkingSlopeKFRI
Road 林道
盛土面의
崩괴에關한硏究
국문 영문 구분없이
유지함데이터 유지
9
家庭用電氣製品
の親環境設計過
程への畵像流體
計測の適用に關
する硏究(A
Study on the
Design of Home
Appliances for
Energy Saving
Using PIV)
家庭用電氣製品の
親環境設計過程へ
の畵像流體計測の
適用に關する硏究
(A Study on
the Design of
Home Appliances
for Energy
Saving Using
PIV)
한쪽의 필드에
영문과 기타외국어
논문명이 모두
입력된 경우
데이터를 구분할
기준이 없으므로
데이터를 유지하고
국문논문명 필드로
이동
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1中韓兩國外銷美國
主要商品之比較硏
중한양국
대미수출
中韓兩國外銷美國主
要商品之比較硏究
논문명 필드 내
논문의 언어를해당 필드로 이동
5 국문영문논문명이 동일하나 (언어)가 표기 되어 있는 경우
6 국문영문 필드에 데이터가 뒤섞여 있는 경우
가 국문 영문을 구분하지 않고 국문논문명은 널이 아니어야 함
나 국문논문명(필수)이 널이고 영문논문명이 널이 아닐 경우 국문논문명으로 영문논문명
을 이동
다 중국어 논문명은 명확히 구분이 되는 경우만 정제하여 영문논문명 필드로 이동 - 일문
논문명 국문 논문명과의 구분 난해
- 69 -
究(중한양국
대미수출
주요상품의
비교연구) [1991년
경영학석사 논문
중국어]
주요상품의
비교연구
표기하여 명확한
구분 가능
No원본데이터 정제 후
데이터 유형 정제요령 비고취득국가코드 취득국가코드
1 KZ NTIS 국가코드와 불일치 널처리
2 오류 데이터 널처리
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 Takashi Tsuruo PhD Takashi Tsuruo PhD
2 유영면(자동차 부품연구원) 유영면(자동차 부품연구원) (기타정보)가 표기된 경우 데이터 유지
3 신현경 김정회 (공동) 신현경 김정회 (공동) 2명 이상인 경우 데이터 유지
4高橋照男(TAKAHASHI
TERUO)
高橋照男(TAKAHASHI
TERUO)(병음)이 표기된 경우 데이터 유지
5 송지복 박사 송지복 박사
교수명 앞뒤에 호칭이 붙은 경우 데이터 유지
6 이와바교수 이와바교수
7 Dr HT Hahn Dr HT Hahn
8 ProfDr NWiberg ProfDr NWiberg
9 C S George Lee aaaaa C S George Lee지도교수명 뒤에 의미없이
알파벳이 반복 나열된 경우
반복 나열된 알파벳 가베지
처리
10J Desmaism aaaaa
DBernacheJ Desmaism DBernache
2인의 지도교수명 사이에
의미없는 알파벳의 반복이 온 경우aaaaa 를 로 치환한다
11 김해구 김해구지도교수명 전후에 의미없는
특수문자나 파자가 존재하는 경우
의미없는 문자 가베지 처리
- 단 성명이 완전하지 않은
학력사항_취득국가 정제지침
1 취득국가코드가 NTIS 코드가 아닐 경우
가 취득국가코드가 NTIS코드가 아니면 널처리함
학력사항_지도교수명 정제지침
1 Null인 경우 정제대상에서 제외
2 필드내 지도교수명 외 기타 정보가 표기된 경우
가 필드내 유효 데이터의 존재 유무만을 중요시 함 유효 데이터가 존재하는 경우 데이
터의 형식 등에 큰 의미를 두지 않음
- 70 -
상황에서 성명이 들어갈
부분에 나 특수문자가
표기된 경우 데이터 유지
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 주강 주강
이름이 정확한지 불확실한 경우올바른 데이터인지 판단이
불가능 하므로 데이터 유지
2 김양 김양
7 공란 공란
3 홍길동 홍길동
4 Hiroyuki KIDO Hiroyuki KIDO
5 DH Youn DH Youn
한국 사람인데
영어(미국식)_이니셜로 표기된
경우
데이터 유지
6 Liu Hung Wen Liu Hung Wen한국 사람인데 영어(한국식)로
표기된 경우데이터 유지
7 이인원이상수 이인원이상수 지도교수가 2인 이상인 경우의
구분기호데이터 유지
8 오정무김상돈 오정무김상돈
9 庄子哲雄 庄子哲雄
일본식 이름의 표기법 데이터 유지
10 가네꼬 준이찌 가네꼬 준이찌
11 Kajiuchi Toshio Kajiuchi Toshio
12 대림성행 대림성행
일본 한자를 한글로 표기 데이터 유지
13 장욕천선대삼 장욕천선대삼
14 목도정부 목도정부
15 불상 불상 유효 데이터 여부 판단 난해 데이터 유지
16 지반 자바 지반 자바 외국어 이름을 한글로 표기 데이터 유지
17 Luo Luo
한국 교수의 성만을 표기한
것인지 외국인 교수의 이름인지
판단 난해
데이터 유지
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 N 가베지 데이터 데이터 가베지 처리
2 NA
3 필드내 데이터가 유효 값인지 판단하기 난해한 경우
가 유효 값인가 유효하지 않은 값인가 판단 자체가 불가능한 경우가 대부분 이므로 데이
터 유지를 기본으로 함
4 필드내에 기타 정보나 가베지 데이터가 존재하는 경우
- 71 -
3 none
4 해당없음
5 알수없음
6 모름
8 김교수 호칭하는 대상이 포괄적인 경우 데이터 가베지 처리
9 농과대학 근무처 또는 전공 정보 데이터 가베지 처리
10 대학원 학위 또는 학과 정보 데이터 가베지 처리
11 교수님 직위 정보 데이터 가베지 처리
12 지도교수명 가베지 데이터 데이터 가베지 처리
11 Kajiuchi Toshio Kajiuchi Toshio
12 대림성행 대림성행 일본 한자를 한글로 표기 데이터 유지
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 19871801 198702 월(MM)이 유효하지 않은
경우 - 졸업년월02월로 갱신
2 19871301 198703 월(MM)이 유효하지 않은
경우 - 입학년월03월로 갱신
3 19871301 198701월(MM)이 유효하지 않은
경우 - 최종학위취득일01월로 갱신
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 10780301 년도(YYYY)가 유효하지
않은 경우 - 공통
데이터 가베지
처리
No 원본데이터 정제 후 오류사항 정제요령 비고
학력사항_날짜유형(입학일졸업일학위취득일)
1 기본 지침
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMM
다 날짜 데이터가 유효하지 않은 경우
(1) 년도(YYYY)가 유효하며 월(MM)이 유효하지 않는 경우 졸업월(MM)은 02로 입학월
(MM)은 03으로 그리고 최종학위취득일(MM)은 01로 갱신
(2) 년도(YYYY)가 유효하지 않은 경우 데이터 가베지 처리
(3) 년도(YYYY)의 유효 범위
rarr 졸업일 입학일 최종학위취득일 1900 lt 졸업일 입학일 최종학위취득일 lt 현재
라 MM(월)이 없는 경우 졸업년월은 02월로 입학년월은 03월로 갱신
- 72 -
졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 1987 198702 월(MM)이 없는 경우 -
졸업년월02월로 갱신
2 1987 198703 월(MM)이 없는 경우 -
입학년월03월로 갱신
3 1987 198701월(MM)이 없는 경우 -
최종학위취득일01월로 갱신
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 19820301 19820301 19820301 입학년월과 졸업년월이
동일입학년월 유지
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 0201
년도가 없음 년도로
간주하더라도 유효하지
않은 데이터
데이터 가베지
처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
1한성대학교
산업시스템공학부한성대학교 정제 정제 처리
2(주)한정화학
총무과부장(주)한정화학 부장 정제 정제 처리
3연세대학교 공과대학
화학공학전공
연세대학교
공과대학정제 정제 처리
4연합철강공업(주) 입사
(국제그룹공채)연합철강공업 정제 정제 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
마 [입학년월 gt= 졸업년월]인 경우 입학년월 유지 졸업년월 가베지 처리
바 YYYY(년도)가 없는 경우 데이터 가베지 처리 정제대상에서 제외
경력사항
경력사항_근무처명 정제지침
1 근무처명이 null인 경우 정제대상에서 제외
2 근무처명에 직위 전공값이 있는 경우
3 가베지 데이터
- 73 -
1 중학교 총무처 군복무 현역 등
가베지 데이터 가베지 처리
2 가 나 다 몰라 가베지 처리 등
3 00 제2청사 (주)ㅇㅇ건설 000공무원 등
4 111163년10년1년106866 등
5 WHO COO aaa dkff saa 등
6 미국 일본 등
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
1 日本産業技術合究所 日本産業技術合究所
오류
가베지 처리
2 고려대학교 보건대학원 역학 I 보건정보학과 고려대학교 보건대학원 정제 처리
3 환경공학 국가기술개발 선도사업 (G-7 연구환경공학 국가기술개발
선도사업 (G-7 연구가베지 처리
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 교수 A01 교수 교수직위명과 일치하는 코드값을
찾아 매핑
2 위촉연구원 B07 위촉연구원 위촉연구원
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 조교수부교수교
수A01
조교수부교수
교수교수
완전일치gt 일치도가 높은
직위명 순으로 매핑
2 시간강사연구조
교A05
시간강사연구조
교시간강사
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
4 기타
경력사항_직위명 정제지침
1 직위코드와 직위명 모두 null인 경우 정제대상에서 제외
2 직위명은 있으나 직위코드가 null인 경우 직위명 검색하여 직위코드 입력
가 직위명과 정확히 일치하는 직위코드값이 존재하는 경우
나 직위명에 직위가 복수인 경우
다 정확히 일치하는 직위명이 검색되지 않는 경우
- 74 -
1 주임교수 A01 주임교수 교수 근사치의 코드값으로 매핑
2 시간강의 A05 시간강의 시간강사
이형정의
표 첨부
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 Professor A01 Professor 교수영문을 번역하여 이형정의표에
의거 코드값을 찾아 매핑
이형정의
표 첨부
2 Research Fellow B20 Research Fellow 전문위원
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 간호사 999 간호사 기타직위명과 일치하는 코드명이
없을경우 기타코드값으로 매핑
2 계장 999 계장 기타
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 36 연구원 B06 연구원 연구원기존의 직위코드를 NTIS
직위코드로 대체
2 13 조교수 A03 조교수 조교수
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 등재 직위명은 가베지 처리
2 ㅁㅁㅁ
라 직위명이 영문일 경우
마 상기 방법으로 매핑이 불가능한 경우
3 직위명과 코드가 모두 존재하는 경우
4 직위명이 오류인 경우(직위명 가베지)
- 75 -
No NTIS코드 코드명(생성) 이형정의(원본데이터) 비고
1 A01 교수
Professor
Prof
Faculty
(대학의)Teacher
Teaching
TeachingFellowship
학장 학장보
부학장 학과주임
학과장 학부장
학생처장
대학원장대학원장보
(대학의)교직원(대학의)교원
총장부총장
2 A02 부교수
AssociateProfessor
AssociateResearchProfessor
AssociateVisitingProfessor
3 A03 조교수AssistantProf
AssistantProfessor
4 A04 전임강사FullTimeLecturer
Instructor
전문강사 전담강사
강의전임 강의전담
전임대우
5 A05 시간강사
시간강의
PartTimeLecturer
PartTimeInstructor
6 A06 강사(기타) 강의 출강
7 A10 명예교수Honorary[Emeritus]Professor
HonoraryVisitingProfessor
8 A11 석좌교수 Chair Professor
9 A12 강의교수
10 A13 겸임교수
겸직교수
adjunctprofessor
adjunctprof
AdjunctFaculty
11 A14 계약교수
12 A15 기금교수
13 A16 대우교수
14 A17 연구교수
ResearchProfessor
ResearchFaculty
FacultyResearch
teachingresearcher
15 A18 초빙교수
초청교수
InvitedProfessor
ProfessorInvite
16 A19 객원교수
Visitingfaculty
visitingprofessor
aprofessorextraordinary
17 A20 조교
조수
Tutor
Assistant
UniversityAssistant
GraduateAssistant
GraduateAssociate
Teachingfellow
TeachingAssistant
TeachingAssociate
FacultyAssociate
TA RA GRA GSRA
18 A21 대학원생박사과정
석사과정
별첨 이형정의표
- 76 -
postgraduate
19 A22 POST-DOC
연수과학자
연수연구원
포스트닥터
포닥
박사후연수
박사후과정
박사후연구원
Post-Dr
Postdoctor
postdoctoral
visitingscholar
visitingfellow
Researchassistant
ResearchAssociate
20 A23 POST_MAS
21 B01 수석연구원 Principal Research Engineer
22 B02 책임연구원
연구책임자
SeniorResearchEngineer
SeniorResearch
SeniorResearcher
SeniorResearchStaff
SeniorInvestigator
23 B03 주임연구원
연구주임
AssistantResearchEngineer
AssistantResearcher
assitantInvestigator
24 B04 전임연구원AssociateResearchEngineer
AssociateResearcher
25 B05 선임연구원 선임-연구소의
26 B06 연구원
연구소장 연구보조원
연구원보연구생
연구개발원연구조원
연구주임연구조수
연구부담당자연구자
연구실장연구보조
연구팀장연구요원
연구센터장연구부처장
연구부문장연구대리
연구단장연구연구진
연구회원연구활동
방문연구 연구수
(연구소연구원연구센터연구실의)-
실장팀장원장부원장소장부소장
선임단장그룹장본부장계장인턴
장장 등
GraduateFellow
(연구소의)-Fellow
Research
Researcher
ResearchStaff
ResearchEngineer
Investigator
27 B07 위촉연구원
VisitingResearcher
VisitingResearchEngineer
VisitingInvestigator
GuestResearcher
GuestInvestigator
28 B10 수석연구위원
29 B11 책임연구위원
30 B12 주임연구위원
31 B13 전임연구위원
32 B14 선임연구위원
33 B15 연구위원
34 B20 전문위원ResearchFellow
ReserchFellowship
35 B30 책임기술원책임기사
기술책임자
SeniorEngineer
ChiefEngineer
- 77 -
PrincipalEngineer
SeniorTechnical
36 B31 선임기술원 선임기사 선임엔지니어
37 B32 기술원
(주식회사의)-기사
엔지니어기술사
기술팀장기술센터장
기술직기술주임
기술담당기술처장
기술직사원
Engineer
Technician
TechnicalStaff
TechnologyStaff
38 C01 공무원
연구사연구관
주사주사보
보좌관기좌
기사보사무관
군무원서기관
이사관조사원
청장차관
자문관비서관
장관행정관
담당관기원
경찰분석관
서서서기보조무원
보건지소장보건소장
보건소영양사보건진료원
보건진료소장지도관
지도사보
(행정기관의)-토목급
(행정기관의)-심사관
(행정기관의)-지도원
(행정기관의)-지도사
(공공기관)-기사
(공사의)-급
39 C02 법조인
심판관변리사
재판관검찰관
변호사법무조정위원
법제이사법의관
법의학감식관
40 C03 의사
전문의전임의
전담의담당의
인턴레지던트
객원의공중보건의
수련의임상의
전공의주치의
의사보일반의
상담의인정의
지도의병원장봉직의
(병원의)-과장부장처장등
Clinician
Intern
Resident
Doctor
Attending
41 C04 교사 (초~고교의)-교원
42 C05 군인
(군관련)-교관소대장
병장교소령
소위대위
군의관의무관
군하사중위
중대장보충역
제대소령
참모의무자문관
기무사기무사보
기무관
43 D01 대표이사
CEO대표
사장법인장
President
44 D02 이사
부사장이사보이사대우
Director
viceDirector
associateDirector
VicePresident
SeniorExecutiveVicePresident
45 D03 전무SeniorManagingDirector
CFO
- 78 -
46 D04 상무 상무보
47 D05 부장
부장대리
DepartmentManager
GeneralManager
48 D06 차장
DeputyGeneralManager
DeputyDirectorGeneral
AssistantDirector
AssistantDirectorvice-chiefManager
49 D07 과장
Manager
GeneralManager
DepartmentManager
DeputyManager
50 D08 대리 Assistant Manager
51 D09 사원 회사원직원
52 999 기타
53 회원(삭제)
No원본데이터 정제 후
오류사항 정제요령 비고근무시작일 근무종료일 근무시작일 근무종료일
1 2005 2007 20050101 20070101 월 없음 월에 01 입력
No원본데이터 정제 후
오류사항 정제요령 비고생년월일 근무시작일 근무종료일 근무시작일 근무종료일
1 19500101 19000101 19400101 유효 범위 오류 삭제처리함
경력사항_날짜유형(근무시작일 근무종료일) 정제지침
1 기본 지침
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMM
다 날짜 데이터가 유효하지 않은 경우
(1) 년도(YYYY)가 유효하며 월(MM)이 유효하지 않는 경우 01로 입력
(2) 년도(YYYY)가 유효하지 않은 경우 데이터 가베지 처리
(3) 년도(YYYY)의 유효 범위
rarr 근무시작일 근무종료일 1900 lt 근무시작일 근무종료일 lt 현재
rarr 근무시작일 근무종료일 생년월일lt근무시작일 근무종료일
라 [근무시작일 gt= 근무종료일]인 경우 근무시작일 유지 근무종료일 가베지 처리
- 79 -
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1한국산업인력
관리공단
건설기계기
사1급1994-12-01
건설기계기사
1급
한국산업인
력관리공단1994-12-01 오류 해당필드로 이동
2치과의사면허
증1993-01-01 보건복지부
치과의사면허
증보건복지부 1993-01-01 오류 해당필드로 이동
3중등 2급
정교사자격증 문교부
중등 2급
정교사자격증문교부 오류 해당필드로 이동
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1워드 프로세서
2급
워드
프로세서
2급
1999-06-01워드
프로세서 2급 1999-06-01 중복 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 발행처 2004-03-01 가베지 가베지 처리
NO원본데이터(가베지) 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 111 222 0000 가베지 가베지 처리
2 상동
No원본데이터 정제 후
오류사항 정제요령 비고근무시작일 근무종료일 근무시작일 근무종료일
1 20050501 20040601 20050501 [근무시작일 gt=
근무종료일]인 경우
근무종료일 가베지
처리
자격사항
자격사항 정제지침
1 자격증명 자격발행처 자격취득일이 모두 null인 경우 정제대상에서 제외
가 자격증명값이 NULL인 경우 나머지 데이터(자격발행처 자격취득일) 모두 가베지 처
리
2 자격증명 자격발행처 자격취득일 각 필드값이 뒤바뀐 경우 처리방법
3 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값이 나올 경우 처리방법
4 자격증명 필드값이 NULL인 경우 처리방법
5 가베지값 처리방법
- 80 -
3 일본
4 없음
NO원본데이터(오탈자) 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 화공기사1급ssssssssssssss 화공기사1급
오탈자데이터 수정 및
가베지 처리
2 충북졍찰청
3 박물관amp8228미술관 정학예사 3급미술관
정학예사 3급
4초경U항공기조종사면허1111111111111
111111111111111111111증
초경량항공기
조종사면허증
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
1 1루프캐리어
이송장치
루프캐리어
이송장치1
루프캐리어
이송장치중복 가베지 처리
2 1 1019990060031101999006003
1 가베지 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
1 1특허등록 제
0290068호 가베지 가베지 처리
2 1 1313131 아자차카 가베지 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
6 기타 처리방법
지식재산권
지식재산권 정제지침
1 특허구분 출원등록번호 지식재산권명이 모두 null인 경우 정제대상에서 제외
가 지식재산권명이 NULL인 경우 나머지 데이터 모두 가베지 처리
2 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값 상이값이 나올 경우 처리방법
3 지식재산권명 필드값이 NULL 가베지값인 경우 처리방법
4 가베지값 처리방법가 출원등록번호 지식재산권명으로 볼 수 없는 데이터는 가베지 처리
- 81 -
1 3자리 이하의
숫자특허
가베지 가베지 처리
2 한국 드릴
3 완료 국제
4 미정 마바
5 이름 사아
6 출원중 파하
7 경상현 가나
8 미지정 다라
9 공개중 카타
10 미입수 혜천
NO원본데이터 정제 후
데이터 유형 정제요령 비고지식재산권명 지식재산권명
1 光微粒子の製造方法 光微粒子の製造方法 오탈자 가베지 처리
2 양자우물amp8228세선의 제작방법 양자우물amp8228세선의 제작방법 오탈자 가베지 처리
3 94-26592 94-26592 오탈자 가베지 처리
NO원본데이터 정제 후 데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 총무
아태물리학회(Associati
on of Asia-Pacific
Physical Societies)
아태물리학회(Associa
tion of Asia-Pacific
Physical Societies)
총무 오류 데이터 이동
2 ASG 없음 Member ASG Member 가베지 가베지 처리
NO원본데이터 정제 후 데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
5 기타 처리방법
소속학협회
소속학협회현황 정제지침
1 학협회명 직위 담당업무 모두 null인 경우 정제대상에서 제외
가 학협회명값이 NULL인 경우 나머지 데이터 모두 가베지 처리
2 학협회명 직위 담당업무 각 필드값이 뒤바뀐 경우
3 해당 필드에 이미 유효 값이 존재하는데 다른 필드값도 나올 경우
- 82 -
1대한병리학회
임상병리학회
대한병리학회
경남(부산)회장
대한병리학회
임상병리학회
대한병리학회
경남(부산)회장 중복 데이터 유지
명칭포함
유지
2한국자원공학회
이사 한국자원공학회 이사 오류 데이터 이동
3여성생명과학기
술포럼 회원운영위원 학술위원
여성생명과학기술
포럼운영위원 학술위원 중복 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 편집위원 가베지 가베지 처리
2 종신회원 명예회장 가베지 가베지 처리 학협회명 아님
3 회원 해당없음 가베지 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 ㄴㄴㄴ 111 eee 20 q 등
가베지 가베지 처리
2 없음 해당없슴 등재
3 화공기사 1 급 덕있으마
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 일본 학회 기타 가베지 처리
NO 원본데이터 정제 후 데이터 정제요령 비고
4 학협회명 필드값이 NULL값인 경우
5 가베지값
6 기타
훈포장사항
훈포장사항 정제지침
1 수여기관명 훈포장명이 모두 null인 경우 - 정제대상에서 제외
가 훈포장명이 NULL인 경우 나머지 데이터 모두 가베지로 처리
2 수여기관명 훈포장명 각 필드값이 뒤바뀐 경우
- 83 -
수여기관명 훈포장명 수여기관명 훈포장명 유형
1 장영실상 과학기술부 과학기술부 장영실상 오류 해당필드로 이동
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 대통령 대통령 대통령 대통령 중복 데이터 유지 대통령 상
2우수논문발표상 -
포스터 부문
우수논문발표상 -
포스터 부문
우수논문발표상 -
포스터 부문중복
데이터 가베지
처리
3 국무총리 표창 국무총리 표창 국무총리 국무총리 표창 중복데이터 가베지
처리
4 광혜학술상 광혜학술상 광혜학술상 중복데이터 가베지
처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 대한민국 정부 오류데이터 가베지
처리
훈포장명 데이터
null값
2 한국물리학회 한국물리학회 오류데이터 가베지
처리
훈포장명 데이터가
가베지값
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 222 111데이터 가베지 처리
2 회원 등재등
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 제어amp8228자동화amp8228시스템공학회 제어amp8228자동화amp8228시스템공학회오탈자
데이터 유지 수정
및 가베지 처리
파일생성 형식에
따른 오류
2 ㅈ조선대총장 조선대총장
3 해당 필드에 이미 유효 값이 존재하는데 다른 필드에서 동일값이 나올 경우
4 훈포장명 필드값이 NULL값인 경우
5 가베지값
6 기타
저역서실적
저역서실적 정제지침
- 84 -
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 3차원
인체해부도1 UBCare
3차원
인체해부도 1 UBCare 오류
해당필드로
이동
2신흥인터내
셔날
소아
청소년치과학1
소아
청소년치과학 1 신흥인터내셔날 오류
해당필드로
이동
3 動力學Engineering
Mechanics2 普文堂 動力學
Engine
ering
Mechan
ics
2 普文堂 한자명 그대로 유지
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1고분자
공학 II
고분자 공학
II1 희중당
고분자 공학
II 1 희중당 중복 가베지 처리
2 주조응고일본금속학회
[주조응고]2
반도출판
사
일본금속학회
[주조응고] 2 반도출판사 오류
해당필드로
이동
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 1
가베지전체 데이터
삭제
2물리강의(20
9쪽)일서 2 대웅
3 wjswktkdrjfo
qhdks rltnf1 생능출판사
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 Polymer Surface
Dynamics 공동저서
Polymer Surface
Dynamics 공동저서 이동 데이터 이동
2
The Handbook of
Groundwater
Engieering-지하수공학에
있어서 지리정보시스템
The Handbook of
Groundwater
Engieering-지하수공
학에 있어서
지하수공학에
있어서
지리정보시스템
The Handbook of
Groundwater Engieering중복 데이터 수정
1 국문저서명 영문저서명 저역서 구분 발행처명이 모두 null인 경우 - 정제대상에서 제외
가 국문저서명 영문저서명 둘 다 NULL인 경우 나머지 데이터 모두 가베지 처리
2 국문저서명 영문저서명 저역서구분 발행처명 각 필드값이 뒤바뀐 경우
3 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값 상이값 나올 경우
4 국문저서명 영문저서명 필드값이 NULL값이거나 가베지값인 경우
5 국문저서명이 널이고 영문저서명이 널일 아닐 경우 국문저서명으로 이동함
- 85 -
지리정보시스템
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 ㅁ 기지이전사업 기획서 YRPMPKOREA 기지이전사업 기획서 YRPMPKOREA 오자 가베지 처리
2 최신 EDICALS 최신 EDI CALS 오자 데이터 유지
3 보호 야동식물 보호 야생 동식물 오자
가능한
범위에서
수정
4 ISBN 1-59033-891-XInequality Theory and
Applications (III)
Inequality Theory and
Applications (III)가베지
가베지 처리
ISBN 필드로
이동
5 NHealth Insurance
Reform In Korea
Health Insurance
Reform In Korea가베지 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 1111 2 골든벨
가베지 가베지 처리
2
곽수동
고필옥
김무강
범문사
3 ㄷㄷㅁㅁ 1
4 (주)지학사 1 (주)지학사
6 오탈자
7 가베지 데이터
논문실적
논문실적 정제지침
1 최종학위국문논문명과 최종학위영문논문명이 모두 null인 경우 정제대상에서 제외
2 논문명 필드에 기타 정보나 가베지 데이터가 존재하는 경우
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 추후입력 가베지 가베지 처리
2 미정 가베지 가베지 처리
3 가베지 가베지 처리
- 86 -
구분 항목 세부항목 항목수단위별
가중치()
참여
인력
정보
기본정보
주민등록번호 성명 자택주소 자택
우편번호 자택전화번호 핸드폰번호
7 31
소속기관사항
소속기관명 부서명 직위명 사무실
전화번호 기관주소 최초임용일 인
력(직업)구분
7 185
학력사항
전공 취득대학 학위 입학일 졸업
일 학과 취득국가 지도교수명 학위
논문명 학위취득일
10 21
16 데이터 검수
161 데이터 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
162 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 87 -
구분 항목 세부항목 항목수단위별
가중치()
경력사항 근무처명 직위명 근무기간 3 45
자격사항 자격발행처 자격증명 자격취득일 3 25
논문실적
논문발표일 국문논문명 영문논문명
저자역할구분 발행처 학술지구분
학술지명 SCI여부
8 105
지식재산권 지식재산권명 출원_등록번호 특허구분 3 25
계 소계 41 905
평가
위원
소속학협회현황 담당업무 직위 학협회사항 3 3
훈포장사항 수상년월 수여기관명 훈포장명 3 25
저역서실적국문저서명 영문저서명 발행년 발
행처 저역서구분5 4
소계 11 95
계 52 100
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
150 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
성명 100자택주소 10자택우편번
호
20
자택전화번 10
항목별 오류율 산정 기준 정의
- 88 -
호
핸드폰번호 10E-mail 10소계 310
소속기
관사항
(7개)
소속기관명 100
부서명 05
직위명 20
사무실전화
번호
10
기관주소 30
인력(직업)구
분
10
최초임용일 10
소계 185
학력사
항
(10개)
전공 20
취득대학 100
학위 20
입학일 10
졸업일 10
학과 15
취득국가 15
지도교수명 05
학위논문명 05
학위취득일 10
소계 210
경력사
항
(3개)
근무처명 20
직위명 15
근무기간 10
소계 45
자격사
항
(3개)
자격발행처 05
자격증명 10
자격취득일 10
소계 25
논문실
적
(8개)
논문발표일 10논문명1 10
논문명2 05저자역할구
분
05
발행처 05학술지구분 05학술지명 10
SCI여부 05
소계 105
지식재
산권
지식재산권
명
10
- 89 -
(3개)
출원_등록번
호
05
특허구분 10소계 25
평가 소속학
협회현
황
(3개)
담당업무 05
위원 직위 05
(11개) 학협회사항 20
소계 30
훈포장
사항
(3개)
수상년월 10
수여기관명 05
훈포장명 10
소계 25
저역서
실적
(5개)
저역서명1 10
저역서명2 05
발행년 10
발행처 05
저역서구분 10
소계 40
계 1000
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 03
품질지표기준점수산정(데이터1
건기준)=오류유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 005
계 6개 오류유형 1
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
- 90 -
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
3000 3 055 150 000825
성명 10 2 035 100 000350자택주소 3 0 000 10 000000자택우편번
호
3 2 035 20 000233
자택전화번
호
4 0 000 10 000000
핸드폰번호 6 0 000 10 000000E-mail 9 0 000 10 000000소계 45 7 125 310 001408
소속기
관사항
(7개)
소속기관명 1000 20 100 000000부서명 80000 200 05 000000직위명 80000 200 20 000000사무실전화
번호
80000 200 10 000000
기관주소 80000 200 30 000000인력(직업)구
분
80000 200 10 000000
최초임용일 80000 200 10 000000소계 481000 1220 000 185 000000
계 1000 01
주민등록번호 한글성명 영문성명 한문성명자택우편번
호
630421-0000000 백중환Joong hwan
Baek
412220
(형식 015)
630421-0000000 백종석Baek Jong
Seok
6304210000000
(형식 015)백인열 Baek IN Youl 白寅烈 711-822
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
국가RampD참여인력 100000건 100000건 3000건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
검사물량 집계표 예시
오류율산정표 예시
검수데이터 예시
- 91 -
630421-0000000 백승호
(오기 02)백제훈
630421-0000000 백종완
630421-
(오기 02)백장선 Jangsun Baek
白壯선
(형식 015)
502-
(오기 02)
630421-0000000 백승호1213132
(오기 02)
630421-0000000 백석형
630421-0000000 백석형
품질지표별
기준점수의
합
055 035 035
데이터별 품질지표 기준 점수
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 03
품질지표기준점수산정(데이
터1건기준)=오류유형별점수
의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 005
계 6개 오류유형 1
- 92 -
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수
기관마다 다름
hurims에 각 기관별 인력관리번호와 NTIS 인력관리번호매핑표관리함
RNO 주민등록번호 필수
-포함한 14자리 일 경우만 연계함
주민등록번호는 기관마다 유일해야 하는데 특정기관은주민등록번호 1개 당 n개의 인력관리번호 존재하는 경우 있음
=gt 연계기관에 연락해서 주민번호 중복되지않게 요구해서 처리
=gt 현재는 맨 처음 해당 데이터의 인력관리번호만 유지
KOR_PSN_NM 한글성명 필수
한글성명은 처음 hurims에 insert될때만 반영하고 update될때는반영하지 않음
기관마다 실명인증을 안 하는 곳이 있기 때문에 같은주민번호인데 성명이 다른 경우가 있음
CHN_PSN_NM 한문성명(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
ENG_PSN_NM 영문이름(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
ZIP_CD 우편번호
(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
hurims에 우편번호||주소1||주소2가 널일 경우만 반영ADDR1 주소1ADDR2 주소2
HOME_TEL_NO 집전화(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
CP_NO 핸드폰번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
EMAIL E-mail(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
MSTR_CLS_CD1 부처(기관)코드1
123에 대중소의 코드를 넣는게 아니라 각각의 분류를 넣어야함
매핑정보가 없으면 반영 못함
1n으로 매핑되는 경우 처음 select 되는 최하위 분류로 매핑함
현재 ntis에는 분류명을 저장하는 필드가 없음=gt분류명은 반영안함
MSTR_CLS_NM1부처(기관)분류명1
MSTR_CLS_CD2부처(기관)분류코드2
MSTR_CLS_NM2부처(기관)분류명2
MSTR_CLS_CD3부처(기관)분류코드3
MSTR_CLS_NM3부처(기관)분류명3
17 데이터 이관
참여인력 기본정보 이관 방안
- 93 -
MP_TYPE 평가위원구분Y일 경우 평가위원 pool Db에 자동 등록함
=gt N 또는 Null일 경우 기존에 평가위원 이면 반영 안함
GENDER_DIV_CD 성별구분 없을 경우 주민번호로 판별
BDT 생년월일 없을 경우 주민번호로 판별INFO_OPEN_SLCT 정보공개구분 없을 경우 비공개로 저장
PINFO_OFR_USE_APR_YN
개인정보제공활용동의여부
N일 경우 최종수정일을 기준으로 기존 동의에서 비동의로변경함
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG 데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
HM_ID 인물ID 인물아이디는 기관에서 넣지 않아도 됨
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
ORG_NM 기관명 필수
hurims에 기관이형DB에 존재하면 대표기관명이형기관코드를 저장하고 없을 경우에는 기관명을그대로 hurims에 저장하고 정제 및 신규 발급을 통해매핑해야함
WORK_DEPT_NM 근무부서명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
POSITION_NM 직위명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
직위명으로 자동코드 매핑하고 직위코드가 없으면 기타999코드로 저장하고
직위명필드에는 연계기관의 직위명 그대로 저장함
ZIP_CD 우편번호
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
hurims에 우편번호||주소1||주소2가 널일 경우만 반영ADDR1 주소1ADDR2 주소2OFFICE_TEL_NO 사무실전화
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
중복체크 기준
- 주민등록번호(주민등록번호 성명이 없으면 반영하지 않음)
소속기관 사항 이관
- 94 -
FIRST_EMP_DT 최초임용일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MP_TYPE 인력구분기관에서 넣지 않아도 되고 기관이형DB에 의해 자동매핑됨
HOFF_DIV_CD 재직구분코드
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일경우에는 재직중으로 인정함
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장
ORD_NO 순번 필수 hurims의 순번으로 저장
DEGREE_ACQ_UNIV_NM 학위취득대학명 필수
hurims에 기관이형DB에 존재하면 대표기관명이형기관코드를 저장하고 없을 경우에는 기관명을그대로 hurims에 저장하고 정제 및 신규 발급을 통해매핑해야함
SDEPT_NM 학과명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
학과명으로 코드매핑하고 매핑안되면 학과명필드만반영함
매핑안된 학과명은 나중에 정제 작업에 의해 매핑함
MAJOR_NM 전공명 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
전공명으로 코드매핑하고 매핑안되면 전공명필드만반영함
매핑안된 전공명은 나중에 정제 작업에 의해 매핑함
GRAD_DT 졸업일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함ENT_DT 입학일 필수 날짜가 1900년 이전이거나 현재보다 크면 삭제함DEGREE_CD 학위구분 필수
ACQ_NAT_CD 취득국가코드(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
DEGREE_ACQ_DT 학위취득일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
소속기관명이 없을 경우 반영하지 않음
학력 사항 이관
- 95 -
ADVISOR_NM 지도교수명기관에서 넣지 않아도 되고 기관이형DB에 의해 자동매핑됨
KOR_THESIS_NM
학위논문제목국문
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일경우에는 재직중으로 인정함ENG_THESIS_NM
학위논문제목영문
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장
ORD_NO 순번 필수 hurims의 순번으로 저장
WORK_ORG_NM 근무처명 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
POSITION_NM 직위명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
WORK_START_DT 근무시작일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
WORK_END_DT 근무종료일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
학위취득대학명 학위가 없을 경우 반영하지 않음
경력 사항 이관
- 96 -
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
INSTIT_LST 학협회명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
POSITION_NM 직위 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용INSTIT_JOB_NM 담당업무
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
INSTIT_ACT_START_DT 학회활동시작일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
INSTIT_ACT_END_DT 학회활동종료일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
CERT_NM 자격증명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
CERT_ISSUE_ORG_NM 자격증발행처 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
CERT_ACQ_D 자격취득일 필수 중복 체크하는 기준에만 쓰임
근무처명이 없을 경우 반영하지 않음
소속 학협회 사항 이관
학협회명이 없을 경우 반영하지 않음
자격 사항 이관
- 97 -
Tinsert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
KOR_PAPER_NM 논문제목국문 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
ENG_PAPER_NM 논문제목영문
중복 체크하는 기준에만 쓰임
insert 할때만 적용
PAPER_PUB_DT 논문발표일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ROLE_SLCT 역할구분(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_ORG_NM 발행처명(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
JRNL_NM 학술지명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
JRNL_SLCT 학술지구분 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용SCI_TYPE_SLCT SCI여부
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
ISSN ISSN번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_BK 게재권집(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_ISSUE 게재호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
START_PG 시작페이지(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
END_PG 종료페이지 (최종수정일이 최신이고 널이 아님) 또는 (hurims가
자격증명이 없을 경우 반영하지 않음
논문실적 이관
- 98 -
널일)때 update에 반영CO_AUTHOR_NM 공동저자명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
PTAPP_SLCT 특허구분 필수(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PTAPP_REGIST_NO 출원등록번호 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
IPR_NM 지식재산권명 필수(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
ACQ_DT 취득일 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ACQ_SLCT 취득구분
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
공동활용항목에 없는데 널일경우 무엇으로 봐야하나(확인요)
PTAPP_REGIST_NAT_CD
출원등록국가코드
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일 경우에는 대한민국으로 자동 반영함(확인요)MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
논문명이 없을 경우 반영하지 않음
지식재산권실적 이관
- 99 -
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
TRNSWRT_SLCT 저역서구분 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
KOR_TRNSWRT_NM 국문저역서명 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
PUB_ORG_NM 발행처명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
PUB_YR 발행년도 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ISBN ISBN번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
AWARD_NM 수상명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
AWARD_ACQ_YM 수상년월 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
AWARD_GRANT_ORG_NM 수여기관 필수 중복 체크하는 기준에만 쓰임
지식재산권명 출원등록구분 특허구분 출원등록번호가 없을 경우 반영하지 않음
저역서실적 이관
저역서명 저역서구분이 없을 경우 반영하지 않음
훈포장실적 이관
- 100 -
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드 훈포장명이 없을 경우 반영하지 않음
- 101 -
2 인력정보 영문이력 입력 매뉴얼
21 개요
211 목표
연구자 이력정보 영문 번역을 통한 DB 구축(1000건)
- 영문이력 번역 대상 항목 선정
기본정보 재직기관 최종학위 경력사항 논문실적 연구실적 특허
- 영문이력정보 관리 기능 개발 및 영문이력DB 구축
- 영문이력DB에 대한 본인확인 안내메일 발송
인물정보에 대한 영문 검색서비스 제공
212 DB구축 공정
- 102 -
항 목 세 부 항 목 영문명 비고
기본(BasicInformation)
기본정보 영문성명 English Name - 한글이력정보와 공동 사용- 전문분야는lsquo08 개정 분류코드 영문명 활용
휴대전화(국가번호)
Cellular PhoneNumber
E-mail E-mail
개인홈페이지 Homepage
전문분야 전문(연구)분야 Research Field 1
Research Field 2
Research Field 3
검색키워드 전문분야명 입력
재직기관(organization)
기관명 Organization Name - 현재 재직기관사항 1개 입력
부서명 Department
직위 Job title(position)
우편번호 Postal Code
주소 Address
전화(국가번호) Telephone
팩스(국가번호) Fax
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) Degree Code
학위취득일 GraduationDate
학교명 School
전공명 Major
22 DB구축 목록 및 범위
221 DB구축대상 및 항목 정의
DB구축대상 수집된 영문 이력서 번역 및 희망자에 대한 이력정보 번역
- 수집된 이력서 번역
middot 수집된 한글이력서 반영하여 번역 수행
middot 수집된 영문이력서 입력
- 이력서 번역 대상자
middot 참여인력 또는 평가위원 서비스 대상자
middot 논문실적 경력사항 등의 데이터가 충실한 인력
DB구축 대상 항목 정의
- 103 -
경력(Career)
경력사항(CAREER)
시작년월 Start Date - 재직 경력으로 주요 경력입력 현 재직정보제외
종료년월 End Date
재직기관명 Organization Name
직위 Position(Job Title)
실적ResearchResult
논문실적(paper)
논문명 Title - 최근 5년 이내만 입력
저널명 Journal Name
게제(권)집 Volume
게제호 Number
시작페이지 Start Page
종료페이지 End Page
게제년월 Date of Publication
공동저자명 Co-Author
비고 Etc
연구실적ResearchProject
시작년월 Start Date
종료년월 End-Date
발주기관 Funding organization
참여구분(역할)-코드
Role
연구실적명 title
특허(patent)
출원등록구분-코
드
appliedregistered
출원등록번호 number
출원등록국가-코
드
National Code
특허출원명 Patent name
출원등록일자 Date
- 104 -
항 목 세 부 항 목 비고
기본(BasicInformation)
기 본정보
영문성명 - 각각 형태가 다른 영문성명을ldquoGilDong Hong 형태로 변경 필요
T
휴대전화(국가번호)
- 휴대전화를 표준형태로 변경 필요(외국 휴대전화만 국가번호 표시)middot 대한민국 010--middot 외국 +국가번호---
T
E-mail abctestcom 형태 T
개인홈페이지
입력 시 http을 제외하고 입력T
전 문분야
전문(연구)분야
- 전문분야는 lsquo08 개정 분류코드 영문명 활용
- 본인 확인에 의해 본인이 직접 선택하도록 함
- 검색키워드 필드에 전문분야명을 입력
재 직기관(organization)
기관명 - 대표기관명- 기관명이 주소정보에 포함되어 있는경우 존재
부서명 - 부서명이 주소정보에 포함되어 있는경우 존재
직위 - 여러개의 직위 존재우편번호 - 주소정보에 기관명 부서명 포함되어
있는 경우 존재- 영문우편번호DB를 이용 가능
주소
전화(국가번호)
- 전화번호를 표준형태로 변경 필요(외국 전화만 국가번호 표시)middot 대한민국 042--middot 외국 +국가번호---
T팩스(국가번호)
학력(Academiccarrer)
최 종학위(FinalDegree)
학위(코드) - 8 박사- 5 석사- 2 학사
C
학위취득일 - YYYY-MM-DD형태 D학교명 - 대표기관명전공명
경력(Career)
경 력사항(CAREER)
시작년월 - YYYY-MM형태 D종료년월 - YYYY-MM형태 D
재직기관명 - 부서명 포함직위 - 여러개의 직위 존재
실적ResearchResul
논 문실적(paper
논문명 - 영문제목 일부 존재저널명
23 데이터 분석 내역
231 세부 항목별 영문이력정보 분석
번역을 위한 영문이력정보 분석
∙ D 날짜형태변환 C 코드화 T 표준형태변환
- 105 -
t ) 게제(권)집
게제호시작페이지종료페이지게제년월 - YYYY-MM형태 D공동저자명 - 공동저자명이 구분자로 N명이상 존
재연 구실적ResearchProject
시작년월 - YYYY-MM형태 D
종료년월 - YYYY-MM형태 D발주기관참여구분(역할)-코드
A 연구책임자B 참여연구원
C
연구실적명 - 영문제목 일부 존재특허(patent)
출원등록구분
-코드C
출원등록번호출원등록국가
-코드C
특허출원명출원등록일자
- YYYY-MM-DD형태D
항 목 세 부 항 목
기본(BasicInformation)
기본정보 영문성명
휴대전화(국가번호)
개인홈페이지
전문분야 전문(연구)분야
재직기관(organization)
기관명
부서명
24 DB구축 절차 및 작업 지침
241 DB구축 지침
DB구축 내용
수집된 연구자 영문 이력서 입력을 통한 DB 구축
연구자 이력정보 영문 번역을 통한 DB 구축
DB구축 항목
DB구축 대상 항목
- 106 -
직위
우편번호
주소
전화(국가번호)
팩스(국가번호)
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드)
학위취득일
학교명
전공명
경력(Career)
경력사항(CAREER)
시작년월
종료년월
재직기관명
직위
실적ResearchResult
논문실적(paper)
논문명
저널명
게제(권)집
게제호
시작페이지
종료페이지
게제년월
공동저자명
비고
연구실적ResearchProject
시작년월
종료년월
발주기관
참여구분(역할)-코드
연구실적명
특허(patent)
출원등록구분-코드
출원등록번호
출원등록국가-코드
특허출원명
출원등록일자
- 107 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
DB구축
준비
계획 수립
번역대상자분석 번역대상자 데이터 분석 대상자 선정 분석 내역 작성
절차 협의선처리 번역 번역확인전문가검수 본인확인KISTI검수
DB구축 대상 확정
매뉴얼 작성
입력 매뉴얼 구성내용
DB구축 개요 및 절차정의
DB구축 대상정의 및 범위
입력 항목별 기준 및 예시
입력프로그램 사용법
전환 코드표
표준 양식
입력 매뉴얼 검토및 확정
입력 매뉴얼 초안작성
상세일정계획수립
입력 량을 분석하여 투입인력대비 주월별 입력 계획대비 실적 산정
일정 검토 및 확정 일정계획 작성
작업 환경구축
작업 환경 및번역자 구성 입력 환경 구성
번역자 선정
영문이력정보 관리기능 개발
입력 교육 실시
번역자를 대상으로 교육실시 및 교육결과서 작성
입력작업 교육 실시
DB구축진행
선처리번역번역확인전문가검수
선처리번역번역확인전문가검수
DB구축 추진결과번역 및 품질활동수행
추진현황보고 실적 보고실적 확인 및 이슈사항 협의
주별진척보고
이슈사항 및 문제점 보고
DB구축완료
서비스DB이관 검수및 납품
서비스DB이관
완료된 영문이력DB의서비스화 이관 확인 데이터 이관
데이터 검수(최종 확인)
영문이력 DB 검사 (샘플링 검수) 검수(샘플링)
검수 데이터 추출제공
242 DB구축 단계별 작업 지침
243 DB구축 항목별 세부지침(선처리)
공통사항
Ⅰ 공통사항
1 기존에 존재하는 영문명은 입력된 그대로 유지하되 일부 정제 필요
- 108 -
원본데이터 입력데이터 입력요령
H20 A2 H20 A2
- 서식에 의한 특수문자는 텍
스트 형태 그대로 입력함
k- iexcl k - ε
- 수식도구에 의한 특수문자는
특수문자표를 참조하여 호환되
는 경우에만 입력하고 그렇지
않으면 수식만 제외하고 입력
참고3 특수문자표
원본데이터 번역데이터 입력요령
문장의 첫 단어
이름장소 등 고유명사
직함칭호의 축약형
1인칭 주어
도시이름월요일휴일시대 등
단어의 시작글자 대문자 표기
책글노래영화제목 등
a an and at by for in
of로 시작할경우
a an and at by for in of
를 제외한 시작문자 대문자로
표기
장소를 지칭하는 고유명사
internet 등Internet 시작문자 대문자 표기
국가언어등을 지칭하는 단어
(고유명사 일반명사의 개념)시작문자 대문자 표기
교과 과목명 시작문자 소문자로 표기
외국기관명 외국대학명 논문제목 연구제목 등
2 한글영문 이외의 표기된 외국어는 그대로 유지
(단 한글영문을 일부 포함한 외국어는 번역 시행)
3 모든 항목은 좌우의 공백을 제거하고 입력
가 줄바꿈 문자나 좌우의 공백문자를 제거하고 입력
나 데이터 사이에 공백문자가 두 개 이상인 경우에는 공백문자를 한 개로 입력
4 휴대전화 및 전화번호는 대한민국의 경우에는 국가번호를 표시하지 않고 외국의 경우에
만 국가번호(+국가번호)를 표시함
5 특수문자의 입력
6 대소문자 규칙
가 번역의 경우 대소문자 표준 준수
해당 기관홈페이지에 표기되어있는 공식영문명칭의 대소문자에 따라 선처리 및 번역
단 번역 시 단어 시작글자만 대문자료 표기
- 109 -
사이트명 url 비고
NAVER 백과사전 http100navercom 기관명 홈페이지 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr기관명 홈페이지 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 기관명 검색서비스
KIS-Report httpwwwkisreportcom한국신용평가정보 기업보고서
국내일반기업 영문명 기재
KJTRANS httpwwwkjtranscokr학교 및 연구기관 분야별 검
색가능
영문표기kr httpwww영문표기kr 기관학교연구기관 검색가능
학위논문 원문 공동이용협의회 httpthesisorkr협의회 대학기관 목록
(연구 발주기관)
NDSL 연구실적 검색 httpscholarndslkrindexdo연구실적 검색 가능
(연구 발주기관)
Paper Searchnet httpwwwpapersearchnet논문 및 저널명 검색서비스
(연구 발주기관)
기관명
Ⅰ 소속기관사항(기관명) 학력사항(학교명) 경력사항(재직기관명) 연구실적(발주기관
명)
1 선처리 작업 수행 시 고려 사항
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
선처리 작업 시 기관명이 Full name 과 약어 기재를 원칙으로 함
단 약어가 존재하지 않을 경우 기재하지 않음
부서직위명을 포함하고 있을 경우 포함하여 선처리
단 소요시간이 길어질 경우 부서직위명 한글 그대로 입력)
업무명이나 업무설명이 포함된 경우 한글 그대로 입력 (추후 번역시 정제)
웹 검색 시 해당기관 홈페이지에 기재되어있는 영문을 우선순위로 선처리
웹 검색 및 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
2 기관명 웹 검색 url 목록
- 110 -
원문 번역 비고
상호명 ldquo(주)rdquo의 번역
상호명 ldquo(사)rdquo의 번역
상호명 ldquo(유)rdquo의 번역
상호명 ldquo(일)rdquo의 번역
상호명 ldquo(재)rdquo의 번역
Co LTd
Association
INC
Foundation
영국식 주식회사 표기 번역
기관명 약어의 경우
기관명(약어)
기관명
약어로 번역
Full name(약어) 번역
Full name 번역
약어가 존재하지 않을 경우
Full name만으로 번역
원문 번역 비고
((주)한일합섬Hanil Synthetic Fiber Co
Ltd
- 오탈자 정제
웹검색
원문DB의(rarr정제
(system2010)산자부과기부
(system2010)Ministry of
Commerce Industry and
EnergyMinistry of Science
and Technology
- 기관명n 괄호명칭 ()
웹검색
n개의 기관명 모두 선처리
()괄호안의 표기내용 기재
(주)부일건화(주)아해BUIL KEON WHA Co
LtdAhae Co Ltd
- 기관명n
웹검색
n개의 기관명 모두 선처리
(주)비츠로테크 공장장VITZRO TECH Co Ltd
Plant Manager
- 직위명 포함
웹검색
직위명 번역 선처리 기재
(재)전북생물산업진흥원Jeonbuk Bioindustry
Development Institute
-상호명 (재)
웹검색
해당기관 홈페이지 영문명기
검색 가능한 url은 추후 추가 가능
3 번역 시 고려사항
상호명 번역 지침
번역 시 고려사항
4 선처리 예
- 111 -
재
(캐나다) 오타와 대학교 (Canada)University of Ottawa
-괄호()
웹검색
괄호()내용 번역 선처리 기재
강원대학교 의과대학Kangwon National University
College of Medicine
-학과명
웹검색
학과명 번역 선처리 기재
국립 지바대학교(일본) National Chiba University(Japan)
-괄호()
웹검색
국립 번역 선처리 기재
괄호()내용 번역 선처리 기재
미국 Cornell대학교 Section of
Molecular Biology
USA Cornell College Section
of molecular Biology
-한글영문명
웹검색
미국 번역 선처리 기재
영문명 그대로 기재
엔에스(Natural Science Co) 공
동설립
NS(Natural Science Co
Ltd)
-괄호() 업무설명
웹검색
괄호() 영문명 그대로 유지
업무설명 ldquo공동설립rdquo 제거
웅진출판(주) 편집국 생태전집
부 - lsquo한국의 자연탐험rsquo 제작 참
여
Woongin Publications Co Ltd
Editorial ecological Colledted
Works
-부서명 업무설명
웹검색
부서명 번역 선처리 기재
업무설명 ldquolsquo한국의 자연탐험rsquo
제작참여rdquo 제거
11 국제산학연 공동기술개발지
원사업
Korea Association of Industry
Academy and Research
Institute(KAIARI) Business
support for academic-industrial
common technology
development
-괄호()
웹검색
국립 번역 선처리 기재
괄호()내용 번역 선처리 기재
기관명 코드 참조 첨부7 기관명 코드
- 112 -
사이트명 url 비고
NAVER 백과사전 http100navercom 통합 검색 서비스
NAVER 사전 httpendicnavercom 표준 영문직위 검색가능
KJTRANS httpwwwkjtranscokr학교 및 연구기관 분야별 검
색가능
영문표기kr httpwww영문표기kr 직위명 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr통합 검색 서비스
원문 번역 비고
교수 (학부장) Professor(Dean)
-직위명n 괄호() 직위명
웹 검색 및 직위표 코드참조
모두 번역 및 선처리
교학부장 겸 학과장 Dean Chair
-직위명n
웹 검색 및 직위표 코드참조
모두 번역 및 선처리
사원(전장설계부)Employee(Department of Wiring
Harness Design)
-직위명 부서명포함
웹 검색 및 직위표 코드참조
부서명 포함 번역 및 선처리
선임연구원(고주파제어시스템)Senior Researcher(High-Frequency
Wave)
-직위명 업무명
웹 검색 및 직위표 코드 참조
직위명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
직위가 n개의 경우 n개로 선처리
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당기관 홈페이지에 기재되어있는 직위 영문을 우선순위로 선처리
웹 검색 불가시 영문 직위명을 참조하여 번역
번역 작업 시 영문 직위명은 표준 영문 직위 표기에 따라 번역
웹 검색 및 영문직위표 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
2 직위명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
3 영문직위 번역 코드 참조
4 선처리 예
- 113 -
사이트명 url 비고
NAVER 백과사전 http100navercom 통합 검색 서비스
KJTRANS httpwwwkjtranscokr학교 및 전공명 검색가능
(자료실영어표현 강좌실)
영문표기kr httpwww영문표기kr 전공명 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr통합 검색 서비스
NAVER 사전 httpendicnavercom 표준 영문직위 검색가능
원문 번역 비고
전기전자전자통신공학Electrical Electronics Communications
Engineering
-전공명n
웹검색 및 코드표 참조
전공명n개 n갯수만큼 선처리
하수도 Sewerage-전공명
웹검색 및 코드표 참조
업무명 번역 및 선처리
연 구 원 ( R E S E A R C H
ASSORIATE)Research Associate
-직위명 영문명 포함 정제
웹 검색 및 직위표 코드참조
정제 AssocraterarrAssociate
괄호() 제거(동일한 영문명
전공명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
전공이 n개의 경우 n개로 선처리
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당학교 홈페이지에 기재되어있는 전공 영문을 우선순위로 선처리
웹 검색 및 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
ldquoOO학과rdquo 항목의 경우 동일한 ldquoOO학rdquo으로 선처리 번역으로 입력
동일한 한글명에 대한 학문 분야별 영문표기명이 다를 경우 표준명칭으로 선처리
2 전공명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
3 선처리 예
- 114 -
사이트명 url 비고
NDSL 논문실적 검색 httpscholarndslkrindexdo 논문검색시 저널명 발췌
과학기술학회마을httpsocietykistirekrmainht
ml학술지검색 메뉴 검색
KJTRANS httpwwwkjtranscokr 자료실
DBpiahttpwwwdbpiacokrpublicati
onview_resultasp저널명 및 논문 검색가능
구글httpwwwgooglecokr
httpscholargooglecokr저널명 및 논문 검색가능
국회도서관httpsu-libnanetgokrdlSear
chIndexphp논문 및 저널명 검색가능
휴리스틱알고리듬 Heuristuc Algorithm
-원문 정제
웹검색 및 코드표 참조
정제 ldquo알고리듬rdquorarrlsquo알고리즘ldquo
면역학(면역학) Immunology
-전공명n 괄호()명
웹검색 및 코드표 참조
괄호()명 제거(동일한용어)
19C영미시19C British and American
Poetry
-숫자영문명
웹검색 및 코드표 참조
19Crarr그대로 유지(19세기 표
현방식)
저널명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당 논문게재지 홈페이지의 영문 표기로 선처리
동일한 논문명으로 여러개의 저널명이 검색될 경우 게재권(게재호) 게재페이지 게재년
월 등을 확인후 선처리
웹 검색 시 영문명이 존재하지 않을 경우 번역
2 저널명 웹 검색 url 목록
- 115 -
NAVER 전문정보httpacademicnavercommain
nhn논문 및 저널명 검색서비스
Paper Searchnet httpwwwpapersearchnet 논문 및 저널명 검색서비스
SpringerLinkhttpwwwspringerlinkcomho
memainmpx논문 및 저널명 검색서비스
원문 번역 비고
Proc 대한조선학회 추계연구발
표회
Proc International Journal of
Naval Architecture and Ocean
Engineering(JNAOE) Fall
Conference
-원문 영문 포함 일부번역
웹검색
영문명 유지
일부번역 ldquo추계연구발표회rdquo
대한건축학회논문집제20권Journal of the Architectural
Institute of Korea
-부서명 업무설명
웹검색
부서명 번역 선처리 기재
업무설명 ldquolsquo한국의 자연탐험rsquo
제작참여rdquo 제거
대한두개안면성형외과학회Korean Cleft Palate-Craniofacial
Association
-공식 영문저널명 특수문자
웹검색
저널홈페이지에 기재된 특수
문자 포함 선처리
대한두개안면성형외과학회지
Journal of the Korean Cleft
Palate-Craniofacial Association(J
Korean Cleft Palate-Craniofac
Assoc)
-약어 저널명
웹검색
저널홈페이지에 기재된약어
선처리
대한토목학회 학술발표회 논문
집 CD-ROM
Proceedings of the Korean Society of
Civil Engineers(KSCE) Conference
Technical Journal CD-ROM
-약어 원문영문
웹검색
약어기재 영문명그대로 유지
표준
지침
Proceedings of
Journal of The 회차 Journal Name Conference 계절 년도(날짜) 개최지
예)Proceedings of
Journal of The 7th Journal Name Conference Fall 2009 09 12 Tokyo Japan
저널명
없음저널명이 없을 경우 원문 순서 그대로 번역
검색 가능한 url은 추후 추가 가능
3 선처리 예
4 저널명 번역시 표준 지침
5 저널명 번역시 유의 사항
- 116 -
원본데이터 번역데이터 입력요령
학술발표학술발표회
학술연구발표학술연구발표회
번역
Journal Name Conference 저널명 뒤에 기재
논문집요약집초록집논문
초록집 번역Proceedings of Journal Name 저널명 앞에 기재
OO학OO학회OO학회지 Journal of Journal name 저널명 앞에 기재
회차 계절 날짜 개최지OOth Journal Name Spring
2010 Seoul Korea
회차 저널명 앞에 기재
계절날짜개최지 저널명 다음
구신 저널명 선처리번역 웹으로 검색된 저널명을 기준 존재하지 않을 경우 신 저널명
6 저널명 대소문자 표기 지침
middot 단어의 첫글자 대문자 표기
244 DB구축 항목별 세부지침(번역)
기본정보
Ⅰ 영문성명
1 영문성명의 입력포맷 홍길동 =gt GilDong Hong
원본데이터 입력데이터 입력요령
HONGGILDONG
Gil-Dong Hong
Hong Gil-Dong
GilDong Hong - 영문성명 입력표준으로 변경
2 영문성명 번역시 고려사항
기존에 존재하는 영문명은 유지
논문실적의 영문명이 존재할 경우 영문명 입력
- 단 논문실적 항목의 공동저자명에 약어 축약어의 경우 영문성명은 Full name기재
번역시 로마자 표기법에 준수하여 번역
참고 로마자 표기법
- 117 -
원본데이터 입력데이터 입력요령
017)- 017-- - ldquo-rdquo구분자로 변경
+82-10-2497- 010-2497-
- 대한민국은 국가번호 제외하
고 입력
- 휴대폰구분번호 앞에 ldquo0rdquo표
시
1-11-- +1-11--- 외국의 휴대전화는 +국가번
호 붙여서 입력
011-123 입력하지 않음- 휴대전화번호가 완전하지 않
은 형태는 입력하지 않음
Ⅱ 휴대전화
1 휴대전화의 입력포맷
대한민국 휴대폰구분번호-국번-전화번호 (대한민국은 국가번호 제외하고 입력)
외국 +국가번호-휴대폰구분번호-국번-전화번호
Ⅲ E-mail
1 E-mail의 입력포맷 abctestcom
Ⅳ 개인홈페이지
1 개인홈페이지의 입력포맷 wwwhomepageurlcom (http 제외하고 입력)
2 한글 도메인의 경우 영문 도메인을 찾아 입력
Ⅴ 전문(연구)분야
1 전문(연구)분야의 코드 입력은 이력서 본인에 의해 과학기술표준분류별 전문분야를 선택
하도록 함
재직기관
Ⅰ 기관명(선처리 작업)
- 118 -
부서명 표현 항목 표현여부
Department of경력사항부서명 기재
전공명(학력사항) 삭제
College of경력사항부서명 기재
전공명(학력사항) 삭제
Ⅱ 부서명
1 번역 수행
번역 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
번역 작업 해당 기관홈페이지의 영문명을 우선순위로 번역
공식화된 영문명이 존재하지 않을 경우 부서명 참조
참조 부서명 코드
기관홈페이지 및 공식화된 영문명이 존재하지 않을 경우 번역수행
부서 영문명은 Department of 등으로 시작하며 약어 및 축약어 기재는 불가하며 모두
Full name 번역을 원칙으로 번역수행
Ⅲ 직위(선처리 작업)
Ⅳ 우편번호 주소
1 영문 우편번호DB 참조
2 주소의 기본주소와 상세주소를 합침
3 우편번호 및 영문 번역주소 검색
httpwwwkoreapostgokrservletkpppostPostInfo (우정사업본부)
4 검색된 번역 영문 주소 입력(단 기관명과 영문주소와 동일하지 않을 경우 기관명을기준)
5 존재하지 않는 상세주소의 경우 로마자 표기법에 준수하여 번역
참고 로마자 표기법
6 우편번호 입력시 웹검색과 원본이 다른 경우 원본그대로 우편번호 유지
(영문주소는 웹검색 그대로 번역 및 입력)
Ⅴ 전화 팩스
1 전화의 입력포맷
대한민국 지역번호-국번-전화번호(내선번호) lt= 대한민국은 국가번호 제외하고 입력
- 119 -
원본데이터 입력데이터 입력요령
042)- 042-- - ldquo-rdquo구분자로 변경
+82-31-2497- 031-2497-
- 대한민국은 국가번호 제외하
고 입력
- 지역번호 앞에 ldquo0rdquo 표시
1-11-- +1-11--- 외국의 전화번호는 +국가번
호 붙여서 입력
061-123 입력하지 않음- 전화번호가 완전하지 않은
형태는 입력하지 않음
02-123-1234(12) 02-123-1234(12) - 내선번호는 그대로 입력
외국 +국가번호-지역번호-국번-전화번호(내선번호)
학력사항
Ⅰ 학위취득일
1 학위취득일 입력포맷
ldquoYYYY-MM-DDrdquo 형태
Ⅱ 학교명(선처리 작업)
Ⅲ 전공명(선처리 작업)
경력사항
Ⅰ 시작년월 종료년월
1 시작년월 종료년월 입력포맷
ldquoYYYY-MMrdquo 형태
시작년월은 종료년월보다 작거나 같아야 함
- 120 -
사이트명 url 비고
NDSL 논문실적 검색 httpscholarndslkrindexdo 논문검색시 저널명 발췌
과학기술학회마을httpsocietykistirekrmainht
ml학술지검색 메뉴 검색
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr저널명 및 논문 검색가능
Ⅱ 재직기관명 직위(선처리 작업)
Ⅲ 직위(선처리 작업)
논문실적
Ⅰ 논문실적 형태
보통 논문제목 저널명 게재권 (게재호) 게재페이지 게재년월 공동저자명으로 작성
volume (Vol) ( 정기 간행물 1년분의 ) 권
issue(ISS)또는 No또는 (숫자) 게제호 예) Vol9 ISS 4 또는 v9 no4 또는 9(4)- 9
권 4호
Ⅱ 공동저자명
웹 검색을 통한 원문 출처의 번역 방식에 따라 입력
저자명과 저자명은 ldquo rdquo으로 구분자(마지막 입력 후 ldquo rdquo 입력)
번역 시 Full name으로 입력하며 로마자 표기법을 준수함
Ⅲ 논문명
1 번역 작업 수행
번역 작업 시 기존 논문 영문명은 그대로 유지하되 일부 정제 필요
웹 검색 시 해당 논문게재지 홈페이지의 영문 표기로 선처리
동일한 논문명으로 여러개의 저널명이 검색될 경우 게재권(게재호) 게재페이지 게재년
월 등을 확인 후 선처리
웹 검색 시 영문명이 존재하지 않을 경우 번역
2 논문명 웹 검색 url 목록
- 121 -
국회도서관httpsu-libnanetgokrdlSear
chIndexphp논문 및 저널명 검색가능
NAVER 전문정보httpacademicnavercommain
nhn논문 및 저널명 검색서비스
Paper Searchnet httpwwwpapersearchnet 논문 및 저널명 검색서비스
DBpiahttpwwwdbpiacokrpublicati
onview_resultasp저널명 및 논문 검색가능
SpringerLinkhttpwwwspringerlinkcomho
memainmpx논문 및 저널명 검색가능
검색 가능한 url은 추후 추가 가능
Ⅳ 저널명(선처리 작업)
연구실적
Ⅰ 시작년월 종료년월
1 시작년월 종료년월 입력포맷
ldquoYYYY-MMrdquo 형태
시작년월은 종료년월보다 작거나 같아야 함
Ⅱ 발주기관(선처리 작업)
Ⅲ 참여구분
1 참여구분 입력지침
연구책임자 참여연구원 중에서 선택하여 입력함(구분 불가능시 선택 안함)
Ⅳ 연구실적명
1 번역 작업수행
번역 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
번역 작업 시 웹검색을 통하여 정확한 연구실적명을 검색
웹 검색 시 공식화되어있는 영문을 우선순위로 번역
웹 검색 및 공식적으로 사용하는 연구실적명이 존재하지 않을 경우 번역
- 122 -
사이트명 url 비고
한국특허정보원httpwwwkiprisorkrkormai
nmainjsp국내특허실적 분야별 검색
구글 특허정보 검색서비스 httpwwwgooglecompatents해외 특허정보 검색서비스
(7백만개 이상 검색가능)
PCT 특허정보 검색서비스 httpwwwwipointpctdben PCT 특허 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 특허정보 검색서비스
사이트명 url 비고
NDSL 연구실적 검색 httpreportndslkrindexdo 연구실적 검색 가능
KJTRANS httpwwwkjtranscokr학교 및 연구기관 검색가능
(자료실영어표현 강좌실)
구글 httpwwwgooglecokr
NAVER 전문정보httpacademicnavercommain
nhn네이버 연구실적명 검색
Paper Searchnet httpwwwpapersearchnet 연구실적명 검색서비스
2 연구실적명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
특허실적
Ⅰ 출원등록구분
출원 등록 중에서 선택함
같은 특허에 대해 출원과 등록 모두 존재하면 등록정보만 입력함
출원 등록이 미구분시에는 선택하지 않음
Ⅱ 출원등록번호
특허 출원등록번호 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
Ⅲ 출원등록국가
- 123 -
사이트명 url 비고
한국특허정보원httpwwwkiprisorkrkormai
nmainjsp국내특허실적 분야별 검색
구글 특허정보 검색서비스 httpwwwgooglecompatents해외 특허정보 검색서비스
(7백만개 이상 검색가능)
PCT 특허정보 검색서비스 httpwwwwipointpctdben PCT 특허 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 특허정보 검색서비스
1 출원등록국가 입력지침
출원등록국가 코드를 찾아 입력
Ⅳ 특허출원명
1 특허출원명 번역지침
특허출원명 입력시 웹 검색을 우선으로 시행
웹 검색 후 영문명이 존재할 경우 그대로 입력
영문명이 존재하지 않을 경우 번역 시행
2 특허출원명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
Ⅴ 출원등록일자
1 출원등록일자 입력포맷
ldquoYYYY-MM-DDrdquo 형태
25 DB구축 검수
251 DB구축 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
- 자체적인 품질활동 점검표 작성등의 수행결과를 주기적으로 측정하여 품질목표를 달성
하도록 함
- 124 -
항 목 세 부 항 목 항목수 단위별가중치()
기본(BasicInformation)
기본정보 영문성명 5 15휴대전화(국가번호)E-mail개인홈페이지
전문(연구)분야-본인입력검색키워드
재직기관(organization)
기관명 7 20부서명직위우편번호
주소전화(국가번호)
검수 기준
- 에러율 전체 데이터(전체 항목 필드 기준)의 01 이하(품질목표 999)
- 에러 체크 방식 전체 데이터에서 본인확인 미완료 대상 중 무작위로 30 샘플링 하
여 검수
- lsquo10년도 10월 DB구축완료단계에 최종 검수 실시
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침
및 매뉴얼에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며
오류율 산정에서 제외함
검수방식 및 기준
- 수집된 영문이력서 원본 파일(hwp doc pdf 등)과 입력 완료된 영문이력DB를 육안검
사 함
- 오류 판단 기준은 KISTI가 작성한 DB구축 작업 지침서를 참조함
252 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 125 -
팩스(국가번호)
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) 4 15학위취득일학교명전공명
경력(Career)
경력사항(CAREER)
시작년월 4 15종료년월
재직기관명직위
실적ResearchResult
논문실적(paper)
논문명 9 15저널명게제(권)집게제호
시작페이지종료페이지게제년월공동저자명비고
연구실적ResearchProject
시작년월 5 10
종료년월발주기관참여구분(역할)-코드연구실적명
특허(patent)
출원등록구분-코드 5 10
출원등록번호
출원등록국가-코드
특허출원명출원등록일자
계 38 100
항 목 세부항목 검수대상
데이터수
오류데이터건
수
품질지표별
기준점수의 합
항목가중치
()
오류율산정
기본(BasicInformation)
기본정보(5개)
영문성명 30 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
단위별 가중치는 KISTI와 협의하여 결정함
항목별 오류율 산정 기준 정의
- 126 -
휴대전화(국가번호)
30
E-mail 30개인홈페이지
30
검색키워드
30
소계 150재직기관(o r gan ization)(7개)
기관명 40부서명 30
직위 30우편번호 10주소 30전화 (국가번호)
30
팩스(국가번호)
30
소계 200
학력(Academiccarrer)
최종학위(FinalDegree)(4개)
학위 (코드)
10
학위취득일
15
학교명 80전공명 45소계 150
경력(Career)
경력사항( C AREER)(4개)
시작년월 15
종료년월 15재직기관명
80
직위 40소계 150
실적ResearchResult
논문실적(paper)(9개)
논문명 40저널명 20
게제(권)집
20
게제호 20시작페이지
10
종료페이지
10
게제년월 10공동저자명
10
비고 10소계 150
연구실적(Researc
시작년월 15종료년월 15발주기관 20
- 127 -
hProject)(5개)
참여구분(역할 ) -코드
10
연구실적명
40
소계 100특허(patent)(5개)
출원등록구 분 - 코
드
10
출원 등록번호
20
출원등록국 가 - 코
드
35
특허 출원명
20
출원 등록일자
15
소계 100계 100
- 128 -
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형구분
오류요형별점수 비고
완전성
누락 - 코드 누락 02
품질지표기준점수산정(데이터1건기준)=오류
유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 01
유효성형식 - 패턴의 오류 02
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 02
계 6개 오류유형 1
기본정보
영문성명 휴대전화 E-mail 개인홈페이지 계
Hong Gil Dong
(형식 02)010-111- testcom
GilDong Hong+82-011-111-
(형식 02)
testcokr
(오기 02)
testcom
(오기 02)
(누락 02) 019-111_ testcokr testcokr
품질지표별
기준점수의 합04 02 02 02 1
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
국가RampD참여인력
영문이력DB
3000건 3000건 3000건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
검사물량 집계표 예시
검수데이터 예시
- 129 -
3 평가위원 데이터 최신성 유지 매뉴얼
31 최신성 유지 업무 개요
311 개요
평가위원 데이터 최신성 유지란 lsquo기 구축된 평가위원 DB 내의 각 데이터들이 가장 마지막
으로 업데이트된 시점을 기준으로 그 시점부터 현재까지의 기간 동안 누락된 대상 인력들
의 변경사항들을 해당데이터에 추가입력 및 수정해주는 것rsquo을 의미
또한 대상 인력의 변경사항 반영이외에도 기 입력된 데이터들의 내용을 검토하고 발견된
오류 및 누락정보에 대한 수정ㆍ보완 작업 역시 평가위원 데이터 최신성 유지의 일환
최신성 유지를 위해 먼저 대상 인력에 대한 정보 수집이 요구됨
- 130 -
312 최신성 유지 업무 절차
최신성 유지 업무 절차는 관리자와 담당자의 역할로 구분가능
관리자는 담당자의 업무할당 데이터 검수 업무보고 등을 수행하며 담당자는 할당된 대
상인력에 대한 데이터 수정 및 보완 작업 수행
최신성 유지 업무 절차를 순서별로 나열하면 다음과 같음
- 관리자는 대상인력에 대한 전체리스트를 작성하고 이를 각 담당자들에게 일정량씩 할당
- 담당자는 할당된 대상인력에 대한 정보를 수집하고 기 입력된 데이터와의 비교를 통해
변경사항에 대한 수정 및 추가입력
- 담당자는 대상인력에 대한 정보를 수집한 출처 및 기타 비고사항에 대한 의견 등을 작
성하여 할당량에 대한 작업 완료시 관리자에게 보고
- 관리자는 보고된 작업결과물을 취합하여 정리하고 대상인력에 대한 정보가 잘 수집되고
입력되었는지 검토하여 수정 및 보완
- 관리자는 일일별 완료된 작업 결과 및 비고사항을 작성된 양식에 따라 담당 책임자에게 보고
- 131 -
32 대상 인력(평가위원) 정보 수집 방법
대상 인력의 정보를 수집하기 위한 방법은 크게 3가지로 구분
- 대상 인력에게 이력파일 요청
- 웹검색(기관홈페이지 개인홈페이지 및 각종 포털사이트)
- 신문기사의 인사ㆍ동정 모니터링
321 대상 인력에게 이력파일 요청
E-Mail 등을 통해 대상 인력에게 본인의 데이터에 대한 직접 업데이트 또는 입력대행을
위한 이력파일의 전송 요청
정보의 수신 방법은 E-Mail 우편 등이며 가장 신뢰성 높은 정보
입력이 완료된 이력파일은 개인정보보호를 위해 별도로 보관되며 E-Mail 및 기타 인쇄
물 이외의 형태로 수신되었을 경우 반드시 출력하여 관리
입력 완료시 해당인력에게 연락하여 결과에 대한 확인 요청
322 웹검색(홈페이지 및 각종 포털사이트)
대상 인력의 가장 최신의 연락정보(전화번호 E-Mail FAX 등) 재직정보 등을 수집하기
위해 웹상에 공개되어 있는 정보를 수집하여 데이터에 반영
대상 인력의 데이터 내 소속기관사항 및 기본정보의 홈페이지 주소 등을 통하여 해당 기
관 홈페이지 및 개인 홈페이지에 접근하여 연락정보 경력정보 실적정보 등에 관한 정보
수집
이직(移職) 등으로 대상 인력의 현재 소재지 재직기관 등에 관한 정보가 누락되어 있을
시 각종 포털사이트를 활용하여 해당인력의 소재정보 수집 및 접근
인물정보제공사이트를 통해 대상 인력의 기본정보 경력정보 실적정보에 대한 수정ㆍ보
완
323 신문기사의 인사ㆍ동정 모니터링
대부분의 신문에서 주요 인물에 대한 인사ㆍ동정에 관한 정보를 매일 싣고 있음
주기적으로 인사ㆍ동정란의 모니터링을 통해 평가위원 데이터에 변경사항 반영
- 132 -
33 최신성 유지 업무 작업 지침
331 언론을 통해 발표 되는 인사동정 수정
평가위원만 해당
교육과학기술부
- 참여인력을 포함하여 인사동정 수정
- 직급은 장관 차관 국장 팀장 사무관 서기관 까지 수정
- 특히 교육과학기술부장관 제2차관 정책보좌관 국장은 꼼꼼하고 세심하게 수정할 것
332 현행화 작업 내용
수정은 기본정보 소속기관 학력사항 초중고학력 경력사항 소속학협회 논문 실적 연구
실적 저역서실적 훈포장사항 지식재산권 주요업적사항 자격사항 사진관리 등 전 항
목에 걸쳐 작업 함
해당 인물의 개인 홈페이지를 최우선으로 보고 그 다음으로 기관 홈페이지를 참고
해당 기관 홈페이지에서 정확히 알 수 없을 경우에는 코셉 조인스 로마켓 동아일보를
참고 할 것
경력사항은 경력의 년도와 날짜가 없더라도 신규 입력 함
기본정보
e-mail에서 (dot)가 아닌 (comma) 로 표기된 경우 변경
e-mail 주소가 2개일 때는 개인홈페이지에 적힌 메일주소가 우선 판단이 안 될 경우는
소속기관에서부여된 e-mail 주소로 기입
인적사항의 홈페이지정보에서 lsquohttprsquo 는 빼고 입력
소속기관
산학협력단
- 소속기관에서 제외(삭제)하고 경력사항에만 기입
- 산학협력단이 주소로 되어있는 기업은 소속기관에 그대로 두거나 기입해 줌
평가위원이 의과대학의 교수이자 병원의 교수(의사)인 경우는 소속기관을 의과 대학
의 교수로 기입하고 병원 근무사항은 경력사항에 기입
(ex 관동대학교 의과대학 정형외과학교실 교수 소속기관
관동대학교 명지병원 정형외과 전문의 경력사항)
소속기관이 대학과 병원 모두 입력되어 있는 경우 수정하지 않고 pass
소속기관은 의과대학이나 주소가 병원일 경우 수정하지 않고 pass
평가위원의 재직기관 홈페이지에서 해당 인물이 검색 되지 않을 경우
- 학교의 교수 명예교수 등은 pass
- 회사의 대표이사 회장 등은 직급은 공란으로 바꾸고 재직중으로 변경
( 대표이사 인사말 회장 인사말 등의 인물 이름이 다를 경우를 뜻함)
- 133 -
평가위원이 학sdot협회에 재직중인 경우
- 소속기관이 하나이고 학sdot협회라면 소속기관에 그대로 둠
- 소속기관이 2개 이상이고 그 중 한 곳이 학sdot협회일 때
학sdot협회를 제외한 소속기관에서 인물이 검색 되는 경우 학sdot협회 내역으로 옮김
학sdot협회를 제외한 소속기관에서 인물이 검색 되지 않고 학sdot협회에서만 검색 되는 경
우 학sdot협회를 제외한 소속기관 내역은 경력사항으로 옮김
학sdot협회를 제외한 소속기관과 학sdot협회 모두 인물이 검색 되지 않는 경우 수정하지
않고 pass
기타
- 직장주소에 집주소가 되어있으면 변경하고 집주소란에 직장주소가 되어있으면 그냥 둠
- 겸임교수직은 경력사항에 입력
소속기관에 기입된 경우 경력사항으로 이동
소속기관이 한 개이고 겸임교수일 경우 pass
- 인물의 직급이 모두 시간강사인 경우 담당자에게 인물key 전송
- 퇴직한 교수로 그 이후의 소속기관이 없는 사람은 재직여부를 lsquo퇴직rsquo으로 변경 후 저장
- 전화번호가 2개인 경우 (comma)로 구분
- 교수의 경우 학과부서 탭엔 단과대 아래의 레벨 모두 기입
(ex 생명과학부 생명공학전공 or 의학과 내과학교실)
학력사항
박사후과정(Post-Doc)은 생략 단 경력사항의 Post-Doc은 기입
논문실적
2006~2010년도 논문sdot연구실적만 입력
현재 HuRIMs에 저장된 가장 최근 년도부터 템플릿에 작업
(ex 개인홈페이지에는 2000년~2009년까지 논문사항이 입력되어있고 HuRIMs에는 2007
년 2월까지만 입력되어 있다면 2007년의 논문은 중복체크를 한 후 입력되지 않은 논문
들과 2008 2009년도 논문을 템플릿에 넣는다)
기타논문집은 학술논문으로 판단되는 것들만 기입
- 판단기준 대학 연구소 학회에서 발행한 논문들
동일한 제목으로 다른 발행처에 중복 기재된 경우
- 발행처 두 곳이 모두 학회일 때 중복하여 기입
- 발행처 두 곳이 학회amp연구소 학회amp대학 일 때 학회의 논문실적만 기입
출판중인 논문은 기재하지 않음
학회sdot협회sdot대학 등에서 발간된 저서 중 일부만 담당한 경우
- 일부 chap theme 만 담당했더라도 저역서실적에 기입
- 일부 작성한 부분의 제목이 논문의 형태를 띄고 있을 때(~에 관한 연구 고찰 등)는 논문
실적에 기입
- 134 -
훈포장사항
세계인명사전등재 내용 기입
감사장 감사패는 기입하지 않음
경력업적학협회 유형 정리
향우회 민방위 동창회 성직자협의회 등은 제외함
lsquoooo위원회rsquo가 들어가는 내용은 직급에 상관없이 업적사항으로 기입 단 기초기술 연구
회와 산업기술연구회는 정부조직이므로 경력사항에 기입
(ex 기록관리혁신전문위원회 회장 정보통신위원회 고문 rarr 업적)
위원회를 제외한 lsquo회rsquo는 직급에 상관없이 학sdot협회 활동사항으로 기입
(ex 한국원예치료협회 상임이사 한국화훼장식학회 편집위원 한국양액재배연구회 이사
한국화훼환경디자인교수연합회 이사 전국대학정보화협의회 이사 rarr 학sdot협회)
활동내역 중 자문 심의는 업적사항에 기입 단 협회 학회 연구회 등의 자문sdot심의는
학sdot협회 활동사항에 기입
활동내역 중 기업sdot학교의 고문은 경력사항에 기입
34 최신성 업무 대상
341 대상 및 범위
평가위원후보추천서비스에서 서비스 중인 평가위원 전체
평가위원 기본정보 경력정보 갱신 및 실적정보 추가입력 및 갱신
추가 입력 및 갱신을 위한 기초자료는 웹사이트에 공개된 정보 신문의 인물 동정기사
평가위원 본인이 제공하는 이력정보 임
342 검수 기준
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
- 최신성 유지 관리를 수행한 전체 데이터 중 3를 샘플링하여 출처별 내용이 최신성 유
지 관리 매뉴얼 기준으로 추가 입력 및 갱신되었는지 여부를 확인
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 135 -
구분 항목 세부항목 항목수단위별
가중치()
참여
인력
정보
기본정보
주민등록번호 성명 자택주소 자택
우편번호 자택전화번호 핸드폰번호
7 31
소속기관사항
소속기관명 부서명 직위명 사무실
전화번호 기관주소 최초임용일 인
력(직업)구분
7 185
학력사항
전공 취득대학 학위 입학일 졸업
일 학과 취득국가 지도교수명 학위
논문명 학위취득일
10 21
경력사항 근무처명 직위명 근무기간 3 45
자격사항 자격발행처 자격증명 자격취득일 3 25
논문실적
논문발표일 국문논문명 영문논문명
저자역할구분 발행처 학술지구분
학술지명 SCI여부
8 105
지식재산권 지식재산권명 출원_등록번호 특허구분 3 25
계 소계 41 905
평가
위원
소속학협회현황 담당업무 직위 학협회사항 3 3
훈포장사항 수상년월 수여기관명 훈포장명 3 25
저역서실적국문저서명 영문저서명 발행년 발
행처 저역서구분5 4
소계 11 95
계 52 100
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
343 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 136 -
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
150 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
성명 100자택주소 10자택우편번
호
20
자택전화번
호
10
핸드폰번호 10E-mail 10소계 310
소속기
관사항
(7개)
소속기관명 100
부서명 05
직위명 20
사무실전화
번호
10
기관주소 30
인력(직업)구
분
10
최초임용일 10
소계 185
학력사
항
(10개)
전공 20
취득대학 100
학위 20
입학일 10
졸업일 10
학과 15
취득국가 15
지도교수명 05
학위논문명 05
학위취득일 10
소계 210
항목별 오류율 산정 기준 정의
- 137 -
경력사
항
(3개)
근무처명 20
직위명 15
근무기간 10
소계 45
자격사
항
(3개)
자격발행처 05
자격증명 10
자격취득일 10
소계 25
논문실
적
(8개)
논문발표일 10논문명1 10
논문명2 05저자역할구
분
05
발행처 05학술지구분 05학술지명 10
SCI여부 05
소계 105
지식재
산권
(3개)
지식재산권
명
10
출원_등록번
호
05
특허구분 10소계 25
평가 소속학
협회현
황
(3개)
담당업무 05
위원 직위 05(11개) 학협회사항 20
소계 30
훈포장
사항
(3개)
수상년월 10
수여기관명 05
훈포장명 10
소계 25
저역서
실적
(5개)
저역서명1 10
저역서명2 05
발행년 10
발행처 05
저역서구분 10
소계 40
계 1000
- 138 -
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 및
출처 비교 오류03
품질지표기준점수산정(데이터1
건기준)=오류유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 맵핑 오류 005
계 6개 오류유형 1
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
3000 3 055 150 000825
성명 10 2 035 100 000350자택주소 3 0 000 10 000000
자택우편번
호
3 2 035 20 000233
자택전화번
호
4 0 000 10 000000
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
평가위원 Pool DB 23000건 23000건 690건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
출처 비교는 작업대상별 출처 리스트 참조
검사물량 집계표 예시
오류율산정표 예시
- 139 -
핸드폰번호 6 0 000 10 000000
E-mail 9 0 000 10 000000소계 45 7 125 310 001408
소속기
관사항
(7개)
소속기관명 1000 20 100 000000부서명 80000 200 05 000000직위명 80000 200 20 000000사무실전화
번호
80000 200 10 000000
기관주소 80000 200 30 000000인력(직업)구
분
80000 200 10 000000
최초임용일 80000 200 10 000000소계 481000 1220 000 185 000000
계 1000 01
주민등록번호 한글성명 영문성명 한문성명자택우편번
호
630421-0000000 백중환Joong hwan
Baek
412220
(형식 015)
630421-0000000 백종석Baek Jong
Seok
6304210000000
(형식 015)백인열 Baek IN Youl 白寅烈 711-822
630421-0000000 백승호
(오기 02)백제훈
630421-0000000 백종완
630421-
(오기 02)백장선 Jangsun Baek
白壯선
(형식 015)
502-
(오기 02)
630421-0000000 백승호1213132
(오기 02)
630421-0000000 백석형
630421-0000000 백석형
품질지표별
기준점수의
합
055 035 035
검수데이터 예시
- 140 -
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 및
출처 비교 오류03
품질지표기준점수산정(데이
터1건기준)=오류유형별점수
의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 맵핑 오류 005
계 6개 오류유형 1
데이터별 품질지표 기준 점수
35 입력 항목별 QampA (처리 방법 및 사례)
기본정보
- 정보공개여부
구 분 내 용
상황 및 질문ㆍ데이터 신규입력 시 정보공개여부 설정(공개 기본인적사항만 공
개 비공개)을 어떻게 해야 하는지
처리 방법
및 사례
- 대상인력의 입력대행요청에 의한 정보입력 시 정보공개여부는 해당인
력이 요청한 대로 설정
- 최신성 유지팀 자체 내에서 수집한 정보를 바탕으로 대상인력 데
이터를 신규생성 할 경우에는 lsquo기본인적사항만 공개rsquo로 설정
- 과학기술표준분류
구 분 내 용
상황 및 질문ㆍ데이터 입력 시 과학기술표준분류에 대한 처리는 어떻게 해야 하
는지
처리 방법
및 사례
- 과학기술표준분류는 정보관리자가 임의로 선택하거나 수정하지 않
음
- 141 -
소속기관사항
- 재직여부
번호 구 분 내 용
1
상황 및 질문
ㆍ대상인력이 이직(移職)하여 재직기관이 변경된 경우 전 재직기
관 정보의 재직여부를 퇴직으로 변경하고 현 재직기관 정보를
추가입력해야 하는지
처리 방법
및 사례
- 대상인력의 재직기관이 변경되었을 경우 전 재직기관 항목은 삭제
후 경력사항에 반영함
- 현 재직기관 정보 신규입력 후 이를 경력사항에 반영
2
상황 및 질문ㆍOO연구원에 재직중인 홍길동씨가 현재 과학기술부에서 파견근
무 중일 경우 이를 어떻게 처리해야 하는지
처리 방법
및 사례
- 먼저 원 소속인 OO연구원 소속기관사항의 재직여부에 lsquo재직중rsquo
에서 lsquo파견중rsquo으로 변경
- 또한 소속기관사항 항목을 추가시켜 파견기관인 lsquo과학기술부rsquo 직위
등의 정보 입력 후 재직여부를 lsquo재직중rsquo으로 선택
3
상황 및 질문ㆍ대상인력이 정년 등의 이유로 퇴직한 상태인 경우 소속기관사
항을 삭제해야 하는지
처리 방법
및 사례
- 대상인력이 퇴직한 상태이고 현재 다른 직업이 없는 경우 소속
기관사항은 삭제 시키지 않고 재직여부를 lsquo퇴직rsquo으로 변경
- 경력사항 항목에 퇴직일자 포함된 정보 추가
- 142 -
학력사항
- 전공명
구 분 내 용
상황 및 질문ㆍ대상인력의 학력정보를 수집하였으나 학과명만 표기 있는 경우 전
공명은 공란으로 두는지
처리 방법
및 사례
- 대상인력의 학과정보만 발견된 경우 일반적으로 전공명은 우선 학
과명과 동일하게 입력
ex) 학과명 경영학과 rarr 전공명 경영학
경력사항주요업적사항
- 경력사항주요업적사항 일반
구 분 내 용
상황 및 질문 ㆍ경력사항과 주요업적사항은 어떤 기준으로 구분하는지
처리 방법
및 사례
- 일반적으로 웹상 및 타기관 인력정보데이터를 통해 수집된 정보에
는 경력사항과 주요업적사항을 따로 구분하지 않은 경우가 대다수
- 본 시스템에서는 경력사항과 주요업적사항을 구분하여 입력
- 경력사항은 대상인력의 직업과 관련된 사항으로 구분
- 주요업적사항은 대상인력의 직업 이외의 대외적인 활동 즉 평가
자문위원 등 각종 위원활동 설계 시공 기술지도 등의 사항으로
구분
예외적으로 학위 이외의 교육과 관련된 사항은 경력사항에 입력
ex) OO대학 OO교육과정 수료이수
- 143 -
소속학협회
- 직위담당업무
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 소속학협회정보에 학회명 이외에 다른 사항이
기재되지 않은 경우 직위 및 담당업무 항목은 어떻게 처리하는지
처리 방법
및 사례
- 활동시작년월 및 학회종료년월에 관한 정보가 없을 시 이는 공란처
리하며 직위의 경우 다른 정보가 없는 경우 lsquo회원rsquo으로 입력
논문실적
- 학술지구분
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 논문실적 정보만으로 학술지구분(국내 및 국외
전문학술지 국내 및 국외 학술대회발표논문집 기타논문집)에 대
한 구분은 어떻게 하는지
처리 방법
및 사례
- 수집된 대상인력의 논문실적 정보의 상당수가 국내 및 국외 전문학
술지 및 학술대회발표논문집에 관한 구분이 되어 있지 않기 때문
에 학술지구분에 어려움을 겪을 수 있음
- 이에 대한 구분기준은 명확하게 한정짓기 어려운 부분이 있어 이
러한 경우 최신성 유지 업무 담당 책임자가 판단하여 처리하고 있
음
- 이에 대한 몇 가지 팁을 제시하자면 먼저 lsquoOO학회지rsquo lsquoJournal
ofrsquo 등의 용어가 해당정보에 삽입되어 있는 경우 대부분 전문학
술지로 구분할 수 있으며 lsquo학술대회rsquo lsquo발표대회rsquo lsquoProceeding
Conference Seminar Workshop등의 용어가 해당정보에 삽입되
어 있는 경우 이는 대부분 rsquo학술대회발표논문집으로 구분할 수 있
음
- 또한 학술대회발표논문집 중 국내와 국외의 구분은 해당 학술대회
가 열린 장소를 기준으로 함
ex) lsquoThe Internation Conference in Seoulrsquo의 경우 학술대회가 열린
장소가 대한민국의 서울이므로 국내 학술대회발표논문집으로
구분함
- 144 -
- 역할
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 논문실적 정보에 역할(단독 공동(제1) 공동(참
여) 공동(책임))이 구분되어 있지 않은 경우 이를 어떻게 처리해야
하는지
처리 방법
및 사례
- 현재 대상 인력의 연구실적과 관련하여 역할구분이 되어 있지 않은 정
보를 입력할 시 해당 연구의 특성을 고려하여 역할을 lsquo단독rsquo 혹은 lsquo공
동(제1)rsquo으로 임시 구분해 줌
- 공동저자명
구 분 내 용
상황 및 질문ㆍ수집된 대상 인력의 논문실적 정보 중 공동저자명 입력 시 10명 이
상이 넘어가는 공동저자명을 모두 넣어주어야 하는지
처리 방법
및 사례
- 공동저자명의 경우 한 연구실적에서 무수히 발생될 수 있는 공동저
자명을 일일이 입력을 해주고 있지는 않음
- 예를 들어 공동저자명이 15명일 경우 공동저자명에는 lsquo홍길동 김순희
이명수 박영희 등rsquo으로 한정시키고 전체저자수 항목에 저자를 포
함한 16명을 입력해 줌
- 논문실적 일반
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 논문실적 정보가 논문명만 있는 경우 이를 입
력해야 하는지
처리 방법
및 사례
- 대상인력의 논문실적 정보에 대한 추가 입력 기준은 아직 명확하
게 정해지지는 않은 상태
- 현재(2007년 7월 18일 기준)는 개재년월 및 논문명의 두 가지 정보 이
상이 존재할 시에만 추가입력을 해주고 있음
- 145 -
연구실적
- 연구기간
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 연구실적 정보에서 연구기간 항목이 종료년월
만 나와 있는 경우는 어떻게 처리하는지
처리 방법
및 사례
- 연구기간에 관한 정보가 종료년월만 나와 있는 경우 임시로 1년의
기간을 책정하여 시작년월을 입력
ex) lsquo2005년 8월 OO에 관한 연구rsquo라는 연구실적의 입력 시 연구기간
에서 시작년월은 2004년 9월 종료년월은 2005년 8월로 입력
- 참여구분
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 연구실적 정보에서 참여구분(연구책임자 공동연
구자)의 경우 이를 어떻게 구분하는지
처리 방법
및 사례
- 연구실적에 관한 정보에서 참여구분이 되어 있지 않은 경우에는 해
당인력의 다른 연구실적 등을 감안하여 참여구분을 하여야 하나
대상이 평가위원인 경우 lsquo연구책임자rsquo로 임시 구분하여 줌
지식재산권
- 취득구분
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 지식재산권 정보에서 취득구분(출원 등록)이
구분되어 있지 않은 경우 어떻게 처리하는지
처리 방법
및 사례
- 수집된 지식재산권 정보에서 취득구분이 되어 있지 않은 경우 임
시로 lsquo등록rsquo으로 선택하여 입력
- 특허구분
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 지식재산권 정보에서 특허구분(특허 실용신안
의장 상표 소프트웨어)이 구분되어 있지 않은 경우 어떻게 처리
하는지처리 방법
및 사례
- 수집된 지식재산권 정보에서 특허구분이 되어 있지 않은 경우 임
시로 lsquo특허rsquo로 선택하여 입력
- 146 -
첨부1 NTIS 코드 표준
NTIS 표준코드
정보공개구분
코드값 코드값 의미
1 공개
2 기본인적사항만공개3 비공개
인력(직업)구분
코드값 코드값 의미
1 대학교2 연구소
3 산업계9 기타
소속구분코드
코드값 코드값 의미
1 재직중2 퇴직
3 해외연수6 파견중
학위코드
코드값 코드값 의미
2 학사이하5 석사
7 박사수료8 박사
- 147 -
학술지구분
코드값 코드값 의미 비고
01 국외전문학술지 발표 학술지가 국외전문학술지에 게재
02 국외학술대회발표논문집 발표 학술지가 국외학술대회발표논문집에 게재
03 국내전문학술지 발표 학술지가 국내전문학술지에 게재
04 국내학술대회발표논문집 발표 학술지가 국내학술대회발표논문집에 게재
05 기타논문집 발표 학술지가 기타논문집에 게재
역할구분
코드값 코드값 의미
1 단독2 공동제1 주저자3 공저자4 교신(책임)저자
참여구분
코드값 코드값 의미
A 연구책임자B 참여연구원
저역서구분
코드값 코드값 의미
1 저서2 역서
발행지구분
코드값 코드값 의미
1 국내2 국외
취득구분
코드값 코드값 의미
01 특허출원02 특허등록
- 148 -
코드값 코드값 의미
9511 조경middot지역시스템공학부
특허구분
코드값 코드값 의미 비고
01 특허 산업재산권이 특허에 해당하는 경우
02 실용신안 산업재산권이 실용신안에 해당하는 경우
03 디자인 산업재산권이 디자인에 해당하는 경우
04 상표 산업재산권이 상표에 해당하는 경우
05 기타 산업재산권이 기타에 해당하는 경우06 프로그램(SW) 산업재산권이 프로그램에에 해당하는 경우07 저작권 산업재산권이 저작권에 해당하는 경우08 신기술 인증 산업재산권이 신기술 인증에 해당하는 경우09 신제품 인증 산업재산권이 신제품 인증에 해당하는 경우10 국제출원(PCT) 산업재산권이 국제출원(PCT)에 해당하는 경우11 서비스 산업재산권이 서비스에 해당하는 경우
업적구분
코드값 코드값 의미
1 평가위원
2 위원회활동3 자문4 설계5 시공6 기술지도9 기타
기관코드(기관명이형전거DB)
코드값 코드값 의미
ZE02400 엘에스엠트론(주)ZE02378 (주)지앤시바이오ZE02376 (주)하나아이엔씨ZE02374 센게이지러닝코리아(주)ZE02373 (주)루켄테크놀러지스ZE02372 (주)디투알컨설팅
ZE02367 (주)대흥이엔지ZE02366 (사)한국벤처산업연구원ZE02365 CSG(주)ZE02364 국제상사(주)전자기술연구소
학과코드
- 149 -
9510 생물정보학과
9509 나노과학기술학부9508 지능기계공학과9507 생명과학기술학부9506 의과학과9505 부동산정보9495 보건정보관리
9999 기타9475 대학원
코드값 코드값 의미 코드값 코드값 의미
A01 교수 B32 기술원A02 부교수 C01 공무원A03 조교수 C02 법조인A04 전임강사 C03 의사
A05 시간강사 C04 교사A06 강사(기타) C05 군인A10 명예교수 D01 대표이사A11 석좌교수 D02 이사A12 강의교수 D03 전무A13 겸임교수 D04 상무
A14 계약교수 D05 부장A15 기금교수 D06 차장A16 대우교수 D07 과장A17 연구교수 D08 대리A18 초빙교수 D09 사원A19 객원교수 D10 부사장
A20 조교 D11 상임이사A21 대학원생 Z01 위원A22 POST-DOC Z02 의원A23 POST_MAS Z03 실장A24 초청교수 Z04 학과장A25 외래교수 Z05 주임
B01 수석연구원 Z06 단장B02 책임연구원 Z07 팀장B03 주임연구원 Z08 회장B04 전임연구원 Z09 본부장B05 선임연구원 Z10 처장B06 연구원 Z11 학장
B07 위촉연구원 Z12 센터장B10 수석연구위원 Z13 소장B11 책임연구위원 Z14 부처장B12 주임연구위원 Z15 국장B13 전임연구위원 Z16 연구주임
직위코드
- 150 -
B14 선임연구위원 Z17 연구소장
B15 연구위원 Z18 원장B20 전문위원 Z19 부원장B30 책임기술원 999 기타B31 선임기술원
코드값 코드값 의미 비고
AD 안도라 ANDORRA
AE 아랍에미리트 UNITED ARAB EMIRATESAF 아프가니스탄 AFGHANISTANAG 앤티가 바부다 ANTIGUA AND BARBUDAAI 안길라 ANGUILLAAL 알바니아 ALBANIAAM 아르메니아 ARMENIA
전공분야코드
코드값 코드값 의미
E340600 구강해부학E340601 육안일반해부학E340602 신경해부학E340603 육안두경부일반해부학
E340604 두경부신경해부학E340605 두경부응용해부학E340700 치아형태학E340701 영구치치아형태학E340702 유치치아형태학E340703 치아교합학
국가코드
개인정보활용동의구분
코드값 코드값 의미
Y 동의N 비동의
목 차
Ⅰ 인력정보 데이터 정제 지침 1
1 국가RampD참여인력 및 평가위원 데이터 정제 지침 1
11 정제 필요성 1
12 정제 내용 1
13 정제 대상 2
14 정제 수준 3
15 정제 작업 방식 5
16 검수 확인 6
17 데이터 이관 7
2 인력정보 영문이력 입력 지침 8
21 영문이력 DB 구축 필요성 8
22 영문이력 DB 구축 대상 8
23 영문이력 DB 구축 항목 8
24 영문이력 DB 수집 방법 10
25 영문이력 DB 입력 방법 11
26 영문이력 DB 번역 방법 11
27 검수 확인 12
Ⅱ 인력정보 데이터 정제 매뉴얼 13
1 참여인력 데이터 정제 매뉴얼 13
11 개요 13
12 데이터 정제 목록 및 범위 13
13 데이터 분석 내역 18
14 데이터 정제 기준 26
15 데이터 정제 절차 및 작업 지침 49
16 데이터 검수 86
17 데이터 이관 92
2 인력정보 영문이력 입력 매뉴얼 101
21 개요 101
22 DB 구축 대상 및 범위 102
23 데이터 분석 내역 104
24 DB 구축 절차 및 작업 지침 105
25 DB 구축 검수 123
3 평가위원 데이터 최신성 유지 매뉴얼 129
31 최신성 유지 업무 개요 129
32 대상 인력(평가위원) 정보 수집 방법 131
33 최신성 유지 작업 지침 132
34 최신성 업무 대상 134
35 입력 항목별 QampA(처리 방법 및 사례) 140
첨부1 NTIS 코드 표준 146
- 1 -
Ⅰ 인력정보 데이터 정제 지침
1 국가RampD 참여인력 및 평가위원 데이터 정제 지침
11 정제 필요성
인력정보 데이터는 연구관리전문기관에서 수집하여 통합 구축하므로 여러 기관에 중복으로 입력되어
있을 수 있음
따라서 데이터 정제를 하지 않을 경우 현 재직기관의 중복 논문실적 이중등록 등 통계현황 및 검
색결과에 많은 문제가 발생할 수 있음
또한 각 기관별로 고유의 코드 및 항목체계를 활용하거나 코드가 필요한 항목에 코드를 사용하지
않는 등 NTIS 표준 코드 및 항목에 대한 매핑 필요
NTIS 인력정보의 현황정보 서비스 제공시 누락항목으로 인해 현황정보가 정확하지 않음
12 정제 내용
수집된 인력 정보를 등록하기 위한 데이터 분류 및 분석
여러 기관에 중복 입력된 인력정보에 대한 중복제거 및 데이터 취합
중복제거 후 취합 된 데이터는 확인 정정
- 학력사항 경력사항 등의 정보 이중 등록
- 기관별 인력정보 중 재직기관 상이
각 기관별 코드 및 항목에 대해 통합 인력DB의 코드 및 항목에 맞게 매핑
- 각 기관 고유의 코드 및 항목을 표준 코드 및 항목과 매핑 작업 필요
- 재직기관 전공 등 코드가 필요한 항목에 코드를 활용하지 않는 기관의 데이터는 표준 코드에 맞
게 데이터 변환 필요
기본정보 경력정보 실적정보 등 인력정보에 대한 오류데이터 정정
- 각 항목의 데이터 내용을 검토하여 오류 정정
예) 학력사항의 데이터 내용 중 입학일이 졸업일 보다 나중일 경우 등
인력정보의 누락항목에 대한 보완
- 수집 가능한 범위 내에서 6개 주요항목기준(인력구분 우편번호 주소 소속기관명 전공 학위 등)
보완
- 2 -
구분 항목 세부항목
참여인력정보(42개)
기본정보(9개)주민등록번호 성명 인력구분 자택주소 자택우편번호 자
택전화번호 핸드폰번호 부처(기관)분류코드 E-mail
소속기관사항(6개)소속기관명 부서명 직위명 사무실전화번호 기관주소
최초임용일
학력사항(10개)전공 취득대학 학위 입학일 졸업일 학과 취득국가 지
도교수명 학위논문명 학위취득일
경력사항(3개) 근무처명 직위명 근무기간
자격사항(3개) 자격발행처 자격증명 자격취득일
논문실적(8개)논문발표일 국문논문명 영문논문명 저자역할구분 발
행처 학술지구분 학술지명 SCI여부
지식재산권(3개) 지식재산권명 출원_등록번호 특허구분
평가위원(10개)
소속학협회현황(3개) 담당업무 직위 학협회사항
훈포장사항(3개) 수상년월 수여기관명 훈포장명
저역서실적(4개) 국문저서명 발행년 발행처 저역서구분
13 정제 대상
정제 대상 범위
- 정보연계를 통해 수집되는 참여인력정보의 정제
정제 대상 항목 정의
주요 정제 대상 정의
구분 항목 세부항목
참여인력정보(12개)
기본정보(6개)주민등록번호 성명 인력구분 핸드폰번호 E-mail 부
처(기관)분류코드
소속기관사항(4개) 소속기관명 기관주소 사무실전화번호 직위명
학력사항(2개) 전공 학위
주요 정제 대상 항목이란 인력정보 서비스를 위해 기본적으로 필요한 최소한의 서비스 항목 Not
null값은 아니지만 최대한 많은 자료 수집이 필요한 항목
- 3 -
코드 대상 항목 정의
구분 항목 세부항목
참여인력정보(16개)
기본정보(3개) 자택우편번호 부처(기관)분류코드
소속기관사항(3개) 인력구분 소속기관명 직위명 기관우편번호
학력사항(4개) 전공 학위 학과 취득국가 취득대학
경력사항(2개) 직위명
논문실적(3개) 저자역할구분 학술지구분 SCI여부
지식재산권(1개) 특허구분
평가위원(1개)
저역서실적(1개) 저역서구분
코드 대상 항목이란 데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목
14 정제 수준
데이터 특성 및 정제 지침
- lsquo속성값 전체 존재rsquo 데이터
공통사항 오류 데이터 정정 및 코드 매핑
① 중복 자료 중 데이터 신뢰성에 근거하여 통합 필수 항목 누락 확인 및 보충 선별(성명 주
민등록번호) 형식 확인(주소 전화번호 및 E-Mail)
② 중복 자료 중 최신 자료 선정 및 확인 형식 확인 (주소 전화번호)
③ ⑤~⑪ 중복 자료 중 데이터 신뢰성에 근거하여 통합
번호는 lsquo정제 대상 항목 정의rsquo 표에서 각 항목에 붙여진 번호
- lsquo일부 또는 6개 미만rsquo 데이터
데이터 누락 정도를 판단하여 필요한 경우 해당 기관에 보완 요청
데이터 보완 후 lsquo속성값 전체 존재rsquo 데이터와 같은 방식으로 정제
오류 유형 정의 및 정제 형태
- 발생 가능한 오류 유형
주요 항목 중 데이터가 존재하지 않는 경우
데이터의 Type(문자형 숫자형)에 위배되는 값이 들어있는 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
정해진 법칙에 따른 번호가 아닌 경우
실제로 존재하지 않는 부점(구분자) 등이 입력되어 있는 경우
- 4 -
오류 유형 세부 정제 지침 비고
주요 항목 중 데이터가 null- 정제가 불가능하므로 정보 재수집
(해당 기관에 정보 제공 재요청)
데이터 Type 오류
- 적합한 Type으로 수정 가능한 정도(의미상으로는
유효한 경우)의 오류는 수정하고 그렇지 않은 데
이터는 삭제
데이터 형식 오류- 데이터들 중 가장 많은 유형을 정규 형식 정고 형
식에 위배되는 데이터들은 정규 형식으로 변환
부점(구분자) 오류
- 실제 서비스 되는 데이터값과 비교하여 변환 과정
에서 발생한 오류면 실제 데이터값으로 변환하고
원시 데이터 자체가 오류인 경우에는 삭제 처리
코드값 오류
- 일치 유사한 코드값으로 변환
- 유사 가장 적합한 코드값으로 변환
- 상이 lsquo기타rsquo코드값으로 분류 또는 삭제
논문제목 오류 - 논문제목1은 반드시 필수 입력으로 처리
중복 데이터들의 데이터 값
상충 오류
- 변경될 수 없는 기본정보(이름 주민번호)의 경우는
기존 데이터 우선
- 변경 가능한 정보(기관명 논문 등)의 경우 최신 업
데이트된 정보를 우선
코드의 값이 정해진 범위를 벗어나는 경우
ex) 기관 코드와 인력시스템 사용 코드와의 매핑 오류
기관 데이터의 코드 항목 값이 잘못 입력되어 있는 경우
국문과 영문으로 구분되는 동일 데이터 항목에 잘못된 위치에 항목 값이 입력되어 있는 경우
ex) 논문실적정보의 국문제목에 영문제목이 입력되어 있는 경우
데이터가 복수로 존재하며 서로 상충되는 경우
ex) 유효하지 않은 주민등록번호의 중복
- 조치 가능한 데이터 정제 형태
재수집 데이터를 제공한 기관에 재요청하여 부족한 데이터 내용을 재수집
수정 데이터 내용은 수정하지 않고 데이터 형태 및 특수문자 수정 정도의 정제
삭제 데이터 값 삭제(Garbage 처리) 또는 레코드 삭제
위의 경우 원시 데이터 값은 관리를 위해 따로 보관
정제 제외 데이터 값이 누락이거나 오류로 판단되지만 정확한 데이터 내용을 알 수 없는 경
우 기준 데이터가 없으므로 정제 대상에서 제외 또한 별다른 오류로 보이지 않는 경우도 정
제 대상에서 제외
오류 유형별 세부 정제 지침
~은 lsquo발생 가능한 오류 유형rsquo 내용 참조
~은 lsquo조치 가능한 데이터 정제 형태rsquo 내용 참조
- 5 -
구분 비고
기본정보 이메일 기존 수집 데이터를 통해 보완
소속기관사항 있으나필드가 null인것
인력구분 기관명이형전거DB 생성 완료 후 적용함
소속기관 우편번호주소가 있는 경우 우편번호 찾기를 통해 보완주소가 없는 경우 기존 수집 데이터를 통해 보완
소속기관 주소 기존 수집 데이터를 통해 보완
소속기관명기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
학력사항 있으나 필드가null인것
전공기존 수집 데이터를 통해 보완하고 기관명이형전거DB로 매핑함
학위기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
소속기관사항 없는것 기존 수집 데이터를 통해 보완
학력사항 없는것 기존 수집 데이터를 통해 보완
인력정보의 누락항목에 대한 보완(기존 서비스 데이터 기준)
기타 (정보 식별자 부여)
- 데이터 정제 최종 단계에서 식별자 부여 체계에 따라 정보식별자(번호) 삽입
- 정보식별자(번호)는 식별체계 API에 의해 자동으로 부여 되며 식별 부여 체계는 사업단 내 식별
체계 담당자가 마련하여 제공
고려 사항
- 정확한 항목매핑 후 작업이 진행되어야 함
- 정제데이터 관리는 임시테이블을 통해서 관리되며 다양한 에러 유형별로 체계적인 관리가 되어야 함
15 정제 작업 방식
중복 확인 기계작업
- 정제 도구에서 제공하는 중복 확인 기능을 이용하여 중복 항목의 리스트 작성(기계작업)
데이터 통합 기계작업 + 수작업
- 중복으로 확인된 항목들의 리스트를 비교하여 통합
- 기계적으로 필드간의 충돌이 없음을 확인할 수 있는 항목은 자동 통합하고 기계적으로 충돌을
- 6 -
확인할 수 없는 경우는 수작업으로 필드별 데이터 통합을 수행
- 최신 또는 최종 여부를 확인하여 통합해야 하는 경우 해당 데이터에 포함된 일자 데이터를 감안
하여 선별 통합(일자 및 기간의 충돌이 없는 경우 기계작업 충돌이 있는 데이터는 리스트 업
후 수작업)
필수 데이터 누락 확인 및 보충 선별 기계작업 + 수작업
- 소속기관명 E-mail 등과 같이 누락되지 말아야 할 항목을 설정하고 기계적으로 누락된 항목의
리스트를 추출(기계작업)
- 이 리스트에 대하여 보충 가능한 데이터는 보충하고 보충이 불가능한 경우 서비스 불가 리스트
로 따로 추출(수작업)
형식 확인 기계작업 + 수작업
- E-Mail 주소 전화번호와 같은 형식이 어느 정도 정의된 데이터의 경우 기본 형식을 템플릿으
로 지정
- 정형화되지 않은 데이터의 리스트를 추출하여 이 중 기계적으로 형식을 일치시키고(기계작업)
일치되지 않은 데이터를 수작업으로 확인하여 수정하거나 형식 불량 데이터 리스트로 따로 추
출(수작업)
16 데이터 검수
161 데이터 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
- 7 -
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
17 데이터 이관
171 NTIS 참여인력 DB 현황 및 데이터 흐름
NTIS 참여인력 DB는 물리적으로 각 연계기관과 NTIS의 데이터 연계를 위해 각 연계기
관에 구성된 연계기관 공동활용 DB와 RampD 참여인력을 관리하기 위한 인력DB RampD참여
인력 서비스 DB로 구성되어 있다
그림 3 NTIS DB 현황 및 데이터 흐름
172 NTIS DB 간 테이블 매핑
NTIS 참여인력 DB가 기능별로 분리되어 있음으로 인해 연계DB에서 인력 관리DB 간
항목 매핑 정의가 필요하다 DB 간 항목 매핑은 아래와 같다
정보구분 테이블명 수집DB 관리DB
인력정보
인력 기본정보 MP_BASIC THR_BASE
소속기관사항 HOFF_ORG THR_JAEJIK
학력사항 SCRE THR_SCHOOL
경력사항 CAREER THR_CAREER
논문실적 PAPER_OUT THR_PAPER
자격사항 CERT THR_LICENSE
지식재산권실적 IPR_OUT THR_PATENT
소속학협회현황 BLNG_INSTIT THR_ACTIVE
저역서실적 TRNSWRT_OUT THR_BOOK
훈포장사항 AWARD THR_MEDAL
- 8 -
항 목 세 부 항 목
기본
기본정보 영문성명 휴대전화 E-mail 개인홈페이지
전문분야 전문(연구)분야
재직기관 기관명 부서명 직위 주소 전화 팩스
학력 최종학위 학위 학위취득일 학교명 전공명
경력 경력사항 시작년월 종료년월 재직기관명 직위
실적
논문실적 논문명 저널명 게제(권)집 페이지 게제년월 공동저자명
연구실적 시작년월 종료년월 발주기관 참여구분(역할) 연구명
특허출원등록구분 출원등록번호 출원등록국가 특허출원명 출
원등록일자
173 데이터 이관
수집 DB에 전송되는 인력정보는 중복 인력이 존재 하며 동일인물의 정보일 지라도 각
기관별 보유 항목이 다르므로 관리DB로 이관을 위해 각 항목별 이관 방안이 필요하다 따
라서 별도의 방안을 마련하여 데이터 이관을 실시하도록 한다
2 인력정보 영문이력 입력 지침
21 영문이력 DB 구축 필요성
해외의 연구자 혹은 외국의 연구기관등에게 관련분야의 연구자문에 필요한 국내 연구전
문가 혹은 국제 공동연구활동 등을 지원하기 위한 국내 인물에 대한 영문검색 체널제공
인물정보에 대하여 영문DB구축을 수행하고 웹을 통한 영문검색을 지원함으로써 국제공
동연구를 지원하기 위한 기반을 조성
기존 개인정보 공동활용에 동의한 연구자들을 대상으로 파악한 영문이력DB 구축방법을
통해 인력정보에 대하여 영문화 작업을 수행
22 영문이력 DB 구축 대상
기본정보 학력사항 경력사항 논문실적 연구실적 특허실적 등
23 영문이력 DB 구축 항목
영문이력서 제공가능 인력에 대해 영문이력서를 제공받아 이를 바탕으로 영문 DB를 구
축하고 번역 요청자를 대상으로 번역을 통한 영문DB구축
- 9 -
항 목 세 부 항 목 영문명 비고
기본(BasicInformation)
기본정보 영문성명 English Name - 한글이력정보와 공동 사용- 전문분야는lsquo08 개정 분류코드 영문명 활용
휴대전화(국가번호)
Cellular PhoneNumber
E-mail E-mail
개인홈페이지 Homepage
전문분야 전문(연구)분야 Research Field 1
Research Field 2
Research Field 3
검색키워드 전문분야명
재직기관(organization)
기관명 Organization Name - 현재 재직기관사항 1개 입력
부서명 Department
직위 Job title(position)
우편번호 Postal Code
주소 Address
전화(국가번호) Telephone
팩스(국가번호) Fax
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) Degree Code
학위취득일 GraduationDate
학교명 School
전공명 Major
경력(Career)
경력사항(CAREER)
시작년월 Start Date - 재직 경력으로 주요 경력입력 현 재직정보제외
종료년월 End Date
재직기관명 Organization Name
직위 Position(Job Title)
실적ResearchResult
논문실적(paper)
논문명 Title - 최근 5년 이내만 입력저널명 Journal Name
게제(권)집 Volume
게제호 Number
시작페이지 Start Page
종료페이지 End Page
게제년월 Date of Publication
공동저자명 Co-Author
비고 Etc
연구실적ResearchProject
시작년월 Start Date
종료년월 End-Date
발주기관 Funding organization
참여구분(역할)-코드
Role
연구실적명 title
영문이력 구축 대상 항목 정의
- 10 -
특허(patent)
출원등록구분-코
드
appliedregistered
출원등록번호 number
출원등록국가-코
드
National Code
특허출원명 Patent name
출원등록일자 Date
코드 대상 항목(데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목)
코드 대상 항목 정의
항목 세부항목 코드
전문분야(3개) 전문(연구)분야NTIS 표준코드(국가과학기술
표준분류) 활용
학력사항(1개) 최종학위
2(학사)
5(석사)
8(박사)
연구실적(1개) 참여구분(역할)A(연구책임자)
B(참여연구원)
특허실적(2개)특허구분(출원등록)
01(출원)
02(등록)
등록국가 NTIS 표준코드 활용
코드 대상 항목이란 데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목
daggerNTIS 표준코드에 영문명을 포함하여 사용
24 영문이력 DB 수집 방법
E-mail을 통한 영문이력서 제공 요청 메일 발송
- 영문이력 DB 구축에 동의하고 영문이력서 제공이 가능한 연구자 대상
전화연락을 통한 이력서 수집
- 영문이력서 제공 요청 메일과 병행하여 영문이력서 제공동의자를 대상으로 영문이력
입력자들이 전화를 통하여 이력서 수집 요청
E-mail을 통한 영문이력서 번역 대행 안내 메일 발송
- 영문이력 DB 구축에 동의한 번역 요청 동의자를 대상으로 메일 발송
이력정보(한글)는 poolkistirekr을 통해 파일형태로 수집 관리함
이력정보(한글)는 메일을 통해서 파일형태(HWP MS-WORD PDF 등)로만 수집함
- 11 -
항 목 선처리 항목
기본 재직기관 기관명 직위
학력 최종학위 학교명 전공명
경력 경력사항 재직기관명 직위
실적논문실적 저널명
연구실적 발주기관
구분 선처리 방법
기관명
기관명(재직기관)
학교명(학력사항)
재직기관명(경력사항)
발주기관(연구실적)
- 웹검색(예 NAVER 백과사전 및 기관 홈페이지)
웹검색시는 출처 기록
- 웹검색 불가는 직접번역
직위직위(재직기관)
직위(경력사항)
- 직위에 대한 영문 코드표 참조
영문 코드표의 출처 기록
전공명 전공명(학력사항)- 전공명에 대한 영문 코드표 참조
영문 코드표의 출처 기록
저널명 저널명(논문실적)- 웹검색(예 httpsocietykistirekr)
웹검색시는 출처 기록
25 영문이력 DB 입력 방법
영문이력 입력
- 수집된 영문이력서는 입력자들이 등록수정 화면을 통해 직접 입력
영문이력 입력결과 확인
- 입력 완료된 영문이력서의 확인은 다른 입력자에 의해 입력결과를 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 본인확인
- 영문이력서의 입력 확인 완료 후 영문이력 본인에게 안내메일을 발송하여 확인
- 본인확인에 의해 수정 가능
26 영문이력 DB 번역 방법
영문이력 선처리 작업
- 영문이력 번역 수행 전 공통적인 항목에 대해 선처리 작업 수행
영문이력 번역
- 인력DB의 번역 대상자 및 수집된 이력서는 영문이력 관리 기능을 통해 번역 수행
- 12 -
영문이력 번역확인
- 번역 완료된 영문이력정보의 확인은 다른 번역자에 의해 번역결과를 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 전문가검수
- 번역확인 완료된 영문이력정보의 검수는 전문가에 의해 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 본인확인
- 영문이력정보의 번역 번역확인 전문가검수 완료 후 영문이력 본인에게 안내메일을
발송하여 확인
- 본인확인에 의해 수정 가능함
KISTI 검수
- KISTI 검수 절차를 거쳐 영문이력에 대해 서비스 제공
27 검수 확인
입력 및 번역 결과 보고
- 주간보고 영문이력 번역에 대한 현황을 매 주 보고
- 이슈사항보고 이슈사항 발생 시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 데이터(전체 항목 필드 기준)의 01 이하(품질목표 999)
- 오류 체크 방식 전체 데이터에서 본인확인 미완료 대상 중 무작위로 30 샘플링
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상
데이터건수) 항목가중치의 합산 결과가 01 이하
- 전문가검수는 모든 번역대상자를 대상으로 수행
- 번역확인 및 전문가검수 단계에서 자체적으로 품질 활동 수행
오류율 산정 기준
- 인력정보 영문이력에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며
오류율 산정에서 제외함
- 13 -
구분 항목 세부항목 세부항목 설명
참여인력정보(42개)
기본정보(8개)
주민등록번호 인력 고유의 주민등록번호
성명 인력 한글 영문 한자 성명
자택주소 인력 본인의 자택 주소
자택우편번호 인력 본인의 자택 우편번호
자택전화번호 인력 본인의 자택 전화번호
핸드폰번호 인력 본인의 핸드폰 번호
E-mail 인력 본인의 E-mail
부처(기관)분류코
드인력 본인의 부처(기관)분류코드
Ⅱ 인력정보 데이터 정제 매뉴얼
1 참여인력 데이터 정제 매뉴얼
11 개요
111 정제 목표
인력데이터는 연구관리전문기관에서 수집하여 통합 구축하므로 여러 기관에 중복으로 입력되어 있
는 경우에 이중등록 데이터가 존재할 수 있어 이를 NTIS에서 활용하기 위해서 정의된 중복기준에
따라 이중등록 확인 및 제거하는 데이터 정제를 절차에 따라 수행
연구관리전문기관의 인력정보관리시스템의 미비 또는 관리체계의 미흡으로 인해 발생된 누락데이
터 및 입력된 데이터의 오류를 수행 가능한 범위 내에서 작업자 및 시스템에 의한 오류 수정
연구관리전문기관별로 각각의 고유의 코드 및 항목체계를 활용하거나 코드가 필요한 항목에 코드
를 사용하지 않고 있는 실정이며 이러한 연구관리전문기관 인력데이터를 NTIS에서 활용하기 위
해서는 NTIS 통합 표준 코드 및 항목으로의 매핑
12 데이터 정제 목록 및 범위
121 데이터 정제대상 및 항목 정의
- 14 -
구분 항목 세부항목 세부항목 설명
소속기관사항(7개)
소속기관명 인력 본인의 현재 소속기관명칭
학과부서명 인력 본인의 소속기관 내 소속학과부서명
직위명 인력 본인의 소속기관 내 직위명칭
사무실전화번호 인력 본인의 소속기관 내 전화번호
기관주소 현재 소속기관의 우편번호 및 상세주소
인력구분 인력구분(대학교 연구소 산업계 기타)
최초임용일 현재 소속중인 기관에 최초 임용(근무)일
학력사항(10개)
전공 인력의 학위별 전공명
취득대학 인력의 학위별 출신 대학교명
학위학력정보의 학위종류예) 학사이하 석사 박사수료 박사
입학일 인력의 학위별 입학년월
졸업일 인력의 학위별 졸업년월
학과 인력의 학위별 출신 대학교 학과명
취득국가 인력의 학위별 출신 대학교 소재지(국가)
지도교수명 인력의 각 학위별 지도교수명
학위논문명 인력의 최종학위취득시 제출한 논문명
학위취득일 인력의 최종학위취득일
경력사항(3개)
근무처명인력의 전ㆍ현재 직업 및 교육과정의 기관명 및세부사항(학과 부서 등)
직위명인력의 전ㆍ현재 직업 및 교육과정의 직급 또는직위명
근무기간인력의 전ㆍ현재 직업 및 교육과정의 시작년월및 종료년월
자격사항(3개)
자격발행처 인력이 발급받은 자격증 등의 발급기관명
자격증명 인력이 발급받은 자격증 등의 자격명
자격취득일 인력이 발급받은 자격증 등의 발급년월
논문실적(8개)
논문발표일 인력이 저술한 논문을 게재하거나 발표한 년월
논문제목1 인력이 저술한 논문의 논문제목1
- 15 -
구분 항목 세부항목 세부항목 설명
논문제목2 인력이 저술한 논문의 논문제목2
저자역할구분
인력이 저술한 논문에 있어서의 역할정도예) 단독공동제1주저자공저자교신(책임)저자
발행처인력이 저술한 논문이 실린 간행물을 발행한 발행처
학술지구분
인력이 저술한 논문의 게재 및 발표형태와 장소에 관련하여 학술지구분예) 국외전문학술지 국외학술대회발표논문집 국내전문학술지 국내학술대회발표논문집 기타논문집
학술지명 인력이 저술한 논문이 실린 간행물의 명칭
SCI여부인력이 저술한 논문이 실린 간행물이 SCI에 수록된 간행물 구분
지식재산권(3개)
지식재산권명 인력이 출원하거나 등록한 지식재산권명
출원_등록번호인력이 출원하거나 등록한 지식재산권의 출원등록번호
특허구분
인력이 출원하거나 등록한 지식재산권의 종류예) 특허 실용신안 디자인 상표 기타 프로그램(SW)저작권 신기술 인증 신제품 인증 국제출원(PCT) 서비스
평가위원(11개)
소속학협회현황(3개)
담당업무인력의 전ㆍ현재 소속 학회 및 협회 내에서의 담당업무
직위 인력의 전ㆍ현재 소속 학회 및 협회 내에서의 직위
학협회사항 인력의 전ㆍ현재 소속 학회 및 협회명
훈포장사항(3개)
수상년월 인력이 훈장 포장 등을 수상한 년월
수여기관명 인력이 수상한 훈장 포장 등을 수여한 기관명
훈포장명 인력이 수상한 훈장 포장 등의 수상명
저역서실적(5개)
저서명1 인력이 저술하거나 역술한 도서의 제목1
저서명2 인력이 저술하거나 역술한 도서의 제목2
발행년 인력이 저술하거나 역술한 도서를 발행한 년도
발행처 인력이 저술하거나 역술한 도서를 발행한 장소
저역서구분 인력이 저술하거나 역술한 도서에 대한 구분 예) 저서 역서
- 16 -
구분 항목 세부항목 현행 DB 항목식별
항목비고
참여
인력
정보
(56개)
기본정보
(12개)
주민등록번호
인물ID NTIS 식별체계 생성
인물관리번호(KOI) 시스템 생성
주민등록번호 lsquo-rsquo포함 14자리
성명
성명-한글
성명-영문
성명-한자
자택주소기본주소(주소1) 우편번호 내 주소를 참조
상세주소(주소2)
자택우편번호 우편번호
자택전화번호 전화번호
핸드폰번호 핸드폰번호
E-mail E-mail
소속기관
사항
(11개)
소속기관명소속기관코드 소속기관명 기준 매핑
기관명이형전거DB 활용소속기관명
부서명 근무부서명
직위명직위코드 직위명 기준 매핑
NTIS 직위코드직위명
사무실전화번
호사무실전화
기관주소
우편번호
기본주소(주소1) 우편번호 내 주소를 참조
상세주소(주소2)
인력구분
인력유형구분
(대학교 연구소 산업
계 기타)
NTIS 인력구분코드
기관명이형전거DB 활용
최초임용일 최초임용일
학력사항
(14개)
전공전공분야 전공명 기준 매핑
NTIS 전공코드전공명
취득대학학위취득대학코드 학위취득대학명 기준 매핑
기관명이형전거DB 활용학위취득대학명
학위 학위코드 NTIS 학위코드
입학일 입학년월
졸업일 졸업년월
학과학과코드 학과명 기준 매핑
NTIS 학과코드학과명
취득국가 취득국가코드 NTIS 국가코드
지도교수명 지도교수명
정제 대상 항목
공동활용정보를 포함하는 현행 DB 구성 기준 69개 항목
- 17 -
구분 항목 세부항목 현행 DB 항목식별
항목비고
학위논문명최종학위논문명1
최종학위논문명2
학위취득일 최종학위취득일
경력사항
(5개)
근무처명 근무처명
직위명직위코드 직위명 기준 매핑
NTIS 직위코드직위명
근무기간근무시작일
근무종료일
자격사항
(3개)
자격발행처 자격발행처
자격증명 자격증명
자격취득일 자격취득일
논문실적
(8개)
논문발표일 논문발표일
논문제목1 논문제목1
논문제목2 논문제목2
저자역할구분 저자역할구분 NTIS 저자역할구분 코드
발행처 발행처명
학술지구분 학술지구분 NTIS 학술지구분코드
학술지명 학술지명
SCI여부 SCI여부 NTIS SCI 여부구분 코드
지식
재산권
(3개)
지식재산권명 지식재산권명
출원_등록번호 출원등록번호
특허구분 특허구분 NTIS 특허구분 코드
평가
위원
(13개)
소속학협
회
현황
(5개)
담당업무 담당업무
직위 직위 직위명
학협회사항
학협회명
활동시작일
활동종료일
훈포장
사항
(3개)
수상년월 수상년도
수여기관명 수여기관명
훈포장명 수상명
저역서
실적
(5개)
저역서명1 저역서명1
저역서명2 저역서명2
발행년 발행년도
발행처 발행처명
저역서구분 저역서구분 NTIS 저역서 구분 코드
- 18 -
구분 항목 세부항목 정제항목 오류유형 비고
참여
인력
정보
(56개)
기본정보
(12개)
주민등록번호
인물ID
-인물ID이 발급되지 않는 경우
예) 외국인 주민등록번호 유효하
지 않거나 중복된 경우
인물관리번호(KOI)1 포맷 오류
예) 자리수 lsquo-rsquo가 있는 경우
주민등록번호
-주민등록번호가유효하지않는경우
예) lsquo-rsquo포함한 14자리가 아닌경우
주민등록번호규칙에맞지않은경우
-중복되는 주민등록번호의 경우
-공란 및 특수문자가 있는 경우
이관 후 서비
스대상에서
제외
성명
성명-한글
-Null인 경우
-공란 및 특수문자 숫자가 있는
경우
-한글이 아닌 경우이관 후 성명
없으면 서비
스대상에서
제외
성명-영문
-공란 및 특수문자 숫자가 있는
경우
-영문성명의 범위를 벗어나는 경
우
예) Lee KHS
성명-한자
-공란 및 특수문자 숫자가 있는
경우
-한자가 아닌 경우
자택주소
기본주소(주소1)
-우편번호 존재하고 Null의 경우
-우편번호의 주소와 상이한 경우
-주소지 정보가 아닌 경우
상세주소(주소2)
-우편번호 및 기본주소 Null의
경우
-주소정보가 아닌 경우
자택우편번호 우편번호-우편번호 Null인 경우
-우편번호가 old data인 경우
자택전화번호 전화번호 -전화번호 Null인 경우
13 데이터 분석 내역
131 세부 항목별 오류 패턴유형 분석
인력데이터
항목별 정해진 규칙에 위배되는 값이 들어있는 경우
- 19 -
구분 항목 세부항목 정제항목 오류유형 비고
-전화번호가 표준 형식이 아닌
경우
-전화번호 데이터가 아닌 경우(지
역번호 없는 경우 포함)
-핸드폰번호인 경우
핸드폰번호 핸드폰번호
-핸드폰번호 Null인 경우
-핸드폰번호가 표준 형식이 아닌
경우
-핸드폰번호 데이터가 아닌 경우
(지역번호 없는 경우 포함)
-전화번호인 경우
E-mail E-mail
-E-mail Null인 경우
-표준 이메일 형식이 아닌 경우
-구분자가 잘못된 경우
-가베지 성 데이터 존재
소속기관
사항(11개)
소속기관명
소속기관코드 NA코드 오류
유형 참조
소속기관명-소속기관명이 기관명이형전거DB
내 대표기관명이 아닌 경우
대표기관명으
로 갱신
부서명 근무부서명 -근무부서명 Null인 경우
직위명
직위코드 NA코드 오류
유형 참조
직위명
-직위명 Null인 경우
-직위명이 직위코드 내 명칭이
아닌 경우
사무실전화번호 사무실전화
-전화번호 Null인 경우
-전화번호가 표준 형식이 아닌
경우
-전화번호 데이터가 아닌 경우(지
역번호 없는 경우 포함)
-핸드폰번호인 경우
기관주소
우편번호-우편번호 Null인 경우
-우편번호가 old data인 경우
기본주소(주소1)
-우편번호 존재하고 기본주소
Null의 경우
-우편번호의 주소와 상이한 경우
-주소지 정보가 아닌 경우
상세주소(주소2) -우편번호 및 기본주소 Null의
- 20 -
구분 항목 세부항목 정제항목 오류유형 비고
경우
-주소정보가 아닌 경우
인력구분 인력유형구분 NA코드 오류
유형 참조
최초임용일 최초임용일 NA날짜 오류
유형 참조
학력사항
(14개)
전공전공분야 NA 코드 오류
유형 참조전공명 -전공명 Null인 경우
취득대학
학위취득대학코드 NA코드 오류
유형 참조학위취득대학명 -학위취득대학명 Null인 경우
학위 학위코드 NA코드 오류
유형 참조
입학일 입학년월 NA날짜 오류
유형 참조
졸업일 졸업년월 NA날짜 오류
유형 참조
학과
학과코드 NA코드 오류
유형 참조학과명 -학과명 Null인 경우
취득국가 취득국가코드 NA코드 오류
유형 참조
지도교수명 지도교수명 -지도교수명 Null인 경우
학위논문명
최종학위논문명1 -가베지 데이터인 경우
최종학위논문명2 -가베지 데이터인 경우
학위취득일 최종학위취득일 NA날짜 오류
유형 참조
경력사항
(5개)
근무처명 근무처명-근무처명 Null인 경우
-가베지 데이터인 경우
직위명
직위코드 NA 코드 오류
유형 참조직위명 1 직위명 Null인 경우
근무기간
근무시작일 NA날짜 오류
유형 참조
근무종료일 NA날짜 오류
유형 참조
- 21 -
구분 항목 세부항목 정제항목 오류유형 비고
자격사항
(3개)
자격발행처 자격발행처-자격발행처 Null인 경우
-가베지 데이터인 경우
자격증명 자격증명-자격증명 Null인 경우
-가베지 데이터인 경우
자격취득일 자격취득일 NA날짜 오류
유형 참조
논문실적
(8개)
논문발표일 논문발표일 NA날짜 오류
유형 참조
논문명1 논문제목1 -가베지 데이터인 경우
논문명2 논문제목1 -가베지 데이터인 경우
저자역할구분 저자역할구분 NA코드 오류
유형 참조
발행처 발행처명-발행처명 Null인 경우
-가베지 데이터인 경우
학술지구분 학술지구분 NA코드 오류
유형 참조
학술지명 학술지명-학술지명 Null인 경우
-가베지 데이터인 경우
SCI여부 SCI여부 NA코드 오류
유형 참조
지식
재산권
(3개)
지식재산권명 지식재산권명-지식재산권명 Null인 경우
-가베지 데이터인 경우
출원_등록번호 출원등록번호-출원등록번호 Null인 경우
-가베지 데이터인 경우
특허구분 특허구분 NA코드 오류
유형 참조
평가
위원
(13개)
소속학
협회
현황
(5개)
담당업무 담당업무-담당업무 Null인 경우
-가베지 데이터인 경우
직위 직위-직위 Null인 경우
-가베지 데이터인 경우
학협회사항
학협회명
-학협회명 Null인 경우
-직위명이 포함된 경우
-가베지 데이터인 경우
활동시작일 NA날짜 오류
유형 참조
활동종료일 NA날짜 오류
유형 참조
- 22 -
구분 항목 세부항목 정제항목 오류유형 비고
훈포장
사항
(3개)
수상년월 수상년도 NA날짜 오류
유형 참조
수여기관명 수여기관명-수여기관명 Null인 경우
-가베지 데이터인 경우
훈포장명 수상명-수상명 Null인 경우
-가베지 데이터인 경우
저역서
실적
(5개)
저역서명
저역서명1 -가베지 데이터인 경우
저역서명2 -가베지 데이터인 경우
발행년 발행년도 NA날짜 오류
유형 참조
발행처 발행처명-발행처명 Null인 경우
-가베지 데이터인 경우
저역서구분 저역서구분 NA코드 오류
유형 참조
구분 항목 세부항목 정제항목 오류내역 비고
참여
인력
정보
(11개)
소속기관사항(1개) 최초임용일최초임용일
YYYYMMDD
-YYYY가 없는 경우(누락)
-MM이 없는 경우
-DD가 없는 경우
-YYYYMMDD이 유효하지
않은 경우
학력사항(3개)
입학일입학년월
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
졸업일졸업년월
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-입학년월보다 같거나 작
은 경우
학위취득일최종학위취득일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
- 23 -
구분 항목 세부항목 정제항목 오류내역 비고
경력사항(2개) 근무기간
근무시작일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
근무종료일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-근무시작일보다 같거나
작은 경우
자격사항(1개) 자격취득일자격취득일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
논문실적(1개) 논문발표일논문발표일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
소속학협회현황(2개) 학협회사항
활동시작일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
활동종료일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-활동시작일보다 같거나
작은 경우
훈포장사항(1개) 수상년월수상년도
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우평가
위원
(1개)
저역서실적(1개) 발행년발행년도
YYYY
-YYYY이 없는 경우(누락)
-YYYY이 유효하지 않은
경우
시작일보다 종료일이 같거나 작은 경우 종료일을 삭제
날짜의 경우 본인의 생년월일보다 작을 수 없음
- 24 -
구분 항목 세부항목 정제항목 오류유형 비고
참여
인력
정보
(14개)
기본
정보
(1개)
자택우편번호 우편번호-Null 경우
-우편번호와 주소정보가 불일치
외국주소는
유지
소속
기관
사항
(4개)
소속기관명소속기관코드
소속기관명
-소속기관명만 존재하는 경우
-소속기관코드가 기관명이형전거
DB의 이형기관코드가 아닌 경우
-소속기관명이 기관명이형전거DB
의 대표기관명이 아닌 경우
직위명직위코드
직위명
-직위명만 존재하는 경우
-직위명 직위코드가 존재하지 않
는 경우
기관주소 우편번호-Null의 경우
-우편번호와 주소정보가 불일치
인력구분 인력유형구분-기관명이형전거DB의 기관유형구
분과 불일치
학력
사항
(4개)
전공전공분야
전공명
-전공명만 존재하는 경우
-전공명 전공분야코드가 Null인 경우
취득대학학위취득대학코드
학위취득대학명
-학위취득대학명만 존재하는 경우
-학위취득대학코드가 기관명이형
전거DB의 이형기관코드가 아닌
경우
-학위취득대학명이 기관명이형전
거DB의 대표기관명이 아닌 경우
학위 학위코드
-학위코드가 Null인 경우
-학위코드가 구분 코드내 표함되
지 않는 경우
학과학과코드
학과명
-학과명만 존재하는 경우
-학과명 학과코드가 존재하지 않
는 경우
취득국가 취득국가코드
-Null인 경우
-기관 국가코드와 NTIS 국가코드
매핑 오류
경력
사항
(1개)
직위명직위코드
직위명
-직위명만 존재하는 경우
-직위명 직위코드가 Null인 경우
코드의 값이 정해진 범위를 벗어난 경우
- 25 -
구분 항목 세부항목 정제항목 오류유형 비고
논문
실적
(3개)
저자역할구분 저자역할구분
-Null인 경우
-저자역할구분이 구분 코드 내 포
함되지 않은 경우
학술지구분 학술지구분
-학술지구분이 Null인 경우
-학술지구분이 구분 코드내 포함
되지 않은 경우
SCI여부 SCI여부
-Null인 경우
-SCI여부가 구분코드 내 포함되지
않은 경우
지식
재산
권
(1개)
특허구분 특허구분
-Null인 경우
-특허구분이 구분 코드내 포함되
지 않은 경우
평가
위원
(1개)
저역
서
실적
(1개)
저역서구분 저역서구분
-Null인 경우
-저역서구분이 구분 코드 내 포함
되지 않은 경우
구분 항목 이중등록 검사 항목 기준 비고
참여인력
기본정보 주민등록번호() 주민등록번호는 유일해야 함
소속기관사항 소속기관명()소속기관명(대표기관명) 유일
해야 함
학력사항
1 취득대학() 학위() 입학일
2 취득대학() 학위() 졸업일
3 취득대학() 학위() 전공
4 취득대학() 학위() 학과
5 취득대학() 학위() 학위취득일
취득대학은 대표기관명으로
비교 함
경력사항1 근무처명() 직위명 근무시작일
1 근무처명() 직위명 근무종료일
논문실적
1 논문명() 논문발표일 학술지명
2 논문명() 논문발표일 ISSN
3 논문명() ISSN 게재권집 게재호
4 논문명() 학술지명 게재권집 게재호
132 이중등록 유형 분석
이중등록 정제 기준 정의( 주키)
- 26 -
구분 항목 이중등록 검사 항목 기준 비고
지식재산권
1 출원_등록번호()
2 지식재산권명() 출원등록구분() 특허구분
() 출원국가
저역서실적1 ISBN
2 저역서명() 저역서구분() 발행년 발행처
평가위원
소속학협회현황1 학협회명() 직위 시작일
1 학협회명() 직위 종료일
훈포장사항 훈포장명() 수상년월 수여기관명
자격사항 자격증명() 자격발행처 자격취득일
이중등록 데이터 분석 방법
- 데이터 정제 결과 데이터를 대상으로 기본정보는 주민등록번호 이외의 정보는 이중등록 검사 항
목을 기준으로 하여 시스템 정제를 통해 인력별 동일한 데이터가 존재하는지를 파악함
14 데이터 정제 기준
141 정제 지침
정제 내용
수집된 인력 정보를 등록하기 위한 데이터 분류 및 분석
여러 기관에 중복 입력된 인력정보에 대한 중복제거 및 데이터 취합
중복제거 후 취합 된 데이터는 확인 정정
- 학력사항 경력사항 등의 정보 이중 등록
- 기관별 인력정보 중 소속기관 상이
각 기관별 코드 및 항목에 대해 통합 인력DB의 코드 및 항목에 맞게 매핑
- 각 기관 고유의 코드 및 항목을 표준 코드 및 항목과 매핑 작업 필요
- 소속기관 전공 등 코드가 필요한 항목에 코드를 활용하지 않는 기관의 데이터는 표준 코드에
맞게 데이터 변환 필요
기본정보 경력정보 실적정보 등 인력정보에 대한 오류데이터 정정
- 각 항목의 데이터 내용을 검토하여 오류 정정
예) 학력사항의 데이터 내용 중 입학일이 졸업일 보다 나중일 경우 등
인력정보의 누락항목에 대한 보완
- 수집 가능한 범위 내에서 6개 주요항목기준(인력구분 우편번호 주소 소속기관명 전공 학위
등) 보완
- 27 -
구분 항목 세부항목
참여인력정보(41개)
기본정보(7개)주민등록번호 성명 자택주소 자택우편번호 자택전화번호
핸드폰번호 E-mail
소속기관사항(7개)소속기관명 부서명 직위명 사무실전화번호 기관주소 인
력구분 최초임용일
학력사항(10개)전공 취득대학 학위 입학일 졸업일 학과 취득국가 지도
교수명 학위논문명 학위취득일
경력사항(3개) 근무처명 직위명 근무기간
자격사항(3개) 자격발행처 자격증명 자격취득일
논문실적(8개)논문발표일 국문논문명 영문논문명 저자역할구분 발행처
학술지구분 학술지명 SCI여부
지식재산권(3개) 지식재산권명 출원_등록번호 특허구분
평가위원(11개)
소속학협회현황(3개) 담당업무 직위 학협회사항
훈포장사항(3개) 수상년월 수여기관명 훈포장명
저역서실적(5개) 국문저서명 영문저서명 발행년 발행처 저역서구분
정제 대상 정의
정제 대상 범위
- 연계시스템을 통해 등록변경되는 참여인력정보의 정제
정제 대상 항목
정제 수준 설정
lsquo속성값 전체 존재rsquo 데이터
- 공통사항 오류 데이터 정정 및 코드 매핑
- ① 중복 자료 중 데이터 신뢰성에 근거하여 통합 항목 누락 확인 및 보충 선별(성명 주민등록
번호) 형식 확인 (주소 전화번호 및 E-Mail)
- ② 중복 자료 중 최신 자료 선정 및 확인 형식 확인 (주소 전화번호)
- ③ ⑤~⑪ 중복 자료 중 데이터 신뢰성에 근거하여 통합
lsquo일부 또는 6개 미만rsquo 데이터
- lsquo속성값 전체 존재rsquo 데이터와 같은 방식으로 정제
오류 유형 정의 및 정제 형태
- 발생 가능한 오류 유형
- 28 -
오류 유형 세부 정제 지침 비고
데이터 내용 데이터 Type 오류
- 적합한 Type으로 수정 가능한 정도(의미상으
로는 유효한 경우)의 오류는 수정하고 그렇
지 않은 데이터는 삭제
데이터 형식 오류
- 데이터들 중 가장 많은 유형을 정규 형식으
로 보고 형식에 위배되는 데이터들은 정규
형식으로 변환
부점(구분자) 오류
- 실제 서비스 되는 데이터값과 비교하여 변환
과정에서 발생한 오류면 실제 데이터값으로
변환하고 원시 데이터 자체가 오류인 경우
에는 삭제 처리
데이터 코드 코드값 오류
- 일치 유사한 코드값으로 변환
- 유사 가장 적합한 코드값으로 변환
- 상이 lsquo기타rsquo코드값으로 분류 또는 삭제
데이터(not null)가 존재하지 않는 경우
데이터의 Type(문자형 숫자형)에 위배되는 값이 들어있는 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
정해진 법칙에 따른 번호가 아닌 경우
실제로 존재하지 않는 부점(구분자) 등이 입력되어 있는 경우
코드의 값이 정해진 범위를 벗어나는 경우
ex) 기관 코드와 인력시스템 사용 코드와의 매핑 오류
기관 데이터의 코드 항목 값이 잘못 입력되어 있는 경우
국문과 영문으로 구분되는 동일 데이터 항목에 잘못된 위치에 항목 값이 입력되어 있는 경우
ex) 논문실적정보의 국문제목에 영문제목이 입력되어 있는 경우
데이터가 복수로 존재하며 서로 상충되는 경우
ex) 유효하지 않은 주민등록번호의 중복
- 조치 가능한 데이터 정제 형태
수정 데이터 내용은 수정하지 않고 데이터 형태 및 특수문자 수정 정도 정제
삭제 데이터 값 삭제(Garbage 처리) 또는 레코드 삭제
위의 경우 원시 데이터 값은 관리를 위해 따로 보관
정제 제외 데이터 값이 누락이거나 오류로 판단되지만 정확한 데이터 내용을 알 수 없는 경
우 기준 데이터가 없으므로 정제 대상에서 제외 또한 별다른 오류로 보이지 않는
경우도 정제 대상에서 제외
오류 유형별 세부 정제 지침
- 29 -
논문제목 오류 - 논문제목1은 반드시 필수 입력으로 처리
중복 데이터들의 데이
터 값 상충 오류
- 변경될 수 없는 기본정보(이름 주민번호)의
경우는 기존 데이터 우선
- 변경 가능한 정보(기관명 논문 등)의 경우
최신 업데이트된 정보를 우선
구분 명(누락) 비고
기본정보 이메일 22719 기존 수집 데이터를 통해 보완
소속기관사항 있으나필드가 null인것
인력구분 15217 기관명이형전거DB 생성 완료 후 적용함
소속기관 우편번호
15977주소가 있는 경우 우편번호 찾기를 통해 보완주소가 없는 경우 기존 수집 데이터를 통해 보완
소속기관 주소
13512 기존 수집 데이터를 통해 보완
소속기관명 428기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
학력사항 있으나 필드가null인것
전공 38915기존 수집 데이터를 통해 보완하고 기관명이형전거DB로 매핑함
학위 34373기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
소속기관사항 없는것 22502 기존 수집 데이터를 통해 보완
학력사항 없는것 31952 기존 수집 데이터를 통해 보완
~은 lsquo발생 가능한 오류 유형rsquo 내용 참조
~은 lsquo조치 가능한 데이터 정제 형태rsquo 내용 참조
인력정보의 누락항목에 대한 보완
기타 (정보 식별자 부여)
- 데이터 정제 최종 단계에서 식별자 부여 체계에 따라 정보식별자(번호) 삽입
- 정보식별자(번호)는 식별체계 API에 의해 자동으로 부여 되며 식별 부여 체계는 사업단 내 식별
체계 담당자가 마련하여 제공
정제 작업 방식
중복 확인 기계작업
- SQL Query를 활용하여 중복 확인하며 중복된 데이터 중 1건을 제외하고 나머지를 표시함(기계
작업)
- 30 -
구분 항목 세부항목 정제항목 오류유형 정제지침
참여
인력
정보
(56개)
기본
정보
(12
개)
주민등록
번호
인물ID인물ID이 발급되지 않
는 경우
인물 중복확인이 가능한 기본 항목(주민등록
번호 성명)이 존재하지 않으면 정제대상에서
제외
식별체계로부터 정제 수행 후 일괄발급 입력
인물관리
번호
(KOI)
NA
정제이전 인물관리번호 일괄 생성하여 key로
활용
Null 여부만 확인하고 정제대상에서 제외
주민등록
번호
Null인 경우 정제대상에서 제외
중복되는 주민등록
번호의 경우
인물관리번호 성명이 상이하면 현행 데이터
를 유지
모두 정제대상에서 제외
유효하지 않은 주민등
록번호의 경우
자리수가 lsquo-rsquo포함한 14자리가 아닌 데이터는
정제대상에서 제외
이관 후 서비스대상에서 제외
데이터 통합 기계작업 + 수작업
- 중복으로 확인된 항목들의 리스트를 비교하여 통합
- 기계적으로 필드간의 충돌이 없음을 확인할 수 있는 항목은 자동 통합하고 기계적으로 충돌을 확
인할 수 없는 경우는 수작업으로 필드별 데이터 통합을 수행
- 최신 또는 최종 여부를 확인하여 통합해야 하는 경우 해당 데이터에 포함된 일자 데이터를 감안
하여 선별 통합(일자 및 기간의 충돌이 없는 경우 기계작업 충돌이 있는 데이터는 리스트 업 후
수작업)
형식 확인 기계작업 + 수작업
- E-Mail 주소 전화번호와 같은 형식이 어느 정도 정의된 데이터의 경우 기본 형식을 템플릿으로
지정
- 정형화되지 않은 데이터의 리스트를 추출하여 이 중 기계적으로 형식을 일치시키고(기계작업)
일치되지 않은 데이터를 수작업으로 확인하여 수정하거나 형식 불량 데이터 리스트로 따로 추출
(수작업)
142 오류 유형별 정제 지침
오류 유형별 정제 지침은 lsquo131 세부 항목별 오류 패턴유형 분석rsquo 을 대상으로 정제지침을 정의
인력데이터
항목별 정해진 규칙에 위배되는 값이 들어있는 경우
- 31 -
구분 항목 세부항목 정제항목 오류유형 정제지침
외국인 및 임시주민번호의 경우 lsquo-rsquo포함한 14
자리가 아닌 데이터는 정제대상에서 제외
표준 포맷으로 구성되
어 있지 않은 경우
lsquo년(2)월(2)일(2)-성별(1)고유번호(6)lsquo 14자 숫자
로 구성되도록 변경
공란 및 특수문자를 제거
성명
성명-한글
Null의 경우
성명-영문 성명-한자가 존재하면 해당 필드
로 이동성명-한글 영문 한자 모두 Null이면 정제대
상에서 제외
이관 후 서비스대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
공란 및 특수문자 숫자 이름이 아닌 경우 제거
예) 이름이 아닌 경우 oo - --
예) 공란의 경우 홍 길동 홍길 동
예) 숫자의 경우 홍길동2 -gt 숫자만 제거
성명-영문
Null의 경우 정제대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
특수문자 숫자 이름이 아닌 경우 제거
예) Lee HS =gt Lee HS영문성명의 범위를 벗어난 경우
예) Lee KHS영문성명이 아닌 경우 해당 필드로 이동하거
나 제거
성명-한자
Null의 경우 정제대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
공란 및 특수문자 숫자 이름이 아닌 경우 제거
예) 金鉉- 洙 =gt 金鉉洙
한문이 아닌 경우 해당 필드로 이동하거나 제거
자택주소기본주소
(주소1)
Null의 경우
우편번호가 존재하면 우편번호로 검색된 주
소 입력 단 우편번호 유효검사를 거친 우편번호만
대상으로 함
우편번호가 존재하지 않으면 정제대상에서 제외
우편번호의 주소와 상
이한 경우
가베지 데이터가 아닌 경우에는 정제대상에서 제외
예) 외국 주소는 유지
가베지 데이터인 경우
기존 데이터는 삭제하고 우편번호가 존재하
면 우편번호로 검색된 주소 입력
우편번호가 존재하지 않으면 기존 데이터 삭
제만 수행
- 32 -
구분 항목 세부항목 정제항목 오류유형 정제지침
상세주소
(주소2)
Null인 경우 정제대상에서 제외
주소정보가 아닌 경우주소정보가 아닌 가베지 데이터는 삭제
예) test 042-123-1234 등
자택우편
번호우편번호
Null인 경우
기본 주소지로 검색하여 입력
기본 주소가 오류데이터이거나 없는 경우는
정제대상에서 제외
우편번호 표준 형식이
아닌 경우
표준 포맷 시도군 구분(3자리)+lsquo-rsquo+지역구분(3
자리)
표준 포맷이 아닌 경우는 표준 포맷으로 변경
예) 300100=gt300-100
300 100=gt300-100
300100 =gt300-100
자리 수가 6자 이하이거나 가베지 데이터인
경우는 제거
우편번호가 old data
인 경우
현재 우편번호가 아닌 경우는 이전 우편번호
주소지를 기준으로 검색하여 입력하고 매핑되
지 않는 데이터의 경우는 삭제
자택전화
번호전화번호
Null인 경우
핸드폰번호가 존재할 경우 복제하여 입력 단 핸드폰 번호의 오류를 정제한 이후 처
리
전화번호가 표준 형식
이 아닌 경우
표준 포맷 국번(2~3자리)-지역전화번호(34자
리)-전화번호(4자리)포준 포맷으로 변경
예) 02-6746-1234 or 041-567-6789
국번은 지역별 국번 참조
내선번호는 유지
지역번호 없는 경우
국번 Null인 경우 자택 주소지의 시도 지역
번호를 입력
예) 6746-1234 이면서 서울 지역의 예
-gt 02-6746-1234
국가번호가포함된경우
(+)국가번호-국번-지역전화번호-전화번호의
형식으로 변경
예) +82-02-6746-1234
가베지 데이터의 경우
자리수가 작거나 크면 제거
예) 02-64-123 or 02-6746-123
숫자(특수문자 포함)가 아닌 문자이면 제거
전화번호 데이터가 아닌 경우 제거
핸드폰번호인 경우 전화번호핸드폰번호 표준포맷으로 변경
- 33 -
구분 항목 세부항목 정제항목 오류유형 정제지침
핸드폰번호 핸드폰번호
Null인 경우 정제 대상에서 제외
핸드폰번호가 표준 형
식이 아닌 경우
이동통신구분번호(3자리)-지역구분번호(34자
리)-전화번호(4자리)로 변경
예) 011-6746-1234 or 019-789-1234
이동통신구분번호는 이동통신사별 구분번호
참조 SK(011 017) KTF(016 018) KG(109)
010(공통)
국가번호가 포함된
경우
(+)국가번호-이동통신구분번호-지역구분번호-
전화번호의 형식으로 변경
예) +82-010-6746-1234
이동통신구분번호가
없는 경우
이동통신구분번호가 없는 경우는 가베지 데이
터으로 판단하여 제거
예) 672-1234의 경우
전화번호인 경우 전화번호핸드폰번호 표준포맷으로 변경
E-mail E-mail
Null인 경우 정제 대상에서 제외
표준 이메일 형식이
아닌 경우
표준 포맷 ID메일서버URI로 구성
예)admin1234daumnet kisti4530kistirekr
구분자 lsquorsquo lsquorsquo으로 변경 및 공란 제거
예) admindaumnet =gt admindaumnet
두 개이상의 이메일이 존재할 경우 앞에 것을
우선으로 유지함
예)admin1234daumnet kisti4530kistirekr
=gt admin1234daumnet
E-mail 데이터가 아닌
경우
E-mail 주소 데이터가 아닌 경우와 가베지 데
이터는 삭제
예) wwwkistirekr -- adminkisti 1 lsquorsquo
공란 등
소속
기관
사항
(11
개)
소속
기관명
소속기관
코드NA 코드 오류 유형 참조
소속
기관명
Null인 경우
소속기관코드가 존재하는 경우에는 해당 소속
기관코드의 명을 검색하여 입력하고 소속기관
코드가 존재하지 않으면 정제대상에서 제외
소속기관명이 NTIS
코드 내 명칭이 아
닌 경우
기관명이형전거DB의 대표기관명으로 변경
예) 서울대 -gt 서울대학교
- 34 -
구분 항목 세부항목 정제항목 오류유형 정제지침
단 기관명이형전거DB에 존재하지 않는 소속
기관명은 신규발급 요청하여 소속기관명을 유
지함
소속기관명이 아닌
경우
소속기관코드가 존재하는 경우에는 해당 소속
기관코드의 명을 검색하여 입력하고 소속기관
코드가 존재하지 않으면 정제대상에서 제외
부서명근무
부서명
Null인 경우 정제대상에서 제외
근무부서명이 아닌
경우
가베지 데이터인 경우만 삭제하고 이외의 경
우는 정제대상에서 제외
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
직위명
직위코드 NA 코드 오류 유형 참조
직위명
Null인 경우
직위코드가 존재하는 경우에는 해당 직위코드
의 명을 검색하여 입력하고 직위코드가 존재
하지 않으면 정제대상에서 제외
직위명이 직위코드 내
명칭이 아닌 경우
직위명이 직위코드내 존재하지 않으면 직위명
은 그대로 유지하고 직위코드는 기타(lsquo999rsquo)로
매핑함
직위명이 아닌 경우
직위코드가 존재하는 경우에는 해당 직위코드
의 명을 검색하여 입력하고 직위코드가 존재
하지 않으면 삭제
사무실
전화번호
사무실
전화
Null인 경우 정제대상에서 제외
전화번호가 표준 형식
이 아닌 경우
표준 포맷 국번(2~3자리)-지역전화번호(34자
리)-전화번호(4자리)포준 포맷으로 변경
예) 02-6746-1234 or 041-567-6789
국번은 지역별 국번 참조
내선번호는 유지
지역번호 없는 경우
국번 Null인 경우 소속기관 주소지의 시도
지역번호를 입력
예) 6746-1234 이면서 서울 지역의 예
-gt 02-6746-1234
국가번호가 포함된
경우
(+)국가번호-국번-지역전화번호-전화번호의
형식으로 변경
예) +82-02-6746-1234
- 35 -
구분 항목 세부항목 정제항목 오류유형 정제지침
가베지 데이터의 경우
자리수가 적거나 크면 제거
예) 02-64-123 or 02-6746-123
숫자(특수문자 포함)가 아닌 문자이면 제거
전화번호 데이터가 아닌 경우 제거
핸드폰번호인 경우 기본정보의 핸드폰번호로 이동
기관주소
기본주소
(주소1)
Null의 경우
우편번호가 존재하면 우편번호로 검색된 주
소 입력
단 우편번호 유효검사를 거친 우편번호만
대상으로 함
우편번호의 주소와 상
이한 경우
가베지 데이터가 아닌 경우에는 정제대상에서
제외
가베지 데이터인 경우기존 데이터는 삭제하고 우편번호가 존재하
면 우편번호로 검색된 주소 입력
상세주소
(주소2)
Null인 경우 정제대상에서 제외
주소정보가 아닌 경우주소정보가 아닌 가베지 데이터는 삭제
예) test 042-123-1234 등
우편번호
Null인 경우
기본 주소지로 검색하여 입력
기본 주소가 오류데이터이거나 없는 경우는
정제대상에서 제외
우편번호 표준 형식이
아닌 경우
표준 포맷 시도군 구분(3자리)+lsquo-rsquo+지역구분(3
자리)
표준 포맷이 아닌 경우는 표준 포맷으로 변경
예) 300100=gt300-100
300 100=gt300-100
300100 =gt300-100
자리 수가 6자 이하 이거나 가베지 데이터인
경우는 제거
우편번호가 old data
인 경우
현재 우편번호가 아닌 경우는 이전 우편번호
주소지를 기준으로 검색하여 입력하고 매핑되
지 않는 데이터의 경우는 삭제
인력
구분
인력
구분NA 기관명이형전거DB에 의해 매핑
최초
임용일
최초
임용일NA 날짜 오류 유형 참조
학력
사항전공
전공분야 NA 코드 오류 유형 참조
전공명 Null인 경우 정제대상에서 제외
- 36 -
구분 항목 세부항목 정제항목 오류유형 정제지침
(14
개)
전공명이 아닌 경우
가베지 데이터인 경우만 삭제하고 이외의 경
우는 정제대상에서 제외
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
취득대학
학위취득
대학코드NA 코드 오류 유형 참조
학위취득
대학명
Null인 경우
학위취득대학코드가 존재하는 경우에는 해당
학위취득대학코드의 명을 검색하여 입력하고
학위취득대학코드가 존재하지 않으면 정제대
상에서 제외
학위취득대학명이 학
위취득대학코드 내 명
칭이 아닌 경우
기관명이형전거DB의 대표기관명으로 매핑하
고 존재하지 않는 경우 신규 발급 요청하여
학위취득대학명을 유지함
학위취득대학명이 아
닌 경우
학위취득대학코드가 존재하는 경우에는 해당
학위취득대학코드의 명을 검색하여 입력하고
학위취득대학코드가 존재하지 않으면 삭제
학위 학위코드 NA 코드 오류 유형 참조입학일 입학년월 NA 날짜 오류 유형 참조졸업일 졸업년월 NA 날짜 오류 유형 참조
학과
학과코드 NA 코드 오류 유형 참조
학과명
Null인 경우 정제대상에서 제외
학과명이 학과코드내
명칭이 아닌 경우학과코드의 명으로 변경
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등
취득국가취득국가
코드NA 코드 오류 유형 참조
지도
교수명
지도
교수명
Null인 경우 정제대상에서 제외
이름이 아닌 경우 삭제하고 정제대상에서 제외
학위
논문명
최종학위
논문명1
Null인 경우 정제대상에서 제외
논문명1이 Null인경우논문제목1이 Null인 경우 논문제목2에서 이동
함
- 37 -
구분 항목 세부항목 정제항목 오류유형 정제지침
가베지 데이터인 경우
삭제
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
최종학위
논문명2
Null인 경우 정제대상에서 제외
논문명1이 Null인경우 논문제목1이 Null인 경우 논문제목1로 이동함
가베지 데이터인 경우
삭제
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터 문자열이지만 특정 문자가
반복된 데이터
학위
취득일
최종학위
취득일NA 날짜 오류 유형 정제지침 참조
경력
사항
(5개)
근무처명 근무처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
직위명
직위코드 NA 코드 오류 유형 정제지침 참조
직위명
Null인 경우 정제대상에서 제외
직위명이 직위코드내
명칭이 아닌 경우
직위명이 직위코드내 존재하지 않으면 직위명
은 그대로 유지하고 직위코드는 기타(lsquo999rsquo)로
매핑함
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
근무기간
근무
시작일NA 날짜 오류 유형 정제지침 참조
근무
종료일NA 날짜 오류 유형 정제지침 참조
자격
사항
(3개)
자격
발행처
자격
발행처
Null인 경우 정제대상에서 제외
가베지 데이터인 경우특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
- 38 -
구분 항목 세부항목 정제항목 오류유형 정제지침
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
자격증명 자격증명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
자격
취득일
자격
취득일NA 날짜 오류 유형 정제지침 참조
논문
실적
(8개)
논문
발표일
논문
발표일NA 날짜 오류 유형 정제지침 참조
국문
논문명
논문제목
국문
Null인 경우 정제대상에서 제외
필수
논문제목국문이 Null이고 논문제목영문이 Null
이 아닐 경우 논문제목영문을 논문제목국문으
로 이동시키고 논문제목영문은 Null로 갱신
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
영문
논문명
논문제목
영문
Null인 경우 정제대상에서 제외
필수
논문제목국문이 Null이고 논문제목영문이 Null
이 아닐 경우 논문제목영문을 논문제목국문으
로 이동시키고 논문제목영문은 Null로 갱신
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
저자역할
구분
저자역할
구분NA 코드 오류 유형 정제지침 참조
발행처 발행처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
- 39 -
구분 항목 세부항목 정제항목 오류유형 정제지침
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터학술지
구분
학술지구
분NA 코드 오류 유형 정제지침 참조
학술지명 학술지명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
SCI여부 SCI여부 NA 코드 오류 유형 정제지침 참조
지식
재산
권
(3개)
지식
재산권명
지식
재산권명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
출원_등
록번호
출원등록
번호
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
특허구분 특허구분 NA 코드 오류 유형 정제지침 참조
평가
위원
(13개)
소속
학협
회
현황
(5개)
담당업무 담당업무
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
직위 직위
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
- 40 -
구분 항목 세부항목 정제항목 오류유형 정제지침
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
학협회
사항
학협회명
Null인 경우 정제대상에서 제외
직위명이 포함되어 있
는 경우
직위명이 존재하지 않으면 직위명 항목에 복
사하고 직위명칭에 관련된 부분은 삭제 존재
한다면 관련 부분을 삭제
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
활동시작
일NA 날짜 오류 유형 정제지침 참조
활동종료
일NA 날짜 오류 유형 정제지침 참조
훈포
장
사항
(3개)
수상년월 수상년도 NA 날짜 오류 유형 정제지침 참조
수여
기관명
수여기관
명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
훈포장명 수상명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저역
서
실적
(5개)
저서명1 저서명1
Null인 경우 정제대상에서 제외
저서명1이 Null인 경
우저서명2를 저서명1로 저장
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저서명2 저서명2
Null인 경우 정제대상에서 제외
저서명1이 Null인 경
우저서명2를 저서명1로 저장
가베지 데이터인 경우 특수문자 숫자로만 구성되거나 그 외의 가베
- 41 -
구분 항목 세부항목 정제항목 오류유형 정제지침
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
발행년 발행년도 NA 날짜 오류 유형 정제지침 참조
발행처 발행처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저역서
구분
저역서
구분NA 코드 오류 유형 정제지침 참조
- 42 -
구분 항목 세부항목 정제항목 오류내역 정제지침
참여인력정보(11개)
소속기관사항(1개)
최초임용일최초임용일
YYYYMMDD
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
DD가 없는 경우 01일로 갱신
YYYYMMDD가 유
효하지 않은 경우
년도가 유효하면 월-gt01월 일-gt01
일로 갱신하고 년도 자체가 유효하
지 않으면 삭제
학력사항(3개)
입학일입학년월
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 03월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt03월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
졸업일졸업년월
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 02월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt02월로 갱신
하고 년도 자체가 유효하지 않으면
삭제입학년월보다 같
거나 작은 경우데이터 삭제
학위취득일
최종학위
취득일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효
하지 않은 경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
경력사항(2개)
근무기간근무시작일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
날짜로서 유효한 형태를 갖고 있지 않은 경우
- 43 -
구분 항목 세부항목 정제항목 오류내역 정제지침
제
근무종료일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
근무시작일보다
같거나 작은 경우
근무시작일에서 YYYYMM이 동일하
면 삭제하고 근무시작일에서 YYYY
은 동일하나 MM이 작을 경우에만
삭제
자격사항(1개)
자격취득일자격취득일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
논문실적(1개)
논문발표일논문발표일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효
하지 않은 경우
년도가 유효하면 월-gt01월로 갱신하고
년도자체가유효하지않으면삭제
소속학협회현황(2개)
학협회사항
활동시작일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경
우데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭제
활동종료일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하고
년도자체가 유효하지않으면 삭제
- 44 -
구분 항목 세부항목 정제항목 오류내역 정제지침
활동시작일보다
같거나 작은 경우
활동시작일에서 YYYYMM이 동일하
면 삭제하고 활동시작일에서 YYYY
은 동일하나 MM이 작을 경우에만
삭제
훈포장사항(1개)
수상년월수상년도
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 변경하고
년도자체가 유효하지않으면 삭제
평가위원(1개)
저역서실적(1개)
발행년발행년도
YYYY
Null인 경우 정제대상에서 제외
YYYY이 유효하지
않은 경우유효하지 않으면 삭제
구분 항목세부항목
정제항목 오류유형 정제지침
참여
인력
정보
(15개)
기본정보
(1개)
자택
우편번호
우편번호
기본주소
Null의 경우주소가 존재하면 주소지로 우편번호 검색
하여 우편번로를 입력(정제작업자)
우편번호와주소
정보가불일치
middot 기본 주소가 가베지 데이터가 아니고 상
세주소가 존재한다면 그대로 유지하고
가베지 데이터이면 우편번호 상 주소를
기본주소에 입력
상세주소가 존재하면서 오류 데이터가 아
닌 경우에는 기본주소의 변경은 하지 않으
며 기존의 우편번호를 주소지에 맞게 주소
검색하여 변경
소속기관
사항(4개)소속기관명
소속기관코드
소속기관명
Null인 경우 정제대상에서 제외
소속기관명만
존재하는 경우
기관명이형전거DB에서 검색하여 이형기관
코드 대표기관명으로 매핑하고 존재하지
않는 경우 신규 발급 요청하여 그대로 유
지함
시작일보다 종료일이 같거나 작은 경우 종료일을 삭제
날짜의 경우 본인의 생년월일보다 작을 수 없음
코드의 값이 정해진 범위를 벗어난 경우
- 45 -
구분 항목세부항목
정제항목 오류유형 정제지침
소속기관코드만
존재하는 경우
해당 소속기관코드를 기관명이형전거DB에
서 검색하여 소속기관명을 갱신하며 매핑
되지 않는 소속기관코드는 삭제
직위명직위코드
직위명
Null인 경우 정제대상에서 제외
직위명만 존재
하는 경우
직위명으로 동일 또는 유사한 직위코드를
검색하여 입력하고 직위코드 내 존재하지
않는 직위명칭이면 lsquo기타rsquo로 매핑
[직위코드] NTIS 직위코드 참조
직위코드만 존
재하는 경우
해당 직위코드를 NTIS 직위코드의 직위명
으로 검색하여 갱신하며 매핑되지 않는 직
위코드는 삭제
[직위코드] NTIS 직위코드 참조
기관주소 우편번호
Null의 경우
주소가 존재하면 주소지로 우편번호 검색
하여 입력
단 우편번호 내 기본주소만 가능
우편번호와 기
본주소가 불일
치
기본 주소가 가베지 데이터가 아니고 상세
주소가 존재한다면 그대로 유지하고 가베
지 데이터이면 우편번호 상 주소를 기본주
소에 입력상세주소가 존재하면서 오류 데이터가 아
닌 경우에는 기본주소의 변경은 하지 않으
며 기존의 우편번호를 주소지에 맞게 주소
검색하여 변경
인력(직업)
구분인력유형구분
Null인 경우 정제대상에서 제외인력유형구분
코드 범위를
벗어나는 경우
[인력구분코드] 대학교 연구소 산업계 기
타 등 구분코드 범위를 벗어나는 데이터는
Null로 갱신
학력사항
(5개)
전공전공코드
전공명
Null인 경우 정제대상에서 제외전공명만 존재
하는 경우
전공명으로 NTIS 전공코드를 검색하여 입
력
[전공코드] NTIS 전공코드 참조
전공코드만 존
재하는 경우
해당 전공분야코드를 NTIS 전공코드에서
전공명을 검색하여 갱신하며 매핑되지 않
는 전공코드는 삭제
[전공코드] NTIS 전공코드 참조
취득대학
학위취득대학
코드
학위취득대학명
Null인 경우 정제대상에서 제외
학위취득대학
명만 존재하는
경우
기관명이형전거DB에서 검색하여 이형기관
코드 대표기관명으로 매핑하고 존재하지
않는 경우 신규 발급 요청하여 그대로 유
지함
- 46 -
구분 항목세부항목
정제항목 오류유형 정제지침
학위취득대학
코드가 존재하
는 경우
해당 학위취득대학코드를 기관명이형전거
DB에서 검색하여 학위취득대학명을 갱신하
며 매핑되지 않는 학위취득대학코드는 삭
제
학위 학위코드
Null인 경우 정제대상에서 제외
학위코드 범위
를 벗어나는
경우
존재하는 학위코드가 NTIS 학위코드와 매
핑되는지 확인하고 멥핑되지 않는 학위코
드는 삭제
[학위코드] NTIS 학위코드 참조
학과학과코드
학과명
Null인 경우 정제대상에서 제외
학과명만 존재
하는 경우
학과명으로 동일 또는 유사한 NTIS 학과코
드를 검색하여 입력하고 NTIS 학과코드 내
존재하지 않는 학과명이면 기타 코드로 매
핑함
[학과코드] NTIS 학과코드 참조
학과코드만 존
재하는 경우
해당 학과코드를 NTIS 학과코드의 학과명
을 검색하여 갱신하며 매핑되지 않는 학과
코드는 삭제
[학과코드] NTIS 학과코드 참조
취득국가 취득국가코드
Null인 경우 정제대상에서 제외
취득국가코드
의 범위를 벗
어나는 경우
존재하는 국가코드가 NTIS 국가코드와 매
핑되는지 확인하고 멥핑되지 않는 국가코
드는 삭제
[국가코드] NTIS 국가코드 참조
경력사항
(2개)직위명
직위코드
직위명
Null인 경우 정제대상에서 제외
직위명만 존재
하는 경우
직위명으로 동일 또는 유사한 직위코드를
검색하여 입력하고 직위코드 내 존재하지
않는 직위명칭이면 lsquo기타rsquo로 매핑
[직위코드] NTIS 직위코드 참조
직위코드만 존
재하는 경우
해당 직위코드를 NTIS 직위코드의 직위명
으로 검색하여 갱신하며 매핑되지 않는 직
위코드는 삭제
[직위코드] NTIS 직위코드 참조
논문실적
(3개)
저자역할
구분저자역할구분
Null인 경우 정재 대상에서 제외
저자역할구분존재하는저자역할구분가 NTIS 저자역할구
- 47 -
구분 항목세부항목
정제항목 오류유형 정제지침
코드의 범위를
벗어나는 경우
분코드와 매핑되는지 확인하고 멥핑되지
않는 국가코드는 삭제
[역할구분코드] NTIS 저자역할구분코드 참
조
학술지
구분학술지구분
Null인 경우 정재 대상에서 제외
학술지구분코
드의 범위를
벗어나는 경우
존재하는 학술지구분코드가 NTIS 학술지
구분코드와 매핑되는지 확인하고 멥핑되지
않는 학술지구분코드는 삭제
[학술지구분코드] NTIS 저자역할구분코드
참조
SCI여부 SCI여부
Null인 경우 정재 대상에서 제외
SCI여부구분코
드의 범위를
벗어나는 경우
존재하는 SCI여부구분코드가 lsquo01 또는
02가 아닌 데이터는 Null로 갱신
[SCI여부구분코드] NTIS SCI여부구분코드
참조
지식
재산권
(1개)
특허구분 특허구분
Null인 경우 정제대상에서 제외
특허구분코드
의 범위를 벗
어나는 경우
존재하는 특허구분코드가 NTIS 특허구분
코드와 매핑되는지 확인하고 멥핑되지 않
는 특허구분코드는 삭제
[특허구분코드] NTIS 특허구분코드 참조
평가위원(1개)
저역서실적(1개)
저역서구분 저역서구분
Null인 경우 정제대상에서 제외
저역서구분코
드의 범위를
벗어나는 경우
존재하는 저역서구분코드가 NTIS 저역서
구분코드와 매핑되는지 확인하고 멥핑되지
않는 저역서구분코드는 삭제
[저역서구분코드] 1저서 2역서 中 택일
공통사항
- 매핑하고자 하는 기존 코드명(공란 및 특수문자 제거)으로 NTIS 표준 코드 內 한글코드명을 대
상으로 검색하여 동일한 코드명(11의 경우)은 시스템(SQL App 등)을 통해 미리 매핑하고 유사
한 코드명(1N의 경우)은 정제작업자가 선택한 코드로 입력하여 매핑 처리
- 코드 종류가 소수(3개 미만)인 경우 Source 데이터 내 등록되어 있는 코드 또는 코드명칭을 대
상으로 동일한 패턴별로 일괄 변환(SQL Query Excel)처리한 후 변환되지 않은 데이터는 삭제
- 코드가 가베지 데이터인 경우는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 영숫자가 아닌 특수문자로만 구성된 데이터 특정 문자가 반복된 코드와
관련되지 않은 데이터
- 48 -
구분 항목 이중등록검사항목 정제지침 비 고
참여
인력
정보
기본
정보주민등록번호()
주민등록번호가 동일한 인력데이
터가 2개 이상이면 시스템으로
추출하여 이중등록검사를 수행함
시스템 정제
소속기
관사항소속기관명()
인력별 동일한 소속기관사항 데이
터가 2개 이상이면 시스템으로
추출하여 1개만 남겨 놓고 나머지
는 오류 체크 필드에 표시함
시스템 정제
학력
사항
1 취득대학() 학위() 입학일
2 취득대학() 학위() 졸업일
3 취득대학() 학위() 전공
4 취득대학() 학위() 학과
5 취득대학() 학위() 학위취득일
인력별 동일한 학력사항 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
경력
사항
1 근무처명() 직위명 근무시작일
1 근무처명() 직위명 근무종료일
인력별 동일한 경력사항 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
논문
실적
1 논문명() 논문발표일 학술지명
2 논문명() 논문발표일 ISSN
3 논문명() ISSN 게재권집 게재
호
4 논문명() 학술지명 게재권집
게재호
인력별 동일한 논문실적 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
지식
재산권
1 출원_등록번호()
2 지식재산권명() 출원등록구분
특허구분() 출원국가
인력별 동일한 지식재산권 데이터
가 2개 이상이면 시스템으로 추
출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
시스템 정제
저역서
실적
1 ISBN
2 저역서명() 저역서구분() 발행
인력별 동일한 저역서실적 데이터
가 2개 이상이면 시스템으로 추시스템 정제
143 이중등록 유형별 정제지침
이중등록 정제 지침
- 이중등록에 대한 정제는 오류 유형 정제 및 코드 매핑 처리 후 수행함
- 이중등록에 대한 데이터는 최신 데이터를 우선으로 유지함
- 이중등록검사항목의 문자Type의 데이터는 공란제거 제거 후 이중등록검사를 수행함
- 대상데이터의 이중등록검사항목 중 1개 이상 항목이 Null인 경우 이외의 항목이 동일하
여도 이중등록 정제 대상에서 제외함
- 49 -
구분 항목 이중등록검사항목 정제지침 비 고
년 발행처출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
평가
위원
소속학
협회
현황
1 학협회명() 직위 시작일
2 학협회명() 직위 종료일
인력별 동일한 소속학협회현황
데이터가 2개 이상이면 시스템으
로 추출하여 1개만 남겨 놓고 나
머지는 오류 체크 필드에 표시함
시스템 정제
훈포장
사항훈포장명() 수상년월 수여기관명
인력별 동일한 훈포장사항 데이터
가 2개 이상이면 시스템으로 추
출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
시스템 정제
자격
사항
자격증명() 자격발행처 자격취득
일
인력별 동일한 데이터가 2개 이상
이면 시스템으로 추출하여 1개만
남겨 놓고 나머지는 오류 체크 필
드에 표시함
시스템 정제
15 데이터 정제 절차 및 작업지침
151 데이터 정제 절차
- 50 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
데이터
정제
준비
초기
데이터
구축
연계기관기반 정보취합
연계기관 인력데이터 구조(스키마 엔터티 정의)코드정보 등 통합 인력DB로의 이관을 위한 연계기관 제공 정보 취합
기관 협의 정보 제공 기반정보 분석
연계대상기관데이터 취합
통합하고자 하는 연계기관 인력데이터를 제공받아 Temp DB(연계기관데이터 구조와 동일)에등록
기관 협의 데이터제공 데이터 생성
연계기관
데이터 이관
준비
NTIS 표준 코드정보를KISTI로부터 제공받음 표준 코드 제공 코드 분석
기존 코드별 NTIS 표준코드 매핑 정의 표준코드매핑 작성
플래그성 매핑기준작성
기존 데이터에 표준 코드 반영 표준코드 매핑처리
표준 코드 적용결과 검토 데이터 확인
연계기관
데이터 분석
및 매핑계획
수립
연계기관 데이터 분석 데이터 분석 데이터 분석
연계기관 코드매핑 정의 기관 코드매핑 작성플래그성 매핑 기준 작성
테이블매핑 정의테이블 매핑정보확정
테이블 매핑(안) 작성
데이터
정제 기준
및
계획 수립
과학기술 인력정보 데이터 분석
정제 대상 RampD참여인력데이터 분석
정제 대상 항목 및 기준에 대한 정의
데이터 정제 내역검토
데이터 분석
데이터정제 내역작성
데이터 정제기준 및 절차협의
정제 대상 데이터 건수및 연계 기관 인력데이터 포함 범위 정제 항목 선정 정제 공정(정제 1차 검증 최종 확인) 확정
정제 범위 대상 확정 협의 진행
데이터 정제매뉴얼 작성
데이터정제매뉴얼구성내용
데이터정제개요및절차정의
정제대상정의및정제범위
정제항목별기준및예시
정제검증도구사용법
전환코드표
표준양식
정제매뉴얼 검토및 확정
정제매뉴얼 초안작성
상세일정계획수립
정제 량을 분석하여 투입인력대비 주월별 데이터 정제 계획대비 실적 산정
일정 검토 및 확정 일정계획 작성
152 정제 단계별 작업 지침
- 51 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
데이터 정제 작업 환경 구축
작업 환경 및작업자 구성 데이터 정제 환경 구성
작업자 모집
작업장 환경 구축(월평동)
데이터정제 작업교육실시
정제작업자 및 정제관리자를 대상으로 교육 실시 및교육결과서작성
작업자 정제작업교육 실시
데이터정제진행
정제 작업수행
데이터 정제및 검증 데이터 정제 추진결과
데이터 정제
정제결과 검증(작업자별 검증)
정제추진현황보고 실적 보고
실적 확인 및 이슈사항 협의
주별진척보고
이슈사항 및 문제점 보고
데이터정제완료
데이터 이관 및 검수
데이터 이관정제된 데이터를 작업DB에서 서비스DB 로이관
이관 확인 데이터 이관
데이터 검수(최종 확인)
RampD 참여인력 데이터(정제 결과물) 검사 (샘플링 검수)
검수(샘플링)검수 데이터 추출제공
153 항목별 정제작업 세부지침
공통사항 및 시스템정제
공통사항
1 정보유형별로 주요항목이 존재하지 않는 경우라도 기본 학력 소속기관사항은 삭제하지
않고 실적정보는 삭제 처리함
가 정보유형별로 경력정보 실적정보의 주요항목이 Null인 데이터는 삭제
나 기존데이터의 경우 학력 소속기관사항은 주요항목이 Null이지만 현황정보 제공 필드가
존재하면 유지함
학력사항 학위 전공 등 존재하면 유지
소속기관사항 우편번호 직위 등 존재하면 유지
2 코드 항목 값을 NTIS 코드정보 내 명칭으로 갱신함
가 소속기관명 학위취득대학명 학과명 전공명 직위명 등을 NTIS 표준코드로 매핑하여
코드값을 넣고 각 항목에 NTIS 코드정보 내 코드명으로 변환하여 갱신함
- 52 -
No원본데이터 정제 후
정제요령 비고코드 명 코드 명
1 한국타이어(주) AAB6793 (주)한국타이어
기관명이형전거DB에서
대표기관명과
이형기관코드로 매핑
2 연구원 B06 연구원 직위코드 매핑
3 가베지 데이터의 값을 삭제 처리함
가 정보유형별 각 항목에서 가베지 데이터에 대해 삭제 처리함
No원본데이터 정제 후
정제요령 비고데이터 데이터
1 test 가베지 처리
2 가베지 처리
3 - 가베지 처리
4 가베지 처리
5 blank 가베지 처리
6 가베지 처리
7 서울대학교 서울대학교 정제 처리
시스템정제
1 비교대상이 존재하지 않는 항목에 대해서는 시스템정제(Null처리) 한다
가 시스템정제 항목
항목 세부항목 비고소속기관 인력구분
학력사항취득국가학위
지식재산권 특허구분
저역서실적 저역서구분
논문실적저자역할구분학술지구분SCI여부
비 고
shy 날짜 데이터의 경우 생성일이 완료일보다 후에 있는 경우 생성일을 남
겨놓고 완료일 삭제
shy 년도 포맷의 경우 1900년도~현재(정제시점)을 기준으로 이전이나 이후는
Null 로 갱신
shy 날자 데이터의 경우 생년월일보다 빠른 경우는 삭제
기본정보
기본정보_주민등록번호 정제지침
1 주민등록번호가 null인 경우 정제대상에서 제외
- 53 -
2 주민등록번호가 유효하지 않은 lsquo-rsquo포함한 14자가 아닌경우 정제대상에서 제외
No원본데이터 정제 후
정제요령 비고주민번호 이름 주민번호 이름
1 090166-471ORHAN
NALCIOGLU090166-471
ORHAN
NALCIOGLU정제대상에서 제외
2 000000-1111111 홍길동 000000-1111111 홍길동 lsquo-rsquo포함 14자리는 유지
3 194912-100001F 요이치로스즈키 194912-100001F 요이치로스즈키주민번호에 영문자
포함(F) 데이터 유지
4 1234561234567 홍길동 123456-1234567 홍길동 lsquo-rsquo 추가
3 기타사항
가 주민번호에 특수문자 포함시 가베지 데이터 처리(삭제)
기본정보_성명 정제지침
1 각 항목(한글영문한자)에 맞는 데이터 값 확인
2 성명 이외의 가베지 데이터는 삭제
3 한글한자영문이름이 모두 null인 경우 데이터 유지(서비스 제외)
4 한글한자영문이름이 가베지 데이터인 경우 가베지 값 삭제 데이터 유지(서비스 제외)
5 한글한자영문 이름을 각 항목에 맞게 값을 이동(한글성명은 한글 영문성명은 영문 한
자성명은 한자)
6 한글한자영문 이름이 기업명 또는 법인명인 경우 데이터 삭제
No원본데이터 정제 후
정제요령 비고한글이름 영문이름 한글이름 영문이름
1 SK LEE SK LEE 맞는 항목으로 값을 이동
2 test -- 삭제
3홍길동
(영구참여제한자)HONG GD 홍길동 HONG GD
이름 외 가베지 데이터
삭제
영문성명이 성+이니셜은
유지
4 성진기계 기업 법인명 삭제
5 홍 길 동 HGD 홍길동 영문성명 삭제
공란 제거
기본정보_주소 우편번호 정제지침
1 우편번호와 주소 모두 null인 경우 정제대상에서 제외
2 우편번호가 표준 형식이 나닌 경우 표준 포맷으로 변경(lsquo-rsquo포함한 7자리)
- 54 -
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302230 302-230 표준 포맷으로 변경
3 우편번호는 null 이지만 주소는 존재하는 경우 주소를 검색하여 우편번호 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 대전 서구 정림동 302-230 대전 서구 정림동우편번호에서 검색하여
매핑한다
4 우편번호는 존재하나 주소가 null인 경우 우편번호에 해당하는 주소 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302-230 302-230 대전 서구 정림동우편번호에서 검색하여
기본주소까지 입력한다
5 우편번호와 주소 값이 가베지 데이터인 경우 가베지 처리
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 111-1 대구 수성구 가베지 처리
2 111 대전 서구 정림동 302-230 대전 서구 정림동
기존 가베지 우편번호
대신에 주소를 가지고
새로운 우편번호를
검색하여 매핑한다
6 우편번호 체계가 OLD 데이터인 경우 현 주소로(NTIS 우편번호체계) 검색하여 매핑
No원본데이터 정제 후
정제요령 비고우편번호 주소1 우편번호 주소
1 449-981경기도 용인시 수지읍 성복리
LG2차아파트201~208동448-981
경기 용인시 수지구 성복동
LG2차빌리지
우편번호에서 검색하여
현재 우편번호로 매핑함
7 기타사항
가 외국주소 데이터 유지 원칙
(1) 우편번호가 국내우편번호인 경우는 우편번호만 가베지 처리
(2) 기본주소에 국가명만 존재해도 데이터 유지
나 주소가 2개 이상인 경우 세부주소를 포함한 주소로 정제
다 기본주소와 상세주소 구분(우편번호 기준 원칙)
(1) 기본주소 우편번호를 검색하여 나온 해당 주소
(2) 상세주소 우편번호를 검색하여 나온 해당 주소 이외의 주소
- 55 -
No원본데이터 정제 후
정제요령 비고우편번호 주소1 주소2 우편번호 주소1 주소2
1
11 schlundt
annex columbia
mo 65211 usa
11 schlundt annex
columbia mo
65211 usa
외국주소는 유지
2 USA USA기본주소에 국가명만
존재해도 데이터 유지
3 137-764
서울 서초구
반포2동
반포주공아파트
0동 0호
137-764
서울 서초구
반포2동
반포주공아파트
0동 0호 기본주소와 상세주소 구분
기본정보_전화번호 핸드폰번호 정제지침
1 전화번호가 null인 경우 정제대상에서 제외
2 전화번호 기본포멧 유지
가 지역번호-국번-전화번호
나 +국가번호-지역번호-국번-전화번호
다 이동통신구분번호(3자리)-지역구분번호(34자리)-전화번호(4자리)
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 042)123-4567 010-1234567 042-123-4567 010-123-4567 기본포맷으로 변경
2 015-123-1234
SK(011 017) KTF(016
018) KG(109) 010(공통)
만 유지
3 +1-125-123-1234 +1-111-123-1215 +1-125-123-1234 +1-111-123-1215 외국전화번호는 유지
3 지역번호 없는 경우 주소지의 시도 지역번호를 입력
No원본데이터 정제 후
정제요령 비고자택 전화번호 주소 자택 전화번호 주소
1 6746-1234 서울 강남구 서초동 02-6746-1234 서울 강남구
서초동
주소지의 시도 지역번호를
입력
2 6746-1234 주소정보 없으므로 삭제
4 국가번호가 포함된 경우 ldquo(+)국가번호-국번-지역전화번호-전화번호ldquo 형태로 변경
No원본데이터 정제 후
정제요령 비고자택 전화번호 자택 전화번호
1 +82)02-6746-1234 +82-02-6746-1234
ldquo(+)국가번호-국번-지역전
화번호-전화번호ldquo 형태로
변경
5 전화번호 외 가베지 데이터는 삭제
- 56 -
가 텍스트 최소자릿수 미달(3자리 미만)등
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 02-64-123 010-111-111 자리수가 작으면 제거
6 데이터를 각 항목에 맞도록 이동 정제
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 010-2353-0416 042-123-0416 042-123-0416 010-2353-0416전화번호와 핸드폰 번호를
각 항목에 맞게 이동
7 기타사항
가 내선번호 및 과거지역번호 데이터 유지
나 전화번호가 2개 이상인 경우 앞의 전화번호를 우선으로 유지함
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 0431-123-1234 0431-123-1234 예전 지역번호는 유지
2 042-123-1234(100) 042-123-1234(100) 내선번호 유지
3 0431-123-1234 1235 0431-123-1234 앞의 전화번호를 우선으로
유지
기본정보_e-mail 정제지침
1 이메일 기본포멧 오류 및 내용상 무의미한 값 가베지 처리
No원본데이터 정제후
정제요령 비고e-mail e-mail
1 123123com 가베지 처리
2 1111111com 가베지 처리
3 123 가베지 처리
4 wwwkistirekr 가베지 처리
5 --- 가베지 처리
2 E-mail 2개 이상 존재 가베지 삭제 후 이상없는 값은 모두 유지
No원본데이터 정제후
정제요령 비고e-mail e-mail
1chhyangmdhanmailnet
chhyangdumcorkrrchhyangmdhanmailnet
앞의 이메일을 우선으로
유지함
2 abcdaumnet abcdaumnet이메일의 구분자가 누락된
경우 구분자 추가함
- 57 -
소속기관사항
소속기관_주소 우편번호 정제지침 ( 기본정보_주소 우편번호 정제지침 참조)
1 우편번호와 주소 모두 null인 경우 - 정제대상에서 제외
2 우편번호는 null 이지만 주소는 존재하는 경우 주소를 검색하여 우편번호 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 대전 서구 정림동 302-230 대전 서구 정림동우편번호에서 검색하여
매핑한다
3 우편번호는 존재하나 주소가 null인 경우 우편번호에 해당하는 주소 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302-230 302-230 대전 서구 정림동우편번호에서 검색하여
기본주소까지 입력한다
4 우편번호와 주소 값이 가베지 데이터인 경우 가베지 처리
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 111-1 가정교육학 가베지 처리
2 111 대전 서구 정림동 302-230 대전 서구 정림동기존 가베지 우편번호 대신에 주소를 가지고
새로운 우편번호를 검색하여 매핑한다
5 우편번호 체계가 OLD 데이터인 경우 현 주소로 검색하여 매핑
6 기타사항
가 외국주소 데이터 유지 원칙
(1)우편번호가 국내우편번호인 경우는 우편번호만 가베지 처리
(2)기본주소에 국가명만 존재해도 데이터 유지
나 주소가 2개 이상인 경우 소속기관명을 기준으로 정제(소속 기관이 소재한 주소만 유
지하고 그 외 주소는 가베지 처리)
다 기관 주소로 적합하지 않은 주소(자택주소)인 경우 유효한 주소로 정제(주소가 둘 이
상일 경우)
소속기관_사무실전화번호 팩스번호 정제지침 ( 기본정보_전화번호 핸드폰번호 정제지침 참조)
1 전화번호가 null인 경우 정제대상에서 제외
2 전화번호 기본포멧 유지
가 지역번호-국번-전화번호
- 58 -
나 +국가번호-지역번호-국번-전화번호
3 전화번호 외 가베지 데이터는 삭제
가 텍스트 최소자릿수 미달(3자리 미만)등
4 데이터를 각 항목에 맞도록 이동 정제
No원본데이터 정제 후
정제요령 비고사무실 전화번호 기본정보핸드폰 번호
1 010-2353-0416 010-2353-0416
사무실전화번호에
핸드폰번호 형태의
데이터가 있을 경우
삭제하고 기본정보의
핸드폰번호가 널일
경우에만 이동함
5 기타사항
가 내선번호 및 과거지역번호 데이터 유지
나 지역번호 누락시 주소항목에서 유추 기입(유추 불가시 널처리)
다 전화번호가 2개 이상인 경우 기존 데이터 유지
라 기준에 명시되지 않은 사항은 추후 사업주관기관과 협의하여 진행
소속기관_기관 부서명 직위 정제지침
1 기관 부서명 직위 모두 null인 경우 정제대상에서 제외
2 기관 직위는 NTIS 코드값에서 검색하여 매핑
3 인력구분은 기관명이형전거DB에 의해 자동 매핑함
No원본데이터 정제 후
정제요령 비고기관코드 기관명 기관코드 기관명
1 한국타이어(주) AAB6793 (주)한국타이어
기관명이형전거DB에서
대표기관명과
이형기관코드로 매핑
No원본데이터 정제 후
정제요령 비고직위코드 직위명 직위코드 직위명
1 교수 A01 교수NTIS 직위코드에서
검색하여 매핑한다
2 항해사 999 항해사
직위코드에 매핑되지
않으면 직위코드는 lsquo999rsquo로
매핑하고 직위명은 유지함
4 필드내 중복데이터가 존재할 경우 가베지 처리하고 각 필드와 부합하지 않는 데이터는
해당 필드로 이동
5 해당 필드내 부합되지 않는 데이터는 해당필드로 옮기고 가베지 처리
- 59 -
No원본데이터 정제 후
정제요령 비고직위코드 직위명 직위코드 직위명
1 비정규직 가베지 처리
6 기타사항
가 소속기관이 2개 이상인 경우
(1)주소 데이터를 참고하여 해당 기관명만 유지하고 이외의 데이터는 가베지 처리
(2)주소 데이터가 없는 경우에는 대학교 연구소 산업계 기타 기관 순으로 정제
나 항목별 값이 2개 이상인 경우 해당 필드에 기 입력된 값을 우선하여 유지하고 이외
의 데이터는 가베지 처리
다 기관명이형전거DB에 존재하지 않는 기관은 신규발급 요청 후 매핑
라 기준에 명시되지 않은 사항은 사업주관기관과 협의하여 진행
소속기관_최초임용일 정제지침
1 날짜 오류 유형 정제
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMMDD
No원본데이터 정제 후
정제요령 비고생년월일 최초임용일 생년월일 최초임용일
1 19500310 19451011 19500310날짜는 생년월일 보다
작을수 없으므로 삭제
2 19500310 20101010 19500310날짜는 현재보다 클수
없으므로 삭제
3 19500310 19000101 19500310 1900년 이전은 삭제
학력사항
학력사항_전공 정제지침
1 전공분야코드와 전공명 모두 null인 경우 정제대상에서 제외
2 전공명은 있으나 전공분야코드가 null인 경우 전공명을 검색하여 전공분야코드 입력
가 전공명과 정확히 일치하는 전공분야코드가 존재하는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 정보통신 D130700 정보통신 정보통신전공명과 일치하는
코드값을 매핑한다
나 전공명에 공백이 있는 경우
- 60 -
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 무기 화학 C060300 무기화학 무기화학공백제거후 일치하는
값을 찾아 매핑한다
다 정확히 일치하는 전공명이 검색되지 않는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 농생물학 F010300 농생물학 농생물근사치의코드값으로매
핑한다
2 생물 C070000 생물 생물학
3 화학전공 C060000 화학전공 화학
4 컴퓨터학과 D130000 컴퓨터학과 컴퓨터학
5 물리전공 C040000 물리전공 물리학
라 전공명이 영문일 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 Medicinal Chemistry C060519Medicinal
Chemistry의약화학
영문을 번역하여
코드값을 찾아
매핑한다
마 전공명칭의 중간에 구분기호 ( - () amp
및 등) 가 포함되어 있는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 미생물계통분류 C070901 미생물계통분류 미생물분류계통
구분기호와 낱말의
순서를 무시하고
매핑한다
2 동물학유전학 C071000 동물학유전학 동물학
구분기호를 기준으로
앞부분 부터 일치하는
순으로 매핑한다
3 병리학 폐암병리 E050000 병리학 폐암병리 병리학
4 환경생태생리 D110800 환경생태생리 환경생태
5 의약화학-약리 C060519 의약화학-약리 의약화학
6 전기공학(컴퓨터공학) D090000전기공학(컴퓨터공학
)전기공학
7 원격탐사amp지구물리 D140900 원격탐사amp지구물리 원격탐사
8 물리화학및 무기화학 C060300물리화학및
무기화학무기화학
바 상기 방법으로 매핑이 불가능한 경우
- 61 -
No
원본데이터 정제 후
코드매핑 결과 정제요령 비고학위취득대학코드
(코드값 없을경우)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 서울대학교 7006431 서울대학교 서울대학교 기관명이형전거DB를
이용하여
학위취득대학코드에는
이형기관코드
학위취득대학명에는
대표기관명을 매핑함
2 서울대학교
공과대학ZD13063 서울대학교 서울대학교
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 발사체 공력 해석 D049900 발사체 공력 해석 기타항공우주공학
전공명을 포괄하는
상위 코드값으로
매핑한다
2 SOLID
MECHANICSD020299
SOLID
MECHANICS기타고체및구조역학
사 원본데이터의 코드값이 오류인 경우(전공분야코드가 아닌 경우)
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 0160 건축공학 D150000 건축공학 건축공학
원문의 코드값을
가베지 처리 후
재매핑한다
3 전공명이 오류인 경우(전공명이 아닌 경우)
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고직위코드 직위명 직위코드 직위명
1 訣廢点뼈膀갹쳬窩 가베지 처리
2 석사학위 없음 가베지 처리
학력사항_취득대학 정제지침
기관명이형전거DB를 이용하여 학위취득대학코드 및 학위취득대학명 정제
1 학위취득대학코드와 학위취득대학명 모두 null인 경우 정제대상에서 제외
2 학위취득대학명은 존재하나 학위취득대학코드가 null인 경우 기관명이형전거DB에서 검
색하여 학위취득대학코드 입력
3 학위취득대학명 풀네임이 아닐때 학위취득대학코드가 null인 경우 - 기관명이형전거DB에
- 62 -
No
정제전 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(()내용이 모두
없을경우)
학위취득대학명학위취득대학코드
(검색코드입력)코드학위취득대학명
1 연세대학교(원주) ZD13266 연세대학교 연세대학교
기관명이형전거DB를
이용하여
학위취득대학코드에는
이형기관코드
학위취득대학명에는
대표기관명을 매핑함
No
정제전 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(기존 코드값)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 114800 서울대학교 7006431 서울대학교 서울대학교
학위취득대학명 검색
기존데이터 가베지
처리 후 검색된 코드
입력
No
정제전(표준대학명 설정) 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(표준대학명
기준설정)
학위취득대학명학위취득대학코드
(검색코드입력)학위취득대학명
1 가톨릭대학교가톨릭대학교(본
부)7001337 가톨릭대학교 가톨릭대학교
신규 발급 요청 후
코드 입력
No
정제전(개칭 외국취득대학명) 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(검색된값)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 부경대학교 부산수산대학교 7003010 부경대학교 부경대학교
인터넷
학위취득대학명
검색하여 검색된 코드
입력
2 東京大學 도쿄대학 JA0122 도쿄대학 東京大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
3 東京工業大學Tokyo Institute
of TechnologyJA0114
Tokyo Institute
of Technology東京工業大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
서 검색하여 학위취득대학코드 입력
4 기존 학위취득대학코드가 있는 경우 NTIS 코드값으로 변경
5 취득대학명 검색 후 취득대학코드가 없을 경우 학위취득대학명 신규 발급 요청 후 코드
기입
6 취득대학명이 개칭 혹은 외국취득대학명일 경우 검색해서 학위취득대학코드 기입함
- 63 -
4 早稻田大學(일본)와세다
대학JA0319 (일본)와세다 대학 早稻田大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
5 서울산업대학교 경기공업전문대학 7002623 경기공업전문대학 서울산업대학교
인터넷
학위취득대학명
검색하여 검색된 코드
입력
오탈자 정제요령
서울대하교 서울대학교 (오탈자 수정)
7 가베지값
가베지 정제요령
111ㄴㄴㄴ amp 김정구 없슴 등등 가베지 처리
8 오탈자
학력사항_학과 정제지침
1 학과코드와 학과명 모두 null인 경우 정제대상에서 제외
2 학과코드는 존재하나 학과명이 null인 경우 학과코드를 검색하여 학과명 입력
No원본데이터 정제 후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 0015 0015 가정 가정코드표에서 학과코드로
검색하여 매핑한다
3 학과명은 존재하나 학과코드가 null인 경우 학과명을 검색하여 학과코드 입력
가 학과코드표에 학과명과 정확히 일치하는 값을 찾아 매핑
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가정 0015 가정 가정코드표에서 학과명으로
검색하여 매핑한다
나 정확히 일치하는 학과명이 검색되지 않는 경우 근사값으로 매핑
- 64 -
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가축번식학번식공
학 전공명칭
전공필드가 Null인 경우
전공필드로 이동한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 건설공학대학원
박사후기9475
건설공학대학원박사
후기대학원
대학원의 경우 일치하는
값이 없으면 상위 개념으로
검색하여 매핑한다
2 이과대학
단과대학의 경우 일치값이
없으면 가베지 처리한다 -
학과명 삭제
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가정교육학 0040 가정교육학 가정교육 근사 값으로 매핑한다 유사
2 기계설계학전공 1260 기계설계학전공기계설계
기계설계학
검색값이 여러 개인 경우
일치도가 높은 값으로
매핑한다
유사
3 건축공학계열 0160 건축공학계열
건축공학
건축공학과
건축공학부
건축공학교육
일치도가 같은 여러 개의
값이 검색된 경우 글자수가
가장 적은 값으로
매핑한다
유사
일치도 높은 값을 매핑 한다하여 ldquo건축공학rdquo을 ldquo건축rdquo의 형태와 같이 학과 자체가 바뀔
수 있는 매핑을하지 않도록 주의한다
다 학과명칭의 중간에 구분기호(쉼표() 마침표() slash() and(amp) 등)가 있으면서 정확히
일치하는 학과명이 검색되지 않는 경우
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 전기 및
컴퓨터공학과0073
전기 및
컴퓨터공학과전기컴퓨터공학과
구분기호를 무시하고
매핑한다
2 생화학세포학 및
분자생물학과3240
생화학세포학 및
분자생물학과생화학
No 1의 결과가 없는 경우
구분기호를 기준으로
각각의 데이터를 검색하여
매핑한다
3 곡류과학식품공학 3715 곡류과학식품공학 식품공학구분기호를 기준으로
두번째의 값이 검색된 경우
라 학과코드가 Null 이고 학과명 필드에 전공명칭이 입력된 경우
(1) 전공필드가 Null인 경우 전공필드로 데이터를 이동하여 매핑하고 학과명 필드의 데이
터는 삭제한다
마 상기 방법으로 매핑이 불가능한 경우
- 65 -
3 요업공업 9999 요업공업 기타유사코드를 찾지 못한
경우 기타로 분류한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 명예박사 가베지 처리한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 공교 공업교육
공예교육
추정된 값이 하나일 때는
그 값으로 매핑 둘
이상이면 가베지 처리한다
2 IHE(Delft)
영문 약어의 경우 추정이
어려운 값은 가베지
처리한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 工學系硏究 가베지 처리한다
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1 추후입력 test 가베지 가베지 처리
2 미정 PH D 가베지 가베지 처리
3 기억안남 NA 가베지 가베지 처리
4 졸업시험으로 대체 null 가베지 가베지 처리
5 국문없음 no data 가베지 가베지 처리
6
공학박사(지능형
소프트웨어 전공)
or 공학사
(자동차기술사)
학위 및 기타정보 가베지 처리
7 박사 학위 가베지 처리
4 가베지 처리
가 학과명이 아닌 경우
나 약어인 경우
다 학과명인지 판단하기 난해한 한문 명칭의 경우
학력사항_학위논문명 정제지침
1 최종학위국문논문명과 최종학위영문논문명이 모두 null인 경우 정제대상에서 제외
2 논문명 필드에 기타 정보나 가베지 데이터가 존재하는 경우
- 66 -
8 영문참조 none 가베지 가베지 처리
9 aa 0 가베지 가베지 처리
10 가 x 가베지 가베지 처리
11 디지털경제학 Chemistry 학과 또는 전공정보 가베지 처리
12
학사학위시설계PR
OJECT날개2001-
gt청소년수련원테마
로 설계함
졸업 작품에 대한
정보가베지 처리
13
교회 건축물의
계획 및
설계(설계작품)
졸업 작품에 대한
정보가베지 처리
14압축기 관련
기술연수 연수 정보 가베지 처리
15
광통신 부품용
소재 연구관련
논문을 준비중임
준비중인 논문 가베지 처리
16 KISTI 영문 약어 가베지 처리
17 CFD 영문 약어 가베지 처리
18
H Atoms in
Photodissociations
and Chemical
Reactions(수소원자
의 광화학반응)
H atoms in
Phtodissociation
and Chemical
Reactions
H Atoms in
Photodissociation
s and Chemical
Reactions(수소원
자의 광화학반응)
H atoms in
Phtodissociation
and Chemical
Reactions
()안에기타정보가표
기됨
-유효데이터의표기
언어는동일하나내용
상다소의차이를보이
는경우
데이터 유지
19
김휘택김승욱김정
일서근택서정탁유
총일대퇴골
근위부의
방사선학적 형태-
정상 고관절과
대퇴골두 무혈성
괴사가 있는
고관절에서의 비교
대한정형외과학회
지
33(1)177-1851998
김휘택김승욱김
정일서근택서정
탁유총일대퇴골
근위부의
방사선학적 형태-
정상 고관절과
대퇴골두 무혈성
괴사가 있는
고관절에서의
비교
대한정형외과학회
지
33(1)177-185199
8
유효 데이터 전후에
기타 정보가 표기된
경우
데이터 유지
20
친환경
도시건축계획에
관한 연구
Oekologisch
orientierte
Stadtplanung in
Seoul
Suedkorea(독문
명)
친환경
도시건축계획에
관한 연구
Oekologisch
orientierte
Stadtplanung in
Seoul Suedkorea
국문영문논문명
필드에 모두
데이터가 있고
영문논문명 필드에
한글로 (언어)
표기가 되어 있는
경우
(언어) 부분만 가베지
처리
21
ZFS symmetry
and parameters
in MR(임시등록)
임시등록데이터의
경우가베지 처리
3 논문명의 후반부가 잘린 경우
- 67 -
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1 합성과 논문명의 남은 부분이
극히 짧음가베지 처리
2 경영통계에 관련 논문명의 남은 부분이
극히 짧음가베지 처리
3
계층구조를
이용한 문서
클러스터 제목의
자동생성 기법
cluster
계층구조를
이용한 문서
클러스터 제목의
자동생성 기법
논문명의 남은 부분이
극히 짧음(영문논문명)
영문논문명
가베지 처리
4암호화된 위상
마스크를 이용한
New visual
cryptography
method based on
optical
interference
암호화된 위상
마스크를 이용한
New visual
cryptography
method based on
optical interference
논문명이
어느정도(2단어 이상)
남아 있음(국문논문명)
데이터 유지
5
metathesis
polymerization of
~
metathesis
polymerization of
~
논문명이
어느정도(2단어 이상)
남아 있음
데이터 유지
6 보편형식On universal
forms보편형식
On universal
forms
가베지 여부를
판단하기 난해함데이터 유지
7
점성유동장내에서
의 최대양력 익형
설계
The Optimal
Design
점성유동장내에서
의 최대양력
익형 설계
The Optimal
Design
영문 논문명에
데이터의 일부 -
두단어 이상 남아 있음
데이터 유지
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문명
최종학위영문논
문명최종학위국문논문명 최종학위영문논문명
1
석사순니켈의수소
취성에미치는Fe및B
의영향에관한연구
박사기계적합금화
에의해제조된ABA
B2형금속수소화물
의전극특성에관한연
구
기계적 합금화에
의해 제조된 AB
AB2 형
금속수소화물의
전극 특성에 관한
연구
석사논문 박사논문이
동시에 입력
최종(박사)
논문명만
유지한다
2
초임계이산화탄소를
이용한 마늘로부터
지방산 추출에 관한
연구(석사)
식품저장기간을연장
할수있는기능성필름
개발을위한항균성물
질추출및흡착에관한
연구
식품저장 기간을
연장 할수있는
기능성 필름 개발을
위한 항균성 물질
추출및 흡착에 관한
연구
석사논문 추정불가
논문이 동시에 입력
후반부의
논문명만
유지한다
3
GIS를 이용한
대학캠퍼스
공간분석(석사논문)
현재 인터넷 GIS를
이용한 경관평가
논문 준비중
GIS를 이용한
대학캠퍼스
공간분석
후반부가 준비중인
논문인 경우
준비중인 논문
가베지 처리
4 논문명이 두개 이상인 경우
- 68 -
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문명
최종학위영문논
문명최종학위국문논문명 최종학위영문논문명
1
(영)A Shift-first
Strategy for
Generalized LR
Parsing
A Shift-first
Strategy for
Generalized LR
Parsing
A Shift-first
Strategy for
Generalized LR
Parsing
()안의 언어표기만
제외하고 동일한
데이터
국문논문명만
유지하고
영문논문제
삭제 처리
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1
3d 전자계에 대한
NMR 이동
계산(Theoretical
calculations of
NMR shifts for
3dⁿsystems)
3d 전자계에
대한 NMR 이동
계산
Theoretical
calculations of
NMR shifts for
3dⁿsystems
한쪽의 필드에
데이터가 모두
입력된 경우
해당 필드로 이동
3
AStudyonLandslid
eofCuttingandBank
ingSlopeKFRI
Road 林道
盛土面의
崩괴에關한硏究
AStudyonLandsli
deofCuttingandBa
nkingSlopeKFRI
Road 林道
盛土面의
崩괴에關한硏究
국문 영문 구분없이
유지함데이터 유지
9
家庭用電氣製品
の親環境設計過
程への畵像流體
計測の適用に關
する硏究(A
Study on the
Design of Home
Appliances for
Energy Saving
Using PIV)
家庭用電氣製品の
親環境設計過程へ
の畵像流體計測の
適用に關する硏究
(A Study on
the Design of
Home Appliances
for Energy
Saving Using
PIV)
한쪽의 필드에
영문과 기타외국어
논문명이 모두
입력된 경우
데이터를 구분할
기준이 없으므로
데이터를 유지하고
국문논문명 필드로
이동
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1中韓兩國外銷美國
主要商品之比較硏
중한양국
대미수출
中韓兩國外銷美國主
要商品之比較硏究
논문명 필드 내
논문의 언어를해당 필드로 이동
5 국문영문논문명이 동일하나 (언어)가 표기 되어 있는 경우
6 국문영문 필드에 데이터가 뒤섞여 있는 경우
가 국문 영문을 구분하지 않고 국문논문명은 널이 아니어야 함
나 국문논문명(필수)이 널이고 영문논문명이 널이 아닐 경우 국문논문명으로 영문논문명
을 이동
다 중국어 논문명은 명확히 구분이 되는 경우만 정제하여 영문논문명 필드로 이동 - 일문
논문명 국문 논문명과의 구분 난해
- 69 -
究(중한양국
대미수출
주요상품의
비교연구) [1991년
경영학석사 논문
중국어]
주요상품의
비교연구
표기하여 명확한
구분 가능
No원본데이터 정제 후
데이터 유형 정제요령 비고취득국가코드 취득국가코드
1 KZ NTIS 국가코드와 불일치 널처리
2 오류 데이터 널처리
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 Takashi Tsuruo PhD Takashi Tsuruo PhD
2 유영면(자동차 부품연구원) 유영면(자동차 부품연구원) (기타정보)가 표기된 경우 데이터 유지
3 신현경 김정회 (공동) 신현경 김정회 (공동) 2명 이상인 경우 데이터 유지
4高橋照男(TAKAHASHI
TERUO)
高橋照男(TAKAHASHI
TERUO)(병음)이 표기된 경우 데이터 유지
5 송지복 박사 송지복 박사
교수명 앞뒤에 호칭이 붙은 경우 데이터 유지
6 이와바교수 이와바교수
7 Dr HT Hahn Dr HT Hahn
8 ProfDr NWiberg ProfDr NWiberg
9 C S George Lee aaaaa C S George Lee지도교수명 뒤에 의미없이
알파벳이 반복 나열된 경우
반복 나열된 알파벳 가베지
처리
10J Desmaism aaaaa
DBernacheJ Desmaism DBernache
2인의 지도교수명 사이에
의미없는 알파벳의 반복이 온 경우aaaaa 를 로 치환한다
11 김해구 김해구지도교수명 전후에 의미없는
특수문자나 파자가 존재하는 경우
의미없는 문자 가베지 처리
- 단 성명이 완전하지 않은
학력사항_취득국가 정제지침
1 취득국가코드가 NTIS 코드가 아닐 경우
가 취득국가코드가 NTIS코드가 아니면 널처리함
학력사항_지도교수명 정제지침
1 Null인 경우 정제대상에서 제외
2 필드내 지도교수명 외 기타 정보가 표기된 경우
가 필드내 유효 데이터의 존재 유무만을 중요시 함 유효 데이터가 존재하는 경우 데이
터의 형식 등에 큰 의미를 두지 않음
- 70 -
상황에서 성명이 들어갈
부분에 나 특수문자가
표기된 경우 데이터 유지
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 주강 주강
이름이 정확한지 불확실한 경우올바른 데이터인지 판단이
불가능 하므로 데이터 유지
2 김양 김양
7 공란 공란
3 홍길동 홍길동
4 Hiroyuki KIDO Hiroyuki KIDO
5 DH Youn DH Youn
한국 사람인데
영어(미국식)_이니셜로 표기된
경우
데이터 유지
6 Liu Hung Wen Liu Hung Wen한국 사람인데 영어(한국식)로
표기된 경우데이터 유지
7 이인원이상수 이인원이상수 지도교수가 2인 이상인 경우의
구분기호데이터 유지
8 오정무김상돈 오정무김상돈
9 庄子哲雄 庄子哲雄
일본식 이름의 표기법 데이터 유지
10 가네꼬 준이찌 가네꼬 준이찌
11 Kajiuchi Toshio Kajiuchi Toshio
12 대림성행 대림성행
일본 한자를 한글로 표기 데이터 유지
13 장욕천선대삼 장욕천선대삼
14 목도정부 목도정부
15 불상 불상 유효 데이터 여부 판단 난해 데이터 유지
16 지반 자바 지반 자바 외국어 이름을 한글로 표기 데이터 유지
17 Luo Luo
한국 교수의 성만을 표기한
것인지 외국인 교수의 이름인지
판단 난해
데이터 유지
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 N 가베지 데이터 데이터 가베지 처리
2 NA
3 필드내 데이터가 유효 값인지 판단하기 난해한 경우
가 유효 값인가 유효하지 않은 값인가 판단 자체가 불가능한 경우가 대부분 이므로 데이
터 유지를 기본으로 함
4 필드내에 기타 정보나 가베지 데이터가 존재하는 경우
- 71 -
3 none
4 해당없음
5 알수없음
6 모름
8 김교수 호칭하는 대상이 포괄적인 경우 데이터 가베지 처리
9 농과대학 근무처 또는 전공 정보 데이터 가베지 처리
10 대학원 학위 또는 학과 정보 데이터 가베지 처리
11 교수님 직위 정보 데이터 가베지 처리
12 지도교수명 가베지 데이터 데이터 가베지 처리
11 Kajiuchi Toshio Kajiuchi Toshio
12 대림성행 대림성행 일본 한자를 한글로 표기 데이터 유지
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 19871801 198702 월(MM)이 유효하지 않은
경우 - 졸업년월02월로 갱신
2 19871301 198703 월(MM)이 유효하지 않은
경우 - 입학년월03월로 갱신
3 19871301 198701월(MM)이 유효하지 않은
경우 - 최종학위취득일01월로 갱신
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 10780301 년도(YYYY)가 유효하지
않은 경우 - 공통
데이터 가베지
처리
No 원본데이터 정제 후 오류사항 정제요령 비고
학력사항_날짜유형(입학일졸업일학위취득일)
1 기본 지침
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMM
다 날짜 데이터가 유효하지 않은 경우
(1) 년도(YYYY)가 유효하며 월(MM)이 유효하지 않는 경우 졸업월(MM)은 02로 입학월
(MM)은 03으로 그리고 최종학위취득일(MM)은 01로 갱신
(2) 년도(YYYY)가 유효하지 않은 경우 데이터 가베지 처리
(3) 년도(YYYY)의 유효 범위
rarr 졸업일 입학일 최종학위취득일 1900 lt 졸업일 입학일 최종학위취득일 lt 현재
라 MM(월)이 없는 경우 졸업년월은 02월로 입학년월은 03월로 갱신
- 72 -
졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 1987 198702 월(MM)이 없는 경우 -
졸업년월02월로 갱신
2 1987 198703 월(MM)이 없는 경우 -
입학년월03월로 갱신
3 1987 198701월(MM)이 없는 경우 -
최종학위취득일01월로 갱신
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 19820301 19820301 19820301 입학년월과 졸업년월이
동일입학년월 유지
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 0201
년도가 없음 년도로
간주하더라도 유효하지
않은 데이터
데이터 가베지
처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
1한성대학교
산업시스템공학부한성대학교 정제 정제 처리
2(주)한정화학
총무과부장(주)한정화학 부장 정제 정제 처리
3연세대학교 공과대학
화학공학전공
연세대학교
공과대학정제 정제 처리
4연합철강공업(주) 입사
(국제그룹공채)연합철강공업 정제 정제 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
마 [입학년월 gt= 졸업년월]인 경우 입학년월 유지 졸업년월 가베지 처리
바 YYYY(년도)가 없는 경우 데이터 가베지 처리 정제대상에서 제외
경력사항
경력사항_근무처명 정제지침
1 근무처명이 null인 경우 정제대상에서 제외
2 근무처명에 직위 전공값이 있는 경우
3 가베지 데이터
- 73 -
1 중학교 총무처 군복무 현역 등
가베지 데이터 가베지 처리
2 가 나 다 몰라 가베지 처리 등
3 00 제2청사 (주)ㅇㅇ건설 000공무원 등
4 111163년10년1년106866 등
5 WHO COO aaa dkff saa 등
6 미국 일본 등
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
1 日本産業技術合究所 日本産業技術合究所
오류
가베지 처리
2 고려대학교 보건대학원 역학 I 보건정보학과 고려대학교 보건대학원 정제 처리
3 환경공학 국가기술개발 선도사업 (G-7 연구환경공학 국가기술개발
선도사업 (G-7 연구가베지 처리
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 교수 A01 교수 교수직위명과 일치하는 코드값을
찾아 매핑
2 위촉연구원 B07 위촉연구원 위촉연구원
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 조교수부교수교
수A01
조교수부교수
교수교수
완전일치gt 일치도가 높은
직위명 순으로 매핑
2 시간강사연구조
교A05
시간강사연구조
교시간강사
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
4 기타
경력사항_직위명 정제지침
1 직위코드와 직위명 모두 null인 경우 정제대상에서 제외
2 직위명은 있으나 직위코드가 null인 경우 직위명 검색하여 직위코드 입력
가 직위명과 정확히 일치하는 직위코드값이 존재하는 경우
나 직위명에 직위가 복수인 경우
다 정확히 일치하는 직위명이 검색되지 않는 경우
- 74 -
1 주임교수 A01 주임교수 교수 근사치의 코드값으로 매핑
2 시간강의 A05 시간강의 시간강사
이형정의
표 첨부
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 Professor A01 Professor 교수영문을 번역하여 이형정의표에
의거 코드값을 찾아 매핑
이형정의
표 첨부
2 Research Fellow B20 Research Fellow 전문위원
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 간호사 999 간호사 기타직위명과 일치하는 코드명이
없을경우 기타코드값으로 매핑
2 계장 999 계장 기타
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 36 연구원 B06 연구원 연구원기존의 직위코드를 NTIS
직위코드로 대체
2 13 조교수 A03 조교수 조교수
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 등재 직위명은 가베지 처리
2 ㅁㅁㅁ
라 직위명이 영문일 경우
마 상기 방법으로 매핑이 불가능한 경우
3 직위명과 코드가 모두 존재하는 경우
4 직위명이 오류인 경우(직위명 가베지)
- 75 -
No NTIS코드 코드명(생성) 이형정의(원본데이터) 비고
1 A01 교수
Professor
Prof
Faculty
(대학의)Teacher
Teaching
TeachingFellowship
학장 학장보
부학장 학과주임
학과장 학부장
학생처장
대학원장대학원장보
(대학의)교직원(대학의)교원
총장부총장
2 A02 부교수
AssociateProfessor
AssociateResearchProfessor
AssociateVisitingProfessor
3 A03 조교수AssistantProf
AssistantProfessor
4 A04 전임강사FullTimeLecturer
Instructor
전문강사 전담강사
강의전임 강의전담
전임대우
5 A05 시간강사
시간강의
PartTimeLecturer
PartTimeInstructor
6 A06 강사(기타) 강의 출강
7 A10 명예교수Honorary[Emeritus]Professor
HonoraryVisitingProfessor
8 A11 석좌교수 Chair Professor
9 A12 강의교수
10 A13 겸임교수
겸직교수
adjunctprofessor
adjunctprof
AdjunctFaculty
11 A14 계약교수
12 A15 기금교수
13 A16 대우교수
14 A17 연구교수
ResearchProfessor
ResearchFaculty
FacultyResearch
teachingresearcher
15 A18 초빙교수
초청교수
InvitedProfessor
ProfessorInvite
16 A19 객원교수
Visitingfaculty
visitingprofessor
aprofessorextraordinary
17 A20 조교
조수
Tutor
Assistant
UniversityAssistant
GraduateAssistant
GraduateAssociate
Teachingfellow
TeachingAssistant
TeachingAssociate
FacultyAssociate
TA RA GRA GSRA
18 A21 대학원생박사과정
석사과정
별첨 이형정의표
- 76 -
postgraduate
19 A22 POST-DOC
연수과학자
연수연구원
포스트닥터
포닥
박사후연수
박사후과정
박사후연구원
Post-Dr
Postdoctor
postdoctoral
visitingscholar
visitingfellow
Researchassistant
ResearchAssociate
20 A23 POST_MAS
21 B01 수석연구원 Principal Research Engineer
22 B02 책임연구원
연구책임자
SeniorResearchEngineer
SeniorResearch
SeniorResearcher
SeniorResearchStaff
SeniorInvestigator
23 B03 주임연구원
연구주임
AssistantResearchEngineer
AssistantResearcher
assitantInvestigator
24 B04 전임연구원AssociateResearchEngineer
AssociateResearcher
25 B05 선임연구원 선임-연구소의
26 B06 연구원
연구소장 연구보조원
연구원보연구생
연구개발원연구조원
연구주임연구조수
연구부담당자연구자
연구실장연구보조
연구팀장연구요원
연구센터장연구부처장
연구부문장연구대리
연구단장연구연구진
연구회원연구활동
방문연구 연구수
(연구소연구원연구센터연구실의)-
실장팀장원장부원장소장부소장
선임단장그룹장본부장계장인턴
장장 등
GraduateFellow
(연구소의)-Fellow
Research
Researcher
ResearchStaff
ResearchEngineer
Investigator
27 B07 위촉연구원
VisitingResearcher
VisitingResearchEngineer
VisitingInvestigator
GuestResearcher
GuestInvestigator
28 B10 수석연구위원
29 B11 책임연구위원
30 B12 주임연구위원
31 B13 전임연구위원
32 B14 선임연구위원
33 B15 연구위원
34 B20 전문위원ResearchFellow
ReserchFellowship
35 B30 책임기술원책임기사
기술책임자
SeniorEngineer
ChiefEngineer
- 77 -
PrincipalEngineer
SeniorTechnical
36 B31 선임기술원 선임기사 선임엔지니어
37 B32 기술원
(주식회사의)-기사
엔지니어기술사
기술팀장기술센터장
기술직기술주임
기술담당기술처장
기술직사원
Engineer
Technician
TechnicalStaff
TechnologyStaff
38 C01 공무원
연구사연구관
주사주사보
보좌관기좌
기사보사무관
군무원서기관
이사관조사원
청장차관
자문관비서관
장관행정관
담당관기원
경찰분석관
서서서기보조무원
보건지소장보건소장
보건소영양사보건진료원
보건진료소장지도관
지도사보
(행정기관의)-토목급
(행정기관의)-심사관
(행정기관의)-지도원
(행정기관의)-지도사
(공공기관)-기사
(공사의)-급
39 C02 법조인
심판관변리사
재판관검찰관
변호사법무조정위원
법제이사법의관
법의학감식관
40 C03 의사
전문의전임의
전담의담당의
인턴레지던트
객원의공중보건의
수련의임상의
전공의주치의
의사보일반의
상담의인정의
지도의병원장봉직의
(병원의)-과장부장처장등
Clinician
Intern
Resident
Doctor
Attending
41 C04 교사 (초~고교의)-교원
42 C05 군인
(군관련)-교관소대장
병장교소령
소위대위
군의관의무관
군하사중위
중대장보충역
제대소령
참모의무자문관
기무사기무사보
기무관
43 D01 대표이사
CEO대표
사장법인장
President
44 D02 이사
부사장이사보이사대우
Director
viceDirector
associateDirector
VicePresident
SeniorExecutiveVicePresident
45 D03 전무SeniorManagingDirector
CFO
- 78 -
46 D04 상무 상무보
47 D05 부장
부장대리
DepartmentManager
GeneralManager
48 D06 차장
DeputyGeneralManager
DeputyDirectorGeneral
AssistantDirector
AssistantDirectorvice-chiefManager
49 D07 과장
Manager
GeneralManager
DepartmentManager
DeputyManager
50 D08 대리 Assistant Manager
51 D09 사원 회사원직원
52 999 기타
53 회원(삭제)
No원본데이터 정제 후
오류사항 정제요령 비고근무시작일 근무종료일 근무시작일 근무종료일
1 2005 2007 20050101 20070101 월 없음 월에 01 입력
No원본데이터 정제 후
오류사항 정제요령 비고생년월일 근무시작일 근무종료일 근무시작일 근무종료일
1 19500101 19000101 19400101 유효 범위 오류 삭제처리함
경력사항_날짜유형(근무시작일 근무종료일) 정제지침
1 기본 지침
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMM
다 날짜 데이터가 유효하지 않은 경우
(1) 년도(YYYY)가 유효하며 월(MM)이 유효하지 않는 경우 01로 입력
(2) 년도(YYYY)가 유효하지 않은 경우 데이터 가베지 처리
(3) 년도(YYYY)의 유효 범위
rarr 근무시작일 근무종료일 1900 lt 근무시작일 근무종료일 lt 현재
rarr 근무시작일 근무종료일 생년월일lt근무시작일 근무종료일
라 [근무시작일 gt= 근무종료일]인 경우 근무시작일 유지 근무종료일 가베지 처리
- 79 -
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1한국산업인력
관리공단
건설기계기
사1급1994-12-01
건설기계기사
1급
한국산업인
력관리공단1994-12-01 오류 해당필드로 이동
2치과의사면허
증1993-01-01 보건복지부
치과의사면허
증보건복지부 1993-01-01 오류 해당필드로 이동
3중등 2급
정교사자격증 문교부
중등 2급
정교사자격증문교부 오류 해당필드로 이동
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1워드 프로세서
2급
워드
프로세서
2급
1999-06-01워드
프로세서 2급 1999-06-01 중복 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 발행처 2004-03-01 가베지 가베지 처리
NO원본데이터(가베지) 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 111 222 0000 가베지 가베지 처리
2 상동
No원본데이터 정제 후
오류사항 정제요령 비고근무시작일 근무종료일 근무시작일 근무종료일
1 20050501 20040601 20050501 [근무시작일 gt=
근무종료일]인 경우
근무종료일 가베지
처리
자격사항
자격사항 정제지침
1 자격증명 자격발행처 자격취득일이 모두 null인 경우 정제대상에서 제외
가 자격증명값이 NULL인 경우 나머지 데이터(자격발행처 자격취득일) 모두 가베지 처
리
2 자격증명 자격발행처 자격취득일 각 필드값이 뒤바뀐 경우 처리방법
3 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값이 나올 경우 처리방법
4 자격증명 필드값이 NULL인 경우 처리방법
5 가베지값 처리방법
- 80 -
3 일본
4 없음
NO원본데이터(오탈자) 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 화공기사1급ssssssssssssss 화공기사1급
오탈자데이터 수정 및
가베지 처리
2 충북졍찰청
3 박물관amp8228미술관 정학예사 3급미술관
정학예사 3급
4초경U항공기조종사면허1111111111111
111111111111111111111증
초경량항공기
조종사면허증
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
1 1루프캐리어
이송장치
루프캐리어
이송장치1
루프캐리어
이송장치중복 가베지 처리
2 1 1019990060031101999006003
1 가베지 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
1 1특허등록 제
0290068호 가베지 가베지 처리
2 1 1313131 아자차카 가베지 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
6 기타 처리방법
지식재산권
지식재산권 정제지침
1 특허구분 출원등록번호 지식재산권명이 모두 null인 경우 정제대상에서 제외
가 지식재산권명이 NULL인 경우 나머지 데이터 모두 가베지 처리
2 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값 상이값이 나올 경우 처리방법
3 지식재산권명 필드값이 NULL 가베지값인 경우 처리방법
4 가베지값 처리방법가 출원등록번호 지식재산권명으로 볼 수 없는 데이터는 가베지 처리
- 81 -
1 3자리 이하의
숫자특허
가베지 가베지 처리
2 한국 드릴
3 완료 국제
4 미정 마바
5 이름 사아
6 출원중 파하
7 경상현 가나
8 미지정 다라
9 공개중 카타
10 미입수 혜천
NO원본데이터 정제 후
데이터 유형 정제요령 비고지식재산권명 지식재산권명
1 光微粒子の製造方法 光微粒子の製造方法 오탈자 가베지 처리
2 양자우물amp8228세선의 제작방법 양자우물amp8228세선의 제작방법 오탈자 가베지 처리
3 94-26592 94-26592 오탈자 가베지 처리
NO원본데이터 정제 후 데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 총무
아태물리학회(Associati
on of Asia-Pacific
Physical Societies)
아태물리학회(Associa
tion of Asia-Pacific
Physical Societies)
총무 오류 데이터 이동
2 ASG 없음 Member ASG Member 가베지 가베지 처리
NO원본데이터 정제 후 데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
5 기타 처리방법
소속학협회
소속학협회현황 정제지침
1 학협회명 직위 담당업무 모두 null인 경우 정제대상에서 제외
가 학협회명값이 NULL인 경우 나머지 데이터 모두 가베지 처리
2 학협회명 직위 담당업무 각 필드값이 뒤바뀐 경우
3 해당 필드에 이미 유효 값이 존재하는데 다른 필드값도 나올 경우
- 82 -
1대한병리학회
임상병리학회
대한병리학회
경남(부산)회장
대한병리학회
임상병리학회
대한병리학회
경남(부산)회장 중복 데이터 유지
명칭포함
유지
2한국자원공학회
이사 한국자원공학회 이사 오류 데이터 이동
3여성생명과학기
술포럼 회원운영위원 학술위원
여성생명과학기술
포럼운영위원 학술위원 중복 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 편집위원 가베지 가베지 처리
2 종신회원 명예회장 가베지 가베지 처리 학협회명 아님
3 회원 해당없음 가베지 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 ㄴㄴㄴ 111 eee 20 q 등
가베지 가베지 처리
2 없음 해당없슴 등재
3 화공기사 1 급 덕있으마
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 일본 학회 기타 가베지 처리
NO 원본데이터 정제 후 데이터 정제요령 비고
4 학협회명 필드값이 NULL값인 경우
5 가베지값
6 기타
훈포장사항
훈포장사항 정제지침
1 수여기관명 훈포장명이 모두 null인 경우 - 정제대상에서 제외
가 훈포장명이 NULL인 경우 나머지 데이터 모두 가베지로 처리
2 수여기관명 훈포장명 각 필드값이 뒤바뀐 경우
- 83 -
수여기관명 훈포장명 수여기관명 훈포장명 유형
1 장영실상 과학기술부 과학기술부 장영실상 오류 해당필드로 이동
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 대통령 대통령 대통령 대통령 중복 데이터 유지 대통령 상
2우수논문발표상 -
포스터 부문
우수논문발표상 -
포스터 부문
우수논문발표상 -
포스터 부문중복
데이터 가베지
처리
3 국무총리 표창 국무총리 표창 국무총리 국무총리 표창 중복데이터 가베지
처리
4 광혜학술상 광혜학술상 광혜학술상 중복데이터 가베지
처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 대한민국 정부 오류데이터 가베지
처리
훈포장명 데이터
null값
2 한국물리학회 한국물리학회 오류데이터 가베지
처리
훈포장명 데이터가
가베지값
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 222 111데이터 가베지 처리
2 회원 등재등
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 제어amp8228자동화amp8228시스템공학회 제어amp8228자동화amp8228시스템공학회오탈자
데이터 유지 수정
및 가베지 처리
파일생성 형식에
따른 오류
2 ㅈ조선대총장 조선대총장
3 해당 필드에 이미 유효 값이 존재하는데 다른 필드에서 동일값이 나올 경우
4 훈포장명 필드값이 NULL값인 경우
5 가베지값
6 기타
저역서실적
저역서실적 정제지침
- 84 -
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 3차원
인체해부도1 UBCare
3차원
인체해부도 1 UBCare 오류
해당필드로
이동
2신흥인터내
셔날
소아
청소년치과학1
소아
청소년치과학 1 신흥인터내셔날 오류
해당필드로
이동
3 動力學Engineering
Mechanics2 普文堂 動力學
Engine
ering
Mechan
ics
2 普文堂 한자명 그대로 유지
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1고분자
공학 II
고분자 공학
II1 희중당
고분자 공학
II 1 희중당 중복 가베지 처리
2 주조응고일본금속학회
[주조응고]2
반도출판
사
일본금속학회
[주조응고] 2 반도출판사 오류
해당필드로
이동
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 1
가베지전체 데이터
삭제
2물리강의(20
9쪽)일서 2 대웅
3 wjswktkdrjfo
qhdks rltnf1 생능출판사
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 Polymer Surface
Dynamics 공동저서
Polymer Surface
Dynamics 공동저서 이동 데이터 이동
2
The Handbook of
Groundwater
Engieering-지하수공학에
있어서 지리정보시스템
The Handbook of
Groundwater
Engieering-지하수공
학에 있어서
지하수공학에
있어서
지리정보시스템
The Handbook of
Groundwater Engieering중복 데이터 수정
1 국문저서명 영문저서명 저역서 구분 발행처명이 모두 null인 경우 - 정제대상에서 제외
가 국문저서명 영문저서명 둘 다 NULL인 경우 나머지 데이터 모두 가베지 처리
2 국문저서명 영문저서명 저역서구분 발행처명 각 필드값이 뒤바뀐 경우
3 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값 상이값 나올 경우
4 국문저서명 영문저서명 필드값이 NULL값이거나 가베지값인 경우
5 국문저서명이 널이고 영문저서명이 널일 아닐 경우 국문저서명으로 이동함
- 85 -
지리정보시스템
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 ㅁ 기지이전사업 기획서 YRPMPKOREA 기지이전사업 기획서 YRPMPKOREA 오자 가베지 처리
2 최신 EDICALS 최신 EDI CALS 오자 데이터 유지
3 보호 야동식물 보호 야생 동식물 오자
가능한
범위에서
수정
4 ISBN 1-59033-891-XInequality Theory and
Applications (III)
Inequality Theory and
Applications (III)가베지
가베지 처리
ISBN 필드로
이동
5 NHealth Insurance
Reform In Korea
Health Insurance
Reform In Korea가베지 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 1111 2 골든벨
가베지 가베지 처리
2
곽수동
고필옥
김무강
범문사
3 ㄷㄷㅁㅁ 1
4 (주)지학사 1 (주)지학사
6 오탈자
7 가베지 데이터
논문실적
논문실적 정제지침
1 최종학위국문논문명과 최종학위영문논문명이 모두 null인 경우 정제대상에서 제외
2 논문명 필드에 기타 정보나 가베지 데이터가 존재하는 경우
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 추후입력 가베지 가베지 처리
2 미정 가베지 가베지 처리
3 가베지 가베지 처리
- 86 -
구분 항목 세부항목 항목수단위별
가중치()
참여
인력
정보
기본정보
주민등록번호 성명 자택주소 자택
우편번호 자택전화번호 핸드폰번호
7 31
소속기관사항
소속기관명 부서명 직위명 사무실
전화번호 기관주소 최초임용일 인
력(직업)구분
7 185
학력사항
전공 취득대학 학위 입학일 졸업
일 학과 취득국가 지도교수명 학위
논문명 학위취득일
10 21
16 데이터 검수
161 데이터 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
162 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 87 -
구분 항목 세부항목 항목수단위별
가중치()
경력사항 근무처명 직위명 근무기간 3 45
자격사항 자격발행처 자격증명 자격취득일 3 25
논문실적
논문발표일 국문논문명 영문논문명
저자역할구분 발행처 학술지구분
학술지명 SCI여부
8 105
지식재산권 지식재산권명 출원_등록번호 특허구분 3 25
계 소계 41 905
평가
위원
소속학협회현황 담당업무 직위 학협회사항 3 3
훈포장사항 수상년월 수여기관명 훈포장명 3 25
저역서실적국문저서명 영문저서명 발행년 발
행처 저역서구분5 4
소계 11 95
계 52 100
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
150 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
성명 100자택주소 10자택우편번
호
20
자택전화번 10
항목별 오류율 산정 기준 정의
- 88 -
호
핸드폰번호 10E-mail 10소계 310
소속기
관사항
(7개)
소속기관명 100
부서명 05
직위명 20
사무실전화
번호
10
기관주소 30
인력(직업)구
분
10
최초임용일 10
소계 185
학력사
항
(10개)
전공 20
취득대학 100
학위 20
입학일 10
졸업일 10
학과 15
취득국가 15
지도교수명 05
학위논문명 05
학위취득일 10
소계 210
경력사
항
(3개)
근무처명 20
직위명 15
근무기간 10
소계 45
자격사
항
(3개)
자격발행처 05
자격증명 10
자격취득일 10
소계 25
논문실
적
(8개)
논문발표일 10논문명1 10
논문명2 05저자역할구
분
05
발행처 05학술지구분 05학술지명 10
SCI여부 05
소계 105
지식재
산권
지식재산권
명
10
- 89 -
(3개)
출원_등록번
호
05
특허구분 10소계 25
평가 소속학
협회현
황
(3개)
담당업무 05
위원 직위 05
(11개) 학협회사항 20
소계 30
훈포장
사항
(3개)
수상년월 10
수여기관명 05
훈포장명 10
소계 25
저역서
실적
(5개)
저역서명1 10
저역서명2 05
발행년 10
발행처 05
저역서구분 10
소계 40
계 1000
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 03
품질지표기준점수산정(데이터1
건기준)=오류유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 005
계 6개 오류유형 1
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
- 90 -
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
3000 3 055 150 000825
성명 10 2 035 100 000350자택주소 3 0 000 10 000000자택우편번
호
3 2 035 20 000233
자택전화번
호
4 0 000 10 000000
핸드폰번호 6 0 000 10 000000E-mail 9 0 000 10 000000소계 45 7 125 310 001408
소속기
관사항
(7개)
소속기관명 1000 20 100 000000부서명 80000 200 05 000000직위명 80000 200 20 000000사무실전화
번호
80000 200 10 000000
기관주소 80000 200 30 000000인력(직업)구
분
80000 200 10 000000
최초임용일 80000 200 10 000000소계 481000 1220 000 185 000000
계 1000 01
주민등록번호 한글성명 영문성명 한문성명자택우편번
호
630421-0000000 백중환Joong hwan
Baek
412220
(형식 015)
630421-0000000 백종석Baek Jong
Seok
6304210000000
(형식 015)백인열 Baek IN Youl 白寅烈 711-822
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
국가RampD참여인력 100000건 100000건 3000건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
검사물량 집계표 예시
오류율산정표 예시
검수데이터 예시
- 91 -
630421-0000000 백승호
(오기 02)백제훈
630421-0000000 백종완
630421-
(오기 02)백장선 Jangsun Baek
白壯선
(형식 015)
502-
(오기 02)
630421-0000000 백승호1213132
(오기 02)
630421-0000000 백석형
630421-0000000 백석형
품질지표별
기준점수의
합
055 035 035
데이터별 품질지표 기준 점수
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 03
품질지표기준점수산정(데이
터1건기준)=오류유형별점수
의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 005
계 6개 오류유형 1
- 92 -
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수
기관마다 다름
hurims에 각 기관별 인력관리번호와 NTIS 인력관리번호매핑표관리함
RNO 주민등록번호 필수
-포함한 14자리 일 경우만 연계함
주민등록번호는 기관마다 유일해야 하는데 특정기관은주민등록번호 1개 당 n개의 인력관리번호 존재하는 경우 있음
=gt 연계기관에 연락해서 주민번호 중복되지않게 요구해서 처리
=gt 현재는 맨 처음 해당 데이터의 인력관리번호만 유지
KOR_PSN_NM 한글성명 필수
한글성명은 처음 hurims에 insert될때만 반영하고 update될때는반영하지 않음
기관마다 실명인증을 안 하는 곳이 있기 때문에 같은주민번호인데 성명이 다른 경우가 있음
CHN_PSN_NM 한문성명(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
ENG_PSN_NM 영문이름(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
ZIP_CD 우편번호
(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
hurims에 우편번호||주소1||주소2가 널일 경우만 반영ADDR1 주소1ADDR2 주소2
HOME_TEL_NO 집전화(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
CP_NO 핸드폰번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
EMAIL E-mail(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
MSTR_CLS_CD1 부처(기관)코드1
123에 대중소의 코드를 넣는게 아니라 각각의 분류를 넣어야함
매핑정보가 없으면 반영 못함
1n으로 매핑되는 경우 처음 select 되는 최하위 분류로 매핑함
현재 ntis에는 분류명을 저장하는 필드가 없음=gt분류명은 반영안함
MSTR_CLS_NM1부처(기관)분류명1
MSTR_CLS_CD2부처(기관)분류코드2
MSTR_CLS_NM2부처(기관)분류명2
MSTR_CLS_CD3부처(기관)분류코드3
MSTR_CLS_NM3부처(기관)분류명3
17 데이터 이관
참여인력 기본정보 이관 방안
- 93 -
MP_TYPE 평가위원구분Y일 경우 평가위원 pool Db에 자동 등록함
=gt N 또는 Null일 경우 기존에 평가위원 이면 반영 안함
GENDER_DIV_CD 성별구분 없을 경우 주민번호로 판별
BDT 생년월일 없을 경우 주민번호로 판별INFO_OPEN_SLCT 정보공개구분 없을 경우 비공개로 저장
PINFO_OFR_USE_APR_YN
개인정보제공활용동의여부
N일 경우 최종수정일을 기준으로 기존 동의에서 비동의로변경함
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG 데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
HM_ID 인물ID 인물아이디는 기관에서 넣지 않아도 됨
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
ORG_NM 기관명 필수
hurims에 기관이형DB에 존재하면 대표기관명이형기관코드를 저장하고 없을 경우에는 기관명을그대로 hurims에 저장하고 정제 및 신규 발급을 통해매핑해야함
WORK_DEPT_NM 근무부서명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
POSITION_NM 직위명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
직위명으로 자동코드 매핑하고 직위코드가 없으면 기타999코드로 저장하고
직위명필드에는 연계기관의 직위명 그대로 저장함
ZIP_CD 우편번호
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
hurims에 우편번호||주소1||주소2가 널일 경우만 반영ADDR1 주소1ADDR2 주소2OFFICE_TEL_NO 사무실전화
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
중복체크 기준
- 주민등록번호(주민등록번호 성명이 없으면 반영하지 않음)
소속기관 사항 이관
- 94 -
FIRST_EMP_DT 최초임용일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MP_TYPE 인력구분기관에서 넣지 않아도 되고 기관이형DB에 의해 자동매핑됨
HOFF_DIV_CD 재직구분코드
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일경우에는 재직중으로 인정함
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장
ORD_NO 순번 필수 hurims의 순번으로 저장
DEGREE_ACQ_UNIV_NM 학위취득대학명 필수
hurims에 기관이형DB에 존재하면 대표기관명이형기관코드를 저장하고 없을 경우에는 기관명을그대로 hurims에 저장하고 정제 및 신규 발급을 통해매핑해야함
SDEPT_NM 학과명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
학과명으로 코드매핑하고 매핑안되면 학과명필드만반영함
매핑안된 학과명은 나중에 정제 작업에 의해 매핑함
MAJOR_NM 전공명 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
전공명으로 코드매핑하고 매핑안되면 전공명필드만반영함
매핑안된 전공명은 나중에 정제 작업에 의해 매핑함
GRAD_DT 졸업일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함ENT_DT 입학일 필수 날짜가 1900년 이전이거나 현재보다 크면 삭제함DEGREE_CD 학위구분 필수
ACQ_NAT_CD 취득국가코드(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
DEGREE_ACQ_DT 학위취득일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
소속기관명이 없을 경우 반영하지 않음
학력 사항 이관
- 95 -
ADVISOR_NM 지도교수명기관에서 넣지 않아도 되고 기관이형DB에 의해 자동매핑됨
KOR_THESIS_NM
학위논문제목국문
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일경우에는 재직중으로 인정함ENG_THESIS_NM
학위논문제목영문
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장
ORD_NO 순번 필수 hurims의 순번으로 저장
WORK_ORG_NM 근무처명 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
POSITION_NM 직위명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
WORK_START_DT 근무시작일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
WORK_END_DT 근무종료일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
학위취득대학명 학위가 없을 경우 반영하지 않음
경력 사항 이관
- 96 -
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
INSTIT_LST 학협회명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
POSITION_NM 직위 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용INSTIT_JOB_NM 담당업무
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
INSTIT_ACT_START_DT 학회활동시작일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
INSTIT_ACT_END_DT 학회활동종료일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
CERT_NM 자격증명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
CERT_ISSUE_ORG_NM 자격증발행처 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
CERT_ACQ_D 자격취득일 필수 중복 체크하는 기준에만 쓰임
근무처명이 없을 경우 반영하지 않음
소속 학협회 사항 이관
학협회명이 없을 경우 반영하지 않음
자격 사항 이관
- 97 -
Tinsert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
KOR_PAPER_NM 논문제목국문 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
ENG_PAPER_NM 논문제목영문
중복 체크하는 기준에만 쓰임
insert 할때만 적용
PAPER_PUB_DT 논문발표일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ROLE_SLCT 역할구분(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_ORG_NM 발행처명(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
JRNL_NM 학술지명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
JRNL_SLCT 학술지구분 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용SCI_TYPE_SLCT SCI여부
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
ISSN ISSN번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_BK 게재권집(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_ISSUE 게재호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
START_PG 시작페이지(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
END_PG 종료페이지 (최종수정일이 최신이고 널이 아님) 또는 (hurims가
자격증명이 없을 경우 반영하지 않음
논문실적 이관
- 98 -
널일)때 update에 반영CO_AUTHOR_NM 공동저자명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
PTAPP_SLCT 특허구분 필수(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PTAPP_REGIST_NO 출원등록번호 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
IPR_NM 지식재산권명 필수(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
ACQ_DT 취득일 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ACQ_SLCT 취득구분
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
공동활용항목에 없는데 널일경우 무엇으로 봐야하나(확인요)
PTAPP_REGIST_NAT_CD
출원등록국가코드
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일 경우에는 대한민국으로 자동 반영함(확인요)MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
논문명이 없을 경우 반영하지 않음
지식재산권실적 이관
- 99 -
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
TRNSWRT_SLCT 저역서구분 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
KOR_TRNSWRT_NM 국문저역서명 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
PUB_ORG_NM 발행처명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
PUB_YR 발행년도 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ISBN ISBN번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
AWARD_NM 수상명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
AWARD_ACQ_YM 수상년월 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
AWARD_GRANT_ORG_NM 수여기관 필수 중복 체크하는 기준에만 쓰임
지식재산권명 출원등록구분 특허구분 출원등록번호가 없을 경우 반영하지 않음
저역서실적 이관
저역서명 저역서구분이 없을 경우 반영하지 않음
훈포장실적 이관
- 100 -
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드 훈포장명이 없을 경우 반영하지 않음
- 101 -
2 인력정보 영문이력 입력 매뉴얼
21 개요
211 목표
연구자 이력정보 영문 번역을 통한 DB 구축(1000건)
- 영문이력 번역 대상 항목 선정
기본정보 재직기관 최종학위 경력사항 논문실적 연구실적 특허
- 영문이력정보 관리 기능 개발 및 영문이력DB 구축
- 영문이력DB에 대한 본인확인 안내메일 발송
인물정보에 대한 영문 검색서비스 제공
212 DB구축 공정
- 102 -
항 목 세 부 항 목 영문명 비고
기본(BasicInformation)
기본정보 영문성명 English Name - 한글이력정보와 공동 사용- 전문분야는lsquo08 개정 분류코드 영문명 활용
휴대전화(국가번호)
Cellular PhoneNumber
E-mail E-mail
개인홈페이지 Homepage
전문분야 전문(연구)분야 Research Field 1
Research Field 2
Research Field 3
검색키워드 전문분야명 입력
재직기관(organization)
기관명 Organization Name - 현재 재직기관사항 1개 입력
부서명 Department
직위 Job title(position)
우편번호 Postal Code
주소 Address
전화(국가번호) Telephone
팩스(국가번호) Fax
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) Degree Code
학위취득일 GraduationDate
학교명 School
전공명 Major
22 DB구축 목록 및 범위
221 DB구축대상 및 항목 정의
DB구축대상 수집된 영문 이력서 번역 및 희망자에 대한 이력정보 번역
- 수집된 이력서 번역
middot 수집된 한글이력서 반영하여 번역 수행
middot 수집된 영문이력서 입력
- 이력서 번역 대상자
middot 참여인력 또는 평가위원 서비스 대상자
middot 논문실적 경력사항 등의 데이터가 충실한 인력
DB구축 대상 항목 정의
- 103 -
경력(Career)
경력사항(CAREER)
시작년월 Start Date - 재직 경력으로 주요 경력입력 현 재직정보제외
종료년월 End Date
재직기관명 Organization Name
직위 Position(Job Title)
실적ResearchResult
논문실적(paper)
논문명 Title - 최근 5년 이내만 입력
저널명 Journal Name
게제(권)집 Volume
게제호 Number
시작페이지 Start Page
종료페이지 End Page
게제년월 Date of Publication
공동저자명 Co-Author
비고 Etc
연구실적ResearchProject
시작년월 Start Date
종료년월 End-Date
발주기관 Funding organization
참여구분(역할)-코드
Role
연구실적명 title
특허(patent)
출원등록구분-코
드
appliedregistered
출원등록번호 number
출원등록국가-코
드
National Code
특허출원명 Patent name
출원등록일자 Date
- 104 -
항 목 세 부 항 목 비고
기본(BasicInformation)
기 본정보
영문성명 - 각각 형태가 다른 영문성명을ldquoGilDong Hong 형태로 변경 필요
T
휴대전화(국가번호)
- 휴대전화를 표준형태로 변경 필요(외국 휴대전화만 국가번호 표시)middot 대한민국 010--middot 외국 +국가번호---
T
E-mail abctestcom 형태 T
개인홈페이지
입력 시 http을 제외하고 입력T
전 문분야
전문(연구)분야
- 전문분야는 lsquo08 개정 분류코드 영문명 활용
- 본인 확인에 의해 본인이 직접 선택하도록 함
- 검색키워드 필드에 전문분야명을 입력
재 직기관(organization)
기관명 - 대표기관명- 기관명이 주소정보에 포함되어 있는경우 존재
부서명 - 부서명이 주소정보에 포함되어 있는경우 존재
직위 - 여러개의 직위 존재우편번호 - 주소정보에 기관명 부서명 포함되어
있는 경우 존재- 영문우편번호DB를 이용 가능
주소
전화(국가번호)
- 전화번호를 표준형태로 변경 필요(외국 전화만 국가번호 표시)middot 대한민국 042--middot 외국 +국가번호---
T팩스(국가번호)
학력(Academiccarrer)
최 종학위(FinalDegree)
학위(코드) - 8 박사- 5 석사- 2 학사
C
학위취득일 - YYYY-MM-DD형태 D학교명 - 대표기관명전공명
경력(Career)
경 력사항(CAREER)
시작년월 - YYYY-MM형태 D종료년월 - YYYY-MM형태 D
재직기관명 - 부서명 포함직위 - 여러개의 직위 존재
실적ResearchResul
논 문실적(paper
논문명 - 영문제목 일부 존재저널명
23 데이터 분석 내역
231 세부 항목별 영문이력정보 분석
번역을 위한 영문이력정보 분석
∙ D 날짜형태변환 C 코드화 T 표준형태변환
- 105 -
t ) 게제(권)집
게제호시작페이지종료페이지게제년월 - YYYY-MM형태 D공동저자명 - 공동저자명이 구분자로 N명이상 존
재연 구실적ResearchProject
시작년월 - YYYY-MM형태 D
종료년월 - YYYY-MM형태 D발주기관참여구분(역할)-코드
A 연구책임자B 참여연구원
C
연구실적명 - 영문제목 일부 존재특허(patent)
출원등록구분
-코드C
출원등록번호출원등록국가
-코드C
특허출원명출원등록일자
- YYYY-MM-DD형태D
항 목 세 부 항 목
기본(BasicInformation)
기본정보 영문성명
휴대전화(국가번호)
개인홈페이지
전문분야 전문(연구)분야
재직기관(organization)
기관명
부서명
24 DB구축 절차 및 작업 지침
241 DB구축 지침
DB구축 내용
수집된 연구자 영문 이력서 입력을 통한 DB 구축
연구자 이력정보 영문 번역을 통한 DB 구축
DB구축 항목
DB구축 대상 항목
- 106 -
직위
우편번호
주소
전화(국가번호)
팩스(국가번호)
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드)
학위취득일
학교명
전공명
경력(Career)
경력사항(CAREER)
시작년월
종료년월
재직기관명
직위
실적ResearchResult
논문실적(paper)
논문명
저널명
게제(권)집
게제호
시작페이지
종료페이지
게제년월
공동저자명
비고
연구실적ResearchProject
시작년월
종료년월
발주기관
참여구분(역할)-코드
연구실적명
특허(patent)
출원등록구분-코드
출원등록번호
출원등록국가-코드
특허출원명
출원등록일자
- 107 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
DB구축
준비
계획 수립
번역대상자분석 번역대상자 데이터 분석 대상자 선정 분석 내역 작성
절차 협의선처리 번역 번역확인전문가검수 본인확인KISTI검수
DB구축 대상 확정
매뉴얼 작성
입력 매뉴얼 구성내용
DB구축 개요 및 절차정의
DB구축 대상정의 및 범위
입력 항목별 기준 및 예시
입력프로그램 사용법
전환 코드표
표준 양식
입력 매뉴얼 검토및 확정
입력 매뉴얼 초안작성
상세일정계획수립
입력 량을 분석하여 투입인력대비 주월별 입력 계획대비 실적 산정
일정 검토 및 확정 일정계획 작성
작업 환경구축
작업 환경 및번역자 구성 입력 환경 구성
번역자 선정
영문이력정보 관리기능 개발
입력 교육 실시
번역자를 대상으로 교육실시 및 교육결과서 작성
입력작업 교육 실시
DB구축진행
선처리번역번역확인전문가검수
선처리번역번역확인전문가검수
DB구축 추진결과번역 및 품질활동수행
추진현황보고 실적 보고실적 확인 및 이슈사항 협의
주별진척보고
이슈사항 및 문제점 보고
DB구축완료
서비스DB이관 검수및 납품
서비스DB이관
완료된 영문이력DB의서비스화 이관 확인 데이터 이관
데이터 검수(최종 확인)
영문이력 DB 검사 (샘플링 검수) 검수(샘플링)
검수 데이터 추출제공
242 DB구축 단계별 작업 지침
243 DB구축 항목별 세부지침(선처리)
공통사항
Ⅰ 공통사항
1 기존에 존재하는 영문명은 입력된 그대로 유지하되 일부 정제 필요
- 108 -
원본데이터 입력데이터 입력요령
H20 A2 H20 A2
- 서식에 의한 특수문자는 텍
스트 형태 그대로 입력함
k- iexcl k - ε
- 수식도구에 의한 특수문자는
특수문자표를 참조하여 호환되
는 경우에만 입력하고 그렇지
않으면 수식만 제외하고 입력
참고3 특수문자표
원본데이터 번역데이터 입력요령
문장의 첫 단어
이름장소 등 고유명사
직함칭호의 축약형
1인칭 주어
도시이름월요일휴일시대 등
단어의 시작글자 대문자 표기
책글노래영화제목 등
a an and at by for in
of로 시작할경우
a an and at by for in of
를 제외한 시작문자 대문자로
표기
장소를 지칭하는 고유명사
internet 등Internet 시작문자 대문자 표기
국가언어등을 지칭하는 단어
(고유명사 일반명사의 개념)시작문자 대문자 표기
교과 과목명 시작문자 소문자로 표기
외국기관명 외국대학명 논문제목 연구제목 등
2 한글영문 이외의 표기된 외국어는 그대로 유지
(단 한글영문을 일부 포함한 외국어는 번역 시행)
3 모든 항목은 좌우의 공백을 제거하고 입력
가 줄바꿈 문자나 좌우의 공백문자를 제거하고 입력
나 데이터 사이에 공백문자가 두 개 이상인 경우에는 공백문자를 한 개로 입력
4 휴대전화 및 전화번호는 대한민국의 경우에는 국가번호를 표시하지 않고 외국의 경우에
만 국가번호(+국가번호)를 표시함
5 특수문자의 입력
6 대소문자 규칙
가 번역의 경우 대소문자 표준 준수
해당 기관홈페이지에 표기되어있는 공식영문명칭의 대소문자에 따라 선처리 및 번역
단 번역 시 단어 시작글자만 대문자료 표기
- 109 -
사이트명 url 비고
NAVER 백과사전 http100navercom 기관명 홈페이지 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr기관명 홈페이지 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 기관명 검색서비스
KIS-Report httpwwwkisreportcom한국신용평가정보 기업보고서
국내일반기업 영문명 기재
KJTRANS httpwwwkjtranscokr학교 및 연구기관 분야별 검
색가능
영문표기kr httpwww영문표기kr 기관학교연구기관 검색가능
학위논문 원문 공동이용협의회 httpthesisorkr협의회 대학기관 목록
(연구 발주기관)
NDSL 연구실적 검색 httpscholarndslkrindexdo연구실적 검색 가능
(연구 발주기관)
Paper Searchnet httpwwwpapersearchnet논문 및 저널명 검색서비스
(연구 발주기관)
기관명
Ⅰ 소속기관사항(기관명) 학력사항(학교명) 경력사항(재직기관명) 연구실적(발주기관
명)
1 선처리 작업 수행 시 고려 사항
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
선처리 작업 시 기관명이 Full name 과 약어 기재를 원칙으로 함
단 약어가 존재하지 않을 경우 기재하지 않음
부서직위명을 포함하고 있을 경우 포함하여 선처리
단 소요시간이 길어질 경우 부서직위명 한글 그대로 입력)
업무명이나 업무설명이 포함된 경우 한글 그대로 입력 (추후 번역시 정제)
웹 검색 시 해당기관 홈페이지에 기재되어있는 영문을 우선순위로 선처리
웹 검색 및 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
2 기관명 웹 검색 url 목록
- 110 -
원문 번역 비고
상호명 ldquo(주)rdquo의 번역
상호명 ldquo(사)rdquo의 번역
상호명 ldquo(유)rdquo의 번역
상호명 ldquo(일)rdquo의 번역
상호명 ldquo(재)rdquo의 번역
Co LTd
Association
INC
Foundation
영국식 주식회사 표기 번역
기관명 약어의 경우
기관명(약어)
기관명
약어로 번역
Full name(약어) 번역
Full name 번역
약어가 존재하지 않을 경우
Full name만으로 번역
원문 번역 비고
((주)한일합섬Hanil Synthetic Fiber Co
Ltd
- 오탈자 정제
웹검색
원문DB의(rarr정제
(system2010)산자부과기부
(system2010)Ministry of
Commerce Industry and
EnergyMinistry of Science
and Technology
- 기관명n 괄호명칭 ()
웹검색
n개의 기관명 모두 선처리
()괄호안의 표기내용 기재
(주)부일건화(주)아해BUIL KEON WHA Co
LtdAhae Co Ltd
- 기관명n
웹검색
n개의 기관명 모두 선처리
(주)비츠로테크 공장장VITZRO TECH Co Ltd
Plant Manager
- 직위명 포함
웹검색
직위명 번역 선처리 기재
(재)전북생물산업진흥원Jeonbuk Bioindustry
Development Institute
-상호명 (재)
웹검색
해당기관 홈페이지 영문명기
검색 가능한 url은 추후 추가 가능
3 번역 시 고려사항
상호명 번역 지침
번역 시 고려사항
4 선처리 예
- 111 -
재
(캐나다) 오타와 대학교 (Canada)University of Ottawa
-괄호()
웹검색
괄호()내용 번역 선처리 기재
강원대학교 의과대학Kangwon National University
College of Medicine
-학과명
웹검색
학과명 번역 선처리 기재
국립 지바대학교(일본) National Chiba University(Japan)
-괄호()
웹검색
국립 번역 선처리 기재
괄호()내용 번역 선처리 기재
미국 Cornell대학교 Section of
Molecular Biology
USA Cornell College Section
of molecular Biology
-한글영문명
웹검색
미국 번역 선처리 기재
영문명 그대로 기재
엔에스(Natural Science Co) 공
동설립
NS(Natural Science Co
Ltd)
-괄호() 업무설명
웹검색
괄호() 영문명 그대로 유지
업무설명 ldquo공동설립rdquo 제거
웅진출판(주) 편집국 생태전집
부 - lsquo한국의 자연탐험rsquo 제작 참
여
Woongin Publications Co Ltd
Editorial ecological Colledted
Works
-부서명 업무설명
웹검색
부서명 번역 선처리 기재
업무설명 ldquolsquo한국의 자연탐험rsquo
제작참여rdquo 제거
11 국제산학연 공동기술개발지
원사업
Korea Association of Industry
Academy and Research
Institute(KAIARI) Business
support for academic-industrial
common technology
development
-괄호()
웹검색
국립 번역 선처리 기재
괄호()내용 번역 선처리 기재
기관명 코드 참조 첨부7 기관명 코드
- 112 -
사이트명 url 비고
NAVER 백과사전 http100navercom 통합 검색 서비스
NAVER 사전 httpendicnavercom 표준 영문직위 검색가능
KJTRANS httpwwwkjtranscokr학교 및 연구기관 분야별 검
색가능
영문표기kr httpwww영문표기kr 직위명 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr통합 검색 서비스
원문 번역 비고
교수 (학부장) Professor(Dean)
-직위명n 괄호() 직위명
웹 검색 및 직위표 코드참조
모두 번역 및 선처리
교학부장 겸 학과장 Dean Chair
-직위명n
웹 검색 및 직위표 코드참조
모두 번역 및 선처리
사원(전장설계부)Employee(Department of Wiring
Harness Design)
-직위명 부서명포함
웹 검색 및 직위표 코드참조
부서명 포함 번역 및 선처리
선임연구원(고주파제어시스템)Senior Researcher(High-Frequency
Wave)
-직위명 업무명
웹 검색 및 직위표 코드 참조
직위명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
직위가 n개의 경우 n개로 선처리
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당기관 홈페이지에 기재되어있는 직위 영문을 우선순위로 선처리
웹 검색 불가시 영문 직위명을 참조하여 번역
번역 작업 시 영문 직위명은 표준 영문 직위 표기에 따라 번역
웹 검색 및 영문직위표 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
2 직위명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
3 영문직위 번역 코드 참조
4 선처리 예
- 113 -
사이트명 url 비고
NAVER 백과사전 http100navercom 통합 검색 서비스
KJTRANS httpwwwkjtranscokr학교 및 전공명 검색가능
(자료실영어표현 강좌실)
영문표기kr httpwww영문표기kr 전공명 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr통합 검색 서비스
NAVER 사전 httpendicnavercom 표준 영문직위 검색가능
원문 번역 비고
전기전자전자통신공학Electrical Electronics Communications
Engineering
-전공명n
웹검색 및 코드표 참조
전공명n개 n갯수만큼 선처리
하수도 Sewerage-전공명
웹검색 및 코드표 참조
업무명 번역 및 선처리
연 구 원 ( R E S E A R C H
ASSORIATE)Research Associate
-직위명 영문명 포함 정제
웹 검색 및 직위표 코드참조
정제 AssocraterarrAssociate
괄호() 제거(동일한 영문명
전공명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
전공이 n개의 경우 n개로 선처리
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당학교 홈페이지에 기재되어있는 전공 영문을 우선순위로 선처리
웹 검색 및 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
ldquoOO학과rdquo 항목의 경우 동일한 ldquoOO학rdquo으로 선처리 번역으로 입력
동일한 한글명에 대한 학문 분야별 영문표기명이 다를 경우 표준명칭으로 선처리
2 전공명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
3 선처리 예
- 114 -
사이트명 url 비고
NDSL 논문실적 검색 httpscholarndslkrindexdo 논문검색시 저널명 발췌
과학기술학회마을httpsocietykistirekrmainht
ml학술지검색 메뉴 검색
KJTRANS httpwwwkjtranscokr 자료실
DBpiahttpwwwdbpiacokrpublicati
onview_resultasp저널명 및 논문 검색가능
구글httpwwwgooglecokr
httpscholargooglecokr저널명 및 논문 검색가능
국회도서관httpsu-libnanetgokrdlSear
chIndexphp논문 및 저널명 검색가능
휴리스틱알고리듬 Heuristuc Algorithm
-원문 정제
웹검색 및 코드표 참조
정제 ldquo알고리듬rdquorarrlsquo알고리즘ldquo
면역학(면역학) Immunology
-전공명n 괄호()명
웹검색 및 코드표 참조
괄호()명 제거(동일한용어)
19C영미시19C British and American
Poetry
-숫자영문명
웹검색 및 코드표 참조
19Crarr그대로 유지(19세기 표
현방식)
저널명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당 논문게재지 홈페이지의 영문 표기로 선처리
동일한 논문명으로 여러개의 저널명이 검색될 경우 게재권(게재호) 게재페이지 게재년
월 등을 확인후 선처리
웹 검색 시 영문명이 존재하지 않을 경우 번역
2 저널명 웹 검색 url 목록
- 115 -
NAVER 전문정보httpacademicnavercommain
nhn논문 및 저널명 검색서비스
Paper Searchnet httpwwwpapersearchnet 논문 및 저널명 검색서비스
SpringerLinkhttpwwwspringerlinkcomho
memainmpx논문 및 저널명 검색서비스
원문 번역 비고
Proc 대한조선학회 추계연구발
표회
Proc International Journal of
Naval Architecture and Ocean
Engineering(JNAOE) Fall
Conference
-원문 영문 포함 일부번역
웹검색
영문명 유지
일부번역 ldquo추계연구발표회rdquo
대한건축학회논문집제20권Journal of the Architectural
Institute of Korea
-부서명 업무설명
웹검색
부서명 번역 선처리 기재
업무설명 ldquolsquo한국의 자연탐험rsquo
제작참여rdquo 제거
대한두개안면성형외과학회Korean Cleft Palate-Craniofacial
Association
-공식 영문저널명 특수문자
웹검색
저널홈페이지에 기재된 특수
문자 포함 선처리
대한두개안면성형외과학회지
Journal of the Korean Cleft
Palate-Craniofacial Association(J
Korean Cleft Palate-Craniofac
Assoc)
-약어 저널명
웹검색
저널홈페이지에 기재된약어
선처리
대한토목학회 학술발표회 논문
집 CD-ROM
Proceedings of the Korean Society of
Civil Engineers(KSCE) Conference
Technical Journal CD-ROM
-약어 원문영문
웹검색
약어기재 영문명그대로 유지
표준
지침
Proceedings of
Journal of The 회차 Journal Name Conference 계절 년도(날짜) 개최지
예)Proceedings of
Journal of The 7th Journal Name Conference Fall 2009 09 12 Tokyo Japan
저널명
없음저널명이 없을 경우 원문 순서 그대로 번역
검색 가능한 url은 추후 추가 가능
3 선처리 예
4 저널명 번역시 표준 지침
5 저널명 번역시 유의 사항
- 116 -
원본데이터 번역데이터 입력요령
학술발표학술발표회
학술연구발표학술연구발표회
번역
Journal Name Conference 저널명 뒤에 기재
논문집요약집초록집논문
초록집 번역Proceedings of Journal Name 저널명 앞에 기재
OO학OO학회OO학회지 Journal of Journal name 저널명 앞에 기재
회차 계절 날짜 개최지OOth Journal Name Spring
2010 Seoul Korea
회차 저널명 앞에 기재
계절날짜개최지 저널명 다음
구신 저널명 선처리번역 웹으로 검색된 저널명을 기준 존재하지 않을 경우 신 저널명
6 저널명 대소문자 표기 지침
middot 단어의 첫글자 대문자 표기
244 DB구축 항목별 세부지침(번역)
기본정보
Ⅰ 영문성명
1 영문성명의 입력포맷 홍길동 =gt GilDong Hong
원본데이터 입력데이터 입력요령
HONGGILDONG
Gil-Dong Hong
Hong Gil-Dong
GilDong Hong - 영문성명 입력표준으로 변경
2 영문성명 번역시 고려사항
기존에 존재하는 영문명은 유지
논문실적의 영문명이 존재할 경우 영문명 입력
- 단 논문실적 항목의 공동저자명에 약어 축약어의 경우 영문성명은 Full name기재
번역시 로마자 표기법에 준수하여 번역
참고 로마자 표기법
- 117 -
원본데이터 입력데이터 입력요령
017)- 017-- - ldquo-rdquo구분자로 변경
+82-10-2497- 010-2497-
- 대한민국은 국가번호 제외하
고 입력
- 휴대폰구분번호 앞에 ldquo0rdquo표
시
1-11-- +1-11--- 외국의 휴대전화는 +국가번
호 붙여서 입력
011-123 입력하지 않음- 휴대전화번호가 완전하지 않
은 형태는 입력하지 않음
Ⅱ 휴대전화
1 휴대전화의 입력포맷
대한민국 휴대폰구분번호-국번-전화번호 (대한민국은 국가번호 제외하고 입력)
외국 +국가번호-휴대폰구분번호-국번-전화번호
Ⅲ E-mail
1 E-mail의 입력포맷 abctestcom
Ⅳ 개인홈페이지
1 개인홈페이지의 입력포맷 wwwhomepageurlcom (http 제외하고 입력)
2 한글 도메인의 경우 영문 도메인을 찾아 입력
Ⅴ 전문(연구)분야
1 전문(연구)분야의 코드 입력은 이력서 본인에 의해 과학기술표준분류별 전문분야를 선택
하도록 함
재직기관
Ⅰ 기관명(선처리 작업)
- 118 -
부서명 표현 항목 표현여부
Department of경력사항부서명 기재
전공명(학력사항) 삭제
College of경력사항부서명 기재
전공명(학력사항) 삭제
Ⅱ 부서명
1 번역 수행
번역 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
번역 작업 해당 기관홈페이지의 영문명을 우선순위로 번역
공식화된 영문명이 존재하지 않을 경우 부서명 참조
참조 부서명 코드
기관홈페이지 및 공식화된 영문명이 존재하지 않을 경우 번역수행
부서 영문명은 Department of 등으로 시작하며 약어 및 축약어 기재는 불가하며 모두
Full name 번역을 원칙으로 번역수행
Ⅲ 직위(선처리 작업)
Ⅳ 우편번호 주소
1 영문 우편번호DB 참조
2 주소의 기본주소와 상세주소를 합침
3 우편번호 및 영문 번역주소 검색
httpwwwkoreapostgokrservletkpppostPostInfo (우정사업본부)
4 검색된 번역 영문 주소 입력(단 기관명과 영문주소와 동일하지 않을 경우 기관명을기준)
5 존재하지 않는 상세주소의 경우 로마자 표기법에 준수하여 번역
참고 로마자 표기법
6 우편번호 입력시 웹검색과 원본이 다른 경우 원본그대로 우편번호 유지
(영문주소는 웹검색 그대로 번역 및 입력)
Ⅴ 전화 팩스
1 전화의 입력포맷
대한민국 지역번호-국번-전화번호(내선번호) lt= 대한민국은 국가번호 제외하고 입력
- 119 -
원본데이터 입력데이터 입력요령
042)- 042-- - ldquo-rdquo구분자로 변경
+82-31-2497- 031-2497-
- 대한민국은 국가번호 제외하
고 입력
- 지역번호 앞에 ldquo0rdquo 표시
1-11-- +1-11--- 외국의 전화번호는 +국가번
호 붙여서 입력
061-123 입력하지 않음- 전화번호가 완전하지 않은
형태는 입력하지 않음
02-123-1234(12) 02-123-1234(12) - 내선번호는 그대로 입력
외국 +국가번호-지역번호-국번-전화번호(내선번호)
학력사항
Ⅰ 학위취득일
1 학위취득일 입력포맷
ldquoYYYY-MM-DDrdquo 형태
Ⅱ 학교명(선처리 작업)
Ⅲ 전공명(선처리 작업)
경력사항
Ⅰ 시작년월 종료년월
1 시작년월 종료년월 입력포맷
ldquoYYYY-MMrdquo 형태
시작년월은 종료년월보다 작거나 같아야 함
- 120 -
사이트명 url 비고
NDSL 논문실적 검색 httpscholarndslkrindexdo 논문검색시 저널명 발췌
과학기술학회마을httpsocietykistirekrmainht
ml학술지검색 메뉴 검색
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr저널명 및 논문 검색가능
Ⅱ 재직기관명 직위(선처리 작업)
Ⅲ 직위(선처리 작업)
논문실적
Ⅰ 논문실적 형태
보통 논문제목 저널명 게재권 (게재호) 게재페이지 게재년월 공동저자명으로 작성
volume (Vol) ( 정기 간행물 1년분의 ) 권
issue(ISS)또는 No또는 (숫자) 게제호 예) Vol9 ISS 4 또는 v9 no4 또는 9(4)- 9
권 4호
Ⅱ 공동저자명
웹 검색을 통한 원문 출처의 번역 방식에 따라 입력
저자명과 저자명은 ldquo rdquo으로 구분자(마지막 입력 후 ldquo rdquo 입력)
번역 시 Full name으로 입력하며 로마자 표기법을 준수함
Ⅲ 논문명
1 번역 작업 수행
번역 작업 시 기존 논문 영문명은 그대로 유지하되 일부 정제 필요
웹 검색 시 해당 논문게재지 홈페이지의 영문 표기로 선처리
동일한 논문명으로 여러개의 저널명이 검색될 경우 게재권(게재호) 게재페이지 게재년
월 등을 확인 후 선처리
웹 검색 시 영문명이 존재하지 않을 경우 번역
2 논문명 웹 검색 url 목록
- 121 -
국회도서관httpsu-libnanetgokrdlSear
chIndexphp논문 및 저널명 검색가능
NAVER 전문정보httpacademicnavercommain
nhn논문 및 저널명 검색서비스
Paper Searchnet httpwwwpapersearchnet 논문 및 저널명 검색서비스
DBpiahttpwwwdbpiacokrpublicati
onview_resultasp저널명 및 논문 검색가능
SpringerLinkhttpwwwspringerlinkcomho
memainmpx논문 및 저널명 검색가능
검색 가능한 url은 추후 추가 가능
Ⅳ 저널명(선처리 작업)
연구실적
Ⅰ 시작년월 종료년월
1 시작년월 종료년월 입력포맷
ldquoYYYY-MMrdquo 형태
시작년월은 종료년월보다 작거나 같아야 함
Ⅱ 발주기관(선처리 작업)
Ⅲ 참여구분
1 참여구분 입력지침
연구책임자 참여연구원 중에서 선택하여 입력함(구분 불가능시 선택 안함)
Ⅳ 연구실적명
1 번역 작업수행
번역 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
번역 작업 시 웹검색을 통하여 정확한 연구실적명을 검색
웹 검색 시 공식화되어있는 영문을 우선순위로 번역
웹 검색 및 공식적으로 사용하는 연구실적명이 존재하지 않을 경우 번역
- 122 -
사이트명 url 비고
한국특허정보원httpwwwkiprisorkrkormai
nmainjsp국내특허실적 분야별 검색
구글 특허정보 검색서비스 httpwwwgooglecompatents해외 특허정보 검색서비스
(7백만개 이상 검색가능)
PCT 특허정보 검색서비스 httpwwwwipointpctdben PCT 특허 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 특허정보 검색서비스
사이트명 url 비고
NDSL 연구실적 검색 httpreportndslkrindexdo 연구실적 검색 가능
KJTRANS httpwwwkjtranscokr학교 및 연구기관 검색가능
(자료실영어표현 강좌실)
구글 httpwwwgooglecokr
NAVER 전문정보httpacademicnavercommain
nhn네이버 연구실적명 검색
Paper Searchnet httpwwwpapersearchnet 연구실적명 검색서비스
2 연구실적명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
특허실적
Ⅰ 출원등록구분
출원 등록 중에서 선택함
같은 특허에 대해 출원과 등록 모두 존재하면 등록정보만 입력함
출원 등록이 미구분시에는 선택하지 않음
Ⅱ 출원등록번호
특허 출원등록번호 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
Ⅲ 출원등록국가
- 123 -
사이트명 url 비고
한국특허정보원httpwwwkiprisorkrkormai
nmainjsp국내특허실적 분야별 검색
구글 특허정보 검색서비스 httpwwwgooglecompatents해외 특허정보 검색서비스
(7백만개 이상 검색가능)
PCT 특허정보 검색서비스 httpwwwwipointpctdben PCT 특허 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 특허정보 검색서비스
1 출원등록국가 입력지침
출원등록국가 코드를 찾아 입력
Ⅳ 특허출원명
1 특허출원명 번역지침
특허출원명 입력시 웹 검색을 우선으로 시행
웹 검색 후 영문명이 존재할 경우 그대로 입력
영문명이 존재하지 않을 경우 번역 시행
2 특허출원명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
Ⅴ 출원등록일자
1 출원등록일자 입력포맷
ldquoYYYY-MM-DDrdquo 형태
25 DB구축 검수
251 DB구축 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
- 자체적인 품질활동 점검표 작성등의 수행결과를 주기적으로 측정하여 품질목표를 달성
하도록 함
- 124 -
항 목 세 부 항 목 항목수 단위별가중치()
기본(BasicInformation)
기본정보 영문성명 5 15휴대전화(국가번호)E-mail개인홈페이지
전문(연구)분야-본인입력검색키워드
재직기관(organization)
기관명 7 20부서명직위우편번호
주소전화(국가번호)
검수 기준
- 에러율 전체 데이터(전체 항목 필드 기준)의 01 이하(품질목표 999)
- 에러 체크 방식 전체 데이터에서 본인확인 미완료 대상 중 무작위로 30 샘플링 하
여 검수
- lsquo10년도 10월 DB구축완료단계에 최종 검수 실시
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침
및 매뉴얼에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며
오류율 산정에서 제외함
검수방식 및 기준
- 수집된 영문이력서 원본 파일(hwp doc pdf 등)과 입력 완료된 영문이력DB를 육안검
사 함
- 오류 판단 기준은 KISTI가 작성한 DB구축 작업 지침서를 참조함
252 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 125 -
팩스(국가번호)
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) 4 15학위취득일학교명전공명
경력(Career)
경력사항(CAREER)
시작년월 4 15종료년월
재직기관명직위
실적ResearchResult
논문실적(paper)
논문명 9 15저널명게제(권)집게제호
시작페이지종료페이지게제년월공동저자명비고
연구실적ResearchProject
시작년월 5 10
종료년월발주기관참여구분(역할)-코드연구실적명
특허(patent)
출원등록구분-코드 5 10
출원등록번호
출원등록국가-코드
특허출원명출원등록일자
계 38 100
항 목 세부항목 검수대상
데이터수
오류데이터건
수
품질지표별
기준점수의 합
항목가중치
()
오류율산정
기본(BasicInformation)
기본정보(5개)
영문성명 30 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
단위별 가중치는 KISTI와 협의하여 결정함
항목별 오류율 산정 기준 정의
- 126 -
휴대전화(국가번호)
30
E-mail 30개인홈페이지
30
검색키워드
30
소계 150재직기관(o r gan ization)(7개)
기관명 40부서명 30
직위 30우편번호 10주소 30전화 (국가번호)
30
팩스(국가번호)
30
소계 200
학력(Academiccarrer)
최종학위(FinalDegree)(4개)
학위 (코드)
10
학위취득일
15
학교명 80전공명 45소계 150
경력(Career)
경력사항( C AREER)(4개)
시작년월 15
종료년월 15재직기관명
80
직위 40소계 150
실적ResearchResult
논문실적(paper)(9개)
논문명 40저널명 20
게제(권)집
20
게제호 20시작페이지
10
종료페이지
10
게제년월 10공동저자명
10
비고 10소계 150
연구실적(Researc
시작년월 15종료년월 15발주기관 20
- 127 -
hProject)(5개)
참여구분(역할 ) -코드
10
연구실적명
40
소계 100특허(patent)(5개)
출원등록구 분 - 코
드
10
출원 등록번호
20
출원등록국 가 - 코
드
35
특허 출원명
20
출원 등록일자
15
소계 100계 100
- 128 -
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형구분
오류요형별점수 비고
완전성
누락 - 코드 누락 02
품질지표기준점수산정(데이터1건기준)=오류
유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 01
유효성형식 - 패턴의 오류 02
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 02
계 6개 오류유형 1
기본정보
영문성명 휴대전화 E-mail 개인홈페이지 계
Hong Gil Dong
(형식 02)010-111- testcom
GilDong Hong+82-011-111-
(형식 02)
testcokr
(오기 02)
testcom
(오기 02)
(누락 02) 019-111_ testcokr testcokr
품질지표별
기준점수의 합04 02 02 02 1
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
국가RampD참여인력
영문이력DB
3000건 3000건 3000건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
검사물량 집계표 예시
검수데이터 예시
- 129 -
3 평가위원 데이터 최신성 유지 매뉴얼
31 최신성 유지 업무 개요
311 개요
평가위원 데이터 최신성 유지란 lsquo기 구축된 평가위원 DB 내의 각 데이터들이 가장 마지막
으로 업데이트된 시점을 기준으로 그 시점부터 현재까지의 기간 동안 누락된 대상 인력들
의 변경사항들을 해당데이터에 추가입력 및 수정해주는 것rsquo을 의미
또한 대상 인력의 변경사항 반영이외에도 기 입력된 데이터들의 내용을 검토하고 발견된
오류 및 누락정보에 대한 수정ㆍ보완 작업 역시 평가위원 데이터 최신성 유지의 일환
최신성 유지를 위해 먼저 대상 인력에 대한 정보 수집이 요구됨
- 130 -
312 최신성 유지 업무 절차
최신성 유지 업무 절차는 관리자와 담당자의 역할로 구분가능
관리자는 담당자의 업무할당 데이터 검수 업무보고 등을 수행하며 담당자는 할당된 대
상인력에 대한 데이터 수정 및 보완 작업 수행
최신성 유지 업무 절차를 순서별로 나열하면 다음과 같음
- 관리자는 대상인력에 대한 전체리스트를 작성하고 이를 각 담당자들에게 일정량씩 할당
- 담당자는 할당된 대상인력에 대한 정보를 수집하고 기 입력된 데이터와의 비교를 통해
변경사항에 대한 수정 및 추가입력
- 담당자는 대상인력에 대한 정보를 수집한 출처 및 기타 비고사항에 대한 의견 등을 작
성하여 할당량에 대한 작업 완료시 관리자에게 보고
- 관리자는 보고된 작업결과물을 취합하여 정리하고 대상인력에 대한 정보가 잘 수집되고
입력되었는지 검토하여 수정 및 보완
- 관리자는 일일별 완료된 작업 결과 및 비고사항을 작성된 양식에 따라 담당 책임자에게 보고
- 131 -
32 대상 인력(평가위원) 정보 수집 방법
대상 인력의 정보를 수집하기 위한 방법은 크게 3가지로 구분
- 대상 인력에게 이력파일 요청
- 웹검색(기관홈페이지 개인홈페이지 및 각종 포털사이트)
- 신문기사의 인사ㆍ동정 모니터링
321 대상 인력에게 이력파일 요청
E-Mail 등을 통해 대상 인력에게 본인의 데이터에 대한 직접 업데이트 또는 입력대행을
위한 이력파일의 전송 요청
정보의 수신 방법은 E-Mail 우편 등이며 가장 신뢰성 높은 정보
입력이 완료된 이력파일은 개인정보보호를 위해 별도로 보관되며 E-Mail 및 기타 인쇄
물 이외의 형태로 수신되었을 경우 반드시 출력하여 관리
입력 완료시 해당인력에게 연락하여 결과에 대한 확인 요청
322 웹검색(홈페이지 및 각종 포털사이트)
대상 인력의 가장 최신의 연락정보(전화번호 E-Mail FAX 등) 재직정보 등을 수집하기
위해 웹상에 공개되어 있는 정보를 수집하여 데이터에 반영
대상 인력의 데이터 내 소속기관사항 및 기본정보의 홈페이지 주소 등을 통하여 해당 기
관 홈페이지 및 개인 홈페이지에 접근하여 연락정보 경력정보 실적정보 등에 관한 정보
수집
이직(移職) 등으로 대상 인력의 현재 소재지 재직기관 등에 관한 정보가 누락되어 있을
시 각종 포털사이트를 활용하여 해당인력의 소재정보 수집 및 접근
인물정보제공사이트를 통해 대상 인력의 기본정보 경력정보 실적정보에 대한 수정ㆍ보
완
323 신문기사의 인사ㆍ동정 모니터링
대부분의 신문에서 주요 인물에 대한 인사ㆍ동정에 관한 정보를 매일 싣고 있음
주기적으로 인사ㆍ동정란의 모니터링을 통해 평가위원 데이터에 변경사항 반영
- 132 -
33 최신성 유지 업무 작업 지침
331 언론을 통해 발표 되는 인사동정 수정
평가위원만 해당
교육과학기술부
- 참여인력을 포함하여 인사동정 수정
- 직급은 장관 차관 국장 팀장 사무관 서기관 까지 수정
- 특히 교육과학기술부장관 제2차관 정책보좌관 국장은 꼼꼼하고 세심하게 수정할 것
332 현행화 작업 내용
수정은 기본정보 소속기관 학력사항 초중고학력 경력사항 소속학협회 논문 실적 연구
실적 저역서실적 훈포장사항 지식재산권 주요업적사항 자격사항 사진관리 등 전 항
목에 걸쳐 작업 함
해당 인물의 개인 홈페이지를 최우선으로 보고 그 다음으로 기관 홈페이지를 참고
해당 기관 홈페이지에서 정확히 알 수 없을 경우에는 코셉 조인스 로마켓 동아일보를
참고 할 것
경력사항은 경력의 년도와 날짜가 없더라도 신규 입력 함
기본정보
e-mail에서 (dot)가 아닌 (comma) 로 표기된 경우 변경
e-mail 주소가 2개일 때는 개인홈페이지에 적힌 메일주소가 우선 판단이 안 될 경우는
소속기관에서부여된 e-mail 주소로 기입
인적사항의 홈페이지정보에서 lsquohttprsquo 는 빼고 입력
소속기관
산학협력단
- 소속기관에서 제외(삭제)하고 경력사항에만 기입
- 산학협력단이 주소로 되어있는 기업은 소속기관에 그대로 두거나 기입해 줌
평가위원이 의과대학의 교수이자 병원의 교수(의사)인 경우는 소속기관을 의과 대학
의 교수로 기입하고 병원 근무사항은 경력사항에 기입
(ex 관동대학교 의과대학 정형외과학교실 교수 소속기관
관동대학교 명지병원 정형외과 전문의 경력사항)
소속기관이 대학과 병원 모두 입력되어 있는 경우 수정하지 않고 pass
소속기관은 의과대학이나 주소가 병원일 경우 수정하지 않고 pass
평가위원의 재직기관 홈페이지에서 해당 인물이 검색 되지 않을 경우
- 학교의 교수 명예교수 등은 pass
- 회사의 대표이사 회장 등은 직급은 공란으로 바꾸고 재직중으로 변경
( 대표이사 인사말 회장 인사말 등의 인물 이름이 다를 경우를 뜻함)
- 133 -
평가위원이 학sdot협회에 재직중인 경우
- 소속기관이 하나이고 학sdot협회라면 소속기관에 그대로 둠
- 소속기관이 2개 이상이고 그 중 한 곳이 학sdot협회일 때
학sdot협회를 제외한 소속기관에서 인물이 검색 되는 경우 학sdot협회 내역으로 옮김
학sdot협회를 제외한 소속기관에서 인물이 검색 되지 않고 학sdot협회에서만 검색 되는 경
우 학sdot협회를 제외한 소속기관 내역은 경력사항으로 옮김
학sdot협회를 제외한 소속기관과 학sdot협회 모두 인물이 검색 되지 않는 경우 수정하지
않고 pass
기타
- 직장주소에 집주소가 되어있으면 변경하고 집주소란에 직장주소가 되어있으면 그냥 둠
- 겸임교수직은 경력사항에 입력
소속기관에 기입된 경우 경력사항으로 이동
소속기관이 한 개이고 겸임교수일 경우 pass
- 인물의 직급이 모두 시간강사인 경우 담당자에게 인물key 전송
- 퇴직한 교수로 그 이후의 소속기관이 없는 사람은 재직여부를 lsquo퇴직rsquo으로 변경 후 저장
- 전화번호가 2개인 경우 (comma)로 구분
- 교수의 경우 학과부서 탭엔 단과대 아래의 레벨 모두 기입
(ex 생명과학부 생명공학전공 or 의학과 내과학교실)
학력사항
박사후과정(Post-Doc)은 생략 단 경력사항의 Post-Doc은 기입
논문실적
2006~2010년도 논문sdot연구실적만 입력
현재 HuRIMs에 저장된 가장 최근 년도부터 템플릿에 작업
(ex 개인홈페이지에는 2000년~2009년까지 논문사항이 입력되어있고 HuRIMs에는 2007
년 2월까지만 입력되어 있다면 2007년의 논문은 중복체크를 한 후 입력되지 않은 논문
들과 2008 2009년도 논문을 템플릿에 넣는다)
기타논문집은 학술논문으로 판단되는 것들만 기입
- 판단기준 대학 연구소 학회에서 발행한 논문들
동일한 제목으로 다른 발행처에 중복 기재된 경우
- 발행처 두 곳이 모두 학회일 때 중복하여 기입
- 발행처 두 곳이 학회amp연구소 학회amp대학 일 때 학회의 논문실적만 기입
출판중인 논문은 기재하지 않음
학회sdot협회sdot대학 등에서 발간된 저서 중 일부만 담당한 경우
- 일부 chap theme 만 담당했더라도 저역서실적에 기입
- 일부 작성한 부분의 제목이 논문의 형태를 띄고 있을 때(~에 관한 연구 고찰 등)는 논문
실적에 기입
- 134 -
훈포장사항
세계인명사전등재 내용 기입
감사장 감사패는 기입하지 않음
경력업적학협회 유형 정리
향우회 민방위 동창회 성직자협의회 등은 제외함
lsquoooo위원회rsquo가 들어가는 내용은 직급에 상관없이 업적사항으로 기입 단 기초기술 연구
회와 산업기술연구회는 정부조직이므로 경력사항에 기입
(ex 기록관리혁신전문위원회 회장 정보통신위원회 고문 rarr 업적)
위원회를 제외한 lsquo회rsquo는 직급에 상관없이 학sdot협회 활동사항으로 기입
(ex 한국원예치료협회 상임이사 한국화훼장식학회 편집위원 한국양액재배연구회 이사
한국화훼환경디자인교수연합회 이사 전국대학정보화협의회 이사 rarr 학sdot협회)
활동내역 중 자문 심의는 업적사항에 기입 단 협회 학회 연구회 등의 자문sdot심의는
학sdot협회 활동사항에 기입
활동내역 중 기업sdot학교의 고문은 경력사항에 기입
34 최신성 업무 대상
341 대상 및 범위
평가위원후보추천서비스에서 서비스 중인 평가위원 전체
평가위원 기본정보 경력정보 갱신 및 실적정보 추가입력 및 갱신
추가 입력 및 갱신을 위한 기초자료는 웹사이트에 공개된 정보 신문의 인물 동정기사
평가위원 본인이 제공하는 이력정보 임
342 검수 기준
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
- 최신성 유지 관리를 수행한 전체 데이터 중 3를 샘플링하여 출처별 내용이 최신성 유
지 관리 매뉴얼 기준으로 추가 입력 및 갱신되었는지 여부를 확인
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 135 -
구분 항목 세부항목 항목수단위별
가중치()
참여
인력
정보
기본정보
주민등록번호 성명 자택주소 자택
우편번호 자택전화번호 핸드폰번호
7 31
소속기관사항
소속기관명 부서명 직위명 사무실
전화번호 기관주소 최초임용일 인
력(직업)구분
7 185
학력사항
전공 취득대학 학위 입학일 졸업
일 학과 취득국가 지도교수명 학위
논문명 학위취득일
10 21
경력사항 근무처명 직위명 근무기간 3 45
자격사항 자격발행처 자격증명 자격취득일 3 25
논문실적
논문발표일 국문논문명 영문논문명
저자역할구분 발행처 학술지구분
학술지명 SCI여부
8 105
지식재산권 지식재산권명 출원_등록번호 특허구분 3 25
계 소계 41 905
평가
위원
소속학협회현황 담당업무 직위 학협회사항 3 3
훈포장사항 수상년월 수여기관명 훈포장명 3 25
저역서실적국문저서명 영문저서명 발행년 발
행처 저역서구분5 4
소계 11 95
계 52 100
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
343 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 136 -
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
150 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
성명 100자택주소 10자택우편번
호
20
자택전화번
호
10
핸드폰번호 10E-mail 10소계 310
소속기
관사항
(7개)
소속기관명 100
부서명 05
직위명 20
사무실전화
번호
10
기관주소 30
인력(직업)구
분
10
최초임용일 10
소계 185
학력사
항
(10개)
전공 20
취득대학 100
학위 20
입학일 10
졸업일 10
학과 15
취득국가 15
지도교수명 05
학위논문명 05
학위취득일 10
소계 210
항목별 오류율 산정 기준 정의
- 137 -
경력사
항
(3개)
근무처명 20
직위명 15
근무기간 10
소계 45
자격사
항
(3개)
자격발행처 05
자격증명 10
자격취득일 10
소계 25
논문실
적
(8개)
논문발표일 10논문명1 10
논문명2 05저자역할구
분
05
발행처 05학술지구분 05학술지명 10
SCI여부 05
소계 105
지식재
산권
(3개)
지식재산권
명
10
출원_등록번
호
05
특허구분 10소계 25
평가 소속학
협회현
황
(3개)
담당업무 05
위원 직위 05(11개) 학협회사항 20
소계 30
훈포장
사항
(3개)
수상년월 10
수여기관명 05
훈포장명 10
소계 25
저역서
실적
(5개)
저역서명1 10
저역서명2 05
발행년 10
발행처 05
저역서구분 10
소계 40
계 1000
- 138 -
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 및
출처 비교 오류03
품질지표기준점수산정(데이터1
건기준)=오류유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 맵핑 오류 005
계 6개 오류유형 1
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
3000 3 055 150 000825
성명 10 2 035 100 000350자택주소 3 0 000 10 000000
자택우편번
호
3 2 035 20 000233
자택전화번
호
4 0 000 10 000000
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
평가위원 Pool DB 23000건 23000건 690건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
출처 비교는 작업대상별 출처 리스트 참조
검사물량 집계표 예시
오류율산정표 예시
- 139 -
핸드폰번호 6 0 000 10 000000
E-mail 9 0 000 10 000000소계 45 7 125 310 001408
소속기
관사항
(7개)
소속기관명 1000 20 100 000000부서명 80000 200 05 000000직위명 80000 200 20 000000사무실전화
번호
80000 200 10 000000
기관주소 80000 200 30 000000인력(직업)구
분
80000 200 10 000000
최초임용일 80000 200 10 000000소계 481000 1220 000 185 000000
계 1000 01
주민등록번호 한글성명 영문성명 한문성명자택우편번
호
630421-0000000 백중환Joong hwan
Baek
412220
(형식 015)
630421-0000000 백종석Baek Jong
Seok
6304210000000
(형식 015)백인열 Baek IN Youl 白寅烈 711-822
630421-0000000 백승호
(오기 02)백제훈
630421-0000000 백종완
630421-
(오기 02)백장선 Jangsun Baek
白壯선
(형식 015)
502-
(오기 02)
630421-0000000 백승호1213132
(오기 02)
630421-0000000 백석형
630421-0000000 백석형
품질지표별
기준점수의
합
055 035 035
검수데이터 예시
- 140 -
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 및
출처 비교 오류03
품질지표기준점수산정(데이
터1건기준)=오류유형별점수
의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 맵핑 오류 005
계 6개 오류유형 1
데이터별 품질지표 기준 점수
35 입력 항목별 QampA (처리 방법 및 사례)
기본정보
- 정보공개여부
구 분 내 용
상황 및 질문ㆍ데이터 신규입력 시 정보공개여부 설정(공개 기본인적사항만 공
개 비공개)을 어떻게 해야 하는지
처리 방법
및 사례
- 대상인력의 입력대행요청에 의한 정보입력 시 정보공개여부는 해당인
력이 요청한 대로 설정
- 최신성 유지팀 자체 내에서 수집한 정보를 바탕으로 대상인력 데
이터를 신규생성 할 경우에는 lsquo기본인적사항만 공개rsquo로 설정
- 과학기술표준분류
구 분 내 용
상황 및 질문ㆍ데이터 입력 시 과학기술표준분류에 대한 처리는 어떻게 해야 하
는지
처리 방법
및 사례
- 과학기술표준분류는 정보관리자가 임의로 선택하거나 수정하지 않
음
- 141 -
소속기관사항
- 재직여부
번호 구 분 내 용
1
상황 및 질문
ㆍ대상인력이 이직(移職)하여 재직기관이 변경된 경우 전 재직기
관 정보의 재직여부를 퇴직으로 변경하고 현 재직기관 정보를
추가입력해야 하는지
처리 방법
및 사례
- 대상인력의 재직기관이 변경되었을 경우 전 재직기관 항목은 삭제
후 경력사항에 반영함
- 현 재직기관 정보 신규입력 후 이를 경력사항에 반영
2
상황 및 질문ㆍOO연구원에 재직중인 홍길동씨가 현재 과학기술부에서 파견근
무 중일 경우 이를 어떻게 처리해야 하는지
처리 방법
및 사례
- 먼저 원 소속인 OO연구원 소속기관사항의 재직여부에 lsquo재직중rsquo
에서 lsquo파견중rsquo으로 변경
- 또한 소속기관사항 항목을 추가시켜 파견기관인 lsquo과학기술부rsquo 직위
등의 정보 입력 후 재직여부를 lsquo재직중rsquo으로 선택
3
상황 및 질문ㆍ대상인력이 정년 등의 이유로 퇴직한 상태인 경우 소속기관사
항을 삭제해야 하는지
처리 방법
및 사례
- 대상인력이 퇴직한 상태이고 현재 다른 직업이 없는 경우 소속
기관사항은 삭제 시키지 않고 재직여부를 lsquo퇴직rsquo으로 변경
- 경력사항 항목에 퇴직일자 포함된 정보 추가
- 142 -
학력사항
- 전공명
구 분 내 용
상황 및 질문ㆍ대상인력의 학력정보를 수집하였으나 학과명만 표기 있는 경우 전
공명은 공란으로 두는지
처리 방법
및 사례
- 대상인력의 학과정보만 발견된 경우 일반적으로 전공명은 우선 학
과명과 동일하게 입력
ex) 학과명 경영학과 rarr 전공명 경영학
경력사항주요업적사항
- 경력사항주요업적사항 일반
구 분 내 용
상황 및 질문 ㆍ경력사항과 주요업적사항은 어떤 기준으로 구분하는지
처리 방법
및 사례
- 일반적으로 웹상 및 타기관 인력정보데이터를 통해 수집된 정보에
는 경력사항과 주요업적사항을 따로 구분하지 않은 경우가 대다수
- 본 시스템에서는 경력사항과 주요업적사항을 구분하여 입력
- 경력사항은 대상인력의 직업과 관련된 사항으로 구분
- 주요업적사항은 대상인력의 직업 이외의 대외적인 활동 즉 평가
자문위원 등 각종 위원활동 설계 시공 기술지도 등의 사항으로
구분
예외적으로 학위 이외의 교육과 관련된 사항은 경력사항에 입력
ex) OO대학 OO교육과정 수료이수
- 143 -
소속학협회
- 직위담당업무
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 소속학협회정보에 학회명 이외에 다른 사항이
기재되지 않은 경우 직위 및 담당업무 항목은 어떻게 처리하는지
처리 방법
및 사례
- 활동시작년월 및 학회종료년월에 관한 정보가 없을 시 이는 공란처
리하며 직위의 경우 다른 정보가 없는 경우 lsquo회원rsquo으로 입력
논문실적
- 학술지구분
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 논문실적 정보만으로 학술지구분(국내 및 국외
전문학술지 국내 및 국외 학술대회발표논문집 기타논문집)에 대
한 구분은 어떻게 하는지
처리 방법
및 사례
- 수집된 대상인력의 논문실적 정보의 상당수가 국내 및 국외 전문학
술지 및 학술대회발표논문집에 관한 구분이 되어 있지 않기 때문
에 학술지구분에 어려움을 겪을 수 있음
- 이에 대한 구분기준은 명확하게 한정짓기 어려운 부분이 있어 이
러한 경우 최신성 유지 업무 담당 책임자가 판단하여 처리하고 있
음
- 이에 대한 몇 가지 팁을 제시하자면 먼저 lsquoOO학회지rsquo lsquoJournal
ofrsquo 등의 용어가 해당정보에 삽입되어 있는 경우 대부분 전문학
술지로 구분할 수 있으며 lsquo학술대회rsquo lsquo발표대회rsquo lsquoProceeding
Conference Seminar Workshop등의 용어가 해당정보에 삽입되
어 있는 경우 이는 대부분 rsquo학술대회발표논문집으로 구분할 수 있
음
- 또한 학술대회발표논문집 중 국내와 국외의 구분은 해당 학술대회
가 열린 장소를 기준으로 함
ex) lsquoThe Internation Conference in Seoulrsquo의 경우 학술대회가 열린
장소가 대한민국의 서울이므로 국내 학술대회발표논문집으로
구분함
- 144 -
- 역할
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 논문실적 정보에 역할(단독 공동(제1) 공동(참
여) 공동(책임))이 구분되어 있지 않은 경우 이를 어떻게 처리해야
하는지
처리 방법
및 사례
- 현재 대상 인력의 연구실적과 관련하여 역할구분이 되어 있지 않은 정
보를 입력할 시 해당 연구의 특성을 고려하여 역할을 lsquo단독rsquo 혹은 lsquo공
동(제1)rsquo으로 임시 구분해 줌
- 공동저자명
구 분 내 용
상황 및 질문ㆍ수집된 대상 인력의 논문실적 정보 중 공동저자명 입력 시 10명 이
상이 넘어가는 공동저자명을 모두 넣어주어야 하는지
처리 방법
및 사례
- 공동저자명의 경우 한 연구실적에서 무수히 발생될 수 있는 공동저
자명을 일일이 입력을 해주고 있지는 않음
- 예를 들어 공동저자명이 15명일 경우 공동저자명에는 lsquo홍길동 김순희
이명수 박영희 등rsquo으로 한정시키고 전체저자수 항목에 저자를 포
함한 16명을 입력해 줌
- 논문실적 일반
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 논문실적 정보가 논문명만 있는 경우 이를 입
력해야 하는지
처리 방법
및 사례
- 대상인력의 논문실적 정보에 대한 추가 입력 기준은 아직 명확하
게 정해지지는 않은 상태
- 현재(2007년 7월 18일 기준)는 개재년월 및 논문명의 두 가지 정보 이
상이 존재할 시에만 추가입력을 해주고 있음
- 145 -
연구실적
- 연구기간
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 연구실적 정보에서 연구기간 항목이 종료년월
만 나와 있는 경우는 어떻게 처리하는지
처리 방법
및 사례
- 연구기간에 관한 정보가 종료년월만 나와 있는 경우 임시로 1년의
기간을 책정하여 시작년월을 입력
ex) lsquo2005년 8월 OO에 관한 연구rsquo라는 연구실적의 입력 시 연구기간
에서 시작년월은 2004년 9월 종료년월은 2005년 8월로 입력
- 참여구분
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 연구실적 정보에서 참여구분(연구책임자 공동연
구자)의 경우 이를 어떻게 구분하는지
처리 방법
및 사례
- 연구실적에 관한 정보에서 참여구분이 되어 있지 않은 경우에는 해
당인력의 다른 연구실적 등을 감안하여 참여구분을 하여야 하나
대상이 평가위원인 경우 lsquo연구책임자rsquo로 임시 구분하여 줌
지식재산권
- 취득구분
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 지식재산권 정보에서 취득구분(출원 등록)이
구분되어 있지 않은 경우 어떻게 처리하는지
처리 방법
및 사례
- 수집된 지식재산권 정보에서 취득구분이 되어 있지 않은 경우 임
시로 lsquo등록rsquo으로 선택하여 입력
- 특허구분
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 지식재산권 정보에서 특허구분(특허 실용신안
의장 상표 소프트웨어)이 구분되어 있지 않은 경우 어떻게 처리
하는지처리 방법
및 사례
- 수집된 지식재산권 정보에서 특허구분이 되어 있지 않은 경우 임
시로 lsquo특허rsquo로 선택하여 입력
- 146 -
첨부1 NTIS 코드 표준
NTIS 표준코드
정보공개구분
코드값 코드값 의미
1 공개
2 기본인적사항만공개3 비공개
인력(직업)구분
코드값 코드값 의미
1 대학교2 연구소
3 산업계9 기타
소속구분코드
코드값 코드값 의미
1 재직중2 퇴직
3 해외연수6 파견중
학위코드
코드값 코드값 의미
2 학사이하5 석사
7 박사수료8 박사
- 147 -
학술지구분
코드값 코드값 의미 비고
01 국외전문학술지 발표 학술지가 국외전문학술지에 게재
02 국외학술대회발표논문집 발표 학술지가 국외학술대회발표논문집에 게재
03 국내전문학술지 발표 학술지가 국내전문학술지에 게재
04 국내학술대회발표논문집 발표 학술지가 국내학술대회발표논문집에 게재
05 기타논문집 발표 학술지가 기타논문집에 게재
역할구분
코드값 코드값 의미
1 단독2 공동제1 주저자3 공저자4 교신(책임)저자
참여구분
코드값 코드값 의미
A 연구책임자B 참여연구원
저역서구분
코드값 코드값 의미
1 저서2 역서
발행지구분
코드값 코드값 의미
1 국내2 국외
취득구분
코드값 코드값 의미
01 특허출원02 특허등록
- 148 -
코드값 코드값 의미
9511 조경middot지역시스템공학부
특허구분
코드값 코드값 의미 비고
01 특허 산업재산권이 특허에 해당하는 경우
02 실용신안 산업재산권이 실용신안에 해당하는 경우
03 디자인 산업재산권이 디자인에 해당하는 경우
04 상표 산업재산권이 상표에 해당하는 경우
05 기타 산업재산권이 기타에 해당하는 경우06 프로그램(SW) 산업재산권이 프로그램에에 해당하는 경우07 저작권 산업재산권이 저작권에 해당하는 경우08 신기술 인증 산업재산권이 신기술 인증에 해당하는 경우09 신제품 인증 산업재산권이 신제품 인증에 해당하는 경우10 국제출원(PCT) 산업재산권이 국제출원(PCT)에 해당하는 경우11 서비스 산업재산권이 서비스에 해당하는 경우
업적구분
코드값 코드값 의미
1 평가위원
2 위원회활동3 자문4 설계5 시공6 기술지도9 기타
기관코드(기관명이형전거DB)
코드값 코드값 의미
ZE02400 엘에스엠트론(주)ZE02378 (주)지앤시바이오ZE02376 (주)하나아이엔씨ZE02374 센게이지러닝코리아(주)ZE02373 (주)루켄테크놀러지스ZE02372 (주)디투알컨설팅
ZE02367 (주)대흥이엔지ZE02366 (사)한국벤처산업연구원ZE02365 CSG(주)ZE02364 국제상사(주)전자기술연구소
학과코드
- 149 -
9510 생물정보학과
9509 나노과학기술학부9508 지능기계공학과9507 생명과학기술학부9506 의과학과9505 부동산정보9495 보건정보관리
9999 기타9475 대학원
코드값 코드값 의미 코드값 코드값 의미
A01 교수 B32 기술원A02 부교수 C01 공무원A03 조교수 C02 법조인A04 전임강사 C03 의사
A05 시간강사 C04 교사A06 강사(기타) C05 군인A10 명예교수 D01 대표이사A11 석좌교수 D02 이사A12 강의교수 D03 전무A13 겸임교수 D04 상무
A14 계약교수 D05 부장A15 기금교수 D06 차장A16 대우교수 D07 과장A17 연구교수 D08 대리A18 초빙교수 D09 사원A19 객원교수 D10 부사장
A20 조교 D11 상임이사A21 대학원생 Z01 위원A22 POST-DOC Z02 의원A23 POST_MAS Z03 실장A24 초청교수 Z04 학과장A25 외래교수 Z05 주임
B01 수석연구원 Z06 단장B02 책임연구원 Z07 팀장B03 주임연구원 Z08 회장B04 전임연구원 Z09 본부장B05 선임연구원 Z10 처장B06 연구원 Z11 학장
B07 위촉연구원 Z12 센터장B10 수석연구위원 Z13 소장B11 책임연구위원 Z14 부처장B12 주임연구위원 Z15 국장B13 전임연구위원 Z16 연구주임
직위코드
- 150 -
B14 선임연구위원 Z17 연구소장
B15 연구위원 Z18 원장B20 전문위원 Z19 부원장B30 책임기술원 999 기타B31 선임기술원
코드값 코드값 의미 비고
AD 안도라 ANDORRA
AE 아랍에미리트 UNITED ARAB EMIRATESAF 아프가니스탄 AFGHANISTANAG 앤티가 바부다 ANTIGUA AND BARBUDAAI 안길라 ANGUILLAAL 알바니아 ALBANIAAM 아르메니아 ARMENIA
전공분야코드
코드값 코드값 의미
E340600 구강해부학E340601 육안일반해부학E340602 신경해부학E340603 육안두경부일반해부학
E340604 두경부신경해부학E340605 두경부응용해부학E340700 치아형태학E340701 영구치치아형태학E340702 유치치아형태학E340703 치아교합학
국가코드
개인정보활용동의구분
코드값 코드값 의미
Y 동의N 비동의
2 인력정보 영문이력 입력 매뉴얼 101
21 개요 101
22 DB 구축 대상 및 범위 102
23 데이터 분석 내역 104
24 DB 구축 절차 및 작업 지침 105
25 DB 구축 검수 123
3 평가위원 데이터 최신성 유지 매뉴얼 129
31 최신성 유지 업무 개요 129
32 대상 인력(평가위원) 정보 수집 방법 131
33 최신성 유지 작업 지침 132
34 최신성 업무 대상 134
35 입력 항목별 QampA(처리 방법 및 사례) 140
첨부1 NTIS 코드 표준 146
- 1 -
Ⅰ 인력정보 데이터 정제 지침
1 국가RampD 참여인력 및 평가위원 데이터 정제 지침
11 정제 필요성
인력정보 데이터는 연구관리전문기관에서 수집하여 통합 구축하므로 여러 기관에 중복으로 입력되어
있을 수 있음
따라서 데이터 정제를 하지 않을 경우 현 재직기관의 중복 논문실적 이중등록 등 통계현황 및 검
색결과에 많은 문제가 발생할 수 있음
또한 각 기관별로 고유의 코드 및 항목체계를 활용하거나 코드가 필요한 항목에 코드를 사용하지
않는 등 NTIS 표준 코드 및 항목에 대한 매핑 필요
NTIS 인력정보의 현황정보 서비스 제공시 누락항목으로 인해 현황정보가 정확하지 않음
12 정제 내용
수집된 인력 정보를 등록하기 위한 데이터 분류 및 분석
여러 기관에 중복 입력된 인력정보에 대한 중복제거 및 데이터 취합
중복제거 후 취합 된 데이터는 확인 정정
- 학력사항 경력사항 등의 정보 이중 등록
- 기관별 인력정보 중 재직기관 상이
각 기관별 코드 및 항목에 대해 통합 인력DB의 코드 및 항목에 맞게 매핑
- 각 기관 고유의 코드 및 항목을 표준 코드 및 항목과 매핑 작업 필요
- 재직기관 전공 등 코드가 필요한 항목에 코드를 활용하지 않는 기관의 데이터는 표준 코드에 맞
게 데이터 변환 필요
기본정보 경력정보 실적정보 등 인력정보에 대한 오류데이터 정정
- 각 항목의 데이터 내용을 검토하여 오류 정정
예) 학력사항의 데이터 내용 중 입학일이 졸업일 보다 나중일 경우 등
인력정보의 누락항목에 대한 보완
- 수집 가능한 범위 내에서 6개 주요항목기준(인력구분 우편번호 주소 소속기관명 전공 학위 등)
보완
- 2 -
구분 항목 세부항목
참여인력정보(42개)
기본정보(9개)주민등록번호 성명 인력구분 자택주소 자택우편번호 자
택전화번호 핸드폰번호 부처(기관)분류코드 E-mail
소속기관사항(6개)소속기관명 부서명 직위명 사무실전화번호 기관주소
최초임용일
학력사항(10개)전공 취득대학 학위 입학일 졸업일 학과 취득국가 지
도교수명 학위논문명 학위취득일
경력사항(3개) 근무처명 직위명 근무기간
자격사항(3개) 자격발행처 자격증명 자격취득일
논문실적(8개)논문발표일 국문논문명 영문논문명 저자역할구분 발
행처 학술지구분 학술지명 SCI여부
지식재산권(3개) 지식재산권명 출원_등록번호 특허구분
평가위원(10개)
소속학협회현황(3개) 담당업무 직위 학협회사항
훈포장사항(3개) 수상년월 수여기관명 훈포장명
저역서실적(4개) 국문저서명 발행년 발행처 저역서구분
13 정제 대상
정제 대상 범위
- 정보연계를 통해 수집되는 참여인력정보의 정제
정제 대상 항목 정의
주요 정제 대상 정의
구분 항목 세부항목
참여인력정보(12개)
기본정보(6개)주민등록번호 성명 인력구분 핸드폰번호 E-mail 부
처(기관)분류코드
소속기관사항(4개) 소속기관명 기관주소 사무실전화번호 직위명
학력사항(2개) 전공 학위
주요 정제 대상 항목이란 인력정보 서비스를 위해 기본적으로 필요한 최소한의 서비스 항목 Not
null값은 아니지만 최대한 많은 자료 수집이 필요한 항목
- 3 -
코드 대상 항목 정의
구분 항목 세부항목
참여인력정보(16개)
기본정보(3개) 자택우편번호 부처(기관)분류코드
소속기관사항(3개) 인력구분 소속기관명 직위명 기관우편번호
학력사항(4개) 전공 학위 학과 취득국가 취득대학
경력사항(2개) 직위명
논문실적(3개) 저자역할구분 학술지구분 SCI여부
지식재산권(1개) 특허구분
평가위원(1개)
저역서실적(1개) 저역서구분
코드 대상 항목이란 데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목
14 정제 수준
데이터 특성 및 정제 지침
- lsquo속성값 전체 존재rsquo 데이터
공통사항 오류 데이터 정정 및 코드 매핑
① 중복 자료 중 데이터 신뢰성에 근거하여 통합 필수 항목 누락 확인 및 보충 선별(성명 주
민등록번호) 형식 확인(주소 전화번호 및 E-Mail)
② 중복 자료 중 최신 자료 선정 및 확인 형식 확인 (주소 전화번호)
③ ⑤~⑪ 중복 자료 중 데이터 신뢰성에 근거하여 통합
번호는 lsquo정제 대상 항목 정의rsquo 표에서 각 항목에 붙여진 번호
- lsquo일부 또는 6개 미만rsquo 데이터
데이터 누락 정도를 판단하여 필요한 경우 해당 기관에 보완 요청
데이터 보완 후 lsquo속성값 전체 존재rsquo 데이터와 같은 방식으로 정제
오류 유형 정의 및 정제 형태
- 발생 가능한 오류 유형
주요 항목 중 데이터가 존재하지 않는 경우
데이터의 Type(문자형 숫자형)에 위배되는 값이 들어있는 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
정해진 법칙에 따른 번호가 아닌 경우
실제로 존재하지 않는 부점(구분자) 등이 입력되어 있는 경우
- 4 -
오류 유형 세부 정제 지침 비고
주요 항목 중 데이터가 null- 정제가 불가능하므로 정보 재수집
(해당 기관에 정보 제공 재요청)
데이터 Type 오류
- 적합한 Type으로 수정 가능한 정도(의미상으로는
유효한 경우)의 오류는 수정하고 그렇지 않은 데
이터는 삭제
데이터 형식 오류- 데이터들 중 가장 많은 유형을 정규 형식 정고 형
식에 위배되는 데이터들은 정규 형식으로 변환
부점(구분자) 오류
- 실제 서비스 되는 데이터값과 비교하여 변환 과정
에서 발생한 오류면 실제 데이터값으로 변환하고
원시 데이터 자체가 오류인 경우에는 삭제 처리
코드값 오류
- 일치 유사한 코드값으로 변환
- 유사 가장 적합한 코드값으로 변환
- 상이 lsquo기타rsquo코드값으로 분류 또는 삭제
논문제목 오류 - 논문제목1은 반드시 필수 입력으로 처리
중복 데이터들의 데이터 값
상충 오류
- 변경될 수 없는 기본정보(이름 주민번호)의 경우는
기존 데이터 우선
- 변경 가능한 정보(기관명 논문 등)의 경우 최신 업
데이트된 정보를 우선
코드의 값이 정해진 범위를 벗어나는 경우
ex) 기관 코드와 인력시스템 사용 코드와의 매핑 오류
기관 데이터의 코드 항목 값이 잘못 입력되어 있는 경우
국문과 영문으로 구분되는 동일 데이터 항목에 잘못된 위치에 항목 값이 입력되어 있는 경우
ex) 논문실적정보의 국문제목에 영문제목이 입력되어 있는 경우
데이터가 복수로 존재하며 서로 상충되는 경우
ex) 유효하지 않은 주민등록번호의 중복
- 조치 가능한 데이터 정제 형태
재수집 데이터를 제공한 기관에 재요청하여 부족한 데이터 내용을 재수집
수정 데이터 내용은 수정하지 않고 데이터 형태 및 특수문자 수정 정도의 정제
삭제 데이터 값 삭제(Garbage 처리) 또는 레코드 삭제
위의 경우 원시 데이터 값은 관리를 위해 따로 보관
정제 제외 데이터 값이 누락이거나 오류로 판단되지만 정확한 데이터 내용을 알 수 없는 경
우 기준 데이터가 없으므로 정제 대상에서 제외 또한 별다른 오류로 보이지 않는 경우도 정
제 대상에서 제외
오류 유형별 세부 정제 지침
~은 lsquo발생 가능한 오류 유형rsquo 내용 참조
~은 lsquo조치 가능한 데이터 정제 형태rsquo 내용 참조
- 5 -
구분 비고
기본정보 이메일 기존 수집 데이터를 통해 보완
소속기관사항 있으나필드가 null인것
인력구분 기관명이형전거DB 생성 완료 후 적용함
소속기관 우편번호주소가 있는 경우 우편번호 찾기를 통해 보완주소가 없는 경우 기존 수집 데이터를 통해 보완
소속기관 주소 기존 수집 데이터를 통해 보완
소속기관명기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
학력사항 있으나 필드가null인것
전공기존 수집 데이터를 통해 보완하고 기관명이형전거DB로 매핑함
학위기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
소속기관사항 없는것 기존 수집 데이터를 통해 보완
학력사항 없는것 기존 수집 데이터를 통해 보완
인력정보의 누락항목에 대한 보완(기존 서비스 데이터 기준)
기타 (정보 식별자 부여)
- 데이터 정제 최종 단계에서 식별자 부여 체계에 따라 정보식별자(번호) 삽입
- 정보식별자(번호)는 식별체계 API에 의해 자동으로 부여 되며 식별 부여 체계는 사업단 내 식별
체계 담당자가 마련하여 제공
고려 사항
- 정확한 항목매핑 후 작업이 진행되어야 함
- 정제데이터 관리는 임시테이블을 통해서 관리되며 다양한 에러 유형별로 체계적인 관리가 되어야 함
15 정제 작업 방식
중복 확인 기계작업
- 정제 도구에서 제공하는 중복 확인 기능을 이용하여 중복 항목의 리스트 작성(기계작업)
데이터 통합 기계작업 + 수작업
- 중복으로 확인된 항목들의 리스트를 비교하여 통합
- 기계적으로 필드간의 충돌이 없음을 확인할 수 있는 항목은 자동 통합하고 기계적으로 충돌을
- 6 -
확인할 수 없는 경우는 수작업으로 필드별 데이터 통합을 수행
- 최신 또는 최종 여부를 확인하여 통합해야 하는 경우 해당 데이터에 포함된 일자 데이터를 감안
하여 선별 통합(일자 및 기간의 충돌이 없는 경우 기계작업 충돌이 있는 데이터는 리스트 업
후 수작업)
필수 데이터 누락 확인 및 보충 선별 기계작업 + 수작업
- 소속기관명 E-mail 등과 같이 누락되지 말아야 할 항목을 설정하고 기계적으로 누락된 항목의
리스트를 추출(기계작업)
- 이 리스트에 대하여 보충 가능한 데이터는 보충하고 보충이 불가능한 경우 서비스 불가 리스트
로 따로 추출(수작업)
형식 확인 기계작업 + 수작업
- E-Mail 주소 전화번호와 같은 형식이 어느 정도 정의된 데이터의 경우 기본 형식을 템플릿으
로 지정
- 정형화되지 않은 데이터의 리스트를 추출하여 이 중 기계적으로 형식을 일치시키고(기계작업)
일치되지 않은 데이터를 수작업으로 확인하여 수정하거나 형식 불량 데이터 리스트로 따로 추
출(수작업)
16 데이터 검수
161 데이터 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
- 7 -
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
17 데이터 이관
171 NTIS 참여인력 DB 현황 및 데이터 흐름
NTIS 참여인력 DB는 물리적으로 각 연계기관과 NTIS의 데이터 연계를 위해 각 연계기
관에 구성된 연계기관 공동활용 DB와 RampD 참여인력을 관리하기 위한 인력DB RampD참여
인력 서비스 DB로 구성되어 있다
그림 3 NTIS DB 현황 및 데이터 흐름
172 NTIS DB 간 테이블 매핑
NTIS 참여인력 DB가 기능별로 분리되어 있음으로 인해 연계DB에서 인력 관리DB 간
항목 매핑 정의가 필요하다 DB 간 항목 매핑은 아래와 같다
정보구분 테이블명 수집DB 관리DB
인력정보
인력 기본정보 MP_BASIC THR_BASE
소속기관사항 HOFF_ORG THR_JAEJIK
학력사항 SCRE THR_SCHOOL
경력사항 CAREER THR_CAREER
논문실적 PAPER_OUT THR_PAPER
자격사항 CERT THR_LICENSE
지식재산권실적 IPR_OUT THR_PATENT
소속학협회현황 BLNG_INSTIT THR_ACTIVE
저역서실적 TRNSWRT_OUT THR_BOOK
훈포장사항 AWARD THR_MEDAL
- 8 -
항 목 세 부 항 목
기본
기본정보 영문성명 휴대전화 E-mail 개인홈페이지
전문분야 전문(연구)분야
재직기관 기관명 부서명 직위 주소 전화 팩스
학력 최종학위 학위 학위취득일 학교명 전공명
경력 경력사항 시작년월 종료년월 재직기관명 직위
실적
논문실적 논문명 저널명 게제(권)집 페이지 게제년월 공동저자명
연구실적 시작년월 종료년월 발주기관 참여구분(역할) 연구명
특허출원등록구분 출원등록번호 출원등록국가 특허출원명 출
원등록일자
173 데이터 이관
수집 DB에 전송되는 인력정보는 중복 인력이 존재 하며 동일인물의 정보일 지라도 각
기관별 보유 항목이 다르므로 관리DB로 이관을 위해 각 항목별 이관 방안이 필요하다 따
라서 별도의 방안을 마련하여 데이터 이관을 실시하도록 한다
2 인력정보 영문이력 입력 지침
21 영문이력 DB 구축 필요성
해외의 연구자 혹은 외국의 연구기관등에게 관련분야의 연구자문에 필요한 국내 연구전
문가 혹은 국제 공동연구활동 등을 지원하기 위한 국내 인물에 대한 영문검색 체널제공
인물정보에 대하여 영문DB구축을 수행하고 웹을 통한 영문검색을 지원함으로써 국제공
동연구를 지원하기 위한 기반을 조성
기존 개인정보 공동활용에 동의한 연구자들을 대상으로 파악한 영문이력DB 구축방법을
통해 인력정보에 대하여 영문화 작업을 수행
22 영문이력 DB 구축 대상
기본정보 학력사항 경력사항 논문실적 연구실적 특허실적 등
23 영문이력 DB 구축 항목
영문이력서 제공가능 인력에 대해 영문이력서를 제공받아 이를 바탕으로 영문 DB를 구
축하고 번역 요청자를 대상으로 번역을 통한 영문DB구축
- 9 -
항 목 세 부 항 목 영문명 비고
기본(BasicInformation)
기본정보 영문성명 English Name - 한글이력정보와 공동 사용- 전문분야는lsquo08 개정 분류코드 영문명 활용
휴대전화(국가번호)
Cellular PhoneNumber
E-mail E-mail
개인홈페이지 Homepage
전문분야 전문(연구)분야 Research Field 1
Research Field 2
Research Field 3
검색키워드 전문분야명
재직기관(organization)
기관명 Organization Name - 현재 재직기관사항 1개 입력
부서명 Department
직위 Job title(position)
우편번호 Postal Code
주소 Address
전화(국가번호) Telephone
팩스(국가번호) Fax
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) Degree Code
학위취득일 GraduationDate
학교명 School
전공명 Major
경력(Career)
경력사항(CAREER)
시작년월 Start Date - 재직 경력으로 주요 경력입력 현 재직정보제외
종료년월 End Date
재직기관명 Organization Name
직위 Position(Job Title)
실적ResearchResult
논문실적(paper)
논문명 Title - 최근 5년 이내만 입력저널명 Journal Name
게제(권)집 Volume
게제호 Number
시작페이지 Start Page
종료페이지 End Page
게제년월 Date of Publication
공동저자명 Co-Author
비고 Etc
연구실적ResearchProject
시작년월 Start Date
종료년월 End-Date
발주기관 Funding organization
참여구분(역할)-코드
Role
연구실적명 title
영문이력 구축 대상 항목 정의
- 10 -
특허(patent)
출원등록구분-코
드
appliedregistered
출원등록번호 number
출원등록국가-코
드
National Code
특허출원명 Patent name
출원등록일자 Date
코드 대상 항목(데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목)
코드 대상 항목 정의
항목 세부항목 코드
전문분야(3개) 전문(연구)분야NTIS 표준코드(국가과학기술
표준분류) 활용
학력사항(1개) 최종학위
2(학사)
5(석사)
8(박사)
연구실적(1개) 참여구분(역할)A(연구책임자)
B(참여연구원)
특허실적(2개)특허구분(출원등록)
01(출원)
02(등록)
등록국가 NTIS 표준코드 활용
코드 대상 항목이란 데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목
daggerNTIS 표준코드에 영문명을 포함하여 사용
24 영문이력 DB 수집 방법
E-mail을 통한 영문이력서 제공 요청 메일 발송
- 영문이력 DB 구축에 동의하고 영문이력서 제공이 가능한 연구자 대상
전화연락을 통한 이력서 수집
- 영문이력서 제공 요청 메일과 병행하여 영문이력서 제공동의자를 대상으로 영문이력
입력자들이 전화를 통하여 이력서 수집 요청
E-mail을 통한 영문이력서 번역 대행 안내 메일 발송
- 영문이력 DB 구축에 동의한 번역 요청 동의자를 대상으로 메일 발송
이력정보(한글)는 poolkistirekr을 통해 파일형태로 수집 관리함
이력정보(한글)는 메일을 통해서 파일형태(HWP MS-WORD PDF 등)로만 수집함
- 11 -
항 목 선처리 항목
기본 재직기관 기관명 직위
학력 최종학위 학교명 전공명
경력 경력사항 재직기관명 직위
실적논문실적 저널명
연구실적 발주기관
구분 선처리 방법
기관명
기관명(재직기관)
학교명(학력사항)
재직기관명(경력사항)
발주기관(연구실적)
- 웹검색(예 NAVER 백과사전 및 기관 홈페이지)
웹검색시는 출처 기록
- 웹검색 불가는 직접번역
직위직위(재직기관)
직위(경력사항)
- 직위에 대한 영문 코드표 참조
영문 코드표의 출처 기록
전공명 전공명(학력사항)- 전공명에 대한 영문 코드표 참조
영문 코드표의 출처 기록
저널명 저널명(논문실적)- 웹검색(예 httpsocietykistirekr)
웹검색시는 출처 기록
25 영문이력 DB 입력 방법
영문이력 입력
- 수집된 영문이력서는 입력자들이 등록수정 화면을 통해 직접 입력
영문이력 입력결과 확인
- 입력 완료된 영문이력서의 확인은 다른 입력자에 의해 입력결과를 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 본인확인
- 영문이력서의 입력 확인 완료 후 영문이력 본인에게 안내메일을 발송하여 확인
- 본인확인에 의해 수정 가능
26 영문이력 DB 번역 방법
영문이력 선처리 작업
- 영문이력 번역 수행 전 공통적인 항목에 대해 선처리 작업 수행
영문이력 번역
- 인력DB의 번역 대상자 및 수집된 이력서는 영문이력 관리 기능을 통해 번역 수행
- 12 -
영문이력 번역확인
- 번역 완료된 영문이력정보의 확인은 다른 번역자에 의해 번역결과를 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 전문가검수
- 번역확인 완료된 영문이력정보의 검수는 전문가에 의해 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 본인확인
- 영문이력정보의 번역 번역확인 전문가검수 완료 후 영문이력 본인에게 안내메일을
발송하여 확인
- 본인확인에 의해 수정 가능함
KISTI 검수
- KISTI 검수 절차를 거쳐 영문이력에 대해 서비스 제공
27 검수 확인
입력 및 번역 결과 보고
- 주간보고 영문이력 번역에 대한 현황을 매 주 보고
- 이슈사항보고 이슈사항 발생 시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 데이터(전체 항목 필드 기준)의 01 이하(품질목표 999)
- 오류 체크 방식 전체 데이터에서 본인확인 미완료 대상 중 무작위로 30 샘플링
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상
데이터건수) 항목가중치의 합산 결과가 01 이하
- 전문가검수는 모든 번역대상자를 대상으로 수행
- 번역확인 및 전문가검수 단계에서 자체적으로 품질 활동 수행
오류율 산정 기준
- 인력정보 영문이력에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며
오류율 산정에서 제외함
- 13 -
구분 항목 세부항목 세부항목 설명
참여인력정보(42개)
기본정보(8개)
주민등록번호 인력 고유의 주민등록번호
성명 인력 한글 영문 한자 성명
자택주소 인력 본인의 자택 주소
자택우편번호 인력 본인의 자택 우편번호
자택전화번호 인력 본인의 자택 전화번호
핸드폰번호 인력 본인의 핸드폰 번호
E-mail 인력 본인의 E-mail
부처(기관)분류코
드인력 본인의 부처(기관)분류코드
Ⅱ 인력정보 데이터 정제 매뉴얼
1 참여인력 데이터 정제 매뉴얼
11 개요
111 정제 목표
인력데이터는 연구관리전문기관에서 수집하여 통합 구축하므로 여러 기관에 중복으로 입력되어 있
는 경우에 이중등록 데이터가 존재할 수 있어 이를 NTIS에서 활용하기 위해서 정의된 중복기준에
따라 이중등록 확인 및 제거하는 데이터 정제를 절차에 따라 수행
연구관리전문기관의 인력정보관리시스템의 미비 또는 관리체계의 미흡으로 인해 발생된 누락데이
터 및 입력된 데이터의 오류를 수행 가능한 범위 내에서 작업자 및 시스템에 의한 오류 수정
연구관리전문기관별로 각각의 고유의 코드 및 항목체계를 활용하거나 코드가 필요한 항목에 코드
를 사용하지 않고 있는 실정이며 이러한 연구관리전문기관 인력데이터를 NTIS에서 활용하기 위
해서는 NTIS 통합 표준 코드 및 항목으로의 매핑
12 데이터 정제 목록 및 범위
121 데이터 정제대상 및 항목 정의
- 14 -
구분 항목 세부항목 세부항목 설명
소속기관사항(7개)
소속기관명 인력 본인의 현재 소속기관명칭
학과부서명 인력 본인의 소속기관 내 소속학과부서명
직위명 인력 본인의 소속기관 내 직위명칭
사무실전화번호 인력 본인의 소속기관 내 전화번호
기관주소 현재 소속기관의 우편번호 및 상세주소
인력구분 인력구분(대학교 연구소 산업계 기타)
최초임용일 현재 소속중인 기관에 최초 임용(근무)일
학력사항(10개)
전공 인력의 학위별 전공명
취득대학 인력의 학위별 출신 대학교명
학위학력정보의 학위종류예) 학사이하 석사 박사수료 박사
입학일 인력의 학위별 입학년월
졸업일 인력의 학위별 졸업년월
학과 인력의 학위별 출신 대학교 학과명
취득국가 인력의 학위별 출신 대학교 소재지(국가)
지도교수명 인력의 각 학위별 지도교수명
학위논문명 인력의 최종학위취득시 제출한 논문명
학위취득일 인력의 최종학위취득일
경력사항(3개)
근무처명인력의 전ㆍ현재 직업 및 교육과정의 기관명 및세부사항(학과 부서 등)
직위명인력의 전ㆍ현재 직업 및 교육과정의 직급 또는직위명
근무기간인력의 전ㆍ현재 직업 및 교육과정의 시작년월및 종료년월
자격사항(3개)
자격발행처 인력이 발급받은 자격증 등의 발급기관명
자격증명 인력이 발급받은 자격증 등의 자격명
자격취득일 인력이 발급받은 자격증 등의 발급년월
논문실적(8개)
논문발표일 인력이 저술한 논문을 게재하거나 발표한 년월
논문제목1 인력이 저술한 논문의 논문제목1
- 15 -
구분 항목 세부항목 세부항목 설명
논문제목2 인력이 저술한 논문의 논문제목2
저자역할구분
인력이 저술한 논문에 있어서의 역할정도예) 단독공동제1주저자공저자교신(책임)저자
발행처인력이 저술한 논문이 실린 간행물을 발행한 발행처
학술지구분
인력이 저술한 논문의 게재 및 발표형태와 장소에 관련하여 학술지구분예) 국외전문학술지 국외학술대회발표논문집 국내전문학술지 국내학술대회발표논문집 기타논문집
학술지명 인력이 저술한 논문이 실린 간행물의 명칭
SCI여부인력이 저술한 논문이 실린 간행물이 SCI에 수록된 간행물 구분
지식재산권(3개)
지식재산권명 인력이 출원하거나 등록한 지식재산권명
출원_등록번호인력이 출원하거나 등록한 지식재산권의 출원등록번호
특허구분
인력이 출원하거나 등록한 지식재산권의 종류예) 특허 실용신안 디자인 상표 기타 프로그램(SW)저작권 신기술 인증 신제품 인증 국제출원(PCT) 서비스
평가위원(11개)
소속학협회현황(3개)
담당업무인력의 전ㆍ현재 소속 학회 및 협회 내에서의 담당업무
직위 인력의 전ㆍ현재 소속 학회 및 협회 내에서의 직위
학협회사항 인력의 전ㆍ현재 소속 학회 및 협회명
훈포장사항(3개)
수상년월 인력이 훈장 포장 등을 수상한 년월
수여기관명 인력이 수상한 훈장 포장 등을 수여한 기관명
훈포장명 인력이 수상한 훈장 포장 등의 수상명
저역서실적(5개)
저서명1 인력이 저술하거나 역술한 도서의 제목1
저서명2 인력이 저술하거나 역술한 도서의 제목2
발행년 인력이 저술하거나 역술한 도서를 발행한 년도
발행처 인력이 저술하거나 역술한 도서를 발행한 장소
저역서구분 인력이 저술하거나 역술한 도서에 대한 구분 예) 저서 역서
- 16 -
구분 항목 세부항목 현행 DB 항목식별
항목비고
참여
인력
정보
(56개)
기본정보
(12개)
주민등록번호
인물ID NTIS 식별체계 생성
인물관리번호(KOI) 시스템 생성
주민등록번호 lsquo-rsquo포함 14자리
성명
성명-한글
성명-영문
성명-한자
자택주소기본주소(주소1) 우편번호 내 주소를 참조
상세주소(주소2)
자택우편번호 우편번호
자택전화번호 전화번호
핸드폰번호 핸드폰번호
E-mail E-mail
소속기관
사항
(11개)
소속기관명소속기관코드 소속기관명 기준 매핑
기관명이형전거DB 활용소속기관명
부서명 근무부서명
직위명직위코드 직위명 기준 매핑
NTIS 직위코드직위명
사무실전화번
호사무실전화
기관주소
우편번호
기본주소(주소1) 우편번호 내 주소를 참조
상세주소(주소2)
인력구분
인력유형구분
(대학교 연구소 산업
계 기타)
NTIS 인력구분코드
기관명이형전거DB 활용
최초임용일 최초임용일
학력사항
(14개)
전공전공분야 전공명 기준 매핑
NTIS 전공코드전공명
취득대학학위취득대학코드 학위취득대학명 기준 매핑
기관명이형전거DB 활용학위취득대학명
학위 학위코드 NTIS 학위코드
입학일 입학년월
졸업일 졸업년월
학과학과코드 학과명 기준 매핑
NTIS 학과코드학과명
취득국가 취득국가코드 NTIS 국가코드
지도교수명 지도교수명
정제 대상 항목
공동활용정보를 포함하는 현행 DB 구성 기준 69개 항목
- 17 -
구분 항목 세부항목 현행 DB 항목식별
항목비고
학위논문명최종학위논문명1
최종학위논문명2
학위취득일 최종학위취득일
경력사항
(5개)
근무처명 근무처명
직위명직위코드 직위명 기준 매핑
NTIS 직위코드직위명
근무기간근무시작일
근무종료일
자격사항
(3개)
자격발행처 자격발행처
자격증명 자격증명
자격취득일 자격취득일
논문실적
(8개)
논문발표일 논문발표일
논문제목1 논문제목1
논문제목2 논문제목2
저자역할구분 저자역할구분 NTIS 저자역할구분 코드
발행처 발행처명
학술지구분 학술지구분 NTIS 학술지구분코드
학술지명 학술지명
SCI여부 SCI여부 NTIS SCI 여부구분 코드
지식
재산권
(3개)
지식재산권명 지식재산권명
출원_등록번호 출원등록번호
특허구분 특허구분 NTIS 특허구분 코드
평가
위원
(13개)
소속학협
회
현황
(5개)
담당업무 담당업무
직위 직위 직위명
학협회사항
학협회명
활동시작일
활동종료일
훈포장
사항
(3개)
수상년월 수상년도
수여기관명 수여기관명
훈포장명 수상명
저역서
실적
(5개)
저역서명1 저역서명1
저역서명2 저역서명2
발행년 발행년도
발행처 발행처명
저역서구분 저역서구분 NTIS 저역서 구분 코드
- 18 -
구분 항목 세부항목 정제항목 오류유형 비고
참여
인력
정보
(56개)
기본정보
(12개)
주민등록번호
인물ID
-인물ID이 발급되지 않는 경우
예) 외국인 주민등록번호 유효하
지 않거나 중복된 경우
인물관리번호(KOI)1 포맷 오류
예) 자리수 lsquo-rsquo가 있는 경우
주민등록번호
-주민등록번호가유효하지않는경우
예) lsquo-rsquo포함한 14자리가 아닌경우
주민등록번호규칙에맞지않은경우
-중복되는 주민등록번호의 경우
-공란 및 특수문자가 있는 경우
이관 후 서비
스대상에서
제외
성명
성명-한글
-Null인 경우
-공란 및 특수문자 숫자가 있는
경우
-한글이 아닌 경우이관 후 성명
없으면 서비
스대상에서
제외
성명-영문
-공란 및 특수문자 숫자가 있는
경우
-영문성명의 범위를 벗어나는 경
우
예) Lee KHS
성명-한자
-공란 및 특수문자 숫자가 있는
경우
-한자가 아닌 경우
자택주소
기본주소(주소1)
-우편번호 존재하고 Null의 경우
-우편번호의 주소와 상이한 경우
-주소지 정보가 아닌 경우
상세주소(주소2)
-우편번호 및 기본주소 Null의
경우
-주소정보가 아닌 경우
자택우편번호 우편번호-우편번호 Null인 경우
-우편번호가 old data인 경우
자택전화번호 전화번호 -전화번호 Null인 경우
13 데이터 분석 내역
131 세부 항목별 오류 패턴유형 분석
인력데이터
항목별 정해진 규칙에 위배되는 값이 들어있는 경우
- 19 -
구분 항목 세부항목 정제항목 오류유형 비고
-전화번호가 표준 형식이 아닌
경우
-전화번호 데이터가 아닌 경우(지
역번호 없는 경우 포함)
-핸드폰번호인 경우
핸드폰번호 핸드폰번호
-핸드폰번호 Null인 경우
-핸드폰번호가 표준 형식이 아닌
경우
-핸드폰번호 데이터가 아닌 경우
(지역번호 없는 경우 포함)
-전화번호인 경우
E-mail E-mail
-E-mail Null인 경우
-표준 이메일 형식이 아닌 경우
-구분자가 잘못된 경우
-가베지 성 데이터 존재
소속기관
사항(11개)
소속기관명
소속기관코드 NA코드 오류
유형 참조
소속기관명-소속기관명이 기관명이형전거DB
내 대표기관명이 아닌 경우
대표기관명으
로 갱신
부서명 근무부서명 -근무부서명 Null인 경우
직위명
직위코드 NA코드 오류
유형 참조
직위명
-직위명 Null인 경우
-직위명이 직위코드 내 명칭이
아닌 경우
사무실전화번호 사무실전화
-전화번호 Null인 경우
-전화번호가 표준 형식이 아닌
경우
-전화번호 데이터가 아닌 경우(지
역번호 없는 경우 포함)
-핸드폰번호인 경우
기관주소
우편번호-우편번호 Null인 경우
-우편번호가 old data인 경우
기본주소(주소1)
-우편번호 존재하고 기본주소
Null의 경우
-우편번호의 주소와 상이한 경우
-주소지 정보가 아닌 경우
상세주소(주소2) -우편번호 및 기본주소 Null의
- 20 -
구분 항목 세부항목 정제항목 오류유형 비고
경우
-주소정보가 아닌 경우
인력구분 인력유형구분 NA코드 오류
유형 참조
최초임용일 최초임용일 NA날짜 오류
유형 참조
학력사항
(14개)
전공전공분야 NA 코드 오류
유형 참조전공명 -전공명 Null인 경우
취득대학
학위취득대학코드 NA코드 오류
유형 참조학위취득대학명 -학위취득대학명 Null인 경우
학위 학위코드 NA코드 오류
유형 참조
입학일 입학년월 NA날짜 오류
유형 참조
졸업일 졸업년월 NA날짜 오류
유형 참조
학과
학과코드 NA코드 오류
유형 참조학과명 -학과명 Null인 경우
취득국가 취득국가코드 NA코드 오류
유형 참조
지도교수명 지도교수명 -지도교수명 Null인 경우
학위논문명
최종학위논문명1 -가베지 데이터인 경우
최종학위논문명2 -가베지 데이터인 경우
학위취득일 최종학위취득일 NA날짜 오류
유형 참조
경력사항
(5개)
근무처명 근무처명-근무처명 Null인 경우
-가베지 데이터인 경우
직위명
직위코드 NA 코드 오류
유형 참조직위명 1 직위명 Null인 경우
근무기간
근무시작일 NA날짜 오류
유형 참조
근무종료일 NA날짜 오류
유형 참조
- 21 -
구분 항목 세부항목 정제항목 오류유형 비고
자격사항
(3개)
자격발행처 자격발행처-자격발행처 Null인 경우
-가베지 데이터인 경우
자격증명 자격증명-자격증명 Null인 경우
-가베지 데이터인 경우
자격취득일 자격취득일 NA날짜 오류
유형 참조
논문실적
(8개)
논문발표일 논문발표일 NA날짜 오류
유형 참조
논문명1 논문제목1 -가베지 데이터인 경우
논문명2 논문제목1 -가베지 데이터인 경우
저자역할구분 저자역할구분 NA코드 오류
유형 참조
발행처 발행처명-발행처명 Null인 경우
-가베지 데이터인 경우
학술지구분 학술지구분 NA코드 오류
유형 참조
학술지명 학술지명-학술지명 Null인 경우
-가베지 데이터인 경우
SCI여부 SCI여부 NA코드 오류
유형 참조
지식
재산권
(3개)
지식재산권명 지식재산권명-지식재산권명 Null인 경우
-가베지 데이터인 경우
출원_등록번호 출원등록번호-출원등록번호 Null인 경우
-가베지 데이터인 경우
특허구분 특허구분 NA코드 오류
유형 참조
평가
위원
(13개)
소속학
협회
현황
(5개)
담당업무 담당업무-담당업무 Null인 경우
-가베지 데이터인 경우
직위 직위-직위 Null인 경우
-가베지 데이터인 경우
학협회사항
학협회명
-학협회명 Null인 경우
-직위명이 포함된 경우
-가베지 데이터인 경우
활동시작일 NA날짜 오류
유형 참조
활동종료일 NA날짜 오류
유형 참조
- 22 -
구분 항목 세부항목 정제항목 오류유형 비고
훈포장
사항
(3개)
수상년월 수상년도 NA날짜 오류
유형 참조
수여기관명 수여기관명-수여기관명 Null인 경우
-가베지 데이터인 경우
훈포장명 수상명-수상명 Null인 경우
-가베지 데이터인 경우
저역서
실적
(5개)
저역서명
저역서명1 -가베지 데이터인 경우
저역서명2 -가베지 데이터인 경우
발행년 발행년도 NA날짜 오류
유형 참조
발행처 발행처명-발행처명 Null인 경우
-가베지 데이터인 경우
저역서구분 저역서구분 NA코드 오류
유형 참조
구분 항목 세부항목 정제항목 오류내역 비고
참여
인력
정보
(11개)
소속기관사항(1개) 최초임용일최초임용일
YYYYMMDD
-YYYY가 없는 경우(누락)
-MM이 없는 경우
-DD가 없는 경우
-YYYYMMDD이 유효하지
않은 경우
학력사항(3개)
입학일입학년월
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
졸업일졸업년월
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-입학년월보다 같거나 작
은 경우
학위취득일최종학위취득일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
- 23 -
구분 항목 세부항목 정제항목 오류내역 비고
경력사항(2개) 근무기간
근무시작일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
근무종료일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-근무시작일보다 같거나
작은 경우
자격사항(1개) 자격취득일자격취득일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
논문실적(1개) 논문발표일논문발표일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
소속학협회현황(2개) 학협회사항
활동시작일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
활동종료일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-활동시작일보다 같거나
작은 경우
훈포장사항(1개) 수상년월수상년도
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우평가
위원
(1개)
저역서실적(1개) 발행년발행년도
YYYY
-YYYY이 없는 경우(누락)
-YYYY이 유효하지 않은
경우
시작일보다 종료일이 같거나 작은 경우 종료일을 삭제
날짜의 경우 본인의 생년월일보다 작을 수 없음
- 24 -
구분 항목 세부항목 정제항목 오류유형 비고
참여
인력
정보
(14개)
기본
정보
(1개)
자택우편번호 우편번호-Null 경우
-우편번호와 주소정보가 불일치
외국주소는
유지
소속
기관
사항
(4개)
소속기관명소속기관코드
소속기관명
-소속기관명만 존재하는 경우
-소속기관코드가 기관명이형전거
DB의 이형기관코드가 아닌 경우
-소속기관명이 기관명이형전거DB
의 대표기관명이 아닌 경우
직위명직위코드
직위명
-직위명만 존재하는 경우
-직위명 직위코드가 존재하지 않
는 경우
기관주소 우편번호-Null의 경우
-우편번호와 주소정보가 불일치
인력구분 인력유형구분-기관명이형전거DB의 기관유형구
분과 불일치
학력
사항
(4개)
전공전공분야
전공명
-전공명만 존재하는 경우
-전공명 전공분야코드가 Null인 경우
취득대학학위취득대학코드
학위취득대학명
-학위취득대학명만 존재하는 경우
-학위취득대학코드가 기관명이형
전거DB의 이형기관코드가 아닌
경우
-학위취득대학명이 기관명이형전
거DB의 대표기관명이 아닌 경우
학위 학위코드
-학위코드가 Null인 경우
-학위코드가 구분 코드내 표함되
지 않는 경우
학과학과코드
학과명
-학과명만 존재하는 경우
-학과명 학과코드가 존재하지 않
는 경우
취득국가 취득국가코드
-Null인 경우
-기관 국가코드와 NTIS 국가코드
매핑 오류
경력
사항
(1개)
직위명직위코드
직위명
-직위명만 존재하는 경우
-직위명 직위코드가 Null인 경우
코드의 값이 정해진 범위를 벗어난 경우
- 25 -
구분 항목 세부항목 정제항목 오류유형 비고
논문
실적
(3개)
저자역할구분 저자역할구분
-Null인 경우
-저자역할구분이 구분 코드 내 포
함되지 않은 경우
학술지구분 학술지구분
-학술지구분이 Null인 경우
-학술지구분이 구분 코드내 포함
되지 않은 경우
SCI여부 SCI여부
-Null인 경우
-SCI여부가 구분코드 내 포함되지
않은 경우
지식
재산
권
(1개)
특허구분 특허구분
-Null인 경우
-특허구분이 구분 코드내 포함되
지 않은 경우
평가
위원
(1개)
저역
서
실적
(1개)
저역서구분 저역서구분
-Null인 경우
-저역서구분이 구분 코드 내 포함
되지 않은 경우
구분 항목 이중등록 검사 항목 기준 비고
참여인력
기본정보 주민등록번호() 주민등록번호는 유일해야 함
소속기관사항 소속기관명()소속기관명(대표기관명) 유일
해야 함
학력사항
1 취득대학() 학위() 입학일
2 취득대학() 학위() 졸업일
3 취득대학() 학위() 전공
4 취득대학() 학위() 학과
5 취득대학() 학위() 학위취득일
취득대학은 대표기관명으로
비교 함
경력사항1 근무처명() 직위명 근무시작일
1 근무처명() 직위명 근무종료일
논문실적
1 논문명() 논문발표일 학술지명
2 논문명() 논문발표일 ISSN
3 논문명() ISSN 게재권집 게재호
4 논문명() 학술지명 게재권집 게재호
132 이중등록 유형 분석
이중등록 정제 기준 정의( 주키)
- 26 -
구분 항목 이중등록 검사 항목 기준 비고
지식재산권
1 출원_등록번호()
2 지식재산권명() 출원등록구분() 특허구분
() 출원국가
저역서실적1 ISBN
2 저역서명() 저역서구분() 발행년 발행처
평가위원
소속학협회현황1 학협회명() 직위 시작일
1 학협회명() 직위 종료일
훈포장사항 훈포장명() 수상년월 수여기관명
자격사항 자격증명() 자격발행처 자격취득일
이중등록 데이터 분석 방법
- 데이터 정제 결과 데이터를 대상으로 기본정보는 주민등록번호 이외의 정보는 이중등록 검사 항
목을 기준으로 하여 시스템 정제를 통해 인력별 동일한 데이터가 존재하는지를 파악함
14 데이터 정제 기준
141 정제 지침
정제 내용
수집된 인력 정보를 등록하기 위한 데이터 분류 및 분석
여러 기관에 중복 입력된 인력정보에 대한 중복제거 및 데이터 취합
중복제거 후 취합 된 데이터는 확인 정정
- 학력사항 경력사항 등의 정보 이중 등록
- 기관별 인력정보 중 소속기관 상이
각 기관별 코드 및 항목에 대해 통합 인력DB의 코드 및 항목에 맞게 매핑
- 각 기관 고유의 코드 및 항목을 표준 코드 및 항목과 매핑 작업 필요
- 소속기관 전공 등 코드가 필요한 항목에 코드를 활용하지 않는 기관의 데이터는 표준 코드에
맞게 데이터 변환 필요
기본정보 경력정보 실적정보 등 인력정보에 대한 오류데이터 정정
- 각 항목의 데이터 내용을 검토하여 오류 정정
예) 학력사항의 데이터 내용 중 입학일이 졸업일 보다 나중일 경우 등
인력정보의 누락항목에 대한 보완
- 수집 가능한 범위 내에서 6개 주요항목기준(인력구분 우편번호 주소 소속기관명 전공 학위
등) 보완
- 27 -
구분 항목 세부항목
참여인력정보(41개)
기본정보(7개)주민등록번호 성명 자택주소 자택우편번호 자택전화번호
핸드폰번호 E-mail
소속기관사항(7개)소속기관명 부서명 직위명 사무실전화번호 기관주소 인
력구분 최초임용일
학력사항(10개)전공 취득대학 학위 입학일 졸업일 학과 취득국가 지도
교수명 학위논문명 학위취득일
경력사항(3개) 근무처명 직위명 근무기간
자격사항(3개) 자격발행처 자격증명 자격취득일
논문실적(8개)논문발표일 국문논문명 영문논문명 저자역할구분 발행처
학술지구분 학술지명 SCI여부
지식재산권(3개) 지식재산권명 출원_등록번호 특허구분
평가위원(11개)
소속학협회현황(3개) 담당업무 직위 학협회사항
훈포장사항(3개) 수상년월 수여기관명 훈포장명
저역서실적(5개) 국문저서명 영문저서명 발행년 발행처 저역서구분
정제 대상 정의
정제 대상 범위
- 연계시스템을 통해 등록변경되는 참여인력정보의 정제
정제 대상 항목
정제 수준 설정
lsquo속성값 전체 존재rsquo 데이터
- 공통사항 오류 데이터 정정 및 코드 매핑
- ① 중복 자료 중 데이터 신뢰성에 근거하여 통합 항목 누락 확인 및 보충 선별(성명 주민등록
번호) 형식 확인 (주소 전화번호 및 E-Mail)
- ② 중복 자료 중 최신 자료 선정 및 확인 형식 확인 (주소 전화번호)
- ③ ⑤~⑪ 중복 자료 중 데이터 신뢰성에 근거하여 통합
lsquo일부 또는 6개 미만rsquo 데이터
- lsquo속성값 전체 존재rsquo 데이터와 같은 방식으로 정제
오류 유형 정의 및 정제 형태
- 발생 가능한 오류 유형
- 28 -
오류 유형 세부 정제 지침 비고
데이터 내용 데이터 Type 오류
- 적합한 Type으로 수정 가능한 정도(의미상으
로는 유효한 경우)의 오류는 수정하고 그렇
지 않은 데이터는 삭제
데이터 형식 오류
- 데이터들 중 가장 많은 유형을 정규 형식으
로 보고 형식에 위배되는 데이터들은 정규
형식으로 변환
부점(구분자) 오류
- 실제 서비스 되는 데이터값과 비교하여 변환
과정에서 발생한 오류면 실제 데이터값으로
변환하고 원시 데이터 자체가 오류인 경우
에는 삭제 처리
데이터 코드 코드값 오류
- 일치 유사한 코드값으로 변환
- 유사 가장 적합한 코드값으로 변환
- 상이 lsquo기타rsquo코드값으로 분류 또는 삭제
데이터(not null)가 존재하지 않는 경우
데이터의 Type(문자형 숫자형)에 위배되는 값이 들어있는 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
정해진 법칙에 따른 번호가 아닌 경우
실제로 존재하지 않는 부점(구분자) 등이 입력되어 있는 경우
코드의 값이 정해진 범위를 벗어나는 경우
ex) 기관 코드와 인력시스템 사용 코드와의 매핑 오류
기관 데이터의 코드 항목 값이 잘못 입력되어 있는 경우
국문과 영문으로 구분되는 동일 데이터 항목에 잘못된 위치에 항목 값이 입력되어 있는 경우
ex) 논문실적정보의 국문제목에 영문제목이 입력되어 있는 경우
데이터가 복수로 존재하며 서로 상충되는 경우
ex) 유효하지 않은 주민등록번호의 중복
- 조치 가능한 데이터 정제 형태
수정 데이터 내용은 수정하지 않고 데이터 형태 및 특수문자 수정 정도 정제
삭제 데이터 값 삭제(Garbage 처리) 또는 레코드 삭제
위의 경우 원시 데이터 값은 관리를 위해 따로 보관
정제 제외 데이터 값이 누락이거나 오류로 판단되지만 정확한 데이터 내용을 알 수 없는 경
우 기준 데이터가 없으므로 정제 대상에서 제외 또한 별다른 오류로 보이지 않는
경우도 정제 대상에서 제외
오류 유형별 세부 정제 지침
- 29 -
논문제목 오류 - 논문제목1은 반드시 필수 입력으로 처리
중복 데이터들의 데이
터 값 상충 오류
- 변경될 수 없는 기본정보(이름 주민번호)의
경우는 기존 데이터 우선
- 변경 가능한 정보(기관명 논문 등)의 경우
최신 업데이트된 정보를 우선
구분 명(누락) 비고
기본정보 이메일 22719 기존 수집 데이터를 통해 보완
소속기관사항 있으나필드가 null인것
인력구분 15217 기관명이형전거DB 생성 완료 후 적용함
소속기관 우편번호
15977주소가 있는 경우 우편번호 찾기를 통해 보완주소가 없는 경우 기존 수집 데이터를 통해 보완
소속기관 주소
13512 기존 수집 데이터를 통해 보완
소속기관명 428기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
학력사항 있으나 필드가null인것
전공 38915기존 수집 데이터를 통해 보완하고 기관명이형전거DB로 매핑함
학위 34373기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
소속기관사항 없는것 22502 기존 수집 데이터를 통해 보완
학력사항 없는것 31952 기존 수집 데이터를 통해 보완
~은 lsquo발생 가능한 오류 유형rsquo 내용 참조
~은 lsquo조치 가능한 데이터 정제 형태rsquo 내용 참조
인력정보의 누락항목에 대한 보완
기타 (정보 식별자 부여)
- 데이터 정제 최종 단계에서 식별자 부여 체계에 따라 정보식별자(번호) 삽입
- 정보식별자(번호)는 식별체계 API에 의해 자동으로 부여 되며 식별 부여 체계는 사업단 내 식별
체계 담당자가 마련하여 제공
정제 작업 방식
중복 확인 기계작업
- SQL Query를 활용하여 중복 확인하며 중복된 데이터 중 1건을 제외하고 나머지를 표시함(기계
작업)
- 30 -
구분 항목 세부항목 정제항목 오류유형 정제지침
참여
인력
정보
(56개)
기본
정보
(12
개)
주민등록
번호
인물ID인물ID이 발급되지 않
는 경우
인물 중복확인이 가능한 기본 항목(주민등록
번호 성명)이 존재하지 않으면 정제대상에서
제외
식별체계로부터 정제 수행 후 일괄발급 입력
인물관리
번호
(KOI)
NA
정제이전 인물관리번호 일괄 생성하여 key로
활용
Null 여부만 확인하고 정제대상에서 제외
주민등록
번호
Null인 경우 정제대상에서 제외
중복되는 주민등록
번호의 경우
인물관리번호 성명이 상이하면 현행 데이터
를 유지
모두 정제대상에서 제외
유효하지 않은 주민등
록번호의 경우
자리수가 lsquo-rsquo포함한 14자리가 아닌 데이터는
정제대상에서 제외
이관 후 서비스대상에서 제외
데이터 통합 기계작업 + 수작업
- 중복으로 확인된 항목들의 리스트를 비교하여 통합
- 기계적으로 필드간의 충돌이 없음을 확인할 수 있는 항목은 자동 통합하고 기계적으로 충돌을 확
인할 수 없는 경우는 수작업으로 필드별 데이터 통합을 수행
- 최신 또는 최종 여부를 확인하여 통합해야 하는 경우 해당 데이터에 포함된 일자 데이터를 감안
하여 선별 통합(일자 및 기간의 충돌이 없는 경우 기계작업 충돌이 있는 데이터는 리스트 업 후
수작업)
형식 확인 기계작업 + 수작업
- E-Mail 주소 전화번호와 같은 형식이 어느 정도 정의된 데이터의 경우 기본 형식을 템플릿으로
지정
- 정형화되지 않은 데이터의 리스트를 추출하여 이 중 기계적으로 형식을 일치시키고(기계작업)
일치되지 않은 데이터를 수작업으로 확인하여 수정하거나 형식 불량 데이터 리스트로 따로 추출
(수작업)
142 오류 유형별 정제 지침
오류 유형별 정제 지침은 lsquo131 세부 항목별 오류 패턴유형 분석rsquo 을 대상으로 정제지침을 정의
인력데이터
항목별 정해진 규칙에 위배되는 값이 들어있는 경우
- 31 -
구분 항목 세부항목 정제항목 오류유형 정제지침
외국인 및 임시주민번호의 경우 lsquo-rsquo포함한 14
자리가 아닌 데이터는 정제대상에서 제외
표준 포맷으로 구성되
어 있지 않은 경우
lsquo년(2)월(2)일(2)-성별(1)고유번호(6)lsquo 14자 숫자
로 구성되도록 변경
공란 및 특수문자를 제거
성명
성명-한글
Null의 경우
성명-영문 성명-한자가 존재하면 해당 필드
로 이동성명-한글 영문 한자 모두 Null이면 정제대
상에서 제외
이관 후 서비스대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
공란 및 특수문자 숫자 이름이 아닌 경우 제거
예) 이름이 아닌 경우 oo - --
예) 공란의 경우 홍 길동 홍길 동
예) 숫자의 경우 홍길동2 -gt 숫자만 제거
성명-영문
Null의 경우 정제대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
특수문자 숫자 이름이 아닌 경우 제거
예) Lee HS =gt Lee HS영문성명의 범위를 벗어난 경우
예) Lee KHS영문성명이 아닌 경우 해당 필드로 이동하거
나 제거
성명-한자
Null의 경우 정제대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
공란 및 특수문자 숫자 이름이 아닌 경우 제거
예) 金鉉- 洙 =gt 金鉉洙
한문이 아닌 경우 해당 필드로 이동하거나 제거
자택주소기본주소
(주소1)
Null의 경우
우편번호가 존재하면 우편번호로 검색된 주
소 입력 단 우편번호 유효검사를 거친 우편번호만
대상으로 함
우편번호가 존재하지 않으면 정제대상에서 제외
우편번호의 주소와 상
이한 경우
가베지 데이터가 아닌 경우에는 정제대상에서 제외
예) 외국 주소는 유지
가베지 데이터인 경우
기존 데이터는 삭제하고 우편번호가 존재하
면 우편번호로 검색된 주소 입력
우편번호가 존재하지 않으면 기존 데이터 삭
제만 수행
- 32 -
구분 항목 세부항목 정제항목 오류유형 정제지침
상세주소
(주소2)
Null인 경우 정제대상에서 제외
주소정보가 아닌 경우주소정보가 아닌 가베지 데이터는 삭제
예) test 042-123-1234 등
자택우편
번호우편번호
Null인 경우
기본 주소지로 검색하여 입력
기본 주소가 오류데이터이거나 없는 경우는
정제대상에서 제외
우편번호 표준 형식이
아닌 경우
표준 포맷 시도군 구분(3자리)+lsquo-rsquo+지역구분(3
자리)
표준 포맷이 아닌 경우는 표준 포맷으로 변경
예) 300100=gt300-100
300 100=gt300-100
300100 =gt300-100
자리 수가 6자 이하이거나 가베지 데이터인
경우는 제거
우편번호가 old data
인 경우
현재 우편번호가 아닌 경우는 이전 우편번호
주소지를 기준으로 검색하여 입력하고 매핑되
지 않는 데이터의 경우는 삭제
자택전화
번호전화번호
Null인 경우
핸드폰번호가 존재할 경우 복제하여 입력 단 핸드폰 번호의 오류를 정제한 이후 처
리
전화번호가 표준 형식
이 아닌 경우
표준 포맷 국번(2~3자리)-지역전화번호(34자
리)-전화번호(4자리)포준 포맷으로 변경
예) 02-6746-1234 or 041-567-6789
국번은 지역별 국번 참조
내선번호는 유지
지역번호 없는 경우
국번 Null인 경우 자택 주소지의 시도 지역
번호를 입력
예) 6746-1234 이면서 서울 지역의 예
-gt 02-6746-1234
국가번호가포함된경우
(+)국가번호-국번-지역전화번호-전화번호의
형식으로 변경
예) +82-02-6746-1234
가베지 데이터의 경우
자리수가 작거나 크면 제거
예) 02-64-123 or 02-6746-123
숫자(특수문자 포함)가 아닌 문자이면 제거
전화번호 데이터가 아닌 경우 제거
핸드폰번호인 경우 전화번호핸드폰번호 표준포맷으로 변경
- 33 -
구분 항목 세부항목 정제항목 오류유형 정제지침
핸드폰번호 핸드폰번호
Null인 경우 정제 대상에서 제외
핸드폰번호가 표준 형
식이 아닌 경우
이동통신구분번호(3자리)-지역구분번호(34자
리)-전화번호(4자리)로 변경
예) 011-6746-1234 or 019-789-1234
이동통신구분번호는 이동통신사별 구분번호
참조 SK(011 017) KTF(016 018) KG(109)
010(공통)
국가번호가 포함된
경우
(+)국가번호-이동통신구분번호-지역구분번호-
전화번호의 형식으로 변경
예) +82-010-6746-1234
이동통신구분번호가
없는 경우
이동통신구분번호가 없는 경우는 가베지 데이
터으로 판단하여 제거
예) 672-1234의 경우
전화번호인 경우 전화번호핸드폰번호 표준포맷으로 변경
E-mail E-mail
Null인 경우 정제 대상에서 제외
표준 이메일 형식이
아닌 경우
표준 포맷 ID메일서버URI로 구성
예)admin1234daumnet kisti4530kistirekr
구분자 lsquorsquo lsquorsquo으로 변경 및 공란 제거
예) admindaumnet =gt admindaumnet
두 개이상의 이메일이 존재할 경우 앞에 것을
우선으로 유지함
예)admin1234daumnet kisti4530kistirekr
=gt admin1234daumnet
E-mail 데이터가 아닌
경우
E-mail 주소 데이터가 아닌 경우와 가베지 데
이터는 삭제
예) wwwkistirekr -- adminkisti 1 lsquorsquo
공란 등
소속
기관
사항
(11
개)
소속
기관명
소속기관
코드NA 코드 오류 유형 참조
소속
기관명
Null인 경우
소속기관코드가 존재하는 경우에는 해당 소속
기관코드의 명을 검색하여 입력하고 소속기관
코드가 존재하지 않으면 정제대상에서 제외
소속기관명이 NTIS
코드 내 명칭이 아
닌 경우
기관명이형전거DB의 대표기관명으로 변경
예) 서울대 -gt 서울대학교
- 34 -
구분 항목 세부항목 정제항목 오류유형 정제지침
단 기관명이형전거DB에 존재하지 않는 소속
기관명은 신규발급 요청하여 소속기관명을 유
지함
소속기관명이 아닌
경우
소속기관코드가 존재하는 경우에는 해당 소속
기관코드의 명을 검색하여 입력하고 소속기관
코드가 존재하지 않으면 정제대상에서 제외
부서명근무
부서명
Null인 경우 정제대상에서 제외
근무부서명이 아닌
경우
가베지 데이터인 경우만 삭제하고 이외의 경
우는 정제대상에서 제외
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
직위명
직위코드 NA 코드 오류 유형 참조
직위명
Null인 경우
직위코드가 존재하는 경우에는 해당 직위코드
의 명을 검색하여 입력하고 직위코드가 존재
하지 않으면 정제대상에서 제외
직위명이 직위코드 내
명칭이 아닌 경우
직위명이 직위코드내 존재하지 않으면 직위명
은 그대로 유지하고 직위코드는 기타(lsquo999rsquo)로
매핑함
직위명이 아닌 경우
직위코드가 존재하는 경우에는 해당 직위코드
의 명을 검색하여 입력하고 직위코드가 존재
하지 않으면 삭제
사무실
전화번호
사무실
전화
Null인 경우 정제대상에서 제외
전화번호가 표준 형식
이 아닌 경우
표준 포맷 국번(2~3자리)-지역전화번호(34자
리)-전화번호(4자리)포준 포맷으로 변경
예) 02-6746-1234 or 041-567-6789
국번은 지역별 국번 참조
내선번호는 유지
지역번호 없는 경우
국번 Null인 경우 소속기관 주소지의 시도
지역번호를 입력
예) 6746-1234 이면서 서울 지역의 예
-gt 02-6746-1234
국가번호가 포함된
경우
(+)국가번호-국번-지역전화번호-전화번호의
형식으로 변경
예) +82-02-6746-1234
- 35 -
구분 항목 세부항목 정제항목 오류유형 정제지침
가베지 데이터의 경우
자리수가 적거나 크면 제거
예) 02-64-123 or 02-6746-123
숫자(특수문자 포함)가 아닌 문자이면 제거
전화번호 데이터가 아닌 경우 제거
핸드폰번호인 경우 기본정보의 핸드폰번호로 이동
기관주소
기본주소
(주소1)
Null의 경우
우편번호가 존재하면 우편번호로 검색된 주
소 입력
단 우편번호 유효검사를 거친 우편번호만
대상으로 함
우편번호의 주소와 상
이한 경우
가베지 데이터가 아닌 경우에는 정제대상에서
제외
가베지 데이터인 경우기존 데이터는 삭제하고 우편번호가 존재하
면 우편번호로 검색된 주소 입력
상세주소
(주소2)
Null인 경우 정제대상에서 제외
주소정보가 아닌 경우주소정보가 아닌 가베지 데이터는 삭제
예) test 042-123-1234 등
우편번호
Null인 경우
기본 주소지로 검색하여 입력
기본 주소가 오류데이터이거나 없는 경우는
정제대상에서 제외
우편번호 표준 형식이
아닌 경우
표준 포맷 시도군 구분(3자리)+lsquo-rsquo+지역구분(3
자리)
표준 포맷이 아닌 경우는 표준 포맷으로 변경
예) 300100=gt300-100
300 100=gt300-100
300100 =gt300-100
자리 수가 6자 이하 이거나 가베지 데이터인
경우는 제거
우편번호가 old data
인 경우
현재 우편번호가 아닌 경우는 이전 우편번호
주소지를 기준으로 검색하여 입력하고 매핑되
지 않는 데이터의 경우는 삭제
인력
구분
인력
구분NA 기관명이형전거DB에 의해 매핑
최초
임용일
최초
임용일NA 날짜 오류 유형 참조
학력
사항전공
전공분야 NA 코드 오류 유형 참조
전공명 Null인 경우 정제대상에서 제외
- 36 -
구분 항목 세부항목 정제항목 오류유형 정제지침
(14
개)
전공명이 아닌 경우
가베지 데이터인 경우만 삭제하고 이외의 경
우는 정제대상에서 제외
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
취득대학
학위취득
대학코드NA 코드 오류 유형 참조
학위취득
대학명
Null인 경우
학위취득대학코드가 존재하는 경우에는 해당
학위취득대학코드의 명을 검색하여 입력하고
학위취득대학코드가 존재하지 않으면 정제대
상에서 제외
학위취득대학명이 학
위취득대학코드 내 명
칭이 아닌 경우
기관명이형전거DB의 대표기관명으로 매핑하
고 존재하지 않는 경우 신규 발급 요청하여
학위취득대학명을 유지함
학위취득대학명이 아
닌 경우
학위취득대학코드가 존재하는 경우에는 해당
학위취득대학코드의 명을 검색하여 입력하고
학위취득대학코드가 존재하지 않으면 삭제
학위 학위코드 NA 코드 오류 유형 참조입학일 입학년월 NA 날짜 오류 유형 참조졸업일 졸업년월 NA 날짜 오류 유형 참조
학과
학과코드 NA 코드 오류 유형 참조
학과명
Null인 경우 정제대상에서 제외
학과명이 학과코드내
명칭이 아닌 경우학과코드의 명으로 변경
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등
취득국가취득국가
코드NA 코드 오류 유형 참조
지도
교수명
지도
교수명
Null인 경우 정제대상에서 제외
이름이 아닌 경우 삭제하고 정제대상에서 제외
학위
논문명
최종학위
논문명1
Null인 경우 정제대상에서 제외
논문명1이 Null인경우논문제목1이 Null인 경우 논문제목2에서 이동
함
- 37 -
구분 항목 세부항목 정제항목 오류유형 정제지침
가베지 데이터인 경우
삭제
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
최종학위
논문명2
Null인 경우 정제대상에서 제외
논문명1이 Null인경우 논문제목1이 Null인 경우 논문제목1로 이동함
가베지 데이터인 경우
삭제
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터 문자열이지만 특정 문자가
반복된 데이터
학위
취득일
최종학위
취득일NA 날짜 오류 유형 정제지침 참조
경력
사항
(5개)
근무처명 근무처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
직위명
직위코드 NA 코드 오류 유형 정제지침 참조
직위명
Null인 경우 정제대상에서 제외
직위명이 직위코드내
명칭이 아닌 경우
직위명이 직위코드내 존재하지 않으면 직위명
은 그대로 유지하고 직위코드는 기타(lsquo999rsquo)로
매핑함
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
근무기간
근무
시작일NA 날짜 오류 유형 정제지침 참조
근무
종료일NA 날짜 오류 유형 정제지침 참조
자격
사항
(3개)
자격
발행처
자격
발행처
Null인 경우 정제대상에서 제외
가베지 데이터인 경우특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
- 38 -
구분 항목 세부항목 정제항목 오류유형 정제지침
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
자격증명 자격증명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
자격
취득일
자격
취득일NA 날짜 오류 유형 정제지침 참조
논문
실적
(8개)
논문
발표일
논문
발표일NA 날짜 오류 유형 정제지침 참조
국문
논문명
논문제목
국문
Null인 경우 정제대상에서 제외
필수
논문제목국문이 Null이고 논문제목영문이 Null
이 아닐 경우 논문제목영문을 논문제목국문으
로 이동시키고 논문제목영문은 Null로 갱신
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
영문
논문명
논문제목
영문
Null인 경우 정제대상에서 제외
필수
논문제목국문이 Null이고 논문제목영문이 Null
이 아닐 경우 논문제목영문을 논문제목국문으
로 이동시키고 논문제목영문은 Null로 갱신
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
저자역할
구분
저자역할
구분NA 코드 오류 유형 정제지침 참조
발행처 발행처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
- 39 -
구분 항목 세부항목 정제항목 오류유형 정제지침
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터학술지
구분
학술지구
분NA 코드 오류 유형 정제지침 참조
학술지명 학술지명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
SCI여부 SCI여부 NA 코드 오류 유형 정제지침 참조
지식
재산
권
(3개)
지식
재산권명
지식
재산권명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
출원_등
록번호
출원등록
번호
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
특허구분 특허구분 NA 코드 오류 유형 정제지침 참조
평가
위원
(13개)
소속
학협
회
현황
(5개)
담당업무 담당업무
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
직위 직위
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
- 40 -
구분 항목 세부항목 정제항목 오류유형 정제지침
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
학협회
사항
학협회명
Null인 경우 정제대상에서 제외
직위명이 포함되어 있
는 경우
직위명이 존재하지 않으면 직위명 항목에 복
사하고 직위명칭에 관련된 부분은 삭제 존재
한다면 관련 부분을 삭제
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
활동시작
일NA 날짜 오류 유형 정제지침 참조
활동종료
일NA 날짜 오류 유형 정제지침 참조
훈포
장
사항
(3개)
수상년월 수상년도 NA 날짜 오류 유형 정제지침 참조
수여
기관명
수여기관
명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
훈포장명 수상명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저역
서
실적
(5개)
저서명1 저서명1
Null인 경우 정제대상에서 제외
저서명1이 Null인 경
우저서명2를 저서명1로 저장
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저서명2 저서명2
Null인 경우 정제대상에서 제외
저서명1이 Null인 경
우저서명2를 저서명1로 저장
가베지 데이터인 경우 특수문자 숫자로만 구성되거나 그 외의 가베
- 41 -
구분 항목 세부항목 정제항목 오류유형 정제지침
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
발행년 발행년도 NA 날짜 오류 유형 정제지침 참조
발행처 발행처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저역서
구분
저역서
구분NA 코드 오류 유형 정제지침 참조
- 42 -
구분 항목 세부항목 정제항목 오류내역 정제지침
참여인력정보(11개)
소속기관사항(1개)
최초임용일최초임용일
YYYYMMDD
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
DD가 없는 경우 01일로 갱신
YYYYMMDD가 유
효하지 않은 경우
년도가 유효하면 월-gt01월 일-gt01
일로 갱신하고 년도 자체가 유효하
지 않으면 삭제
학력사항(3개)
입학일입학년월
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 03월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt03월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
졸업일졸업년월
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 02월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt02월로 갱신
하고 년도 자체가 유효하지 않으면
삭제입학년월보다 같
거나 작은 경우데이터 삭제
학위취득일
최종학위
취득일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효
하지 않은 경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
경력사항(2개)
근무기간근무시작일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
날짜로서 유효한 형태를 갖고 있지 않은 경우
- 43 -
구분 항목 세부항목 정제항목 오류내역 정제지침
제
근무종료일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
근무시작일보다
같거나 작은 경우
근무시작일에서 YYYYMM이 동일하
면 삭제하고 근무시작일에서 YYYY
은 동일하나 MM이 작을 경우에만
삭제
자격사항(1개)
자격취득일자격취득일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
논문실적(1개)
논문발표일논문발표일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효
하지 않은 경우
년도가 유효하면 월-gt01월로 갱신하고
년도자체가유효하지않으면삭제
소속학협회현황(2개)
학협회사항
활동시작일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경
우데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭제
활동종료일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하고
년도자체가 유효하지않으면 삭제
- 44 -
구분 항목 세부항목 정제항목 오류내역 정제지침
활동시작일보다
같거나 작은 경우
활동시작일에서 YYYYMM이 동일하
면 삭제하고 활동시작일에서 YYYY
은 동일하나 MM이 작을 경우에만
삭제
훈포장사항(1개)
수상년월수상년도
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 변경하고
년도자체가 유효하지않으면 삭제
평가위원(1개)
저역서실적(1개)
발행년발행년도
YYYY
Null인 경우 정제대상에서 제외
YYYY이 유효하지
않은 경우유효하지 않으면 삭제
구분 항목세부항목
정제항목 오류유형 정제지침
참여
인력
정보
(15개)
기본정보
(1개)
자택
우편번호
우편번호
기본주소
Null의 경우주소가 존재하면 주소지로 우편번호 검색
하여 우편번로를 입력(정제작업자)
우편번호와주소
정보가불일치
middot 기본 주소가 가베지 데이터가 아니고 상
세주소가 존재한다면 그대로 유지하고
가베지 데이터이면 우편번호 상 주소를
기본주소에 입력
상세주소가 존재하면서 오류 데이터가 아
닌 경우에는 기본주소의 변경은 하지 않으
며 기존의 우편번호를 주소지에 맞게 주소
검색하여 변경
소속기관
사항(4개)소속기관명
소속기관코드
소속기관명
Null인 경우 정제대상에서 제외
소속기관명만
존재하는 경우
기관명이형전거DB에서 검색하여 이형기관
코드 대표기관명으로 매핑하고 존재하지
않는 경우 신규 발급 요청하여 그대로 유
지함
시작일보다 종료일이 같거나 작은 경우 종료일을 삭제
날짜의 경우 본인의 생년월일보다 작을 수 없음
코드의 값이 정해진 범위를 벗어난 경우
- 45 -
구분 항목세부항목
정제항목 오류유형 정제지침
소속기관코드만
존재하는 경우
해당 소속기관코드를 기관명이형전거DB에
서 검색하여 소속기관명을 갱신하며 매핑
되지 않는 소속기관코드는 삭제
직위명직위코드
직위명
Null인 경우 정제대상에서 제외
직위명만 존재
하는 경우
직위명으로 동일 또는 유사한 직위코드를
검색하여 입력하고 직위코드 내 존재하지
않는 직위명칭이면 lsquo기타rsquo로 매핑
[직위코드] NTIS 직위코드 참조
직위코드만 존
재하는 경우
해당 직위코드를 NTIS 직위코드의 직위명
으로 검색하여 갱신하며 매핑되지 않는 직
위코드는 삭제
[직위코드] NTIS 직위코드 참조
기관주소 우편번호
Null의 경우
주소가 존재하면 주소지로 우편번호 검색
하여 입력
단 우편번호 내 기본주소만 가능
우편번호와 기
본주소가 불일
치
기본 주소가 가베지 데이터가 아니고 상세
주소가 존재한다면 그대로 유지하고 가베
지 데이터이면 우편번호 상 주소를 기본주
소에 입력상세주소가 존재하면서 오류 데이터가 아
닌 경우에는 기본주소의 변경은 하지 않으
며 기존의 우편번호를 주소지에 맞게 주소
검색하여 변경
인력(직업)
구분인력유형구분
Null인 경우 정제대상에서 제외인력유형구분
코드 범위를
벗어나는 경우
[인력구분코드] 대학교 연구소 산업계 기
타 등 구분코드 범위를 벗어나는 데이터는
Null로 갱신
학력사항
(5개)
전공전공코드
전공명
Null인 경우 정제대상에서 제외전공명만 존재
하는 경우
전공명으로 NTIS 전공코드를 검색하여 입
력
[전공코드] NTIS 전공코드 참조
전공코드만 존
재하는 경우
해당 전공분야코드를 NTIS 전공코드에서
전공명을 검색하여 갱신하며 매핑되지 않
는 전공코드는 삭제
[전공코드] NTIS 전공코드 참조
취득대학
학위취득대학
코드
학위취득대학명
Null인 경우 정제대상에서 제외
학위취득대학
명만 존재하는
경우
기관명이형전거DB에서 검색하여 이형기관
코드 대표기관명으로 매핑하고 존재하지
않는 경우 신규 발급 요청하여 그대로 유
지함
- 46 -
구분 항목세부항목
정제항목 오류유형 정제지침
학위취득대학
코드가 존재하
는 경우
해당 학위취득대학코드를 기관명이형전거
DB에서 검색하여 학위취득대학명을 갱신하
며 매핑되지 않는 학위취득대학코드는 삭
제
학위 학위코드
Null인 경우 정제대상에서 제외
학위코드 범위
를 벗어나는
경우
존재하는 학위코드가 NTIS 학위코드와 매
핑되는지 확인하고 멥핑되지 않는 학위코
드는 삭제
[학위코드] NTIS 학위코드 참조
학과학과코드
학과명
Null인 경우 정제대상에서 제외
학과명만 존재
하는 경우
학과명으로 동일 또는 유사한 NTIS 학과코
드를 검색하여 입력하고 NTIS 학과코드 내
존재하지 않는 학과명이면 기타 코드로 매
핑함
[학과코드] NTIS 학과코드 참조
학과코드만 존
재하는 경우
해당 학과코드를 NTIS 학과코드의 학과명
을 검색하여 갱신하며 매핑되지 않는 학과
코드는 삭제
[학과코드] NTIS 학과코드 참조
취득국가 취득국가코드
Null인 경우 정제대상에서 제외
취득국가코드
의 범위를 벗
어나는 경우
존재하는 국가코드가 NTIS 국가코드와 매
핑되는지 확인하고 멥핑되지 않는 국가코
드는 삭제
[국가코드] NTIS 국가코드 참조
경력사항
(2개)직위명
직위코드
직위명
Null인 경우 정제대상에서 제외
직위명만 존재
하는 경우
직위명으로 동일 또는 유사한 직위코드를
검색하여 입력하고 직위코드 내 존재하지
않는 직위명칭이면 lsquo기타rsquo로 매핑
[직위코드] NTIS 직위코드 참조
직위코드만 존
재하는 경우
해당 직위코드를 NTIS 직위코드의 직위명
으로 검색하여 갱신하며 매핑되지 않는 직
위코드는 삭제
[직위코드] NTIS 직위코드 참조
논문실적
(3개)
저자역할
구분저자역할구분
Null인 경우 정재 대상에서 제외
저자역할구분존재하는저자역할구분가 NTIS 저자역할구
- 47 -
구분 항목세부항목
정제항목 오류유형 정제지침
코드의 범위를
벗어나는 경우
분코드와 매핑되는지 확인하고 멥핑되지
않는 국가코드는 삭제
[역할구분코드] NTIS 저자역할구분코드 참
조
학술지
구분학술지구분
Null인 경우 정재 대상에서 제외
학술지구분코
드의 범위를
벗어나는 경우
존재하는 학술지구분코드가 NTIS 학술지
구분코드와 매핑되는지 확인하고 멥핑되지
않는 학술지구분코드는 삭제
[학술지구분코드] NTIS 저자역할구분코드
참조
SCI여부 SCI여부
Null인 경우 정재 대상에서 제외
SCI여부구분코
드의 범위를
벗어나는 경우
존재하는 SCI여부구분코드가 lsquo01 또는
02가 아닌 데이터는 Null로 갱신
[SCI여부구분코드] NTIS SCI여부구분코드
참조
지식
재산권
(1개)
특허구분 특허구분
Null인 경우 정제대상에서 제외
특허구분코드
의 범위를 벗
어나는 경우
존재하는 특허구분코드가 NTIS 특허구분
코드와 매핑되는지 확인하고 멥핑되지 않
는 특허구분코드는 삭제
[특허구분코드] NTIS 특허구분코드 참조
평가위원(1개)
저역서실적(1개)
저역서구분 저역서구분
Null인 경우 정제대상에서 제외
저역서구분코
드의 범위를
벗어나는 경우
존재하는 저역서구분코드가 NTIS 저역서
구분코드와 매핑되는지 확인하고 멥핑되지
않는 저역서구분코드는 삭제
[저역서구분코드] 1저서 2역서 中 택일
공통사항
- 매핑하고자 하는 기존 코드명(공란 및 특수문자 제거)으로 NTIS 표준 코드 內 한글코드명을 대
상으로 검색하여 동일한 코드명(11의 경우)은 시스템(SQL App 등)을 통해 미리 매핑하고 유사
한 코드명(1N의 경우)은 정제작업자가 선택한 코드로 입력하여 매핑 처리
- 코드 종류가 소수(3개 미만)인 경우 Source 데이터 내 등록되어 있는 코드 또는 코드명칭을 대
상으로 동일한 패턴별로 일괄 변환(SQL Query Excel)처리한 후 변환되지 않은 데이터는 삭제
- 코드가 가베지 데이터인 경우는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 영숫자가 아닌 특수문자로만 구성된 데이터 특정 문자가 반복된 코드와
관련되지 않은 데이터
- 48 -
구분 항목 이중등록검사항목 정제지침 비 고
참여
인력
정보
기본
정보주민등록번호()
주민등록번호가 동일한 인력데이
터가 2개 이상이면 시스템으로
추출하여 이중등록검사를 수행함
시스템 정제
소속기
관사항소속기관명()
인력별 동일한 소속기관사항 데이
터가 2개 이상이면 시스템으로
추출하여 1개만 남겨 놓고 나머지
는 오류 체크 필드에 표시함
시스템 정제
학력
사항
1 취득대학() 학위() 입학일
2 취득대학() 학위() 졸업일
3 취득대학() 학위() 전공
4 취득대학() 학위() 학과
5 취득대학() 학위() 학위취득일
인력별 동일한 학력사항 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
경력
사항
1 근무처명() 직위명 근무시작일
1 근무처명() 직위명 근무종료일
인력별 동일한 경력사항 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
논문
실적
1 논문명() 논문발표일 학술지명
2 논문명() 논문발표일 ISSN
3 논문명() ISSN 게재권집 게재
호
4 논문명() 학술지명 게재권집
게재호
인력별 동일한 논문실적 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
지식
재산권
1 출원_등록번호()
2 지식재산권명() 출원등록구분
특허구분() 출원국가
인력별 동일한 지식재산권 데이터
가 2개 이상이면 시스템으로 추
출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
시스템 정제
저역서
실적
1 ISBN
2 저역서명() 저역서구분() 발행
인력별 동일한 저역서실적 데이터
가 2개 이상이면 시스템으로 추시스템 정제
143 이중등록 유형별 정제지침
이중등록 정제 지침
- 이중등록에 대한 정제는 오류 유형 정제 및 코드 매핑 처리 후 수행함
- 이중등록에 대한 데이터는 최신 데이터를 우선으로 유지함
- 이중등록검사항목의 문자Type의 데이터는 공란제거 제거 후 이중등록검사를 수행함
- 대상데이터의 이중등록검사항목 중 1개 이상 항목이 Null인 경우 이외의 항목이 동일하
여도 이중등록 정제 대상에서 제외함
- 49 -
구분 항목 이중등록검사항목 정제지침 비 고
년 발행처출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
평가
위원
소속학
협회
현황
1 학협회명() 직위 시작일
2 학협회명() 직위 종료일
인력별 동일한 소속학협회현황
데이터가 2개 이상이면 시스템으
로 추출하여 1개만 남겨 놓고 나
머지는 오류 체크 필드에 표시함
시스템 정제
훈포장
사항훈포장명() 수상년월 수여기관명
인력별 동일한 훈포장사항 데이터
가 2개 이상이면 시스템으로 추
출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
시스템 정제
자격
사항
자격증명() 자격발행처 자격취득
일
인력별 동일한 데이터가 2개 이상
이면 시스템으로 추출하여 1개만
남겨 놓고 나머지는 오류 체크 필
드에 표시함
시스템 정제
15 데이터 정제 절차 및 작업지침
151 데이터 정제 절차
- 50 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
데이터
정제
준비
초기
데이터
구축
연계기관기반 정보취합
연계기관 인력데이터 구조(스키마 엔터티 정의)코드정보 등 통합 인력DB로의 이관을 위한 연계기관 제공 정보 취합
기관 협의 정보 제공 기반정보 분석
연계대상기관데이터 취합
통합하고자 하는 연계기관 인력데이터를 제공받아 Temp DB(연계기관데이터 구조와 동일)에등록
기관 협의 데이터제공 데이터 생성
연계기관
데이터 이관
준비
NTIS 표준 코드정보를KISTI로부터 제공받음 표준 코드 제공 코드 분석
기존 코드별 NTIS 표준코드 매핑 정의 표준코드매핑 작성
플래그성 매핑기준작성
기존 데이터에 표준 코드 반영 표준코드 매핑처리
표준 코드 적용결과 검토 데이터 확인
연계기관
데이터 분석
및 매핑계획
수립
연계기관 데이터 분석 데이터 분석 데이터 분석
연계기관 코드매핑 정의 기관 코드매핑 작성플래그성 매핑 기준 작성
테이블매핑 정의테이블 매핑정보확정
테이블 매핑(안) 작성
데이터
정제 기준
및
계획 수립
과학기술 인력정보 데이터 분석
정제 대상 RampD참여인력데이터 분석
정제 대상 항목 및 기준에 대한 정의
데이터 정제 내역검토
데이터 분석
데이터정제 내역작성
데이터 정제기준 및 절차협의
정제 대상 데이터 건수및 연계 기관 인력데이터 포함 범위 정제 항목 선정 정제 공정(정제 1차 검증 최종 확인) 확정
정제 범위 대상 확정 협의 진행
데이터 정제매뉴얼 작성
데이터정제매뉴얼구성내용
데이터정제개요및절차정의
정제대상정의및정제범위
정제항목별기준및예시
정제검증도구사용법
전환코드표
표준양식
정제매뉴얼 검토및 확정
정제매뉴얼 초안작성
상세일정계획수립
정제 량을 분석하여 투입인력대비 주월별 데이터 정제 계획대비 실적 산정
일정 검토 및 확정 일정계획 작성
152 정제 단계별 작업 지침
- 51 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
데이터 정제 작업 환경 구축
작업 환경 및작업자 구성 데이터 정제 환경 구성
작업자 모집
작업장 환경 구축(월평동)
데이터정제 작업교육실시
정제작업자 및 정제관리자를 대상으로 교육 실시 및교육결과서작성
작업자 정제작업교육 실시
데이터정제진행
정제 작업수행
데이터 정제및 검증 데이터 정제 추진결과
데이터 정제
정제결과 검증(작업자별 검증)
정제추진현황보고 실적 보고
실적 확인 및 이슈사항 협의
주별진척보고
이슈사항 및 문제점 보고
데이터정제완료
데이터 이관 및 검수
데이터 이관정제된 데이터를 작업DB에서 서비스DB 로이관
이관 확인 데이터 이관
데이터 검수(최종 확인)
RampD 참여인력 데이터(정제 결과물) 검사 (샘플링 검수)
검수(샘플링)검수 데이터 추출제공
153 항목별 정제작업 세부지침
공통사항 및 시스템정제
공통사항
1 정보유형별로 주요항목이 존재하지 않는 경우라도 기본 학력 소속기관사항은 삭제하지
않고 실적정보는 삭제 처리함
가 정보유형별로 경력정보 실적정보의 주요항목이 Null인 데이터는 삭제
나 기존데이터의 경우 학력 소속기관사항은 주요항목이 Null이지만 현황정보 제공 필드가
존재하면 유지함
학력사항 학위 전공 등 존재하면 유지
소속기관사항 우편번호 직위 등 존재하면 유지
2 코드 항목 값을 NTIS 코드정보 내 명칭으로 갱신함
가 소속기관명 학위취득대학명 학과명 전공명 직위명 등을 NTIS 표준코드로 매핑하여
코드값을 넣고 각 항목에 NTIS 코드정보 내 코드명으로 변환하여 갱신함
- 52 -
No원본데이터 정제 후
정제요령 비고코드 명 코드 명
1 한국타이어(주) AAB6793 (주)한국타이어
기관명이형전거DB에서
대표기관명과
이형기관코드로 매핑
2 연구원 B06 연구원 직위코드 매핑
3 가베지 데이터의 값을 삭제 처리함
가 정보유형별 각 항목에서 가베지 데이터에 대해 삭제 처리함
No원본데이터 정제 후
정제요령 비고데이터 데이터
1 test 가베지 처리
2 가베지 처리
3 - 가베지 처리
4 가베지 처리
5 blank 가베지 처리
6 가베지 처리
7 서울대학교 서울대학교 정제 처리
시스템정제
1 비교대상이 존재하지 않는 항목에 대해서는 시스템정제(Null처리) 한다
가 시스템정제 항목
항목 세부항목 비고소속기관 인력구분
학력사항취득국가학위
지식재산권 특허구분
저역서실적 저역서구분
논문실적저자역할구분학술지구분SCI여부
비 고
shy 날짜 데이터의 경우 생성일이 완료일보다 후에 있는 경우 생성일을 남
겨놓고 완료일 삭제
shy 년도 포맷의 경우 1900년도~현재(정제시점)을 기준으로 이전이나 이후는
Null 로 갱신
shy 날자 데이터의 경우 생년월일보다 빠른 경우는 삭제
기본정보
기본정보_주민등록번호 정제지침
1 주민등록번호가 null인 경우 정제대상에서 제외
- 53 -
2 주민등록번호가 유효하지 않은 lsquo-rsquo포함한 14자가 아닌경우 정제대상에서 제외
No원본데이터 정제 후
정제요령 비고주민번호 이름 주민번호 이름
1 090166-471ORHAN
NALCIOGLU090166-471
ORHAN
NALCIOGLU정제대상에서 제외
2 000000-1111111 홍길동 000000-1111111 홍길동 lsquo-rsquo포함 14자리는 유지
3 194912-100001F 요이치로스즈키 194912-100001F 요이치로스즈키주민번호에 영문자
포함(F) 데이터 유지
4 1234561234567 홍길동 123456-1234567 홍길동 lsquo-rsquo 추가
3 기타사항
가 주민번호에 특수문자 포함시 가베지 데이터 처리(삭제)
기본정보_성명 정제지침
1 각 항목(한글영문한자)에 맞는 데이터 값 확인
2 성명 이외의 가베지 데이터는 삭제
3 한글한자영문이름이 모두 null인 경우 데이터 유지(서비스 제외)
4 한글한자영문이름이 가베지 데이터인 경우 가베지 값 삭제 데이터 유지(서비스 제외)
5 한글한자영문 이름을 각 항목에 맞게 값을 이동(한글성명은 한글 영문성명은 영문 한
자성명은 한자)
6 한글한자영문 이름이 기업명 또는 법인명인 경우 데이터 삭제
No원본데이터 정제 후
정제요령 비고한글이름 영문이름 한글이름 영문이름
1 SK LEE SK LEE 맞는 항목으로 값을 이동
2 test -- 삭제
3홍길동
(영구참여제한자)HONG GD 홍길동 HONG GD
이름 외 가베지 데이터
삭제
영문성명이 성+이니셜은
유지
4 성진기계 기업 법인명 삭제
5 홍 길 동 HGD 홍길동 영문성명 삭제
공란 제거
기본정보_주소 우편번호 정제지침
1 우편번호와 주소 모두 null인 경우 정제대상에서 제외
2 우편번호가 표준 형식이 나닌 경우 표준 포맷으로 변경(lsquo-rsquo포함한 7자리)
- 54 -
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302230 302-230 표준 포맷으로 변경
3 우편번호는 null 이지만 주소는 존재하는 경우 주소를 검색하여 우편번호 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 대전 서구 정림동 302-230 대전 서구 정림동우편번호에서 검색하여
매핑한다
4 우편번호는 존재하나 주소가 null인 경우 우편번호에 해당하는 주소 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302-230 302-230 대전 서구 정림동우편번호에서 검색하여
기본주소까지 입력한다
5 우편번호와 주소 값이 가베지 데이터인 경우 가베지 처리
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 111-1 대구 수성구 가베지 처리
2 111 대전 서구 정림동 302-230 대전 서구 정림동
기존 가베지 우편번호
대신에 주소를 가지고
새로운 우편번호를
검색하여 매핑한다
6 우편번호 체계가 OLD 데이터인 경우 현 주소로(NTIS 우편번호체계) 검색하여 매핑
No원본데이터 정제 후
정제요령 비고우편번호 주소1 우편번호 주소
1 449-981경기도 용인시 수지읍 성복리
LG2차아파트201~208동448-981
경기 용인시 수지구 성복동
LG2차빌리지
우편번호에서 검색하여
현재 우편번호로 매핑함
7 기타사항
가 외국주소 데이터 유지 원칙
(1) 우편번호가 국내우편번호인 경우는 우편번호만 가베지 처리
(2) 기본주소에 국가명만 존재해도 데이터 유지
나 주소가 2개 이상인 경우 세부주소를 포함한 주소로 정제
다 기본주소와 상세주소 구분(우편번호 기준 원칙)
(1) 기본주소 우편번호를 검색하여 나온 해당 주소
(2) 상세주소 우편번호를 검색하여 나온 해당 주소 이외의 주소
- 55 -
No원본데이터 정제 후
정제요령 비고우편번호 주소1 주소2 우편번호 주소1 주소2
1
11 schlundt
annex columbia
mo 65211 usa
11 schlundt annex
columbia mo
65211 usa
외국주소는 유지
2 USA USA기본주소에 국가명만
존재해도 데이터 유지
3 137-764
서울 서초구
반포2동
반포주공아파트
0동 0호
137-764
서울 서초구
반포2동
반포주공아파트
0동 0호 기본주소와 상세주소 구분
기본정보_전화번호 핸드폰번호 정제지침
1 전화번호가 null인 경우 정제대상에서 제외
2 전화번호 기본포멧 유지
가 지역번호-국번-전화번호
나 +국가번호-지역번호-국번-전화번호
다 이동통신구분번호(3자리)-지역구분번호(34자리)-전화번호(4자리)
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 042)123-4567 010-1234567 042-123-4567 010-123-4567 기본포맷으로 변경
2 015-123-1234
SK(011 017) KTF(016
018) KG(109) 010(공통)
만 유지
3 +1-125-123-1234 +1-111-123-1215 +1-125-123-1234 +1-111-123-1215 외국전화번호는 유지
3 지역번호 없는 경우 주소지의 시도 지역번호를 입력
No원본데이터 정제 후
정제요령 비고자택 전화번호 주소 자택 전화번호 주소
1 6746-1234 서울 강남구 서초동 02-6746-1234 서울 강남구
서초동
주소지의 시도 지역번호를
입력
2 6746-1234 주소정보 없으므로 삭제
4 국가번호가 포함된 경우 ldquo(+)국가번호-국번-지역전화번호-전화번호ldquo 형태로 변경
No원본데이터 정제 후
정제요령 비고자택 전화번호 자택 전화번호
1 +82)02-6746-1234 +82-02-6746-1234
ldquo(+)국가번호-국번-지역전
화번호-전화번호ldquo 형태로
변경
5 전화번호 외 가베지 데이터는 삭제
- 56 -
가 텍스트 최소자릿수 미달(3자리 미만)등
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 02-64-123 010-111-111 자리수가 작으면 제거
6 데이터를 각 항목에 맞도록 이동 정제
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 010-2353-0416 042-123-0416 042-123-0416 010-2353-0416전화번호와 핸드폰 번호를
각 항목에 맞게 이동
7 기타사항
가 내선번호 및 과거지역번호 데이터 유지
나 전화번호가 2개 이상인 경우 앞의 전화번호를 우선으로 유지함
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 0431-123-1234 0431-123-1234 예전 지역번호는 유지
2 042-123-1234(100) 042-123-1234(100) 내선번호 유지
3 0431-123-1234 1235 0431-123-1234 앞의 전화번호를 우선으로
유지
기본정보_e-mail 정제지침
1 이메일 기본포멧 오류 및 내용상 무의미한 값 가베지 처리
No원본데이터 정제후
정제요령 비고e-mail e-mail
1 123123com 가베지 처리
2 1111111com 가베지 처리
3 123 가베지 처리
4 wwwkistirekr 가베지 처리
5 --- 가베지 처리
2 E-mail 2개 이상 존재 가베지 삭제 후 이상없는 값은 모두 유지
No원본데이터 정제후
정제요령 비고e-mail e-mail
1chhyangmdhanmailnet
chhyangdumcorkrrchhyangmdhanmailnet
앞의 이메일을 우선으로
유지함
2 abcdaumnet abcdaumnet이메일의 구분자가 누락된
경우 구분자 추가함
- 57 -
소속기관사항
소속기관_주소 우편번호 정제지침 ( 기본정보_주소 우편번호 정제지침 참조)
1 우편번호와 주소 모두 null인 경우 - 정제대상에서 제외
2 우편번호는 null 이지만 주소는 존재하는 경우 주소를 검색하여 우편번호 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 대전 서구 정림동 302-230 대전 서구 정림동우편번호에서 검색하여
매핑한다
3 우편번호는 존재하나 주소가 null인 경우 우편번호에 해당하는 주소 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302-230 302-230 대전 서구 정림동우편번호에서 검색하여
기본주소까지 입력한다
4 우편번호와 주소 값이 가베지 데이터인 경우 가베지 처리
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 111-1 가정교육학 가베지 처리
2 111 대전 서구 정림동 302-230 대전 서구 정림동기존 가베지 우편번호 대신에 주소를 가지고
새로운 우편번호를 검색하여 매핑한다
5 우편번호 체계가 OLD 데이터인 경우 현 주소로 검색하여 매핑
6 기타사항
가 외국주소 데이터 유지 원칙
(1)우편번호가 국내우편번호인 경우는 우편번호만 가베지 처리
(2)기본주소에 국가명만 존재해도 데이터 유지
나 주소가 2개 이상인 경우 소속기관명을 기준으로 정제(소속 기관이 소재한 주소만 유
지하고 그 외 주소는 가베지 처리)
다 기관 주소로 적합하지 않은 주소(자택주소)인 경우 유효한 주소로 정제(주소가 둘 이
상일 경우)
소속기관_사무실전화번호 팩스번호 정제지침 ( 기본정보_전화번호 핸드폰번호 정제지침 참조)
1 전화번호가 null인 경우 정제대상에서 제외
2 전화번호 기본포멧 유지
가 지역번호-국번-전화번호
- 58 -
나 +국가번호-지역번호-국번-전화번호
3 전화번호 외 가베지 데이터는 삭제
가 텍스트 최소자릿수 미달(3자리 미만)등
4 데이터를 각 항목에 맞도록 이동 정제
No원본데이터 정제 후
정제요령 비고사무실 전화번호 기본정보핸드폰 번호
1 010-2353-0416 010-2353-0416
사무실전화번호에
핸드폰번호 형태의
데이터가 있을 경우
삭제하고 기본정보의
핸드폰번호가 널일
경우에만 이동함
5 기타사항
가 내선번호 및 과거지역번호 데이터 유지
나 지역번호 누락시 주소항목에서 유추 기입(유추 불가시 널처리)
다 전화번호가 2개 이상인 경우 기존 데이터 유지
라 기준에 명시되지 않은 사항은 추후 사업주관기관과 협의하여 진행
소속기관_기관 부서명 직위 정제지침
1 기관 부서명 직위 모두 null인 경우 정제대상에서 제외
2 기관 직위는 NTIS 코드값에서 검색하여 매핑
3 인력구분은 기관명이형전거DB에 의해 자동 매핑함
No원본데이터 정제 후
정제요령 비고기관코드 기관명 기관코드 기관명
1 한국타이어(주) AAB6793 (주)한국타이어
기관명이형전거DB에서
대표기관명과
이형기관코드로 매핑
No원본데이터 정제 후
정제요령 비고직위코드 직위명 직위코드 직위명
1 교수 A01 교수NTIS 직위코드에서
검색하여 매핑한다
2 항해사 999 항해사
직위코드에 매핑되지
않으면 직위코드는 lsquo999rsquo로
매핑하고 직위명은 유지함
4 필드내 중복데이터가 존재할 경우 가베지 처리하고 각 필드와 부합하지 않는 데이터는
해당 필드로 이동
5 해당 필드내 부합되지 않는 데이터는 해당필드로 옮기고 가베지 처리
- 59 -
No원본데이터 정제 후
정제요령 비고직위코드 직위명 직위코드 직위명
1 비정규직 가베지 처리
6 기타사항
가 소속기관이 2개 이상인 경우
(1)주소 데이터를 참고하여 해당 기관명만 유지하고 이외의 데이터는 가베지 처리
(2)주소 데이터가 없는 경우에는 대학교 연구소 산업계 기타 기관 순으로 정제
나 항목별 값이 2개 이상인 경우 해당 필드에 기 입력된 값을 우선하여 유지하고 이외
의 데이터는 가베지 처리
다 기관명이형전거DB에 존재하지 않는 기관은 신규발급 요청 후 매핑
라 기준에 명시되지 않은 사항은 사업주관기관과 협의하여 진행
소속기관_최초임용일 정제지침
1 날짜 오류 유형 정제
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMMDD
No원본데이터 정제 후
정제요령 비고생년월일 최초임용일 생년월일 최초임용일
1 19500310 19451011 19500310날짜는 생년월일 보다
작을수 없으므로 삭제
2 19500310 20101010 19500310날짜는 현재보다 클수
없으므로 삭제
3 19500310 19000101 19500310 1900년 이전은 삭제
학력사항
학력사항_전공 정제지침
1 전공분야코드와 전공명 모두 null인 경우 정제대상에서 제외
2 전공명은 있으나 전공분야코드가 null인 경우 전공명을 검색하여 전공분야코드 입력
가 전공명과 정확히 일치하는 전공분야코드가 존재하는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 정보통신 D130700 정보통신 정보통신전공명과 일치하는
코드값을 매핑한다
나 전공명에 공백이 있는 경우
- 60 -
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 무기 화학 C060300 무기화학 무기화학공백제거후 일치하는
값을 찾아 매핑한다
다 정확히 일치하는 전공명이 검색되지 않는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 농생물학 F010300 농생물학 농생물근사치의코드값으로매
핑한다
2 생물 C070000 생물 생물학
3 화학전공 C060000 화학전공 화학
4 컴퓨터학과 D130000 컴퓨터학과 컴퓨터학
5 물리전공 C040000 물리전공 물리학
라 전공명이 영문일 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 Medicinal Chemistry C060519Medicinal
Chemistry의약화학
영문을 번역하여
코드값을 찾아
매핑한다
마 전공명칭의 중간에 구분기호 ( - () amp
및 등) 가 포함되어 있는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 미생물계통분류 C070901 미생물계통분류 미생물분류계통
구분기호와 낱말의
순서를 무시하고
매핑한다
2 동물학유전학 C071000 동물학유전학 동물학
구분기호를 기준으로
앞부분 부터 일치하는
순으로 매핑한다
3 병리학 폐암병리 E050000 병리학 폐암병리 병리학
4 환경생태생리 D110800 환경생태생리 환경생태
5 의약화학-약리 C060519 의약화학-약리 의약화학
6 전기공학(컴퓨터공학) D090000전기공학(컴퓨터공학
)전기공학
7 원격탐사amp지구물리 D140900 원격탐사amp지구물리 원격탐사
8 물리화학및 무기화학 C060300물리화학및
무기화학무기화학
바 상기 방법으로 매핑이 불가능한 경우
- 61 -
No
원본데이터 정제 후
코드매핑 결과 정제요령 비고학위취득대학코드
(코드값 없을경우)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 서울대학교 7006431 서울대학교 서울대학교 기관명이형전거DB를
이용하여
학위취득대학코드에는
이형기관코드
학위취득대학명에는
대표기관명을 매핑함
2 서울대학교
공과대학ZD13063 서울대학교 서울대학교
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 발사체 공력 해석 D049900 발사체 공력 해석 기타항공우주공학
전공명을 포괄하는
상위 코드값으로
매핑한다
2 SOLID
MECHANICSD020299
SOLID
MECHANICS기타고체및구조역학
사 원본데이터의 코드값이 오류인 경우(전공분야코드가 아닌 경우)
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 0160 건축공학 D150000 건축공학 건축공학
원문의 코드값을
가베지 처리 후
재매핑한다
3 전공명이 오류인 경우(전공명이 아닌 경우)
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고직위코드 직위명 직위코드 직위명
1 訣廢点뼈膀갹쳬窩 가베지 처리
2 석사학위 없음 가베지 처리
학력사항_취득대학 정제지침
기관명이형전거DB를 이용하여 학위취득대학코드 및 학위취득대학명 정제
1 학위취득대학코드와 학위취득대학명 모두 null인 경우 정제대상에서 제외
2 학위취득대학명은 존재하나 학위취득대학코드가 null인 경우 기관명이형전거DB에서 검
색하여 학위취득대학코드 입력
3 학위취득대학명 풀네임이 아닐때 학위취득대학코드가 null인 경우 - 기관명이형전거DB에
- 62 -
No
정제전 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(()내용이 모두
없을경우)
학위취득대학명학위취득대학코드
(검색코드입력)코드학위취득대학명
1 연세대학교(원주) ZD13266 연세대학교 연세대학교
기관명이형전거DB를
이용하여
학위취득대학코드에는
이형기관코드
학위취득대학명에는
대표기관명을 매핑함
No
정제전 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(기존 코드값)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 114800 서울대학교 7006431 서울대학교 서울대학교
학위취득대학명 검색
기존데이터 가베지
처리 후 검색된 코드
입력
No
정제전(표준대학명 설정) 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(표준대학명
기준설정)
학위취득대학명학위취득대학코드
(검색코드입력)학위취득대학명
1 가톨릭대학교가톨릭대학교(본
부)7001337 가톨릭대학교 가톨릭대학교
신규 발급 요청 후
코드 입력
No
정제전(개칭 외국취득대학명) 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(검색된값)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 부경대학교 부산수산대학교 7003010 부경대학교 부경대학교
인터넷
학위취득대학명
검색하여 검색된 코드
입력
2 東京大學 도쿄대학 JA0122 도쿄대학 東京大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
3 東京工業大學Tokyo Institute
of TechnologyJA0114
Tokyo Institute
of Technology東京工業大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
서 검색하여 학위취득대학코드 입력
4 기존 학위취득대학코드가 있는 경우 NTIS 코드값으로 변경
5 취득대학명 검색 후 취득대학코드가 없을 경우 학위취득대학명 신규 발급 요청 후 코드
기입
6 취득대학명이 개칭 혹은 외국취득대학명일 경우 검색해서 학위취득대학코드 기입함
- 63 -
4 早稻田大學(일본)와세다
대학JA0319 (일본)와세다 대학 早稻田大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
5 서울산업대학교 경기공업전문대학 7002623 경기공업전문대학 서울산업대학교
인터넷
학위취득대학명
검색하여 검색된 코드
입력
오탈자 정제요령
서울대하교 서울대학교 (오탈자 수정)
7 가베지값
가베지 정제요령
111ㄴㄴㄴ amp 김정구 없슴 등등 가베지 처리
8 오탈자
학력사항_학과 정제지침
1 학과코드와 학과명 모두 null인 경우 정제대상에서 제외
2 학과코드는 존재하나 학과명이 null인 경우 학과코드를 검색하여 학과명 입력
No원본데이터 정제 후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 0015 0015 가정 가정코드표에서 학과코드로
검색하여 매핑한다
3 학과명은 존재하나 학과코드가 null인 경우 학과명을 검색하여 학과코드 입력
가 학과코드표에 학과명과 정확히 일치하는 값을 찾아 매핑
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가정 0015 가정 가정코드표에서 학과명으로
검색하여 매핑한다
나 정확히 일치하는 학과명이 검색되지 않는 경우 근사값으로 매핑
- 64 -
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가축번식학번식공
학 전공명칭
전공필드가 Null인 경우
전공필드로 이동한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 건설공학대학원
박사후기9475
건설공학대학원박사
후기대학원
대학원의 경우 일치하는
값이 없으면 상위 개념으로
검색하여 매핑한다
2 이과대학
단과대학의 경우 일치값이
없으면 가베지 처리한다 -
학과명 삭제
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가정교육학 0040 가정교육학 가정교육 근사 값으로 매핑한다 유사
2 기계설계학전공 1260 기계설계학전공기계설계
기계설계학
검색값이 여러 개인 경우
일치도가 높은 값으로
매핑한다
유사
3 건축공학계열 0160 건축공학계열
건축공학
건축공학과
건축공학부
건축공학교육
일치도가 같은 여러 개의
값이 검색된 경우 글자수가
가장 적은 값으로
매핑한다
유사
일치도 높은 값을 매핑 한다하여 ldquo건축공학rdquo을 ldquo건축rdquo의 형태와 같이 학과 자체가 바뀔
수 있는 매핑을하지 않도록 주의한다
다 학과명칭의 중간에 구분기호(쉼표() 마침표() slash() and(amp) 등)가 있으면서 정확히
일치하는 학과명이 검색되지 않는 경우
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 전기 및
컴퓨터공학과0073
전기 및
컴퓨터공학과전기컴퓨터공학과
구분기호를 무시하고
매핑한다
2 생화학세포학 및
분자생물학과3240
생화학세포학 및
분자생물학과생화학
No 1의 결과가 없는 경우
구분기호를 기준으로
각각의 데이터를 검색하여
매핑한다
3 곡류과학식품공학 3715 곡류과학식품공학 식품공학구분기호를 기준으로
두번째의 값이 검색된 경우
라 학과코드가 Null 이고 학과명 필드에 전공명칭이 입력된 경우
(1) 전공필드가 Null인 경우 전공필드로 데이터를 이동하여 매핑하고 학과명 필드의 데이
터는 삭제한다
마 상기 방법으로 매핑이 불가능한 경우
- 65 -
3 요업공업 9999 요업공업 기타유사코드를 찾지 못한
경우 기타로 분류한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 명예박사 가베지 처리한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 공교 공업교육
공예교육
추정된 값이 하나일 때는
그 값으로 매핑 둘
이상이면 가베지 처리한다
2 IHE(Delft)
영문 약어의 경우 추정이
어려운 값은 가베지
처리한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 工學系硏究 가베지 처리한다
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1 추후입력 test 가베지 가베지 처리
2 미정 PH D 가베지 가베지 처리
3 기억안남 NA 가베지 가베지 처리
4 졸업시험으로 대체 null 가베지 가베지 처리
5 국문없음 no data 가베지 가베지 처리
6
공학박사(지능형
소프트웨어 전공)
or 공학사
(자동차기술사)
학위 및 기타정보 가베지 처리
7 박사 학위 가베지 처리
4 가베지 처리
가 학과명이 아닌 경우
나 약어인 경우
다 학과명인지 판단하기 난해한 한문 명칭의 경우
학력사항_학위논문명 정제지침
1 최종학위국문논문명과 최종학위영문논문명이 모두 null인 경우 정제대상에서 제외
2 논문명 필드에 기타 정보나 가베지 데이터가 존재하는 경우
- 66 -
8 영문참조 none 가베지 가베지 처리
9 aa 0 가베지 가베지 처리
10 가 x 가베지 가베지 처리
11 디지털경제학 Chemistry 학과 또는 전공정보 가베지 처리
12
학사학위시설계PR
OJECT날개2001-
gt청소년수련원테마
로 설계함
졸업 작품에 대한
정보가베지 처리
13
교회 건축물의
계획 및
설계(설계작품)
졸업 작품에 대한
정보가베지 처리
14압축기 관련
기술연수 연수 정보 가베지 처리
15
광통신 부품용
소재 연구관련
논문을 준비중임
준비중인 논문 가베지 처리
16 KISTI 영문 약어 가베지 처리
17 CFD 영문 약어 가베지 처리
18
H Atoms in
Photodissociations
and Chemical
Reactions(수소원자
의 광화학반응)
H atoms in
Phtodissociation
and Chemical
Reactions
H Atoms in
Photodissociation
s and Chemical
Reactions(수소원
자의 광화학반응)
H atoms in
Phtodissociation
and Chemical
Reactions
()안에기타정보가표
기됨
-유효데이터의표기
언어는동일하나내용
상다소의차이를보이
는경우
데이터 유지
19
김휘택김승욱김정
일서근택서정탁유
총일대퇴골
근위부의
방사선학적 형태-
정상 고관절과
대퇴골두 무혈성
괴사가 있는
고관절에서의 비교
대한정형외과학회
지
33(1)177-1851998
김휘택김승욱김
정일서근택서정
탁유총일대퇴골
근위부의
방사선학적 형태-
정상 고관절과
대퇴골두 무혈성
괴사가 있는
고관절에서의
비교
대한정형외과학회
지
33(1)177-185199
8
유효 데이터 전후에
기타 정보가 표기된
경우
데이터 유지
20
친환경
도시건축계획에
관한 연구
Oekologisch
orientierte
Stadtplanung in
Seoul
Suedkorea(독문
명)
친환경
도시건축계획에
관한 연구
Oekologisch
orientierte
Stadtplanung in
Seoul Suedkorea
국문영문논문명
필드에 모두
데이터가 있고
영문논문명 필드에
한글로 (언어)
표기가 되어 있는
경우
(언어) 부분만 가베지
처리
21
ZFS symmetry
and parameters
in MR(임시등록)
임시등록데이터의
경우가베지 처리
3 논문명의 후반부가 잘린 경우
- 67 -
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1 합성과 논문명의 남은 부분이
극히 짧음가베지 처리
2 경영통계에 관련 논문명의 남은 부분이
극히 짧음가베지 처리
3
계층구조를
이용한 문서
클러스터 제목의
자동생성 기법
cluster
계층구조를
이용한 문서
클러스터 제목의
자동생성 기법
논문명의 남은 부분이
극히 짧음(영문논문명)
영문논문명
가베지 처리
4암호화된 위상
마스크를 이용한
New visual
cryptography
method based on
optical
interference
암호화된 위상
마스크를 이용한
New visual
cryptography
method based on
optical interference
논문명이
어느정도(2단어 이상)
남아 있음(국문논문명)
데이터 유지
5
metathesis
polymerization of
~
metathesis
polymerization of
~
논문명이
어느정도(2단어 이상)
남아 있음
데이터 유지
6 보편형식On universal
forms보편형식
On universal
forms
가베지 여부를
판단하기 난해함데이터 유지
7
점성유동장내에서
의 최대양력 익형
설계
The Optimal
Design
점성유동장내에서
의 최대양력
익형 설계
The Optimal
Design
영문 논문명에
데이터의 일부 -
두단어 이상 남아 있음
데이터 유지
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문명
최종학위영문논
문명최종학위국문논문명 최종학위영문논문명
1
석사순니켈의수소
취성에미치는Fe및B
의영향에관한연구
박사기계적합금화
에의해제조된ABA
B2형금속수소화물
의전극특성에관한연
구
기계적 합금화에
의해 제조된 AB
AB2 형
금속수소화물의
전극 특성에 관한
연구
석사논문 박사논문이
동시에 입력
최종(박사)
논문명만
유지한다
2
초임계이산화탄소를
이용한 마늘로부터
지방산 추출에 관한
연구(석사)
식품저장기간을연장
할수있는기능성필름
개발을위한항균성물
질추출및흡착에관한
연구
식품저장 기간을
연장 할수있는
기능성 필름 개발을
위한 항균성 물질
추출및 흡착에 관한
연구
석사논문 추정불가
논문이 동시에 입력
후반부의
논문명만
유지한다
3
GIS를 이용한
대학캠퍼스
공간분석(석사논문)
현재 인터넷 GIS를
이용한 경관평가
논문 준비중
GIS를 이용한
대학캠퍼스
공간분석
후반부가 준비중인
논문인 경우
준비중인 논문
가베지 처리
4 논문명이 두개 이상인 경우
- 68 -
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문명
최종학위영문논
문명최종학위국문논문명 최종학위영문논문명
1
(영)A Shift-first
Strategy for
Generalized LR
Parsing
A Shift-first
Strategy for
Generalized LR
Parsing
A Shift-first
Strategy for
Generalized LR
Parsing
()안의 언어표기만
제외하고 동일한
데이터
국문논문명만
유지하고
영문논문제
삭제 처리
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1
3d 전자계에 대한
NMR 이동
계산(Theoretical
calculations of
NMR shifts for
3dⁿsystems)
3d 전자계에
대한 NMR 이동
계산
Theoretical
calculations of
NMR shifts for
3dⁿsystems
한쪽의 필드에
데이터가 모두
입력된 경우
해당 필드로 이동
3
AStudyonLandslid
eofCuttingandBank
ingSlopeKFRI
Road 林道
盛土面의
崩괴에關한硏究
AStudyonLandsli
deofCuttingandBa
nkingSlopeKFRI
Road 林道
盛土面의
崩괴에關한硏究
국문 영문 구분없이
유지함데이터 유지
9
家庭用電氣製品
の親環境設計過
程への畵像流體
計測の適用に關
する硏究(A
Study on the
Design of Home
Appliances for
Energy Saving
Using PIV)
家庭用電氣製品の
親環境設計過程へ
の畵像流體計測の
適用に關する硏究
(A Study on
the Design of
Home Appliances
for Energy
Saving Using
PIV)
한쪽의 필드에
영문과 기타외국어
논문명이 모두
입력된 경우
데이터를 구분할
기준이 없으므로
데이터를 유지하고
국문논문명 필드로
이동
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1中韓兩國外銷美國
主要商品之比較硏
중한양국
대미수출
中韓兩國外銷美國主
要商品之比較硏究
논문명 필드 내
논문의 언어를해당 필드로 이동
5 국문영문논문명이 동일하나 (언어)가 표기 되어 있는 경우
6 국문영문 필드에 데이터가 뒤섞여 있는 경우
가 국문 영문을 구분하지 않고 국문논문명은 널이 아니어야 함
나 국문논문명(필수)이 널이고 영문논문명이 널이 아닐 경우 국문논문명으로 영문논문명
을 이동
다 중국어 논문명은 명확히 구분이 되는 경우만 정제하여 영문논문명 필드로 이동 - 일문
논문명 국문 논문명과의 구분 난해
- 69 -
究(중한양국
대미수출
주요상품의
비교연구) [1991년
경영학석사 논문
중국어]
주요상품의
비교연구
표기하여 명확한
구분 가능
No원본데이터 정제 후
데이터 유형 정제요령 비고취득국가코드 취득국가코드
1 KZ NTIS 국가코드와 불일치 널처리
2 오류 데이터 널처리
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 Takashi Tsuruo PhD Takashi Tsuruo PhD
2 유영면(자동차 부품연구원) 유영면(자동차 부품연구원) (기타정보)가 표기된 경우 데이터 유지
3 신현경 김정회 (공동) 신현경 김정회 (공동) 2명 이상인 경우 데이터 유지
4高橋照男(TAKAHASHI
TERUO)
高橋照男(TAKAHASHI
TERUO)(병음)이 표기된 경우 데이터 유지
5 송지복 박사 송지복 박사
교수명 앞뒤에 호칭이 붙은 경우 데이터 유지
6 이와바교수 이와바교수
7 Dr HT Hahn Dr HT Hahn
8 ProfDr NWiberg ProfDr NWiberg
9 C S George Lee aaaaa C S George Lee지도교수명 뒤에 의미없이
알파벳이 반복 나열된 경우
반복 나열된 알파벳 가베지
처리
10J Desmaism aaaaa
DBernacheJ Desmaism DBernache
2인의 지도교수명 사이에
의미없는 알파벳의 반복이 온 경우aaaaa 를 로 치환한다
11 김해구 김해구지도교수명 전후에 의미없는
특수문자나 파자가 존재하는 경우
의미없는 문자 가베지 처리
- 단 성명이 완전하지 않은
학력사항_취득국가 정제지침
1 취득국가코드가 NTIS 코드가 아닐 경우
가 취득국가코드가 NTIS코드가 아니면 널처리함
학력사항_지도교수명 정제지침
1 Null인 경우 정제대상에서 제외
2 필드내 지도교수명 외 기타 정보가 표기된 경우
가 필드내 유효 데이터의 존재 유무만을 중요시 함 유효 데이터가 존재하는 경우 데이
터의 형식 등에 큰 의미를 두지 않음
- 70 -
상황에서 성명이 들어갈
부분에 나 특수문자가
표기된 경우 데이터 유지
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 주강 주강
이름이 정확한지 불확실한 경우올바른 데이터인지 판단이
불가능 하므로 데이터 유지
2 김양 김양
7 공란 공란
3 홍길동 홍길동
4 Hiroyuki KIDO Hiroyuki KIDO
5 DH Youn DH Youn
한국 사람인데
영어(미국식)_이니셜로 표기된
경우
데이터 유지
6 Liu Hung Wen Liu Hung Wen한국 사람인데 영어(한국식)로
표기된 경우데이터 유지
7 이인원이상수 이인원이상수 지도교수가 2인 이상인 경우의
구분기호데이터 유지
8 오정무김상돈 오정무김상돈
9 庄子哲雄 庄子哲雄
일본식 이름의 표기법 데이터 유지
10 가네꼬 준이찌 가네꼬 준이찌
11 Kajiuchi Toshio Kajiuchi Toshio
12 대림성행 대림성행
일본 한자를 한글로 표기 데이터 유지
13 장욕천선대삼 장욕천선대삼
14 목도정부 목도정부
15 불상 불상 유효 데이터 여부 판단 난해 데이터 유지
16 지반 자바 지반 자바 외국어 이름을 한글로 표기 데이터 유지
17 Luo Luo
한국 교수의 성만을 표기한
것인지 외국인 교수의 이름인지
판단 난해
데이터 유지
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 N 가베지 데이터 데이터 가베지 처리
2 NA
3 필드내 데이터가 유효 값인지 판단하기 난해한 경우
가 유효 값인가 유효하지 않은 값인가 판단 자체가 불가능한 경우가 대부분 이므로 데이
터 유지를 기본으로 함
4 필드내에 기타 정보나 가베지 데이터가 존재하는 경우
- 71 -
3 none
4 해당없음
5 알수없음
6 모름
8 김교수 호칭하는 대상이 포괄적인 경우 데이터 가베지 처리
9 농과대학 근무처 또는 전공 정보 데이터 가베지 처리
10 대학원 학위 또는 학과 정보 데이터 가베지 처리
11 교수님 직위 정보 데이터 가베지 처리
12 지도교수명 가베지 데이터 데이터 가베지 처리
11 Kajiuchi Toshio Kajiuchi Toshio
12 대림성행 대림성행 일본 한자를 한글로 표기 데이터 유지
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 19871801 198702 월(MM)이 유효하지 않은
경우 - 졸업년월02월로 갱신
2 19871301 198703 월(MM)이 유효하지 않은
경우 - 입학년월03월로 갱신
3 19871301 198701월(MM)이 유효하지 않은
경우 - 최종학위취득일01월로 갱신
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 10780301 년도(YYYY)가 유효하지
않은 경우 - 공통
데이터 가베지
처리
No 원본데이터 정제 후 오류사항 정제요령 비고
학력사항_날짜유형(입학일졸업일학위취득일)
1 기본 지침
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMM
다 날짜 데이터가 유효하지 않은 경우
(1) 년도(YYYY)가 유효하며 월(MM)이 유효하지 않는 경우 졸업월(MM)은 02로 입학월
(MM)은 03으로 그리고 최종학위취득일(MM)은 01로 갱신
(2) 년도(YYYY)가 유효하지 않은 경우 데이터 가베지 처리
(3) 년도(YYYY)의 유효 범위
rarr 졸업일 입학일 최종학위취득일 1900 lt 졸업일 입학일 최종학위취득일 lt 현재
라 MM(월)이 없는 경우 졸업년월은 02월로 입학년월은 03월로 갱신
- 72 -
졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 1987 198702 월(MM)이 없는 경우 -
졸업년월02월로 갱신
2 1987 198703 월(MM)이 없는 경우 -
입학년월03월로 갱신
3 1987 198701월(MM)이 없는 경우 -
최종학위취득일01월로 갱신
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 19820301 19820301 19820301 입학년월과 졸업년월이
동일입학년월 유지
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 0201
년도가 없음 년도로
간주하더라도 유효하지
않은 데이터
데이터 가베지
처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
1한성대학교
산업시스템공학부한성대학교 정제 정제 처리
2(주)한정화학
총무과부장(주)한정화학 부장 정제 정제 처리
3연세대학교 공과대학
화학공학전공
연세대학교
공과대학정제 정제 처리
4연합철강공업(주) 입사
(국제그룹공채)연합철강공업 정제 정제 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
마 [입학년월 gt= 졸업년월]인 경우 입학년월 유지 졸업년월 가베지 처리
바 YYYY(년도)가 없는 경우 데이터 가베지 처리 정제대상에서 제외
경력사항
경력사항_근무처명 정제지침
1 근무처명이 null인 경우 정제대상에서 제외
2 근무처명에 직위 전공값이 있는 경우
3 가베지 데이터
- 73 -
1 중학교 총무처 군복무 현역 등
가베지 데이터 가베지 처리
2 가 나 다 몰라 가베지 처리 등
3 00 제2청사 (주)ㅇㅇ건설 000공무원 등
4 111163년10년1년106866 등
5 WHO COO aaa dkff saa 등
6 미국 일본 등
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
1 日本産業技術合究所 日本産業技術合究所
오류
가베지 처리
2 고려대학교 보건대학원 역학 I 보건정보학과 고려대학교 보건대학원 정제 처리
3 환경공학 국가기술개발 선도사업 (G-7 연구환경공학 국가기술개발
선도사업 (G-7 연구가베지 처리
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 교수 A01 교수 교수직위명과 일치하는 코드값을
찾아 매핑
2 위촉연구원 B07 위촉연구원 위촉연구원
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 조교수부교수교
수A01
조교수부교수
교수교수
완전일치gt 일치도가 높은
직위명 순으로 매핑
2 시간강사연구조
교A05
시간강사연구조
교시간강사
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
4 기타
경력사항_직위명 정제지침
1 직위코드와 직위명 모두 null인 경우 정제대상에서 제외
2 직위명은 있으나 직위코드가 null인 경우 직위명 검색하여 직위코드 입력
가 직위명과 정확히 일치하는 직위코드값이 존재하는 경우
나 직위명에 직위가 복수인 경우
다 정확히 일치하는 직위명이 검색되지 않는 경우
- 74 -
1 주임교수 A01 주임교수 교수 근사치의 코드값으로 매핑
2 시간강의 A05 시간강의 시간강사
이형정의
표 첨부
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 Professor A01 Professor 교수영문을 번역하여 이형정의표에
의거 코드값을 찾아 매핑
이형정의
표 첨부
2 Research Fellow B20 Research Fellow 전문위원
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 간호사 999 간호사 기타직위명과 일치하는 코드명이
없을경우 기타코드값으로 매핑
2 계장 999 계장 기타
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 36 연구원 B06 연구원 연구원기존의 직위코드를 NTIS
직위코드로 대체
2 13 조교수 A03 조교수 조교수
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 등재 직위명은 가베지 처리
2 ㅁㅁㅁ
라 직위명이 영문일 경우
마 상기 방법으로 매핑이 불가능한 경우
3 직위명과 코드가 모두 존재하는 경우
4 직위명이 오류인 경우(직위명 가베지)
- 75 -
No NTIS코드 코드명(생성) 이형정의(원본데이터) 비고
1 A01 교수
Professor
Prof
Faculty
(대학의)Teacher
Teaching
TeachingFellowship
학장 학장보
부학장 학과주임
학과장 학부장
학생처장
대학원장대학원장보
(대학의)교직원(대학의)교원
총장부총장
2 A02 부교수
AssociateProfessor
AssociateResearchProfessor
AssociateVisitingProfessor
3 A03 조교수AssistantProf
AssistantProfessor
4 A04 전임강사FullTimeLecturer
Instructor
전문강사 전담강사
강의전임 강의전담
전임대우
5 A05 시간강사
시간강의
PartTimeLecturer
PartTimeInstructor
6 A06 강사(기타) 강의 출강
7 A10 명예교수Honorary[Emeritus]Professor
HonoraryVisitingProfessor
8 A11 석좌교수 Chair Professor
9 A12 강의교수
10 A13 겸임교수
겸직교수
adjunctprofessor
adjunctprof
AdjunctFaculty
11 A14 계약교수
12 A15 기금교수
13 A16 대우교수
14 A17 연구교수
ResearchProfessor
ResearchFaculty
FacultyResearch
teachingresearcher
15 A18 초빙교수
초청교수
InvitedProfessor
ProfessorInvite
16 A19 객원교수
Visitingfaculty
visitingprofessor
aprofessorextraordinary
17 A20 조교
조수
Tutor
Assistant
UniversityAssistant
GraduateAssistant
GraduateAssociate
Teachingfellow
TeachingAssistant
TeachingAssociate
FacultyAssociate
TA RA GRA GSRA
18 A21 대학원생박사과정
석사과정
별첨 이형정의표
- 76 -
postgraduate
19 A22 POST-DOC
연수과학자
연수연구원
포스트닥터
포닥
박사후연수
박사후과정
박사후연구원
Post-Dr
Postdoctor
postdoctoral
visitingscholar
visitingfellow
Researchassistant
ResearchAssociate
20 A23 POST_MAS
21 B01 수석연구원 Principal Research Engineer
22 B02 책임연구원
연구책임자
SeniorResearchEngineer
SeniorResearch
SeniorResearcher
SeniorResearchStaff
SeniorInvestigator
23 B03 주임연구원
연구주임
AssistantResearchEngineer
AssistantResearcher
assitantInvestigator
24 B04 전임연구원AssociateResearchEngineer
AssociateResearcher
25 B05 선임연구원 선임-연구소의
26 B06 연구원
연구소장 연구보조원
연구원보연구생
연구개발원연구조원
연구주임연구조수
연구부담당자연구자
연구실장연구보조
연구팀장연구요원
연구센터장연구부처장
연구부문장연구대리
연구단장연구연구진
연구회원연구활동
방문연구 연구수
(연구소연구원연구센터연구실의)-
실장팀장원장부원장소장부소장
선임단장그룹장본부장계장인턴
장장 등
GraduateFellow
(연구소의)-Fellow
Research
Researcher
ResearchStaff
ResearchEngineer
Investigator
27 B07 위촉연구원
VisitingResearcher
VisitingResearchEngineer
VisitingInvestigator
GuestResearcher
GuestInvestigator
28 B10 수석연구위원
29 B11 책임연구위원
30 B12 주임연구위원
31 B13 전임연구위원
32 B14 선임연구위원
33 B15 연구위원
34 B20 전문위원ResearchFellow
ReserchFellowship
35 B30 책임기술원책임기사
기술책임자
SeniorEngineer
ChiefEngineer
- 77 -
PrincipalEngineer
SeniorTechnical
36 B31 선임기술원 선임기사 선임엔지니어
37 B32 기술원
(주식회사의)-기사
엔지니어기술사
기술팀장기술센터장
기술직기술주임
기술담당기술처장
기술직사원
Engineer
Technician
TechnicalStaff
TechnologyStaff
38 C01 공무원
연구사연구관
주사주사보
보좌관기좌
기사보사무관
군무원서기관
이사관조사원
청장차관
자문관비서관
장관행정관
담당관기원
경찰분석관
서서서기보조무원
보건지소장보건소장
보건소영양사보건진료원
보건진료소장지도관
지도사보
(행정기관의)-토목급
(행정기관의)-심사관
(행정기관의)-지도원
(행정기관의)-지도사
(공공기관)-기사
(공사의)-급
39 C02 법조인
심판관변리사
재판관검찰관
변호사법무조정위원
법제이사법의관
법의학감식관
40 C03 의사
전문의전임의
전담의담당의
인턴레지던트
객원의공중보건의
수련의임상의
전공의주치의
의사보일반의
상담의인정의
지도의병원장봉직의
(병원의)-과장부장처장등
Clinician
Intern
Resident
Doctor
Attending
41 C04 교사 (초~고교의)-교원
42 C05 군인
(군관련)-교관소대장
병장교소령
소위대위
군의관의무관
군하사중위
중대장보충역
제대소령
참모의무자문관
기무사기무사보
기무관
43 D01 대표이사
CEO대표
사장법인장
President
44 D02 이사
부사장이사보이사대우
Director
viceDirector
associateDirector
VicePresident
SeniorExecutiveVicePresident
45 D03 전무SeniorManagingDirector
CFO
- 78 -
46 D04 상무 상무보
47 D05 부장
부장대리
DepartmentManager
GeneralManager
48 D06 차장
DeputyGeneralManager
DeputyDirectorGeneral
AssistantDirector
AssistantDirectorvice-chiefManager
49 D07 과장
Manager
GeneralManager
DepartmentManager
DeputyManager
50 D08 대리 Assistant Manager
51 D09 사원 회사원직원
52 999 기타
53 회원(삭제)
No원본데이터 정제 후
오류사항 정제요령 비고근무시작일 근무종료일 근무시작일 근무종료일
1 2005 2007 20050101 20070101 월 없음 월에 01 입력
No원본데이터 정제 후
오류사항 정제요령 비고생년월일 근무시작일 근무종료일 근무시작일 근무종료일
1 19500101 19000101 19400101 유효 범위 오류 삭제처리함
경력사항_날짜유형(근무시작일 근무종료일) 정제지침
1 기본 지침
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMM
다 날짜 데이터가 유효하지 않은 경우
(1) 년도(YYYY)가 유효하며 월(MM)이 유효하지 않는 경우 01로 입력
(2) 년도(YYYY)가 유효하지 않은 경우 데이터 가베지 처리
(3) 년도(YYYY)의 유효 범위
rarr 근무시작일 근무종료일 1900 lt 근무시작일 근무종료일 lt 현재
rarr 근무시작일 근무종료일 생년월일lt근무시작일 근무종료일
라 [근무시작일 gt= 근무종료일]인 경우 근무시작일 유지 근무종료일 가베지 처리
- 79 -
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1한국산업인력
관리공단
건설기계기
사1급1994-12-01
건설기계기사
1급
한국산업인
력관리공단1994-12-01 오류 해당필드로 이동
2치과의사면허
증1993-01-01 보건복지부
치과의사면허
증보건복지부 1993-01-01 오류 해당필드로 이동
3중등 2급
정교사자격증 문교부
중등 2급
정교사자격증문교부 오류 해당필드로 이동
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1워드 프로세서
2급
워드
프로세서
2급
1999-06-01워드
프로세서 2급 1999-06-01 중복 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 발행처 2004-03-01 가베지 가베지 처리
NO원본데이터(가베지) 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 111 222 0000 가베지 가베지 처리
2 상동
No원본데이터 정제 후
오류사항 정제요령 비고근무시작일 근무종료일 근무시작일 근무종료일
1 20050501 20040601 20050501 [근무시작일 gt=
근무종료일]인 경우
근무종료일 가베지
처리
자격사항
자격사항 정제지침
1 자격증명 자격발행처 자격취득일이 모두 null인 경우 정제대상에서 제외
가 자격증명값이 NULL인 경우 나머지 데이터(자격발행처 자격취득일) 모두 가베지 처
리
2 자격증명 자격발행처 자격취득일 각 필드값이 뒤바뀐 경우 처리방법
3 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값이 나올 경우 처리방법
4 자격증명 필드값이 NULL인 경우 처리방법
5 가베지값 처리방법
- 80 -
3 일본
4 없음
NO원본데이터(오탈자) 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 화공기사1급ssssssssssssss 화공기사1급
오탈자데이터 수정 및
가베지 처리
2 충북졍찰청
3 박물관amp8228미술관 정학예사 3급미술관
정학예사 3급
4초경U항공기조종사면허1111111111111
111111111111111111111증
초경량항공기
조종사면허증
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
1 1루프캐리어
이송장치
루프캐리어
이송장치1
루프캐리어
이송장치중복 가베지 처리
2 1 1019990060031101999006003
1 가베지 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
1 1특허등록 제
0290068호 가베지 가베지 처리
2 1 1313131 아자차카 가베지 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
6 기타 처리방법
지식재산권
지식재산권 정제지침
1 특허구분 출원등록번호 지식재산권명이 모두 null인 경우 정제대상에서 제외
가 지식재산권명이 NULL인 경우 나머지 데이터 모두 가베지 처리
2 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값 상이값이 나올 경우 처리방법
3 지식재산권명 필드값이 NULL 가베지값인 경우 처리방법
4 가베지값 처리방법가 출원등록번호 지식재산권명으로 볼 수 없는 데이터는 가베지 처리
- 81 -
1 3자리 이하의
숫자특허
가베지 가베지 처리
2 한국 드릴
3 완료 국제
4 미정 마바
5 이름 사아
6 출원중 파하
7 경상현 가나
8 미지정 다라
9 공개중 카타
10 미입수 혜천
NO원본데이터 정제 후
데이터 유형 정제요령 비고지식재산권명 지식재산권명
1 光微粒子の製造方法 光微粒子の製造方法 오탈자 가베지 처리
2 양자우물amp8228세선의 제작방법 양자우물amp8228세선의 제작방법 오탈자 가베지 처리
3 94-26592 94-26592 오탈자 가베지 처리
NO원본데이터 정제 후 데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 총무
아태물리학회(Associati
on of Asia-Pacific
Physical Societies)
아태물리학회(Associa
tion of Asia-Pacific
Physical Societies)
총무 오류 데이터 이동
2 ASG 없음 Member ASG Member 가베지 가베지 처리
NO원본데이터 정제 후 데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
5 기타 처리방법
소속학협회
소속학협회현황 정제지침
1 학협회명 직위 담당업무 모두 null인 경우 정제대상에서 제외
가 학협회명값이 NULL인 경우 나머지 데이터 모두 가베지 처리
2 학협회명 직위 담당업무 각 필드값이 뒤바뀐 경우
3 해당 필드에 이미 유효 값이 존재하는데 다른 필드값도 나올 경우
- 82 -
1대한병리학회
임상병리학회
대한병리학회
경남(부산)회장
대한병리학회
임상병리학회
대한병리학회
경남(부산)회장 중복 데이터 유지
명칭포함
유지
2한국자원공학회
이사 한국자원공학회 이사 오류 데이터 이동
3여성생명과학기
술포럼 회원운영위원 학술위원
여성생명과학기술
포럼운영위원 학술위원 중복 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 편집위원 가베지 가베지 처리
2 종신회원 명예회장 가베지 가베지 처리 학협회명 아님
3 회원 해당없음 가베지 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 ㄴㄴㄴ 111 eee 20 q 등
가베지 가베지 처리
2 없음 해당없슴 등재
3 화공기사 1 급 덕있으마
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 일본 학회 기타 가베지 처리
NO 원본데이터 정제 후 데이터 정제요령 비고
4 학협회명 필드값이 NULL값인 경우
5 가베지값
6 기타
훈포장사항
훈포장사항 정제지침
1 수여기관명 훈포장명이 모두 null인 경우 - 정제대상에서 제외
가 훈포장명이 NULL인 경우 나머지 데이터 모두 가베지로 처리
2 수여기관명 훈포장명 각 필드값이 뒤바뀐 경우
- 83 -
수여기관명 훈포장명 수여기관명 훈포장명 유형
1 장영실상 과학기술부 과학기술부 장영실상 오류 해당필드로 이동
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 대통령 대통령 대통령 대통령 중복 데이터 유지 대통령 상
2우수논문발표상 -
포스터 부문
우수논문발표상 -
포스터 부문
우수논문발표상 -
포스터 부문중복
데이터 가베지
처리
3 국무총리 표창 국무총리 표창 국무총리 국무총리 표창 중복데이터 가베지
처리
4 광혜학술상 광혜학술상 광혜학술상 중복데이터 가베지
처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 대한민국 정부 오류데이터 가베지
처리
훈포장명 데이터
null값
2 한국물리학회 한국물리학회 오류데이터 가베지
처리
훈포장명 데이터가
가베지값
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 222 111데이터 가베지 처리
2 회원 등재등
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 제어amp8228자동화amp8228시스템공학회 제어amp8228자동화amp8228시스템공학회오탈자
데이터 유지 수정
및 가베지 처리
파일생성 형식에
따른 오류
2 ㅈ조선대총장 조선대총장
3 해당 필드에 이미 유효 값이 존재하는데 다른 필드에서 동일값이 나올 경우
4 훈포장명 필드값이 NULL값인 경우
5 가베지값
6 기타
저역서실적
저역서실적 정제지침
- 84 -
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 3차원
인체해부도1 UBCare
3차원
인체해부도 1 UBCare 오류
해당필드로
이동
2신흥인터내
셔날
소아
청소년치과학1
소아
청소년치과학 1 신흥인터내셔날 오류
해당필드로
이동
3 動力學Engineering
Mechanics2 普文堂 動力學
Engine
ering
Mechan
ics
2 普文堂 한자명 그대로 유지
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1고분자
공학 II
고분자 공학
II1 희중당
고분자 공학
II 1 희중당 중복 가베지 처리
2 주조응고일본금속학회
[주조응고]2
반도출판
사
일본금속학회
[주조응고] 2 반도출판사 오류
해당필드로
이동
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 1
가베지전체 데이터
삭제
2물리강의(20
9쪽)일서 2 대웅
3 wjswktkdrjfo
qhdks rltnf1 생능출판사
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 Polymer Surface
Dynamics 공동저서
Polymer Surface
Dynamics 공동저서 이동 데이터 이동
2
The Handbook of
Groundwater
Engieering-지하수공학에
있어서 지리정보시스템
The Handbook of
Groundwater
Engieering-지하수공
학에 있어서
지하수공학에
있어서
지리정보시스템
The Handbook of
Groundwater Engieering중복 데이터 수정
1 국문저서명 영문저서명 저역서 구분 발행처명이 모두 null인 경우 - 정제대상에서 제외
가 국문저서명 영문저서명 둘 다 NULL인 경우 나머지 데이터 모두 가베지 처리
2 국문저서명 영문저서명 저역서구분 발행처명 각 필드값이 뒤바뀐 경우
3 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값 상이값 나올 경우
4 국문저서명 영문저서명 필드값이 NULL값이거나 가베지값인 경우
5 국문저서명이 널이고 영문저서명이 널일 아닐 경우 국문저서명으로 이동함
- 85 -
지리정보시스템
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 ㅁ 기지이전사업 기획서 YRPMPKOREA 기지이전사업 기획서 YRPMPKOREA 오자 가베지 처리
2 최신 EDICALS 최신 EDI CALS 오자 데이터 유지
3 보호 야동식물 보호 야생 동식물 오자
가능한
범위에서
수정
4 ISBN 1-59033-891-XInequality Theory and
Applications (III)
Inequality Theory and
Applications (III)가베지
가베지 처리
ISBN 필드로
이동
5 NHealth Insurance
Reform In Korea
Health Insurance
Reform In Korea가베지 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 1111 2 골든벨
가베지 가베지 처리
2
곽수동
고필옥
김무강
범문사
3 ㄷㄷㅁㅁ 1
4 (주)지학사 1 (주)지학사
6 오탈자
7 가베지 데이터
논문실적
논문실적 정제지침
1 최종학위국문논문명과 최종학위영문논문명이 모두 null인 경우 정제대상에서 제외
2 논문명 필드에 기타 정보나 가베지 데이터가 존재하는 경우
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 추후입력 가베지 가베지 처리
2 미정 가베지 가베지 처리
3 가베지 가베지 처리
- 86 -
구분 항목 세부항목 항목수단위별
가중치()
참여
인력
정보
기본정보
주민등록번호 성명 자택주소 자택
우편번호 자택전화번호 핸드폰번호
7 31
소속기관사항
소속기관명 부서명 직위명 사무실
전화번호 기관주소 최초임용일 인
력(직업)구분
7 185
학력사항
전공 취득대학 학위 입학일 졸업
일 학과 취득국가 지도교수명 학위
논문명 학위취득일
10 21
16 데이터 검수
161 데이터 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
162 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 87 -
구분 항목 세부항목 항목수단위별
가중치()
경력사항 근무처명 직위명 근무기간 3 45
자격사항 자격발행처 자격증명 자격취득일 3 25
논문실적
논문발표일 국문논문명 영문논문명
저자역할구분 발행처 학술지구분
학술지명 SCI여부
8 105
지식재산권 지식재산권명 출원_등록번호 특허구분 3 25
계 소계 41 905
평가
위원
소속학협회현황 담당업무 직위 학협회사항 3 3
훈포장사항 수상년월 수여기관명 훈포장명 3 25
저역서실적국문저서명 영문저서명 발행년 발
행처 저역서구분5 4
소계 11 95
계 52 100
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
150 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
성명 100자택주소 10자택우편번
호
20
자택전화번 10
항목별 오류율 산정 기준 정의
- 88 -
호
핸드폰번호 10E-mail 10소계 310
소속기
관사항
(7개)
소속기관명 100
부서명 05
직위명 20
사무실전화
번호
10
기관주소 30
인력(직업)구
분
10
최초임용일 10
소계 185
학력사
항
(10개)
전공 20
취득대학 100
학위 20
입학일 10
졸업일 10
학과 15
취득국가 15
지도교수명 05
학위논문명 05
학위취득일 10
소계 210
경력사
항
(3개)
근무처명 20
직위명 15
근무기간 10
소계 45
자격사
항
(3개)
자격발행처 05
자격증명 10
자격취득일 10
소계 25
논문실
적
(8개)
논문발표일 10논문명1 10
논문명2 05저자역할구
분
05
발행처 05학술지구분 05학술지명 10
SCI여부 05
소계 105
지식재
산권
지식재산권
명
10
- 89 -
(3개)
출원_등록번
호
05
특허구분 10소계 25
평가 소속학
협회현
황
(3개)
담당업무 05
위원 직위 05
(11개) 학협회사항 20
소계 30
훈포장
사항
(3개)
수상년월 10
수여기관명 05
훈포장명 10
소계 25
저역서
실적
(5개)
저역서명1 10
저역서명2 05
발행년 10
발행처 05
저역서구분 10
소계 40
계 1000
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 03
품질지표기준점수산정(데이터1
건기준)=오류유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 005
계 6개 오류유형 1
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
- 90 -
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
3000 3 055 150 000825
성명 10 2 035 100 000350자택주소 3 0 000 10 000000자택우편번
호
3 2 035 20 000233
자택전화번
호
4 0 000 10 000000
핸드폰번호 6 0 000 10 000000E-mail 9 0 000 10 000000소계 45 7 125 310 001408
소속기
관사항
(7개)
소속기관명 1000 20 100 000000부서명 80000 200 05 000000직위명 80000 200 20 000000사무실전화
번호
80000 200 10 000000
기관주소 80000 200 30 000000인력(직업)구
분
80000 200 10 000000
최초임용일 80000 200 10 000000소계 481000 1220 000 185 000000
계 1000 01
주민등록번호 한글성명 영문성명 한문성명자택우편번
호
630421-0000000 백중환Joong hwan
Baek
412220
(형식 015)
630421-0000000 백종석Baek Jong
Seok
6304210000000
(형식 015)백인열 Baek IN Youl 白寅烈 711-822
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
국가RampD참여인력 100000건 100000건 3000건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
검사물량 집계표 예시
오류율산정표 예시
검수데이터 예시
- 91 -
630421-0000000 백승호
(오기 02)백제훈
630421-0000000 백종완
630421-
(오기 02)백장선 Jangsun Baek
白壯선
(형식 015)
502-
(오기 02)
630421-0000000 백승호1213132
(오기 02)
630421-0000000 백석형
630421-0000000 백석형
품질지표별
기준점수의
합
055 035 035
데이터별 품질지표 기준 점수
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 03
품질지표기준점수산정(데이
터1건기준)=오류유형별점수
의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 005
계 6개 오류유형 1
- 92 -
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수
기관마다 다름
hurims에 각 기관별 인력관리번호와 NTIS 인력관리번호매핑표관리함
RNO 주민등록번호 필수
-포함한 14자리 일 경우만 연계함
주민등록번호는 기관마다 유일해야 하는데 특정기관은주민등록번호 1개 당 n개의 인력관리번호 존재하는 경우 있음
=gt 연계기관에 연락해서 주민번호 중복되지않게 요구해서 처리
=gt 현재는 맨 처음 해당 데이터의 인력관리번호만 유지
KOR_PSN_NM 한글성명 필수
한글성명은 처음 hurims에 insert될때만 반영하고 update될때는반영하지 않음
기관마다 실명인증을 안 하는 곳이 있기 때문에 같은주민번호인데 성명이 다른 경우가 있음
CHN_PSN_NM 한문성명(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
ENG_PSN_NM 영문이름(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
ZIP_CD 우편번호
(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
hurims에 우편번호||주소1||주소2가 널일 경우만 반영ADDR1 주소1ADDR2 주소2
HOME_TEL_NO 집전화(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
CP_NO 핸드폰번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
EMAIL E-mail(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
MSTR_CLS_CD1 부처(기관)코드1
123에 대중소의 코드를 넣는게 아니라 각각의 분류를 넣어야함
매핑정보가 없으면 반영 못함
1n으로 매핑되는 경우 처음 select 되는 최하위 분류로 매핑함
현재 ntis에는 분류명을 저장하는 필드가 없음=gt분류명은 반영안함
MSTR_CLS_NM1부처(기관)분류명1
MSTR_CLS_CD2부처(기관)분류코드2
MSTR_CLS_NM2부처(기관)분류명2
MSTR_CLS_CD3부처(기관)분류코드3
MSTR_CLS_NM3부처(기관)분류명3
17 데이터 이관
참여인력 기본정보 이관 방안
- 93 -
MP_TYPE 평가위원구분Y일 경우 평가위원 pool Db에 자동 등록함
=gt N 또는 Null일 경우 기존에 평가위원 이면 반영 안함
GENDER_DIV_CD 성별구분 없을 경우 주민번호로 판별
BDT 생년월일 없을 경우 주민번호로 판별INFO_OPEN_SLCT 정보공개구분 없을 경우 비공개로 저장
PINFO_OFR_USE_APR_YN
개인정보제공활용동의여부
N일 경우 최종수정일을 기준으로 기존 동의에서 비동의로변경함
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG 데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
HM_ID 인물ID 인물아이디는 기관에서 넣지 않아도 됨
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
ORG_NM 기관명 필수
hurims에 기관이형DB에 존재하면 대표기관명이형기관코드를 저장하고 없을 경우에는 기관명을그대로 hurims에 저장하고 정제 및 신규 발급을 통해매핑해야함
WORK_DEPT_NM 근무부서명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
POSITION_NM 직위명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
직위명으로 자동코드 매핑하고 직위코드가 없으면 기타999코드로 저장하고
직위명필드에는 연계기관의 직위명 그대로 저장함
ZIP_CD 우편번호
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
hurims에 우편번호||주소1||주소2가 널일 경우만 반영ADDR1 주소1ADDR2 주소2OFFICE_TEL_NO 사무실전화
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
중복체크 기준
- 주민등록번호(주민등록번호 성명이 없으면 반영하지 않음)
소속기관 사항 이관
- 94 -
FIRST_EMP_DT 최초임용일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MP_TYPE 인력구분기관에서 넣지 않아도 되고 기관이형DB에 의해 자동매핑됨
HOFF_DIV_CD 재직구분코드
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일경우에는 재직중으로 인정함
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장
ORD_NO 순번 필수 hurims의 순번으로 저장
DEGREE_ACQ_UNIV_NM 학위취득대학명 필수
hurims에 기관이형DB에 존재하면 대표기관명이형기관코드를 저장하고 없을 경우에는 기관명을그대로 hurims에 저장하고 정제 및 신규 발급을 통해매핑해야함
SDEPT_NM 학과명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
학과명으로 코드매핑하고 매핑안되면 학과명필드만반영함
매핑안된 학과명은 나중에 정제 작업에 의해 매핑함
MAJOR_NM 전공명 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
전공명으로 코드매핑하고 매핑안되면 전공명필드만반영함
매핑안된 전공명은 나중에 정제 작업에 의해 매핑함
GRAD_DT 졸업일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함ENT_DT 입학일 필수 날짜가 1900년 이전이거나 현재보다 크면 삭제함DEGREE_CD 학위구분 필수
ACQ_NAT_CD 취득국가코드(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
DEGREE_ACQ_DT 학위취득일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
소속기관명이 없을 경우 반영하지 않음
학력 사항 이관
- 95 -
ADVISOR_NM 지도교수명기관에서 넣지 않아도 되고 기관이형DB에 의해 자동매핑됨
KOR_THESIS_NM
학위논문제목국문
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일경우에는 재직중으로 인정함ENG_THESIS_NM
학위논문제목영문
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장
ORD_NO 순번 필수 hurims의 순번으로 저장
WORK_ORG_NM 근무처명 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
POSITION_NM 직위명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
WORK_START_DT 근무시작일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
WORK_END_DT 근무종료일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
학위취득대학명 학위가 없을 경우 반영하지 않음
경력 사항 이관
- 96 -
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
INSTIT_LST 학협회명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
POSITION_NM 직위 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용INSTIT_JOB_NM 담당업무
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
INSTIT_ACT_START_DT 학회활동시작일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
INSTIT_ACT_END_DT 학회활동종료일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
CERT_NM 자격증명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
CERT_ISSUE_ORG_NM 자격증발행처 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
CERT_ACQ_D 자격취득일 필수 중복 체크하는 기준에만 쓰임
근무처명이 없을 경우 반영하지 않음
소속 학협회 사항 이관
학협회명이 없을 경우 반영하지 않음
자격 사항 이관
- 97 -
Tinsert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
KOR_PAPER_NM 논문제목국문 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
ENG_PAPER_NM 논문제목영문
중복 체크하는 기준에만 쓰임
insert 할때만 적용
PAPER_PUB_DT 논문발표일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ROLE_SLCT 역할구분(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_ORG_NM 발행처명(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
JRNL_NM 학술지명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
JRNL_SLCT 학술지구분 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용SCI_TYPE_SLCT SCI여부
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
ISSN ISSN번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_BK 게재권집(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_ISSUE 게재호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
START_PG 시작페이지(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
END_PG 종료페이지 (최종수정일이 최신이고 널이 아님) 또는 (hurims가
자격증명이 없을 경우 반영하지 않음
논문실적 이관
- 98 -
널일)때 update에 반영CO_AUTHOR_NM 공동저자명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
PTAPP_SLCT 특허구분 필수(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PTAPP_REGIST_NO 출원등록번호 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
IPR_NM 지식재산권명 필수(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
ACQ_DT 취득일 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ACQ_SLCT 취득구분
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
공동활용항목에 없는데 널일경우 무엇으로 봐야하나(확인요)
PTAPP_REGIST_NAT_CD
출원등록국가코드
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일 경우에는 대한민국으로 자동 반영함(확인요)MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
논문명이 없을 경우 반영하지 않음
지식재산권실적 이관
- 99 -
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
TRNSWRT_SLCT 저역서구분 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
KOR_TRNSWRT_NM 국문저역서명 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
PUB_ORG_NM 발행처명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
PUB_YR 발행년도 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ISBN ISBN번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
AWARD_NM 수상명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
AWARD_ACQ_YM 수상년월 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
AWARD_GRANT_ORG_NM 수여기관 필수 중복 체크하는 기준에만 쓰임
지식재산권명 출원등록구분 특허구분 출원등록번호가 없을 경우 반영하지 않음
저역서실적 이관
저역서명 저역서구분이 없을 경우 반영하지 않음
훈포장실적 이관
- 100 -
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드 훈포장명이 없을 경우 반영하지 않음
- 101 -
2 인력정보 영문이력 입력 매뉴얼
21 개요
211 목표
연구자 이력정보 영문 번역을 통한 DB 구축(1000건)
- 영문이력 번역 대상 항목 선정
기본정보 재직기관 최종학위 경력사항 논문실적 연구실적 특허
- 영문이력정보 관리 기능 개발 및 영문이력DB 구축
- 영문이력DB에 대한 본인확인 안내메일 발송
인물정보에 대한 영문 검색서비스 제공
212 DB구축 공정
- 102 -
항 목 세 부 항 목 영문명 비고
기본(BasicInformation)
기본정보 영문성명 English Name - 한글이력정보와 공동 사용- 전문분야는lsquo08 개정 분류코드 영문명 활용
휴대전화(국가번호)
Cellular PhoneNumber
E-mail E-mail
개인홈페이지 Homepage
전문분야 전문(연구)분야 Research Field 1
Research Field 2
Research Field 3
검색키워드 전문분야명 입력
재직기관(organization)
기관명 Organization Name - 현재 재직기관사항 1개 입력
부서명 Department
직위 Job title(position)
우편번호 Postal Code
주소 Address
전화(국가번호) Telephone
팩스(국가번호) Fax
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) Degree Code
학위취득일 GraduationDate
학교명 School
전공명 Major
22 DB구축 목록 및 범위
221 DB구축대상 및 항목 정의
DB구축대상 수집된 영문 이력서 번역 및 희망자에 대한 이력정보 번역
- 수집된 이력서 번역
middot 수집된 한글이력서 반영하여 번역 수행
middot 수집된 영문이력서 입력
- 이력서 번역 대상자
middot 참여인력 또는 평가위원 서비스 대상자
middot 논문실적 경력사항 등의 데이터가 충실한 인력
DB구축 대상 항목 정의
- 103 -
경력(Career)
경력사항(CAREER)
시작년월 Start Date - 재직 경력으로 주요 경력입력 현 재직정보제외
종료년월 End Date
재직기관명 Organization Name
직위 Position(Job Title)
실적ResearchResult
논문실적(paper)
논문명 Title - 최근 5년 이내만 입력
저널명 Journal Name
게제(권)집 Volume
게제호 Number
시작페이지 Start Page
종료페이지 End Page
게제년월 Date of Publication
공동저자명 Co-Author
비고 Etc
연구실적ResearchProject
시작년월 Start Date
종료년월 End-Date
발주기관 Funding organization
참여구분(역할)-코드
Role
연구실적명 title
특허(patent)
출원등록구분-코
드
appliedregistered
출원등록번호 number
출원등록국가-코
드
National Code
특허출원명 Patent name
출원등록일자 Date
- 104 -
항 목 세 부 항 목 비고
기본(BasicInformation)
기 본정보
영문성명 - 각각 형태가 다른 영문성명을ldquoGilDong Hong 형태로 변경 필요
T
휴대전화(국가번호)
- 휴대전화를 표준형태로 변경 필요(외국 휴대전화만 국가번호 표시)middot 대한민국 010--middot 외국 +국가번호---
T
E-mail abctestcom 형태 T
개인홈페이지
입력 시 http을 제외하고 입력T
전 문분야
전문(연구)분야
- 전문분야는 lsquo08 개정 분류코드 영문명 활용
- 본인 확인에 의해 본인이 직접 선택하도록 함
- 검색키워드 필드에 전문분야명을 입력
재 직기관(organization)
기관명 - 대표기관명- 기관명이 주소정보에 포함되어 있는경우 존재
부서명 - 부서명이 주소정보에 포함되어 있는경우 존재
직위 - 여러개의 직위 존재우편번호 - 주소정보에 기관명 부서명 포함되어
있는 경우 존재- 영문우편번호DB를 이용 가능
주소
전화(국가번호)
- 전화번호를 표준형태로 변경 필요(외국 전화만 국가번호 표시)middot 대한민국 042--middot 외국 +국가번호---
T팩스(국가번호)
학력(Academiccarrer)
최 종학위(FinalDegree)
학위(코드) - 8 박사- 5 석사- 2 학사
C
학위취득일 - YYYY-MM-DD형태 D학교명 - 대표기관명전공명
경력(Career)
경 력사항(CAREER)
시작년월 - YYYY-MM형태 D종료년월 - YYYY-MM형태 D
재직기관명 - 부서명 포함직위 - 여러개의 직위 존재
실적ResearchResul
논 문실적(paper
논문명 - 영문제목 일부 존재저널명
23 데이터 분석 내역
231 세부 항목별 영문이력정보 분석
번역을 위한 영문이력정보 분석
∙ D 날짜형태변환 C 코드화 T 표준형태변환
- 105 -
t ) 게제(권)집
게제호시작페이지종료페이지게제년월 - YYYY-MM형태 D공동저자명 - 공동저자명이 구분자로 N명이상 존
재연 구실적ResearchProject
시작년월 - YYYY-MM형태 D
종료년월 - YYYY-MM형태 D발주기관참여구분(역할)-코드
A 연구책임자B 참여연구원
C
연구실적명 - 영문제목 일부 존재특허(patent)
출원등록구분
-코드C
출원등록번호출원등록국가
-코드C
특허출원명출원등록일자
- YYYY-MM-DD형태D
항 목 세 부 항 목
기본(BasicInformation)
기본정보 영문성명
휴대전화(국가번호)
개인홈페이지
전문분야 전문(연구)분야
재직기관(organization)
기관명
부서명
24 DB구축 절차 및 작업 지침
241 DB구축 지침
DB구축 내용
수집된 연구자 영문 이력서 입력을 통한 DB 구축
연구자 이력정보 영문 번역을 통한 DB 구축
DB구축 항목
DB구축 대상 항목
- 106 -
직위
우편번호
주소
전화(국가번호)
팩스(국가번호)
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드)
학위취득일
학교명
전공명
경력(Career)
경력사항(CAREER)
시작년월
종료년월
재직기관명
직위
실적ResearchResult
논문실적(paper)
논문명
저널명
게제(권)집
게제호
시작페이지
종료페이지
게제년월
공동저자명
비고
연구실적ResearchProject
시작년월
종료년월
발주기관
참여구분(역할)-코드
연구실적명
특허(patent)
출원등록구분-코드
출원등록번호
출원등록국가-코드
특허출원명
출원등록일자
- 107 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
DB구축
준비
계획 수립
번역대상자분석 번역대상자 데이터 분석 대상자 선정 분석 내역 작성
절차 협의선처리 번역 번역확인전문가검수 본인확인KISTI검수
DB구축 대상 확정
매뉴얼 작성
입력 매뉴얼 구성내용
DB구축 개요 및 절차정의
DB구축 대상정의 및 범위
입력 항목별 기준 및 예시
입력프로그램 사용법
전환 코드표
표준 양식
입력 매뉴얼 검토및 확정
입력 매뉴얼 초안작성
상세일정계획수립
입력 량을 분석하여 투입인력대비 주월별 입력 계획대비 실적 산정
일정 검토 및 확정 일정계획 작성
작업 환경구축
작업 환경 및번역자 구성 입력 환경 구성
번역자 선정
영문이력정보 관리기능 개발
입력 교육 실시
번역자를 대상으로 교육실시 및 교육결과서 작성
입력작업 교육 실시
DB구축진행
선처리번역번역확인전문가검수
선처리번역번역확인전문가검수
DB구축 추진결과번역 및 품질활동수행
추진현황보고 실적 보고실적 확인 및 이슈사항 협의
주별진척보고
이슈사항 및 문제점 보고
DB구축완료
서비스DB이관 검수및 납품
서비스DB이관
완료된 영문이력DB의서비스화 이관 확인 데이터 이관
데이터 검수(최종 확인)
영문이력 DB 검사 (샘플링 검수) 검수(샘플링)
검수 데이터 추출제공
242 DB구축 단계별 작업 지침
243 DB구축 항목별 세부지침(선처리)
공통사항
Ⅰ 공통사항
1 기존에 존재하는 영문명은 입력된 그대로 유지하되 일부 정제 필요
- 108 -
원본데이터 입력데이터 입력요령
H20 A2 H20 A2
- 서식에 의한 특수문자는 텍
스트 형태 그대로 입력함
k- iexcl k - ε
- 수식도구에 의한 특수문자는
특수문자표를 참조하여 호환되
는 경우에만 입력하고 그렇지
않으면 수식만 제외하고 입력
참고3 특수문자표
원본데이터 번역데이터 입력요령
문장의 첫 단어
이름장소 등 고유명사
직함칭호의 축약형
1인칭 주어
도시이름월요일휴일시대 등
단어의 시작글자 대문자 표기
책글노래영화제목 등
a an and at by for in
of로 시작할경우
a an and at by for in of
를 제외한 시작문자 대문자로
표기
장소를 지칭하는 고유명사
internet 등Internet 시작문자 대문자 표기
국가언어등을 지칭하는 단어
(고유명사 일반명사의 개념)시작문자 대문자 표기
교과 과목명 시작문자 소문자로 표기
외국기관명 외국대학명 논문제목 연구제목 등
2 한글영문 이외의 표기된 외국어는 그대로 유지
(단 한글영문을 일부 포함한 외국어는 번역 시행)
3 모든 항목은 좌우의 공백을 제거하고 입력
가 줄바꿈 문자나 좌우의 공백문자를 제거하고 입력
나 데이터 사이에 공백문자가 두 개 이상인 경우에는 공백문자를 한 개로 입력
4 휴대전화 및 전화번호는 대한민국의 경우에는 국가번호를 표시하지 않고 외국의 경우에
만 국가번호(+국가번호)를 표시함
5 특수문자의 입력
6 대소문자 규칙
가 번역의 경우 대소문자 표준 준수
해당 기관홈페이지에 표기되어있는 공식영문명칭의 대소문자에 따라 선처리 및 번역
단 번역 시 단어 시작글자만 대문자료 표기
- 109 -
사이트명 url 비고
NAVER 백과사전 http100navercom 기관명 홈페이지 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr기관명 홈페이지 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 기관명 검색서비스
KIS-Report httpwwwkisreportcom한국신용평가정보 기업보고서
국내일반기업 영문명 기재
KJTRANS httpwwwkjtranscokr학교 및 연구기관 분야별 검
색가능
영문표기kr httpwww영문표기kr 기관학교연구기관 검색가능
학위논문 원문 공동이용협의회 httpthesisorkr협의회 대학기관 목록
(연구 발주기관)
NDSL 연구실적 검색 httpscholarndslkrindexdo연구실적 검색 가능
(연구 발주기관)
Paper Searchnet httpwwwpapersearchnet논문 및 저널명 검색서비스
(연구 발주기관)
기관명
Ⅰ 소속기관사항(기관명) 학력사항(학교명) 경력사항(재직기관명) 연구실적(발주기관
명)
1 선처리 작업 수행 시 고려 사항
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
선처리 작업 시 기관명이 Full name 과 약어 기재를 원칙으로 함
단 약어가 존재하지 않을 경우 기재하지 않음
부서직위명을 포함하고 있을 경우 포함하여 선처리
단 소요시간이 길어질 경우 부서직위명 한글 그대로 입력)
업무명이나 업무설명이 포함된 경우 한글 그대로 입력 (추후 번역시 정제)
웹 검색 시 해당기관 홈페이지에 기재되어있는 영문을 우선순위로 선처리
웹 검색 및 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
2 기관명 웹 검색 url 목록
- 110 -
원문 번역 비고
상호명 ldquo(주)rdquo의 번역
상호명 ldquo(사)rdquo의 번역
상호명 ldquo(유)rdquo의 번역
상호명 ldquo(일)rdquo의 번역
상호명 ldquo(재)rdquo의 번역
Co LTd
Association
INC
Foundation
영국식 주식회사 표기 번역
기관명 약어의 경우
기관명(약어)
기관명
약어로 번역
Full name(약어) 번역
Full name 번역
약어가 존재하지 않을 경우
Full name만으로 번역
원문 번역 비고
((주)한일합섬Hanil Synthetic Fiber Co
Ltd
- 오탈자 정제
웹검색
원문DB의(rarr정제
(system2010)산자부과기부
(system2010)Ministry of
Commerce Industry and
EnergyMinistry of Science
and Technology
- 기관명n 괄호명칭 ()
웹검색
n개의 기관명 모두 선처리
()괄호안의 표기내용 기재
(주)부일건화(주)아해BUIL KEON WHA Co
LtdAhae Co Ltd
- 기관명n
웹검색
n개의 기관명 모두 선처리
(주)비츠로테크 공장장VITZRO TECH Co Ltd
Plant Manager
- 직위명 포함
웹검색
직위명 번역 선처리 기재
(재)전북생물산업진흥원Jeonbuk Bioindustry
Development Institute
-상호명 (재)
웹검색
해당기관 홈페이지 영문명기
검색 가능한 url은 추후 추가 가능
3 번역 시 고려사항
상호명 번역 지침
번역 시 고려사항
4 선처리 예
- 111 -
재
(캐나다) 오타와 대학교 (Canada)University of Ottawa
-괄호()
웹검색
괄호()내용 번역 선처리 기재
강원대학교 의과대학Kangwon National University
College of Medicine
-학과명
웹검색
학과명 번역 선처리 기재
국립 지바대학교(일본) National Chiba University(Japan)
-괄호()
웹검색
국립 번역 선처리 기재
괄호()내용 번역 선처리 기재
미국 Cornell대학교 Section of
Molecular Biology
USA Cornell College Section
of molecular Biology
-한글영문명
웹검색
미국 번역 선처리 기재
영문명 그대로 기재
엔에스(Natural Science Co) 공
동설립
NS(Natural Science Co
Ltd)
-괄호() 업무설명
웹검색
괄호() 영문명 그대로 유지
업무설명 ldquo공동설립rdquo 제거
웅진출판(주) 편집국 생태전집
부 - lsquo한국의 자연탐험rsquo 제작 참
여
Woongin Publications Co Ltd
Editorial ecological Colledted
Works
-부서명 업무설명
웹검색
부서명 번역 선처리 기재
업무설명 ldquolsquo한국의 자연탐험rsquo
제작참여rdquo 제거
11 국제산학연 공동기술개발지
원사업
Korea Association of Industry
Academy and Research
Institute(KAIARI) Business
support for academic-industrial
common technology
development
-괄호()
웹검색
국립 번역 선처리 기재
괄호()내용 번역 선처리 기재
기관명 코드 참조 첨부7 기관명 코드
- 112 -
사이트명 url 비고
NAVER 백과사전 http100navercom 통합 검색 서비스
NAVER 사전 httpendicnavercom 표준 영문직위 검색가능
KJTRANS httpwwwkjtranscokr학교 및 연구기관 분야별 검
색가능
영문표기kr httpwww영문표기kr 직위명 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr통합 검색 서비스
원문 번역 비고
교수 (학부장) Professor(Dean)
-직위명n 괄호() 직위명
웹 검색 및 직위표 코드참조
모두 번역 및 선처리
교학부장 겸 학과장 Dean Chair
-직위명n
웹 검색 및 직위표 코드참조
모두 번역 및 선처리
사원(전장설계부)Employee(Department of Wiring
Harness Design)
-직위명 부서명포함
웹 검색 및 직위표 코드참조
부서명 포함 번역 및 선처리
선임연구원(고주파제어시스템)Senior Researcher(High-Frequency
Wave)
-직위명 업무명
웹 검색 및 직위표 코드 참조
직위명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
직위가 n개의 경우 n개로 선처리
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당기관 홈페이지에 기재되어있는 직위 영문을 우선순위로 선처리
웹 검색 불가시 영문 직위명을 참조하여 번역
번역 작업 시 영문 직위명은 표준 영문 직위 표기에 따라 번역
웹 검색 및 영문직위표 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
2 직위명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
3 영문직위 번역 코드 참조
4 선처리 예
- 113 -
사이트명 url 비고
NAVER 백과사전 http100navercom 통합 검색 서비스
KJTRANS httpwwwkjtranscokr학교 및 전공명 검색가능
(자료실영어표현 강좌실)
영문표기kr httpwww영문표기kr 전공명 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr통합 검색 서비스
NAVER 사전 httpendicnavercom 표준 영문직위 검색가능
원문 번역 비고
전기전자전자통신공학Electrical Electronics Communications
Engineering
-전공명n
웹검색 및 코드표 참조
전공명n개 n갯수만큼 선처리
하수도 Sewerage-전공명
웹검색 및 코드표 참조
업무명 번역 및 선처리
연 구 원 ( R E S E A R C H
ASSORIATE)Research Associate
-직위명 영문명 포함 정제
웹 검색 및 직위표 코드참조
정제 AssocraterarrAssociate
괄호() 제거(동일한 영문명
전공명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
전공이 n개의 경우 n개로 선처리
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당학교 홈페이지에 기재되어있는 전공 영문을 우선순위로 선처리
웹 검색 및 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
ldquoOO학과rdquo 항목의 경우 동일한 ldquoOO학rdquo으로 선처리 번역으로 입력
동일한 한글명에 대한 학문 분야별 영문표기명이 다를 경우 표준명칭으로 선처리
2 전공명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
3 선처리 예
- 114 -
사이트명 url 비고
NDSL 논문실적 검색 httpscholarndslkrindexdo 논문검색시 저널명 발췌
과학기술학회마을httpsocietykistirekrmainht
ml학술지검색 메뉴 검색
KJTRANS httpwwwkjtranscokr 자료실
DBpiahttpwwwdbpiacokrpublicati
onview_resultasp저널명 및 논문 검색가능
구글httpwwwgooglecokr
httpscholargooglecokr저널명 및 논문 검색가능
국회도서관httpsu-libnanetgokrdlSear
chIndexphp논문 및 저널명 검색가능
휴리스틱알고리듬 Heuristuc Algorithm
-원문 정제
웹검색 및 코드표 참조
정제 ldquo알고리듬rdquorarrlsquo알고리즘ldquo
면역학(면역학) Immunology
-전공명n 괄호()명
웹검색 및 코드표 참조
괄호()명 제거(동일한용어)
19C영미시19C British and American
Poetry
-숫자영문명
웹검색 및 코드표 참조
19Crarr그대로 유지(19세기 표
현방식)
저널명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당 논문게재지 홈페이지의 영문 표기로 선처리
동일한 논문명으로 여러개의 저널명이 검색될 경우 게재권(게재호) 게재페이지 게재년
월 등을 확인후 선처리
웹 검색 시 영문명이 존재하지 않을 경우 번역
2 저널명 웹 검색 url 목록
- 115 -
NAVER 전문정보httpacademicnavercommain
nhn논문 및 저널명 검색서비스
Paper Searchnet httpwwwpapersearchnet 논문 및 저널명 검색서비스
SpringerLinkhttpwwwspringerlinkcomho
memainmpx논문 및 저널명 검색서비스
원문 번역 비고
Proc 대한조선학회 추계연구발
표회
Proc International Journal of
Naval Architecture and Ocean
Engineering(JNAOE) Fall
Conference
-원문 영문 포함 일부번역
웹검색
영문명 유지
일부번역 ldquo추계연구발표회rdquo
대한건축학회논문집제20권Journal of the Architectural
Institute of Korea
-부서명 업무설명
웹검색
부서명 번역 선처리 기재
업무설명 ldquolsquo한국의 자연탐험rsquo
제작참여rdquo 제거
대한두개안면성형외과학회Korean Cleft Palate-Craniofacial
Association
-공식 영문저널명 특수문자
웹검색
저널홈페이지에 기재된 특수
문자 포함 선처리
대한두개안면성형외과학회지
Journal of the Korean Cleft
Palate-Craniofacial Association(J
Korean Cleft Palate-Craniofac
Assoc)
-약어 저널명
웹검색
저널홈페이지에 기재된약어
선처리
대한토목학회 학술발표회 논문
집 CD-ROM
Proceedings of the Korean Society of
Civil Engineers(KSCE) Conference
Technical Journal CD-ROM
-약어 원문영문
웹검색
약어기재 영문명그대로 유지
표준
지침
Proceedings of
Journal of The 회차 Journal Name Conference 계절 년도(날짜) 개최지
예)Proceedings of
Journal of The 7th Journal Name Conference Fall 2009 09 12 Tokyo Japan
저널명
없음저널명이 없을 경우 원문 순서 그대로 번역
검색 가능한 url은 추후 추가 가능
3 선처리 예
4 저널명 번역시 표준 지침
5 저널명 번역시 유의 사항
- 116 -
원본데이터 번역데이터 입력요령
학술발표학술발표회
학술연구발표학술연구발표회
번역
Journal Name Conference 저널명 뒤에 기재
논문집요약집초록집논문
초록집 번역Proceedings of Journal Name 저널명 앞에 기재
OO학OO학회OO학회지 Journal of Journal name 저널명 앞에 기재
회차 계절 날짜 개최지OOth Journal Name Spring
2010 Seoul Korea
회차 저널명 앞에 기재
계절날짜개최지 저널명 다음
구신 저널명 선처리번역 웹으로 검색된 저널명을 기준 존재하지 않을 경우 신 저널명
6 저널명 대소문자 표기 지침
middot 단어의 첫글자 대문자 표기
244 DB구축 항목별 세부지침(번역)
기본정보
Ⅰ 영문성명
1 영문성명의 입력포맷 홍길동 =gt GilDong Hong
원본데이터 입력데이터 입력요령
HONGGILDONG
Gil-Dong Hong
Hong Gil-Dong
GilDong Hong - 영문성명 입력표준으로 변경
2 영문성명 번역시 고려사항
기존에 존재하는 영문명은 유지
논문실적의 영문명이 존재할 경우 영문명 입력
- 단 논문실적 항목의 공동저자명에 약어 축약어의 경우 영문성명은 Full name기재
번역시 로마자 표기법에 준수하여 번역
참고 로마자 표기법
- 117 -
원본데이터 입력데이터 입력요령
017)- 017-- - ldquo-rdquo구분자로 변경
+82-10-2497- 010-2497-
- 대한민국은 국가번호 제외하
고 입력
- 휴대폰구분번호 앞에 ldquo0rdquo표
시
1-11-- +1-11--- 외국의 휴대전화는 +국가번
호 붙여서 입력
011-123 입력하지 않음- 휴대전화번호가 완전하지 않
은 형태는 입력하지 않음
Ⅱ 휴대전화
1 휴대전화의 입력포맷
대한민국 휴대폰구분번호-국번-전화번호 (대한민국은 국가번호 제외하고 입력)
외국 +국가번호-휴대폰구분번호-국번-전화번호
Ⅲ E-mail
1 E-mail의 입력포맷 abctestcom
Ⅳ 개인홈페이지
1 개인홈페이지의 입력포맷 wwwhomepageurlcom (http 제외하고 입력)
2 한글 도메인의 경우 영문 도메인을 찾아 입력
Ⅴ 전문(연구)분야
1 전문(연구)분야의 코드 입력은 이력서 본인에 의해 과학기술표준분류별 전문분야를 선택
하도록 함
재직기관
Ⅰ 기관명(선처리 작업)
- 118 -
부서명 표현 항목 표현여부
Department of경력사항부서명 기재
전공명(학력사항) 삭제
College of경력사항부서명 기재
전공명(학력사항) 삭제
Ⅱ 부서명
1 번역 수행
번역 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
번역 작업 해당 기관홈페이지의 영문명을 우선순위로 번역
공식화된 영문명이 존재하지 않을 경우 부서명 참조
참조 부서명 코드
기관홈페이지 및 공식화된 영문명이 존재하지 않을 경우 번역수행
부서 영문명은 Department of 등으로 시작하며 약어 및 축약어 기재는 불가하며 모두
Full name 번역을 원칙으로 번역수행
Ⅲ 직위(선처리 작업)
Ⅳ 우편번호 주소
1 영문 우편번호DB 참조
2 주소의 기본주소와 상세주소를 합침
3 우편번호 및 영문 번역주소 검색
httpwwwkoreapostgokrservletkpppostPostInfo (우정사업본부)
4 검색된 번역 영문 주소 입력(단 기관명과 영문주소와 동일하지 않을 경우 기관명을기준)
5 존재하지 않는 상세주소의 경우 로마자 표기법에 준수하여 번역
참고 로마자 표기법
6 우편번호 입력시 웹검색과 원본이 다른 경우 원본그대로 우편번호 유지
(영문주소는 웹검색 그대로 번역 및 입력)
Ⅴ 전화 팩스
1 전화의 입력포맷
대한민국 지역번호-국번-전화번호(내선번호) lt= 대한민국은 국가번호 제외하고 입력
- 119 -
원본데이터 입력데이터 입력요령
042)- 042-- - ldquo-rdquo구분자로 변경
+82-31-2497- 031-2497-
- 대한민국은 국가번호 제외하
고 입력
- 지역번호 앞에 ldquo0rdquo 표시
1-11-- +1-11--- 외국의 전화번호는 +국가번
호 붙여서 입력
061-123 입력하지 않음- 전화번호가 완전하지 않은
형태는 입력하지 않음
02-123-1234(12) 02-123-1234(12) - 내선번호는 그대로 입력
외국 +국가번호-지역번호-국번-전화번호(내선번호)
학력사항
Ⅰ 학위취득일
1 학위취득일 입력포맷
ldquoYYYY-MM-DDrdquo 형태
Ⅱ 학교명(선처리 작업)
Ⅲ 전공명(선처리 작업)
경력사항
Ⅰ 시작년월 종료년월
1 시작년월 종료년월 입력포맷
ldquoYYYY-MMrdquo 형태
시작년월은 종료년월보다 작거나 같아야 함
- 120 -
사이트명 url 비고
NDSL 논문실적 검색 httpscholarndslkrindexdo 논문검색시 저널명 발췌
과학기술학회마을httpsocietykistirekrmainht
ml학술지검색 메뉴 검색
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr저널명 및 논문 검색가능
Ⅱ 재직기관명 직위(선처리 작업)
Ⅲ 직위(선처리 작업)
논문실적
Ⅰ 논문실적 형태
보통 논문제목 저널명 게재권 (게재호) 게재페이지 게재년월 공동저자명으로 작성
volume (Vol) ( 정기 간행물 1년분의 ) 권
issue(ISS)또는 No또는 (숫자) 게제호 예) Vol9 ISS 4 또는 v9 no4 또는 9(4)- 9
권 4호
Ⅱ 공동저자명
웹 검색을 통한 원문 출처의 번역 방식에 따라 입력
저자명과 저자명은 ldquo rdquo으로 구분자(마지막 입력 후 ldquo rdquo 입력)
번역 시 Full name으로 입력하며 로마자 표기법을 준수함
Ⅲ 논문명
1 번역 작업 수행
번역 작업 시 기존 논문 영문명은 그대로 유지하되 일부 정제 필요
웹 검색 시 해당 논문게재지 홈페이지의 영문 표기로 선처리
동일한 논문명으로 여러개의 저널명이 검색될 경우 게재권(게재호) 게재페이지 게재년
월 등을 확인 후 선처리
웹 검색 시 영문명이 존재하지 않을 경우 번역
2 논문명 웹 검색 url 목록
- 121 -
국회도서관httpsu-libnanetgokrdlSear
chIndexphp논문 및 저널명 검색가능
NAVER 전문정보httpacademicnavercommain
nhn논문 및 저널명 검색서비스
Paper Searchnet httpwwwpapersearchnet 논문 및 저널명 검색서비스
DBpiahttpwwwdbpiacokrpublicati
onview_resultasp저널명 및 논문 검색가능
SpringerLinkhttpwwwspringerlinkcomho
memainmpx논문 및 저널명 검색가능
검색 가능한 url은 추후 추가 가능
Ⅳ 저널명(선처리 작업)
연구실적
Ⅰ 시작년월 종료년월
1 시작년월 종료년월 입력포맷
ldquoYYYY-MMrdquo 형태
시작년월은 종료년월보다 작거나 같아야 함
Ⅱ 발주기관(선처리 작업)
Ⅲ 참여구분
1 참여구분 입력지침
연구책임자 참여연구원 중에서 선택하여 입력함(구분 불가능시 선택 안함)
Ⅳ 연구실적명
1 번역 작업수행
번역 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
번역 작업 시 웹검색을 통하여 정확한 연구실적명을 검색
웹 검색 시 공식화되어있는 영문을 우선순위로 번역
웹 검색 및 공식적으로 사용하는 연구실적명이 존재하지 않을 경우 번역
- 122 -
사이트명 url 비고
한국특허정보원httpwwwkiprisorkrkormai
nmainjsp국내특허실적 분야별 검색
구글 특허정보 검색서비스 httpwwwgooglecompatents해외 특허정보 검색서비스
(7백만개 이상 검색가능)
PCT 특허정보 검색서비스 httpwwwwipointpctdben PCT 특허 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 특허정보 검색서비스
사이트명 url 비고
NDSL 연구실적 검색 httpreportndslkrindexdo 연구실적 검색 가능
KJTRANS httpwwwkjtranscokr학교 및 연구기관 검색가능
(자료실영어표현 강좌실)
구글 httpwwwgooglecokr
NAVER 전문정보httpacademicnavercommain
nhn네이버 연구실적명 검색
Paper Searchnet httpwwwpapersearchnet 연구실적명 검색서비스
2 연구실적명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
특허실적
Ⅰ 출원등록구분
출원 등록 중에서 선택함
같은 특허에 대해 출원과 등록 모두 존재하면 등록정보만 입력함
출원 등록이 미구분시에는 선택하지 않음
Ⅱ 출원등록번호
특허 출원등록번호 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
Ⅲ 출원등록국가
- 123 -
사이트명 url 비고
한국특허정보원httpwwwkiprisorkrkormai
nmainjsp국내특허실적 분야별 검색
구글 특허정보 검색서비스 httpwwwgooglecompatents해외 특허정보 검색서비스
(7백만개 이상 검색가능)
PCT 특허정보 검색서비스 httpwwwwipointpctdben PCT 특허 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 특허정보 검색서비스
1 출원등록국가 입력지침
출원등록국가 코드를 찾아 입력
Ⅳ 특허출원명
1 특허출원명 번역지침
특허출원명 입력시 웹 검색을 우선으로 시행
웹 검색 후 영문명이 존재할 경우 그대로 입력
영문명이 존재하지 않을 경우 번역 시행
2 특허출원명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
Ⅴ 출원등록일자
1 출원등록일자 입력포맷
ldquoYYYY-MM-DDrdquo 형태
25 DB구축 검수
251 DB구축 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
- 자체적인 품질활동 점검표 작성등의 수행결과를 주기적으로 측정하여 품질목표를 달성
하도록 함
- 124 -
항 목 세 부 항 목 항목수 단위별가중치()
기본(BasicInformation)
기본정보 영문성명 5 15휴대전화(국가번호)E-mail개인홈페이지
전문(연구)분야-본인입력검색키워드
재직기관(organization)
기관명 7 20부서명직위우편번호
주소전화(국가번호)
검수 기준
- 에러율 전체 데이터(전체 항목 필드 기준)의 01 이하(품질목표 999)
- 에러 체크 방식 전체 데이터에서 본인확인 미완료 대상 중 무작위로 30 샘플링 하
여 검수
- lsquo10년도 10월 DB구축완료단계에 최종 검수 실시
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침
및 매뉴얼에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며
오류율 산정에서 제외함
검수방식 및 기준
- 수집된 영문이력서 원본 파일(hwp doc pdf 등)과 입력 완료된 영문이력DB를 육안검
사 함
- 오류 판단 기준은 KISTI가 작성한 DB구축 작업 지침서를 참조함
252 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 125 -
팩스(국가번호)
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) 4 15학위취득일학교명전공명
경력(Career)
경력사항(CAREER)
시작년월 4 15종료년월
재직기관명직위
실적ResearchResult
논문실적(paper)
논문명 9 15저널명게제(권)집게제호
시작페이지종료페이지게제년월공동저자명비고
연구실적ResearchProject
시작년월 5 10
종료년월발주기관참여구분(역할)-코드연구실적명
특허(patent)
출원등록구분-코드 5 10
출원등록번호
출원등록국가-코드
특허출원명출원등록일자
계 38 100
항 목 세부항목 검수대상
데이터수
오류데이터건
수
품질지표별
기준점수의 합
항목가중치
()
오류율산정
기본(BasicInformation)
기본정보(5개)
영문성명 30 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
단위별 가중치는 KISTI와 협의하여 결정함
항목별 오류율 산정 기준 정의
- 126 -
휴대전화(국가번호)
30
E-mail 30개인홈페이지
30
검색키워드
30
소계 150재직기관(o r gan ization)(7개)
기관명 40부서명 30
직위 30우편번호 10주소 30전화 (국가번호)
30
팩스(국가번호)
30
소계 200
학력(Academiccarrer)
최종학위(FinalDegree)(4개)
학위 (코드)
10
학위취득일
15
학교명 80전공명 45소계 150
경력(Career)
경력사항( C AREER)(4개)
시작년월 15
종료년월 15재직기관명
80
직위 40소계 150
실적ResearchResult
논문실적(paper)(9개)
논문명 40저널명 20
게제(권)집
20
게제호 20시작페이지
10
종료페이지
10
게제년월 10공동저자명
10
비고 10소계 150
연구실적(Researc
시작년월 15종료년월 15발주기관 20
- 127 -
hProject)(5개)
참여구분(역할 ) -코드
10
연구실적명
40
소계 100특허(patent)(5개)
출원등록구 분 - 코
드
10
출원 등록번호
20
출원등록국 가 - 코
드
35
특허 출원명
20
출원 등록일자
15
소계 100계 100
- 128 -
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형구분
오류요형별점수 비고
완전성
누락 - 코드 누락 02
품질지표기준점수산정(데이터1건기준)=오류
유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 01
유효성형식 - 패턴의 오류 02
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 02
계 6개 오류유형 1
기본정보
영문성명 휴대전화 E-mail 개인홈페이지 계
Hong Gil Dong
(형식 02)010-111- testcom
GilDong Hong+82-011-111-
(형식 02)
testcokr
(오기 02)
testcom
(오기 02)
(누락 02) 019-111_ testcokr testcokr
품질지표별
기준점수의 합04 02 02 02 1
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
국가RampD참여인력
영문이력DB
3000건 3000건 3000건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
검사물량 집계표 예시
검수데이터 예시
- 129 -
3 평가위원 데이터 최신성 유지 매뉴얼
31 최신성 유지 업무 개요
311 개요
평가위원 데이터 최신성 유지란 lsquo기 구축된 평가위원 DB 내의 각 데이터들이 가장 마지막
으로 업데이트된 시점을 기준으로 그 시점부터 현재까지의 기간 동안 누락된 대상 인력들
의 변경사항들을 해당데이터에 추가입력 및 수정해주는 것rsquo을 의미
또한 대상 인력의 변경사항 반영이외에도 기 입력된 데이터들의 내용을 검토하고 발견된
오류 및 누락정보에 대한 수정ㆍ보완 작업 역시 평가위원 데이터 최신성 유지의 일환
최신성 유지를 위해 먼저 대상 인력에 대한 정보 수집이 요구됨
- 130 -
312 최신성 유지 업무 절차
최신성 유지 업무 절차는 관리자와 담당자의 역할로 구분가능
관리자는 담당자의 업무할당 데이터 검수 업무보고 등을 수행하며 담당자는 할당된 대
상인력에 대한 데이터 수정 및 보완 작업 수행
최신성 유지 업무 절차를 순서별로 나열하면 다음과 같음
- 관리자는 대상인력에 대한 전체리스트를 작성하고 이를 각 담당자들에게 일정량씩 할당
- 담당자는 할당된 대상인력에 대한 정보를 수집하고 기 입력된 데이터와의 비교를 통해
변경사항에 대한 수정 및 추가입력
- 담당자는 대상인력에 대한 정보를 수집한 출처 및 기타 비고사항에 대한 의견 등을 작
성하여 할당량에 대한 작업 완료시 관리자에게 보고
- 관리자는 보고된 작업결과물을 취합하여 정리하고 대상인력에 대한 정보가 잘 수집되고
입력되었는지 검토하여 수정 및 보완
- 관리자는 일일별 완료된 작업 결과 및 비고사항을 작성된 양식에 따라 담당 책임자에게 보고
- 131 -
32 대상 인력(평가위원) 정보 수집 방법
대상 인력의 정보를 수집하기 위한 방법은 크게 3가지로 구분
- 대상 인력에게 이력파일 요청
- 웹검색(기관홈페이지 개인홈페이지 및 각종 포털사이트)
- 신문기사의 인사ㆍ동정 모니터링
321 대상 인력에게 이력파일 요청
E-Mail 등을 통해 대상 인력에게 본인의 데이터에 대한 직접 업데이트 또는 입력대행을
위한 이력파일의 전송 요청
정보의 수신 방법은 E-Mail 우편 등이며 가장 신뢰성 높은 정보
입력이 완료된 이력파일은 개인정보보호를 위해 별도로 보관되며 E-Mail 및 기타 인쇄
물 이외의 형태로 수신되었을 경우 반드시 출력하여 관리
입력 완료시 해당인력에게 연락하여 결과에 대한 확인 요청
322 웹검색(홈페이지 및 각종 포털사이트)
대상 인력의 가장 최신의 연락정보(전화번호 E-Mail FAX 등) 재직정보 등을 수집하기
위해 웹상에 공개되어 있는 정보를 수집하여 데이터에 반영
대상 인력의 데이터 내 소속기관사항 및 기본정보의 홈페이지 주소 등을 통하여 해당 기
관 홈페이지 및 개인 홈페이지에 접근하여 연락정보 경력정보 실적정보 등에 관한 정보
수집
이직(移職) 등으로 대상 인력의 현재 소재지 재직기관 등에 관한 정보가 누락되어 있을
시 각종 포털사이트를 활용하여 해당인력의 소재정보 수집 및 접근
인물정보제공사이트를 통해 대상 인력의 기본정보 경력정보 실적정보에 대한 수정ㆍ보
완
323 신문기사의 인사ㆍ동정 모니터링
대부분의 신문에서 주요 인물에 대한 인사ㆍ동정에 관한 정보를 매일 싣고 있음
주기적으로 인사ㆍ동정란의 모니터링을 통해 평가위원 데이터에 변경사항 반영
- 132 -
33 최신성 유지 업무 작업 지침
331 언론을 통해 발표 되는 인사동정 수정
평가위원만 해당
교육과학기술부
- 참여인력을 포함하여 인사동정 수정
- 직급은 장관 차관 국장 팀장 사무관 서기관 까지 수정
- 특히 교육과학기술부장관 제2차관 정책보좌관 국장은 꼼꼼하고 세심하게 수정할 것
332 현행화 작업 내용
수정은 기본정보 소속기관 학력사항 초중고학력 경력사항 소속학협회 논문 실적 연구
실적 저역서실적 훈포장사항 지식재산권 주요업적사항 자격사항 사진관리 등 전 항
목에 걸쳐 작업 함
해당 인물의 개인 홈페이지를 최우선으로 보고 그 다음으로 기관 홈페이지를 참고
해당 기관 홈페이지에서 정확히 알 수 없을 경우에는 코셉 조인스 로마켓 동아일보를
참고 할 것
경력사항은 경력의 년도와 날짜가 없더라도 신규 입력 함
기본정보
e-mail에서 (dot)가 아닌 (comma) 로 표기된 경우 변경
e-mail 주소가 2개일 때는 개인홈페이지에 적힌 메일주소가 우선 판단이 안 될 경우는
소속기관에서부여된 e-mail 주소로 기입
인적사항의 홈페이지정보에서 lsquohttprsquo 는 빼고 입력
소속기관
산학협력단
- 소속기관에서 제외(삭제)하고 경력사항에만 기입
- 산학협력단이 주소로 되어있는 기업은 소속기관에 그대로 두거나 기입해 줌
평가위원이 의과대학의 교수이자 병원의 교수(의사)인 경우는 소속기관을 의과 대학
의 교수로 기입하고 병원 근무사항은 경력사항에 기입
(ex 관동대학교 의과대학 정형외과학교실 교수 소속기관
관동대학교 명지병원 정형외과 전문의 경력사항)
소속기관이 대학과 병원 모두 입력되어 있는 경우 수정하지 않고 pass
소속기관은 의과대학이나 주소가 병원일 경우 수정하지 않고 pass
평가위원의 재직기관 홈페이지에서 해당 인물이 검색 되지 않을 경우
- 학교의 교수 명예교수 등은 pass
- 회사의 대표이사 회장 등은 직급은 공란으로 바꾸고 재직중으로 변경
( 대표이사 인사말 회장 인사말 등의 인물 이름이 다를 경우를 뜻함)
- 133 -
평가위원이 학sdot협회에 재직중인 경우
- 소속기관이 하나이고 학sdot협회라면 소속기관에 그대로 둠
- 소속기관이 2개 이상이고 그 중 한 곳이 학sdot협회일 때
학sdot협회를 제외한 소속기관에서 인물이 검색 되는 경우 학sdot협회 내역으로 옮김
학sdot협회를 제외한 소속기관에서 인물이 검색 되지 않고 학sdot협회에서만 검색 되는 경
우 학sdot협회를 제외한 소속기관 내역은 경력사항으로 옮김
학sdot협회를 제외한 소속기관과 학sdot협회 모두 인물이 검색 되지 않는 경우 수정하지
않고 pass
기타
- 직장주소에 집주소가 되어있으면 변경하고 집주소란에 직장주소가 되어있으면 그냥 둠
- 겸임교수직은 경력사항에 입력
소속기관에 기입된 경우 경력사항으로 이동
소속기관이 한 개이고 겸임교수일 경우 pass
- 인물의 직급이 모두 시간강사인 경우 담당자에게 인물key 전송
- 퇴직한 교수로 그 이후의 소속기관이 없는 사람은 재직여부를 lsquo퇴직rsquo으로 변경 후 저장
- 전화번호가 2개인 경우 (comma)로 구분
- 교수의 경우 학과부서 탭엔 단과대 아래의 레벨 모두 기입
(ex 생명과학부 생명공학전공 or 의학과 내과학교실)
학력사항
박사후과정(Post-Doc)은 생략 단 경력사항의 Post-Doc은 기입
논문실적
2006~2010년도 논문sdot연구실적만 입력
현재 HuRIMs에 저장된 가장 최근 년도부터 템플릿에 작업
(ex 개인홈페이지에는 2000년~2009년까지 논문사항이 입력되어있고 HuRIMs에는 2007
년 2월까지만 입력되어 있다면 2007년의 논문은 중복체크를 한 후 입력되지 않은 논문
들과 2008 2009년도 논문을 템플릿에 넣는다)
기타논문집은 학술논문으로 판단되는 것들만 기입
- 판단기준 대학 연구소 학회에서 발행한 논문들
동일한 제목으로 다른 발행처에 중복 기재된 경우
- 발행처 두 곳이 모두 학회일 때 중복하여 기입
- 발행처 두 곳이 학회amp연구소 학회amp대학 일 때 학회의 논문실적만 기입
출판중인 논문은 기재하지 않음
학회sdot협회sdot대학 등에서 발간된 저서 중 일부만 담당한 경우
- 일부 chap theme 만 담당했더라도 저역서실적에 기입
- 일부 작성한 부분의 제목이 논문의 형태를 띄고 있을 때(~에 관한 연구 고찰 등)는 논문
실적에 기입
- 134 -
훈포장사항
세계인명사전등재 내용 기입
감사장 감사패는 기입하지 않음
경력업적학협회 유형 정리
향우회 민방위 동창회 성직자협의회 등은 제외함
lsquoooo위원회rsquo가 들어가는 내용은 직급에 상관없이 업적사항으로 기입 단 기초기술 연구
회와 산업기술연구회는 정부조직이므로 경력사항에 기입
(ex 기록관리혁신전문위원회 회장 정보통신위원회 고문 rarr 업적)
위원회를 제외한 lsquo회rsquo는 직급에 상관없이 학sdot협회 활동사항으로 기입
(ex 한국원예치료협회 상임이사 한국화훼장식학회 편집위원 한국양액재배연구회 이사
한국화훼환경디자인교수연합회 이사 전국대학정보화협의회 이사 rarr 학sdot협회)
활동내역 중 자문 심의는 업적사항에 기입 단 협회 학회 연구회 등의 자문sdot심의는
학sdot협회 활동사항에 기입
활동내역 중 기업sdot학교의 고문은 경력사항에 기입
34 최신성 업무 대상
341 대상 및 범위
평가위원후보추천서비스에서 서비스 중인 평가위원 전체
평가위원 기본정보 경력정보 갱신 및 실적정보 추가입력 및 갱신
추가 입력 및 갱신을 위한 기초자료는 웹사이트에 공개된 정보 신문의 인물 동정기사
평가위원 본인이 제공하는 이력정보 임
342 검수 기준
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
- 최신성 유지 관리를 수행한 전체 데이터 중 3를 샘플링하여 출처별 내용이 최신성 유
지 관리 매뉴얼 기준으로 추가 입력 및 갱신되었는지 여부를 확인
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 135 -
구분 항목 세부항목 항목수단위별
가중치()
참여
인력
정보
기본정보
주민등록번호 성명 자택주소 자택
우편번호 자택전화번호 핸드폰번호
7 31
소속기관사항
소속기관명 부서명 직위명 사무실
전화번호 기관주소 최초임용일 인
력(직업)구분
7 185
학력사항
전공 취득대학 학위 입학일 졸업
일 학과 취득국가 지도교수명 학위
논문명 학위취득일
10 21
경력사항 근무처명 직위명 근무기간 3 45
자격사항 자격발행처 자격증명 자격취득일 3 25
논문실적
논문발표일 국문논문명 영문논문명
저자역할구분 발행처 학술지구분
학술지명 SCI여부
8 105
지식재산권 지식재산권명 출원_등록번호 특허구분 3 25
계 소계 41 905
평가
위원
소속학협회현황 담당업무 직위 학협회사항 3 3
훈포장사항 수상년월 수여기관명 훈포장명 3 25
저역서실적국문저서명 영문저서명 발행년 발
행처 저역서구분5 4
소계 11 95
계 52 100
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
343 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 136 -
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
150 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
성명 100자택주소 10자택우편번
호
20
자택전화번
호
10
핸드폰번호 10E-mail 10소계 310
소속기
관사항
(7개)
소속기관명 100
부서명 05
직위명 20
사무실전화
번호
10
기관주소 30
인력(직업)구
분
10
최초임용일 10
소계 185
학력사
항
(10개)
전공 20
취득대학 100
학위 20
입학일 10
졸업일 10
학과 15
취득국가 15
지도교수명 05
학위논문명 05
학위취득일 10
소계 210
항목별 오류율 산정 기준 정의
- 137 -
경력사
항
(3개)
근무처명 20
직위명 15
근무기간 10
소계 45
자격사
항
(3개)
자격발행처 05
자격증명 10
자격취득일 10
소계 25
논문실
적
(8개)
논문발표일 10논문명1 10
논문명2 05저자역할구
분
05
발행처 05학술지구분 05학술지명 10
SCI여부 05
소계 105
지식재
산권
(3개)
지식재산권
명
10
출원_등록번
호
05
특허구분 10소계 25
평가 소속학
협회현
황
(3개)
담당업무 05
위원 직위 05(11개) 학협회사항 20
소계 30
훈포장
사항
(3개)
수상년월 10
수여기관명 05
훈포장명 10
소계 25
저역서
실적
(5개)
저역서명1 10
저역서명2 05
발행년 10
발행처 05
저역서구분 10
소계 40
계 1000
- 138 -
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 및
출처 비교 오류03
품질지표기준점수산정(데이터1
건기준)=오류유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 맵핑 오류 005
계 6개 오류유형 1
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
3000 3 055 150 000825
성명 10 2 035 100 000350자택주소 3 0 000 10 000000
자택우편번
호
3 2 035 20 000233
자택전화번
호
4 0 000 10 000000
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
평가위원 Pool DB 23000건 23000건 690건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
출처 비교는 작업대상별 출처 리스트 참조
검사물량 집계표 예시
오류율산정표 예시
- 139 -
핸드폰번호 6 0 000 10 000000
E-mail 9 0 000 10 000000소계 45 7 125 310 001408
소속기
관사항
(7개)
소속기관명 1000 20 100 000000부서명 80000 200 05 000000직위명 80000 200 20 000000사무실전화
번호
80000 200 10 000000
기관주소 80000 200 30 000000인력(직업)구
분
80000 200 10 000000
최초임용일 80000 200 10 000000소계 481000 1220 000 185 000000
계 1000 01
주민등록번호 한글성명 영문성명 한문성명자택우편번
호
630421-0000000 백중환Joong hwan
Baek
412220
(형식 015)
630421-0000000 백종석Baek Jong
Seok
6304210000000
(형식 015)백인열 Baek IN Youl 白寅烈 711-822
630421-0000000 백승호
(오기 02)백제훈
630421-0000000 백종완
630421-
(오기 02)백장선 Jangsun Baek
白壯선
(형식 015)
502-
(오기 02)
630421-0000000 백승호1213132
(오기 02)
630421-0000000 백석형
630421-0000000 백석형
품질지표별
기준점수의
합
055 035 035
검수데이터 예시
- 140 -
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 및
출처 비교 오류03
품질지표기준점수산정(데이
터1건기준)=오류유형별점수
의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 맵핑 오류 005
계 6개 오류유형 1
데이터별 품질지표 기준 점수
35 입력 항목별 QampA (처리 방법 및 사례)
기본정보
- 정보공개여부
구 분 내 용
상황 및 질문ㆍ데이터 신규입력 시 정보공개여부 설정(공개 기본인적사항만 공
개 비공개)을 어떻게 해야 하는지
처리 방법
및 사례
- 대상인력의 입력대행요청에 의한 정보입력 시 정보공개여부는 해당인
력이 요청한 대로 설정
- 최신성 유지팀 자체 내에서 수집한 정보를 바탕으로 대상인력 데
이터를 신규생성 할 경우에는 lsquo기본인적사항만 공개rsquo로 설정
- 과학기술표준분류
구 분 내 용
상황 및 질문ㆍ데이터 입력 시 과학기술표준분류에 대한 처리는 어떻게 해야 하
는지
처리 방법
및 사례
- 과학기술표준분류는 정보관리자가 임의로 선택하거나 수정하지 않
음
- 141 -
소속기관사항
- 재직여부
번호 구 분 내 용
1
상황 및 질문
ㆍ대상인력이 이직(移職)하여 재직기관이 변경된 경우 전 재직기
관 정보의 재직여부를 퇴직으로 변경하고 현 재직기관 정보를
추가입력해야 하는지
처리 방법
및 사례
- 대상인력의 재직기관이 변경되었을 경우 전 재직기관 항목은 삭제
후 경력사항에 반영함
- 현 재직기관 정보 신규입력 후 이를 경력사항에 반영
2
상황 및 질문ㆍOO연구원에 재직중인 홍길동씨가 현재 과학기술부에서 파견근
무 중일 경우 이를 어떻게 처리해야 하는지
처리 방법
및 사례
- 먼저 원 소속인 OO연구원 소속기관사항의 재직여부에 lsquo재직중rsquo
에서 lsquo파견중rsquo으로 변경
- 또한 소속기관사항 항목을 추가시켜 파견기관인 lsquo과학기술부rsquo 직위
등의 정보 입력 후 재직여부를 lsquo재직중rsquo으로 선택
3
상황 및 질문ㆍ대상인력이 정년 등의 이유로 퇴직한 상태인 경우 소속기관사
항을 삭제해야 하는지
처리 방법
및 사례
- 대상인력이 퇴직한 상태이고 현재 다른 직업이 없는 경우 소속
기관사항은 삭제 시키지 않고 재직여부를 lsquo퇴직rsquo으로 변경
- 경력사항 항목에 퇴직일자 포함된 정보 추가
- 142 -
학력사항
- 전공명
구 분 내 용
상황 및 질문ㆍ대상인력의 학력정보를 수집하였으나 학과명만 표기 있는 경우 전
공명은 공란으로 두는지
처리 방법
및 사례
- 대상인력의 학과정보만 발견된 경우 일반적으로 전공명은 우선 학
과명과 동일하게 입력
ex) 학과명 경영학과 rarr 전공명 경영학
경력사항주요업적사항
- 경력사항주요업적사항 일반
구 분 내 용
상황 및 질문 ㆍ경력사항과 주요업적사항은 어떤 기준으로 구분하는지
처리 방법
및 사례
- 일반적으로 웹상 및 타기관 인력정보데이터를 통해 수집된 정보에
는 경력사항과 주요업적사항을 따로 구분하지 않은 경우가 대다수
- 본 시스템에서는 경력사항과 주요업적사항을 구분하여 입력
- 경력사항은 대상인력의 직업과 관련된 사항으로 구분
- 주요업적사항은 대상인력의 직업 이외의 대외적인 활동 즉 평가
자문위원 등 각종 위원활동 설계 시공 기술지도 등의 사항으로
구분
예외적으로 학위 이외의 교육과 관련된 사항은 경력사항에 입력
ex) OO대학 OO교육과정 수료이수
- 143 -
소속학협회
- 직위담당업무
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 소속학협회정보에 학회명 이외에 다른 사항이
기재되지 않은 경우 직위 및 담당업무 항목은 어떻게 처리하는지
처리 방법
및 사례
- 활동시작년월 및 학회종료년월에 관한 정보가 없을 시 이는 공란처
리하며 직위의 경우 다른 정보가 없는 경우 lsquo회원rsquo으로 입력
논문실적
- 학술지구분
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 논문실적 정보만으로 학술지구분(국내 및 국외
전문학술지 국내 및 국외 학술대회발표논문집 기타논문집)에 대
한 구분은 어떻게 하는지
처리 방법
및 사례
- 수집된 대상인력의 논문실적 정보의 상당수가 국내 및 국외 전문학
술지 및 학술대회발표논문집에 관한 구분이 되어 있지 않기 때문
에 학술지구분에 어려움을 겪을 수 있음
- 이에 대한 구분기준은 명확하게 한정짓기 어려운 부분이 있어 이
러한 경우 최신성 유지 업무 담당 책임자가 판단하여 처리하고 있
음
- 이에 대한 몇 가지 팁을 제시하자면 먼저 lsquoOO학회지rsquo lsquoJournal
ofrsquo 등의 용어가 해당정보에 삽입되어 있는 경우 대부분 전문학
술지로 구분할 수 있으며 lsquo학술대회rsquo lsquo발표대회rsquo lsquoProceeding
Conference Seminar Workshop등의 용어가 해당정보에 삽입되
어 있는 경우 이는 대부분 rsquo학술대회발표논문집으로 구분할 수 있
음
- 또한 학술대회발표논문집 중 국내와 국외의 구분은 해당 학술대회
가 열린 장소를 기준으로 함
ex) lsquoThe Internation Conference in Seoulrsquo의 경우 학술대회가 열린
장소가 대한민국의 서울이므로 국내 학술대회발표논문집으로
구분함
- 144 -
- 역할
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 논문실적 정보에 역할(단독 공동(제1) 공동(참
여) 공동(책임))이 구분되어 있지 않은 경우 이를 어떻게 처리해야
하는지
처리 방법
및 사례
- 현재 대상 인력의 연구실적과 관련하여 역할구분이 되어 있지 않은 정
보를 입력할 시 해당 연구의 특성을 고려하여 역할을 lsquo단독rsquo 혹은 lsquo공
동(제1)rsquo으로 임시 구분해 줌
- 공동저자명
구 분 내 용
상황 및 질문ㆍ수집된 대상 인력의 논문실적 정보 중 공동저자명 입력 시 10명 이
상이 넘어가는 공동저자명을 모두 넣어주어야 하는지
처리 방법
및 사례
- 공동저자명의 경우 한 연구실적에서 무수히 발생될 수 있는 공동저
자명을 일일이 입력을 해주고 있지는 않음
- 예를 들어 공동저자명이 15명일 경우 공동저자명에는 lsquo홍길동 김순희
이명수 박영희 등rsquo으로 한정시키고 전체저자수 항목에 저자를 포
함한 16명을 입력해 줌
- 논문실적 일반
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 논문실적 정보가 논문명만 있는 경우 이를 입
력해야 하는지
처리 방법
및 사례
- 대상인력의 논문실적 정보에 대한 추가 입력 기준은 아직 명확하
게 정해지지는 않은 상태
- 현재(2007년 7월 18일 기준)는 개재년월 및 논문명의 두 가지 정보 이
상이 존재할 시에만 추가입력을 해주고 있음
- 145 -
연구실적
- 연구기간
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 연구실적 정보에서 연구기간 항목이 종료년월
만 나와 있는 경우는 어떻게 처리하는지
처리 방법
및 사례
- 연구기간에 관한 정보가 종료년월만 나와 있는 경우 임시로 1년의
기간을 책정하여 시작년월을 입력
ex) lsquo2005년 8월 OO에 관한 연구rsquo라는 연구실적의 입력 시 연구기간
에서 시작년월은 2004년 9월 종료년월은 2005년 8월로 입력
- 참여구분
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 연구실적 정보에서 참여구분(연구책임자 공동연
구자)의 경우 이를 어떻게 구분하는지
처리 방법
및 사례
- 연구실적에 관한 정보에서 참여구분이 되어 있지 않은 경우에는 해
당인력의 다른 연구실적 등을 감안하여 참여구분을 하여야 하나
대상이 평가위원인 경우 lsquo연구책임자rsquo로 임시 구분하여 줌
지식재산권
- 취득구분
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 지식재산권 정보에서 취득구분(출원 등록)이
구분되어 있지 않은 경우 어떻게 처리하는지
처리 방법
및 사례
- 수집된 지식재산권 정보에서 취득구분이 되어 있지 않은 경우 임
시로 lsquo등록rsquo으로 선택하여 입력
- 특허구분
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 지식재산권 정보에서 특허구분(특허 실용신안
의장 상표 소프트웨어)이 구분되어 있지 않은 경우 어떻게 처리
하는지처리 방법
및 사례
- 수집된 지식재산권 정보에서 특허구분이 되어 있지 않은 경우 임
시로 lsquo특허rsquo로 선택하여 입력
- 146 -
첨부1 NTIS 코드 표준
NTIS 표준코드
정보공개구분
코드값 코드값 의미
1 공개
2 기본인적사항만공개3 비공개
인력(직업)구분
코드값 코드값 의미
1 대학교2 연구소
3 산업계9 기타
소속구분코드
코드값 코드값 의미
1 재직중2 퇴직
3 해외연수6 파견중
학위코드
코드값 코드값 의미
2 학사이하5 석사
7 박사수료8 박사
- 147 -
학술지구분
코드값 코드값 의미 비고
01 국외전문학술지 발표 학술지가 국외전문학술지에 게재
02 국외학술대회발표논문집 발표 학술지가 국외학술대회발표논문집에 게재
03 국내전문학술지 발표 학술지가 국내전문학술지에 게재
04 국내학술대회발표논문집 발표 학술지가 국내학술대회발표논문집에 게재
05 기타논문집 발표 학술지가 기타논문집에 게재
역할구분
코드값 코드값 의미
1 단독2 공동제1 주저자3 공저자4 교신(책임)저자
참여구분
코드값 코드값 의미
A 연구책임자B 참여연구원
저역서구분
코드값 코드값 의미
1 저서2 역서
발행지구분
코드값 코드값 의미
1 국내2 국외
취득구분
코드값 코드값 의미
01 특허출원02 특허등록
- 148 -
코드값 코드값 의미
9511 조경middot지역시스템공학부
특허구분
코드값 코드값 의미 비고
01 특허 산업재산권이 특허에 해당하는 경우
02 실용신안 산업재산권이 실용신안에 해당하는 경우
03 디자인 산업재산권이 디자인에 해당하는 경우
04 상표 산업재산권이 상표에 해당하는 경우
05 기타 산업재산권이 기타에 해당하는 경우06 프로그램(SW) 산업재산권이 프로그램에에 해당하는 경우07 저작권 산업재산권이 저작권에 해당하는 경우08 신기술 인증 산업재산권이 신기술 인증에 해당하는 경우09 신제품 인증 산업재산권이 신제품 인증에 해당하는 경우10 국제출원(PCT) 산업재산권이 국제출원(PCT)에 해당하는 경우11 서비스 산업재산권이 서비스에 해당하는 경우
업적구분
코드값 코드값 의미
1 평가위원
2 위원회활동3 자문4 설계5 시공6 기술지도9 기타
기관코드(기관명이형전거DB)
코드값 코드값 의미
ZE02400 엘에스엠트론(주)ZE02378 (주)지앤시바이오ZE02376 (주)하나아이엔씨ZE02374 센게이지러닝코리아(주)ZE02373 (주)루켄테크놀러지스ZE02372 (주)디투알컨설팅
ZE02367 (주)대흥이엔지ZE02366 (사)한국벤처산업연구원ZE02365 CSG(주)ZE02364 국제상사(주)전자기술연구소
학과코드
- 149 -
9510 생물정보학과
9509 나노과학기술학부9508 지능기계공학과9507 생명과학기술학부9506 의과학과9505 부동산정보9495 보건정보관리
9999 기타9475 대학원
코드값 코드값 의미 코드값 코드값 의미
A01 교수 B32 기술원A02 부교수 C01 공무원A03 조교수 C02 법조인A04 전임강사 C03 의사
A05 시간강사 C04 교사A06 강사(기타) C05 군인A10 명예교수 D01 대표이사A11 석좌교수 D02 이사A12 강의교수 D03 전무A13 겸임교수 D04 상무
A14 계약교수 D05 부장A15 기금교수 D06 차장A16 대우교수 D07 과장A17 연구교수 D08 대리A18 초빙교수 D09 사원A19 객원교수 D10 부사장
A20 조교 D11 상임이사A21 대학원생 Z01 위원A22 POST-DOC Z02 의원A23 POST_MAS Z03 실장A24 초청교수 Z04 학과장A25 외래교수 Z05 주임
B01 수석연구원 Z06 단장B02 책임연구원 Z07 팀장B03 주임연구원 Z08 회장B04 전임연구원 Z09 본부장B05 선임연구원 Z10 처장B06 연구원 Z11 학장
B07 위촉연구원 Z12 센터장B10 수석연구위원 Z13 소장B11 책임연구위원 Z14 부처장B12 주임연구위원 Z15 국장B13 전임연구위원 Z16 연구주임
직위코드
- 150 -
B14 선임연구위원 Z17 연구소장
B15 연구위원 Z18 원장B20 전문위원 Z19 부원장B30 책임기술원 999 기타B31 선임기술원
코드값 코드값 의미 비고
AD 안도라 ANDORRA
AE 아랍에미리트 UNITED ARAB EMIRATESAF 아프가니스탄 AFGHANISTANAG 앤티가 바부다 ANTIGUA AND BARBUDAAI 안길라 ANGUILLAAL 알바니아 ALBANIAAM 아르메니아 ARMENIA
전공분야코드
코드값 코드값 의미
E340600 구강해부학E340601 육안일반해부학E340602 신경해부학E340603 육안두경부일반해부학
E340604 두경부신경해부학E340605 두경부응용해부학E340700 치아형태학E340701 영구치치아형태학E340702 유치치아형태학E340703 치아교합학
국가코드
개인정보활용동의구분
코드값 코드값 의미
Y 동의N 비동의
- 1 -
Ⅰ 인력정보 데이터 정제 지침
1 국가RampD 참여인력 및 평가위원 데이터 정제 지침
11 정제 필요성
인력정보 데이터는 연구관리전문기관에서 수집하여 통합 구축하므로 여러 기관에 중복으로 입력되어
있을 수 있음
따라서 데이터 정제를 하지 않을 경우 현 재직기관의 중복 논문실적 이중등록 등 통계현황 및 검
색결과에 많은 문제가 발생할 수 있음
또한 각 기관별로 고유의 코드 및 항목체계를 활용하거나 코드가 필요한 항목에 코드를 사용하지
않는 등 NTIS 표준 코드 및 항목에 대한 매핑 필요
NTIS 인력정보의 현황정보 서비스 제공시 누락항목으로 인해 현황정보가 정확하지 않음
12 정제 내용
수집된 인력 정보를 등록하기 위한 데이터 분류 및 분석
여러 기관에 중복 입력된 인력정보에 대한 중복제거 및 데이터 취합
중복제거 후 취합 된 데이터는 확인 정정
- 학력사항 경력사항 등의 정보 이중 등록
- 기관별 인력정보 중 재직기관 상이
각 기관별 코드 및 항목에 대해 통합 인력DB의 코드 및 항목에 맞게 매핑
- 각 기관 고유의 코드 및 항목을 표준 코드 및 항목과 매핑 작업 필요
- 재직기관 전공 등 코드가 필요한 항목에 코드를 활용하지 않는 기관의 데이터는 표준 코드에 맞
게 데이터 변환 필요
기본정보 경력정보 실적정보 등 인력정보에 대한 오류데이터 정정
- 각 항목의 데이터 내용을 검토하여 오류 정정
예) 학력사항의 데이터 내용 중 입학일이 졸업일 보다 나중일 경우 등
인력정보의 누락항목에 대한 보완
- 수집 가능한 범위 내에서 6개 주요항목기준(인력구분 우편번호 주소 소속기관명 전공 학위 등)
보완
- 2 -
구분 항목 세부항목
참여인력정보(42개)
기본정보(9개)주민등록번호 성명 인력구분 자택주소 자택우편번호 자
택전화번호 핸드폰번호 부처(기관)분류코드 E-mail
소속기관사항(6개)소속기관명 부서명 직위명 사무실전화번호 기관주소
최초임용일
학력사항(10개)전공 취득대학 학위 입학일 졸업일 학과 취득국가 지
도교수명 학위논문명 학위취득일
경력사항(3개) 근무처명 직위명 근무기간
자격사항(3개) 자격발행처 자격증명 자격취득일
논문실적(8개)논문발표일 국문논문명 영문논문명 저자역할구분 발
행처 학술지구분 학술지명 SCI여부
지식재산권(3개) 지식재산권명 출원_등록번호 특허구분
평가위원(10개)
소속학협회현황(3개) 담당업무 직위 학협회사항
훈포장사항(3개) 수상년월 수여기관명 훈포장명
저역서실적(4개) 국문저서명 발행년 발행처 저역서구분
13 정제 대상
정제 대상 범위
- 정보연계를 통해 수집되는 참여인력정보의 정제
정제 대상 항목 정의
주요 정제 대상 정의
구분 항목 세부항목
참여인력정보(12개)
기본정보(6개)주민등록번호 성명 인력구분 핸드폰번호 E-mail 부
처(기관)분류코드
소속기관사항(4개) 소속기관명 기관주소 사무실전화번호 직위명
학력사항(2개) 전공 학위
주요 정제 대상 항목이란 인력정보 서비스를 위해 기본적으로 필요한 최소한의 서비스 항목 Not
null값은 아니지만 최대한 많은 자료 수집이 필요한 항목
- 3 -
코드 대상 항목 정의
구분 항목 세부항목
참여인력정보(16개)
기본정보(3개) 자택우편번호 부처(기관)분류코드
소속기관사항(3개) 인력구분 소속기관명 직위명 기관우편번호
학력사항(4개) 전공 학위 학과 취득국가 취득대학
경력사항(2개) 직위명
논문실적(3개) 저자역할구분 학술지구분 SCI여부
지식재산권(1개) 특허구분
평가위원(1개)
저역서실적(1개) 저역서구분
코드 대상 항목이란 데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목
14 정제 수준
데이터 특성 및 정제 지침
- lsquo속성값 전체 존재rsquo 데이터
공통사항 오류 데이터 정정 및 코드 매핑
① 중복 자료 중 데이터 신뢰성에 근거하여 통합 필수 항목 누락 확인 및 보충 선별(성명 주
민등록번호) 형식 확인(주소 전화번호 및 E-Mail)
② 중복 자료 중 최신 자료 선정 및 확인 형식 확인 (주소 전화번호)
③ ⑤~⑪ 중복 자료 중 데이터 신뢰성에 근거하여 통합
번호는 lsquo정제 대상 항목 정의rsquo 표에서 각 항목에 붙여진 번호
- lsquo일부 또는 6개 미만rsquo 데이터
데이터 누락 정도를 판단하여 필요한 경우 해당 기관에 보완 요청
데이터 보완 후 lsquo속성값 전체 존재rsquo 데이터와 같은 방식으로 정제
오류 유형 정의 및 정제 형태
- 발생 가능한 오류 유형
주요 항목 중 데이터가 존재하지 않는 경우
데이터의 Type(문자형 숫자형)에 위배되는 값이 들어있는 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
정해진 법칙에 따른 번호가 아닌 경우
실제로 존재하지 않는 부점(구분자) 등이 입력되어 있는 경우
- 4 -
오류 유형 세부 정제 지침 비고
주요 항목 중 데이터가 null- 정제가 불가능하므로 정보 재수집
(해당 기관에 정보 제공 재요청)
데이터 Type 오류
- 적합한 Type으로 수정 가능한 정도(의미상으로는
유효한 경우)의 오류는 수정하고 그렇지 않은 데
이터는 삭제
데이터 형식 오류- 데이터들 중 가장 많은 유형을 정규 형식 정고 형
식에 위배되는 데이터들은 정규 형식으로 변환
부점(구분자) 오류
- 실제 서비스 되는 데이터값과 비교하여 변환 과정
에서 발생한 오류면 실제 데이터값으로 변환하고
원시 데이터 자체가 오류인 경우에는 삭제 처리
코드값 오류
- 일치 유사한 코드값으로 변환
- 유사 가장 적합한 코드값으로 변환
- 상이 lsquo기타rsquo코드값으로 분류 또는 삭제
논문제목 오류 - 논문제목1은 반드시 필수 입력으로 처리
중복 데이터들의 데이터 값
상충 오류
- 변경될 수 없는 기본정보(이름 주민번호)의 경우는
기존 데이터 우선
- 변경 가능한 정보(기관명 논문 등)의 경우 최신 업
데이트된 정보를 우선
코드의 값이 정해진 범위를 벗어나는 경우
ex) 기관 코드와 인력시스템 사용 코드와의 매핑 오류
기관 데이터의 코드 항목 값이 잘못 입력되어 있는 경우
국문과 영문으로 구분되는 동일 데이터 항목에 잘못된 위치에 항목 값이 입력되어 있는 경우
ex) 논문실적정보의 국문제목에 영문제목이 입력되어 있는 경우
데이터가 복수로 존재하며 서로 상충되는 경우
ex) 유효하지 않은 주민등록번호의 중복
- 조치 가능한 데이터 정제 형태
재수집 데이터를 제공한 기관에 재요청하여 부족한 데이터 내용을 재수집
수정 데이터 내용은 수정하지 않고 데이터 형태 및 특수문자 수정 정도의 정제
삭제 데이터 값 삭제(Garbage 처리) 또는 레코드 삭제
위의 경우 원시 데이터 값은 관리를 위해 따로 보관
정제 제외 데이터 값이 누락이거나 오류로 판단되지만 정확한 데이터 내용을 알 수 없는 경
우 기준 데이터가 없으므로 정제 대상에서 제외 또한 별다른 오류로 보이지 않는 경우도 정
제 대상에서 제외
오류 유형별 세부 정제 지침
~은 lsquo발생 가능한 오류 유형rsquo 내용 참조
~은 lsquo조치 가능한 데이터 정제 형태rsquo 내용 참조
- 5 -
구분 비고
기본정보 이메일 기존 수집 데이터를 통해 보완
소속기관사항 있으나필드가 null인것
인력구분 기관명이형전거DB 생성 완료 후 적용함
소속기관 우편번호주소가 있는 경우 우편번호 찾기를 통해 보완주소가 없는 경우 기존 수집 데이터를 통해 보완
소속기관 주소 기존 수집 데이터를 통해 보완
소속기관명기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
학력사항 있으나 필드가null인것
전공기존 수집 데이터를 통해 보완하고 기관명이형전거DB로 매핑함
학위기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
소속기관사항 없는것 기존 수집 데이터를 통해 보완
학력사항 없는것 기존 수집 데이터를 통해 보완
인력정보의 누락항목에 대한 보완(기존 서비스 데이터 기준)
기타 (정보 식별자 부여)
- 데이터 정제 최종 단계에서 식별자 부여 체계에 따라 정보식별자(번호) 삽입
- 정보식별자(번호)는 식별체계 API에 의해 자동으로 부여 되며 식별 부여 체계는 사업단 내 식별
체계 담당자가 마련하여 제공
고려 사항
- 정확한 항목매핑 후 작업이 진행되어야 함
- 정제데이터 관리는 임시테이블을 통해서 관리되며 다양한 에러 유형별로 체계적인 관리가 되어야 함
15 정제 작업 방식
중복 확인 기계작업
- 정제 도구에서 제공하는 중복 확인 기능을 이용하여 중복 항목의 리스트 작성(기계작업)
데이터 통합 기계작업 + 수작업
- 중복으로 확인된 항목들의 리스트를 비교하여 통합
- 기계적으로 필드간의 충돌이 없음을 확인할 수 있는 항목은 자동 통합하고 기계적으로 충돌을
- 6 -
확인할 수 없는 경우는 수작업으로 필드별 데이터 통합을 수행
- 최신 또는 최종 여부를 확인하여 통합해야 하는 경우 해당 데이터에 포함된 일자 데이터를 감안
하여 선별 통합(일자 및 기간의 충돌이 없는 경우 기계작업 충돌이 있는 데이터는 리스트 업
후 수작업)
필수 데이터 누락 확인 및 보충 선별 기계작업 + 수작업
- 소속기관명 E-mail 등과 같이 누락되지 말아야 할 항목을 설정하고 기계적으로 누락된 항목의
리스트를 추출(기계작업)
- 이 리스트에 대하여 보충 가능한 데이터는 보충하고 보충이 불가능한 경우 서비스 불가 리스트
로 따로 추출(수작업)
형식 확인 기계작업 + 수작업
- E-Mail 주소 전화번호와 같은 형식이 어느 정도 정의된 데이터의 경우 기본 형식을 템플릿으
로 지정
- 정형화되지 않은 데이터의 리스트를 추출하여 이 중 기계적으로 형식을 일치시키고(기계작업)
일치되지 않은 데이터를 수작업으로 확인하여 수정하거나 형식 불량 데이터 리스트로 따로 추
출(수작업)
16 데이터 검수
161 데이터 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
- 7 -
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
17 데이터 이관
171 NTIS 참여인력 DB 현황 및 데이터 흐름
NTIS 참여인력 DB는 물리적으로 각 연계기관과 NTIS의 데이터 연계를 위해 각 연계기
관에 구성된 연계기관 공동활용 DB와 RampD 참여인력을 관리하기 위한 인력DB RampD참여
인력 서비스 DB로 구성되어 있다
그림 3 NTIS DB 현황 및 데이터 흐름
172 NTIS DB 간 테이블 매핑
NTIS 참여인력 DB가 기능별로 분리되어 있음으로 인해 연계DB에서 인력 관리DB 간
항목 매핑 정의가 필요하다 DB 간 항목 매핑은 아래와 같다
정보구분 테이블명 수집DB 관리DB
인력정보
인력 기본정보 MP_BASIC THR_BASE
소속기관사항 HOFF_ORG THR_JAEJIK
학력사항 SCRE THR_SCHOOL
경력사항 CAREER THR_CAREER
논문실적 PAPER_OUT THR_PAPER
자격사항 CERT THR_LICENSE
지식재산권실적 IPR_OUT THR_PATENT
소속학협회현황 BLNG_INSTIT THR_ACTIVE
저역서실적 TRNSWRT_OUT THR_BOOK
훈포장사항 AWARD THR_MEDAL
- 8 -
항 목 세 부 항 목
기본
기본정보 영문성명 휴대전화 E-mail 개인홈페이지
전문분야 전문(연구)분야
재직기관 기관명 부서명 직위 주소 전화 팩스
학력 최종학위 학위 학위취득일 학교명 전공명
경력 경력사항 시작년월 종료년월 재직기관명 직위
실적
논문실적 논문명 저널명 게제(권)집 페이지 게제년월 공동저자명
연구실적 시작년월 종료년월 발주기관 참여구분(역할) 연구명
특허출원등록구분 출원등록번호 출원등록국가 특허출원명 출
원등록일자
173 데이터 이관
수집 DB에 전송되는 인력정보는 중복 인력이 존재 하며 동일인물의 정보일 지라도 각
기관별 보유 항목이 다르므로 관리DB로 이관을 위해 각 항목별 이관 방안이 필요하다 따
라서 별도의 방안을 마련하여 데이터 이관을 실시하도록 한다
2 인력정보 영문이력 입력 지침
21 영문이력 DB 구축 필요성
해외의 연구자 혹은 외국의 연구기관등에게 관련분야의 연구자문에 필요한 국내 연구전
문가 혹은 국제 공동연구활동 등을 지원하기 위한 국내 인물에 대한 영문검색 체널제공
인물정보에 대하여 영문DB구축을 수행하고 웹을 통한 영문검색을 지원함으로써 국제공
동연구를 지원하기 위한 기반을 조성
기존 개인정보 공동활용에 동의한 연구자들을 대상으로 파악한 영문이력DB 구축방법을
통해 인력정보에 대하여 영문화 작업을 수행
22 영문이력 DB 구축 대상
기본정보 학력사항 경력사항 논문실적 연구실적 특허실적 등
23 영문이력 DB 구축 항목
영문이력서 제공가능 인력에 대해 영문이력서를 제공받아 이를 바탕으로 영문 DB를 구
축하고 번역 요청자를 대상으로 번역을 통한 영문DB구축
- 9 -
항 목 세 부 항 목 영문명 비고
기본(BasicInformation)
기본정보 영문성명 English Name - 한글이력정보와 공동 사용- 전문분야는lsquo08 개정 분류코드 영문명 활용
휴대전화(국가번호)
Cellular PhoneNumber
E-mail E-mail
개인홈페이지 Homepage
전문분야 전문(연구)분야 Research Field 1
Research Field 2
Research Field 3
검색키워드 전문분야명
재직기관(organization)
기관명 Organization Name - 현재 재직기관사항 1개 입력
부서명 Department
직위 Job title(position)
우편번호 Postal Code
주소 Address
전화(국가번호) Telephone
팩스(국가번호) Fax
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) Degree Code
학위취득일 GraduationDate
학교명 School
전공명 Major
경력(Career)
경력사항(CAREER)
시작년월 Start Date - 재직 경력으로 주요 경력입력 현 재직정보제외
종료년월 End Date
재직기관명 Organization Name
직위 Position(Job Title)
실적ResearchResult
논문실적(paper)
논문명 Title - 최근 5년 이내만 입력저널명 Journal Name
게제(권)집 Volume
게제호 Number
시작페이지 Start Page
종료페이지 End Page
게제년월 Date of Publication
공동저자명 Co-Author
비고 Etc
연구실적ResearchProject
시작년월 Start Date
종료년월 End-Date
발주기관 Funding organization
참여구분(역할)-코드
Role
연구실적명 title
영문이력 구축 대상 항목 정의
- 10 -
특허(patent)
출원등록구분-코
드
appliedregistered
출원등록번호 number
출원등록국가-코
드
National Code
특허출원명 Patent name
출원등록일자 Date
코드 대상 항목(데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목)
코드 대상 항목 정의
항목 세부항목 코드
전문분야(3개) 전문(연구)분야NTIS 표준코드(국가과학기술
표준분류) 활용
학력사항(1개) 최종학위
2(학사)
5(석사)
8(박사)
연구실적(1개) 참여구분(역할)A(연구책임자)
B(참여연구원)
특허실적(2개)특허구분(출원등록)
01(출원)
02(등록)
등록국가 NTIS 표준코드 활용
코드 대상 항목이란 데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목
daggerNTIS 표준코드에 영문명을 포함하여 사용
24 영문이력 DB 수집 방법
E-mail을 통한 영문이력서 제공 요청 메일 발송
- 영문이력 DB 구축에 동의하고 영문이력서 제공이 가능한 연구자 대상
전화연락을 통한 이력서 수집
- 영문이력서 제공 요청 메일과 병행하여 영문이력서 제공동의자를 대상으로 영문이력
입력자들이 전화를 통하여 이력서 수집 요청
E-mail을 통한 영문이력서 번역 대행 안내 메일 발송
- 영문이력 DB 구축에 동의한 번역 요청 동의자를 대상으로 메일 발송
이력정보(한글)는 poolkistirekr을 통해 파일형태로 수집 관리함
이력정보(한글)는 메일을 통해서 파일형태(HWP MS-WORD PDF 등)로만 수집함
- 11 -
항 목 선처리 항목
기본 재직기관 기관명 직위
학력 최종학위 학교명 전공명
경력 경력사항 재직기관명 직위
실적논문실적 저널명
연구실적 발주기관
구분 선처리 방법
기관명
기관명(재직기관)
학교명(학력사항)
재직기관명(경력사항)
발주기관(연구실적)
- 웹검색(예 NAVER 백과사전 및 기관 홈페이지)
웹검색시는 출처 기록
- 웹검색 불가는 직접번역
직위직위(재직기관)
직위(경력사항)
- 직위에 대한 영문 코드표 참조
영문 코드표의 출처 기록
전공명 전공명(학력사항)- 전공명에 대한 영문 코드표 참조
영문 코드표의 출처 기록
저널명 저널명(논문실적)- 웹검색(예 httpsocietykistirekr)
웹검색시는 출처 기록
25 영문이력 DB 입력 방법
영문이력 입력
- 수집된 영문이력서는 입력자들이 등록수정 화면을 통해 직접 입력
영문이력 입력결과 확인
- 입력 완료된 영문이력서의 확인은 다른 입력자에 의해 입력결과를 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 본인확인
- 영문이력서의 입력 확인 완료 후 영문이력 본인에게 안내메일을 발송하여 확인
- 본인확인에 의해 수정 가능
26 영문이력 DB 번역 방법
영문이력 선처리 작업
- 영문이력 번역 수행 전 공통적인 항목에 대해 선처리 작업 수행
영문이력 번역
- 인력DB의 번역 대상자 및 수집된 이력서는 영문이력 관리 기능을 통해 번역 수행
- 12 -
영문이력 번역확인
- 번역 완료된 영문이력정보의 확인은 다른 번역자에 의해 번역결과를 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 전문가검수
- 번역확인 완료된 영문이력정보의 검수는 전문가에 의해 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 본인확인
- 영문이력정보의 번역 번역확인 전문가검수 완료 후 영문이력 본인에게 안내메일을
발송하여 확인
- 본인확인에 의해 수정 가능함
KISTI 검수
- KISTI 검수 절차를 거쳐 영문이력에 대해 서비스 제공
27 검수 확인
입력 및 번역 결과 보고
- 주간보고 영문이력 번역에 대한 현황을 매 주 보고
- 이슈사항보고 이슈사항 발생 시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 데이터(전체 항목 필드 기준)의 01 이하(품질목표 999)
- 오류 체크 방식 전체 데이터에서 본인확인 미완료 대상 중 무작위로 30 샘플링
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상
데이터건수) 항목가중치의 합산 결과가 01 이하
- 전문가검수는 모든 번역대상자를 대상으로 수행
- 번역확인 및 전문가검수 단계에서 자체적으로 품질 활동 수행
오류율 산정 기준
- 인력정보 영문이력에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며
오류율 산정에서 제외함
- 13 -
구분 항목 세부항목 세부항목 설명
참여인력정보(42개)
기본정보(8개)
주민등록번호 인력 고유의 주민등록번호
성명 인력 한글 영문 한자 성명
자택주소 인력 본인의 자택 주소
자택우편번호 인력 본인의 자택 우편번호
자택전화번호 인력 본인의 자택 전화번호
핸드폰번호 인력 본인의 핸드폰 번호
E-mail 인력 본인의 E-mail
부처(기관)분류코
드인력 본인의 부처(기관)분류코드
Ⅱ 인력정보 데이터 정제 매뉴얼
1 참여인력 데이터 정제 매뉴얼
11 개요
111 정제 목표
인력데이터는 연구관리전문기관에서 수집하여 통합 구축하므로 여러 기관에 중복으로 입력되어 있
는 경우에 이중등록 데이터가 존재할 수 있어 이를 NTIS에서 활용하기 위해서 정의된 중복기준에
따라 이중등록 확인 및 제거하는 데이터 정제를 절차에 따라 수행
연구관리전문기관의 인력정보관리시스템의 미비 또는 관리체계의 미흡으로 인해 발생된 누락데이
터 및 입력된 데이터의 오류를 수행 가능한 범위 내에서 작업자 및 시스템에 의한 오류 수정
연구관리전문기관별로 각각의 고유의 코드 및 항목체계를 활용하거나 코드가 필요한 항목에 코드
를 사용하지 않고 있는 실정이며 이러한 연구관리전문기관 인력데이터를 NTIS에서 활용하기 위
해서는 NTIS 통합 표준 코드 및 항목으로의 매핑
12 데이터 정제 목록 및 범위
121 데이터 정제대상 및 항목 정의
- 14 -
구분 항목 세부항목 세부항목 설명
소속기관사항(7개)
소속기관명 인력 본인의 현재 소속기관명칭
학과부서명 인력 본인의 소속기관 내 소속학과부서명
직위명 인력 본인의 소속기관 내 직위명칭
사무실전화번호 인력 본인의 소속기관 내 전화번호
기관주소 현재 소속기관의 우편번호 및 상세주소
인력구분 인력구분(대학교 연구소 산업계 기타)
최초임용일 현재 소속중인 기관에 최초 임용(근무)일
학력사항(10개)
전공 인력의 학위별 전공명
취득대학 인력의 학위별 출신 대학교명
학위학력정보의 학위종류예) 학사이하 석사 박사수료 박사
입학일 인력의 학위별 입학년월
졸업일 인력의 학위별 졸업년월
학과 인력의 학위별 출신 대학교 학과명
취득국가 인력의 학위별 출신 대학교 소재지(국가)
지도교수명 인력의 각 학위별 지도교수명
학위논문명 인력의 최종학위취득시 제출한 논문명
학위취득일 인력의 최종학위취득일
경력사항(3개)
근무처명인력의 전ㆍ현재 직업 및 교육과정의 기관명 및세부사항(학과 부서 등)
직위명인력의 전ㆍ현재 직업 및 교육과정의 직급 또는직위명
근무기간인력의 전ㆍ현재 직업 및 교육과정의 시작년월및 종료년월
자격사항(3개)
자격발행처 인력이 발급받은 자격증 등의 발급기관명
자격증명 인력이 발급받은 자격증 등의 자격명
자격취득일 인력이 발급받은 자격증 등의 발급년월
논문실적(8개)
논문발표일 인력이 저술한 논문을 게재하거나 발표한 년월
논문제목1 인력이 저술한 논문의 논문제목1
- 15 -
구분 항목 세부항목 세부항목 설명
논문제목2 인력이 저술한 논문의 논문제목2
저자역할구분
인력이 저술한 논문에 있어서의 역할정도예) 단독공동제1주저자공저자교신(책임)저자
발행처인력이 저술한 논문이 실린 간행물을 발행한 발행처
학술지구분
인력이 저술한 논문의 게재 및 발표형태와 장소에 관련하여 학술지구분예) 국외전문학술지 국외학술대회발표논문집 국내전문학술지 국내학술대회발표논문집 기타논문집
학술지명 인력이 저술한 논문이 실린 간행물의 명칭
SCI여부인력이 저술한 논문이 실린 간행물이 SCI에 수록된 간행물 구분
지식재산권(3개)
지식재산권명 인력이 출원하거나 등록한 지식재산권명
출원_등록번호인력이 출원하거나 등록한 지식재산권의 출원등록번호
특허구분
인력이 출원하거나 등록한 지식재산권의 종류예) 특허 실용신안 디자인 상표 기타 프로그램(SW)저작권 신기술 인증 신제품 인증 국제출원(PCT) 서비스
평가위원(11개)
소속학협회현황(3개)
담당업무인력의 전ㆍ현재 소속 학회 및 협회 내에서의 담당업무
직위 인력의 전ㆍ현재 소속 학회 및 협회 내에서의 직위
학협회사항 인력의 전ㆍ현재 소속 학회 및 협회명
훈포장사항(3개)
수상년월 인력이 훈장 포장 등을 수상한 년월
수여기관명 인력이 수상한 훈장 포장 등을 수여한 기관명
훈포장명 인력이 수상한 훈장 포장 등의 수상명
저역서실적(5개)
저서명1 인력이 저술하거나 역술한 도서의 제목1
저서명2 인력이 저술하거나 역술한 도서의 제목2
발행년 인력이 저술하거나 역술한 도서를 발행한 년도
발행처 인력이 저술하거나 역술한 도서를 발행한 장소
저역서구분 인력이 저술하거나 역술한 도서에 대한 구분 예) 저서 역서
- 16 -
구분 항목 세부항목 현행 DB 항목식별
항목비고
참여
인력
정보
(56개)
기본정보
(12개)
주민등록번호
인물ID NTIS 식별체계 생성
인물관리번호(KOI) 시스템 생성
주민등록번호 lsquo-rsquo포함 14자리
성명
성명-한글
성명-영문
성명-한자
자택주소기본주소(주소1) 우편번호 내 주소를 참조
상세주소(주소2)
자택우편번호 우편번호
자택전화번호 전화번호
핸드폰번호 핸드폰번호
E-mail E-mail
소속기관
사항
(11개)
소속기관명소속기관코드 소속기관명 기준 매핑
기관명이형전거DB 활용소속기관명
부서명 근무부서명
직위명직위코드 직위명 기준 매핑
NTIS 직위코드직위명
사무실전화번
호사무실전화
기관주소
우편번호
기본주소(주소1) 우편번호 내 주소를 참조
상세주소(주소2)
인력구분
인력유형구분
(대학교 연구소 산업
계 기타)
NTIS 인력구분코드
기관명이형전거DB 활용
최초임용일 최초임용일
학력사항
(14개)
전공전공분야 전공명 기준 매핑
NTIS 전공코드전공명
취득대학학위취득대학코드 학위취득대학명 기준 매핑
기관명이형전거DB 활용학위취득대학명
학위 학위코드 NTIS 학위코드
입학일 입학년월
졸업일 졸업년월
학과학과코드 학과명 기준 매핑
NTIS 학과코드학과명
취득국가 취득국가코드 NTIS 국가코드
지도교수명 지도교수명
정제 대상 항목
공동활용정보를 포함하는 현행 DB 구성 기준 69개 항목
- 17 -
구분 항목 세부항목 현행 DB 항목식별
항목비고
학위논문명최종학위논문명1
최종학위논문명2
학위취득일 최종학위취득일
경력사항
(5개)
근무처명 근무처명
직위명직위코드 직위명 기준 매핑
NTIS 직위코드직위명
근무기간근무시작일
근무종료일
자격사항
(3개)
자격발행처 자격발행처
자격증명 자격증명
자격취득일 자격취득일
논문실적
(8개)
논문발표일 논문발표일
논문제목1 논문제목1
논문제목2 논문제목2
저자역할구분 저자역할구분 NTIS 저자역할구분 코드
발행처 발행처명
학술지구분 학술지구분 NTIS 학술지구분코드
학술지명 학술지명
SCI여부 SCI여부 NTIS SCI 여부구분 코드
지식
재산권
(3개)
지식재산권명 지식재산권명
출원_등록번호 출원등록번호
특허구분 특허구분 NTIS 특허구분 코드
평가
위원
(13개)
소속학협
회
현황
(5개)
담당업무 담당업무
직위 직위 직위명
학협회사항
학협회명
활동시작일
활동종료일
훈포장
사항
(3개)
수상년월 수상년도
수여기관명 수여기관명
훈포장명 수상명
저역서
실적
(5개)
저역서명1 저역서명1
저역서명2 저역서명2
발행년 발행년도
발행처 발행처명
저역서구분 저역서구분 NTIS 저역서 구분 코드
- 18 -
구분 항목 세부항목 정제항목 오류유형 비고
참여
인력
정보
(56개)
기본정보
(12개)
주민등록번호
인물ID
-인물ID이 발급되지 않는 경우
예) 외국인 주민등록번호 유효하
지 않거나 중복된 경우
인물관리번호(KOI)1 포맷 오류
예) 자리수 lsquo-rsquo가 있는 경우
주민등록번호
-주민등록번호가유효하지않는경우
예) lsquo-rsquo포함한 14자리가 아닌경우
주민등록번호규칙에맞지않은경우
-중복되는 주민등록번호의 경우
-공란 및 특수문자가 있는 경우
이관 후 서비
스대상에서
제외
성명
성명-한글
-Null인 경우
-공란 및 특수문자 숫자가 있는
경우
-한글이 아닌 경우이관 후 성명
없으면 서비
스대상에서
제외
성명-영문
-공란 및 특수문자 숫자가 있는
경우
-영문성명의 범위를 벗어나는 경
우
예) Lee KHS
성명-한자
-공란 및 특수문자 숫자가 있는
경우
-한자가 아닌 경우
자택주소
기본주소(주소1)
-우편번호 존재하고 Null의 경우
-우편번호의 주소와 상이한 경우
-주소지 정보가 아닌 경우
상세주소(주소2)
-우편번호 및 기본주소 Null의
경우
-주소정보가 아닌 경우
자택우편번호 우편번호-우편번호 Null인 경우
-우편번호가 old data인 경우
자택전화번호 전화번호 -전화번호 Null인 경우
13 데이터 분석 내역
131 세부 항목별 오류 패턴유형 분석
인력데이터
항목별 정해진 규칙에 위배되는 값이 들어있는 경우
- 19 -
구분 항목 세부항목 정제항목 오류유형 비고
-전화번호가 표준 형식이 아닌
경우
-전화번호 데이터가 아닌 경우(지
역번호 없는 경우 포함)
-핸드폰번호인 경우
핸드폰번호 핸드폰번호
-핸드폰번호 Null인 경우
-핸드폰번호가 표준 형식이 아닌
경우
-핸드폰번호 데이터가 아닌 경우
(지역번호 없는 경우 포함)
-전화번호인 경우
E-mail E-mail
-E-mail Null인 경우
-표준 이메일 형식이 아닌 경우
-구분자가 잘못된 경우
-가베지 성 데이터 존재
소속기관
사항(11개)
소속기관명
소속기관코드 NA코드 오류
유형 참조
소속기관명-소속기관명이 기관명이형전거DB
내 대표기관명이 아닌 경우
대표기관명으
로 갱신
부서명 근무부서명 -근무부서명 Null인 경우
직위명
직위코드 NA코드 오류
유형 참조
직위명
-직위명 Null인 경우
-직위명이 직위코드 내 명칭이
아닌 경우
사무실전화번호 사무실전화
-전화번호 Null인 경우
-전화번호가 표준 형식이 아닌
경우
-전화번호 데이터가 아닌 경우(지
역번호 없는 경우 포함)
-핸드폰번호인 경우
기관주소
우편번호-우편번호 Null인 경우
-우편번호가 old data인 경우
기본주소(주소1)
-우편번호 존재하고 기본주소
Null의 경우
-우편번호의 주소와 상이한 경우
-주소지 정보가 아닌 경우
상세주소(주소2) -우편번호 및 기본주소 Null의
- 20 -
구분 항목 세부항목 정제항목 오류유형 비고
경우
-주소정보가 아닌 경우
인력구분 인력유형구분 NA코드 오류
유형 참조
최초임용일 최초임용일 NA날짜 오류
유형 참조
학력사항
(14개)
전공전공분야 NA 코드 오류
유형 참조전공명 -전공명 Null인 경우
취득대학
학위취득대학코드 NA코드 오류
유형 참조학위취득대학명 -학위취득대학명 Null인 경우
학위 학위코드 NA코드 오류
유형 참조
입학일 입학년월 NA날짜 오류
유형 참조
졸업일 졸업년월 NA날짜 오류
유형 참조
학과
학과코드 NA코드 오류
유형 참조학과명 -학과명 Null인 경우
취득국가 취득국가코드 NA코드 오류
유형 참조
지도교수명 지도교수명 -지도교수명 Null인 경우
학위논문명
최종학위논문명1 -가베지 데이터인 경우
최종학위논문명2 -가베지 데이터인 경우
학위취득일 최종학위취득일 NA날짜 오류
유형 참조
경력사항
(5개)
근무처명 근무처명-근무처명 Null인 경우
-가베지 데이터인 경우
직위명
직위코드 NA 코드 오류
유형 참조직위명 1 직위명 Null인 경우
근무기간
근무시작일 NA날짜 오류
유형 참조
근무종료일 NA날짜 오류
유형 참조
- 21 -
구분 항목 세부항목 정제항목 오류유형 비고
자격사항
(3개)
자격발행처 자격발행처-자격발행처 Null인 경우
-가베지 데이터인 경우
자격증명 자격증명-자격증명 Null인 경우
-가베지 데이터인 경우
자격취득일 자격취득일 NA날짜 오류
유형 참조
논문실적
(8개)
논문발표일 논문발표일 NA날짜 오류
유형 참조
논문명1 논문제목1 -가베지 데이터인 경우
논문명2 논문제목1 -가베지 데이터인 경우
저자역할구분 저자역할구분 NA코드 오류
유형 참조
발행처 발행처명-발행처명 Null인 경우
-가베지 데이터인 경우
학술지구분 학술지구분 NA코드 오류
유형 참조
학술지명 학술지명-학술지명 Null인 경우
-가베지 데이터인 경우
SCI여부 SCI여부 NA코드 오류
유형 참조
지식
재산권
(3개)
지식재산권명 지식재산권명-지식재산권명 Null인 경우
-가베지 데이터인 경우
출원_등록번호 출원등록번호-출원등록번호 Null인 경우
-가베지 데이터인 경우
특허구분 특허구분 NA코드 오류
유형 참조
평가
위원
(13개)
소속학
협회
현황
(5개)
담당업무 담당업무-담당업무 Null인 경우
-가베지 데이터인 경우
직위 직위-직위 Null인 경우
-가베지 데이터인 경우
학협회사항
학협회명
-학협회명 Null인 경우
-직위명이 포함된 경우
-가베지 데이터인 경우
활동시작일 NA날짜 오류
유형 참조
활동종료일 NA날짜 오류
유형 참조
- 22 -
구분 항목 세부항목 정제항목 오류유형 비고
훈포장
사항
(3개)
수상년월 수상년도 NA날짜 오류
유형 참조
수여기관명 수여기관명-수여기관명 Null인 경우
-가베지 데이터인 경우
훈포장명 수상명-수상명 Null인 경우
-가베지 데이터인 경우
저역서
실적
(5개)
저역서명
저역서명1 -가베지 데이터인 경우
저역서명2 -가베지 데이터인 경우
발행년 발행년도 NA날짜 오류
유형 참조
발행처 발행처명-발행처명 Null인 경우
-가베지 데이터인 경우
저역서구분 저역서구분 NA코드 오류
유형 참조
구분 항목 세부항목 정제항목 오류내역 비고
참여
인력
정보
(11개)
소속기관사항(1개) 최초임용일최초임용일
YYYYMMDD
-YYYY가 없는 경우(누락)
-MM이 없는 경우
-DD가 없는 경우
-YYYYMMDD이 유효하지
않은 경우
학력사항(3개)
입학일입학년월
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
졸업일졸업년월
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-입학년월보다 같거나 작
은 경우
학위취득일최종학위취득일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
- 23 -
구분 항목 세부항목 정제항목 오류내역 비고
경력사항(2개) 근무기간
근무시작일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
근무종료일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-근무시작일보다 같거나
작은 경우
자격사항(1개) 자격취득일자격취득일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
논문실적(1개) 논문발표일논문발표일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
소속학협회현황(2개) 학협회사항
활동시작일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
활동종료일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-활동시작일보다 같거나
작은 경우
훈포장사항(1개) 수상년월수상년도
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우평가
위원
(1개)
저역서실적(1개) 발행년발행년도
YYYY
-YYYY이 없는 경우(누락)
-YYYY이 유효하지 않은
경우
시작일보다 종료일이 같거나 작은 경우 종료일을 삭제
날짜의 경우 본인의 생년월일보다 작을 수 없음
- 24 -
구분 항목 세부항목 정제항목 오류유형 비고
참여
인력
정보
(14개)
기본
정보
(1개)
자택우편번호 우편번호-Null 경우
-우편번호와 주소정보가 불일치
외국주소는
유지
소속
기관
사항
(4개)
소속기관명소속기관코드
소속기관명
-소속기관명만 존재하는 경우
-소속기관코드가 기관명이형전거
DB의 이형기관코드가 아닌 경우
-소속기관명이 기관명이형전거DB
의 대표기관명이 아닌 경우
직위명직위코드
직위명
-직위명만 존재하는 경우
-직위명 직위코드가 존재하지 않
는 경우
기관주소 우편번호-Null의 경우
-우편번호와 주소정보가 불일치
인력구분 인력유형구분-기관명이형전거DB의 기관유형구
분과 불일치
학력
사항
(4개)
전공전공분야
전공명
-전공명만 존재하는 경우
-전공명 전공분야코드가 Null인 경우
취득대학학위취득대학코드
학위취득대학명
-학위취득대학명만 존재하는 경우
-학위취득대학코드가 기관명이형
전거DB의 이형기관코드가 아닌
경우
-학위취득대학명이 기관명이형전
거DB의 대표기관명이 아닌 경우
학위 학위코드
-학위코드가 Null인 경우
-학위코드가 구분 코드내 표함되
지 않는 경우
학과학과코드
학과명
-학과명만 존재하는 경우
-학과명 학과코드가 존재하지 않
는 경우
취득국가 취득국가코드
-Null인 경우
-기관 국가코드와 NTIS 국가코드
매핑 오류
경력
사항
(1개)
직위명직위코드
직위명
-직위명만 존재하는 경우
-직위명 직위코드가 Null인 경우
코드의 값이 정해진 범위를 벗어난 경우
- 25 -
구분 항목 세부항목 정제항목 오류유형 비고
논문
실적
(3개)
저자역할구분 저자역할구분
-Null인 경우
-저자역할구분이 구분 코드 내 포
함되지 않은 경우
학술지구분 학술지구분
-학술지구분이 Null인 경우
-학술지구분이 구분 코드내 포함
되지 않은 경우
SCI여부 SCI여부
-Null인 경우
-SCI여부가 구분코드 내 포함되지
않은 경우
지식
재산
권
(1개)
특허구분 특허구분
-Null인 경우
-특허구분이 구분 코드내 포함되
지 않은 경우
평가
위원
(1개)
저역
서
실적
(1개)
저역서구분 저역서구분
-Null인 경우
-저역서구분이 구분 코드 내 포함
되지 않은 경우
구분 항목 이중등록 검사 항목 기준 비고
참여인력
기본정보 주민등록번호() 주민등록번호는 유일해야 함
소속기관사항 소속기관명()소속기관명(대표기관명) 유일
해야 함
학력사항
1 취득대학() 학위() 입학일
2 취득대학() 학위() 졸업일
3 취득대학() 학위() 전공
4 취득대학() 학위() 학과
5 취득대학() 학위() 학위취득일
취득대학은 대표기관명으로
비교 함
경력사항1 근무처명() 직위명 근무시작일
1 근무처명() 직위명 근무종료일
논문실적
1 논문명() 논문발표일 학술지명
2 논문명() 논문발표일 ISSN
3 논문명() ISSN 게재권집 게재호
4 논문명() 학술지명 게재권집 게재호
132 이중등록 유형 분석
이중등록 정제 기준 정의( 주키)
- 26 -
구분 항목 이중등록 검사 항목 기준 비고
지식재산권
1 출원_등록번호()
2 지식재산권명() 출원등록구분() 특허구분
() 출원국가
저역서실적1 ISBN
2 저역서명() 저역서구분() 발행년 발행처
평가위원
소속학협회현황1 학협회명() 직위 시작일
1 학협회명() 직위 종료일
훈포장사항 훈포장명() 수상년월 수여기관명
자격사항 자격증명() 자격발행처 자격취득일
이중등록 데이터 분석 방법
- 데이터 정제 결과 데이터를 대상으로 기본정보는 주민등록번호 이외의 정보는 이중등록 검사 항
목을 기준으로 하여 시스템 정제를 통해 인력별 동일한 데이터가 존재하는지를 파악함
14 데이터 정제 기준
141 정제 지침
정제 내용
수집된 인력 정보를 등록하기 위한 데이터 분류 및 분석
여러 기관에 중복 입력된 인력정보에 대한 중복제거 및 데이터 취합
중복제거 후 취합 된 데이터는 확인 정정
- 학력사항 경력사항 등의 정보 이중 등록
- 기관별 인력정보 중 소속기관 상이
각 기관별 코드 및 항목에 대해 통합 인력DB의 코드 및 항목에 맞게 매핑
- 각 기관 고유의 코드 및 항목을 표준 코드 및 항목과 매핑 작업 필요
- 소속기관 전공 등 코드가 필요한 항목에 코드를 활용하지 않는 기관의 데이터는 표준 코드에
맞게 데이터 변환 필요
기본정보 경력정보 실적정보 등 인력정보에 대한 오류데이터 정정
- 각 항목의 데이터 내용을 검토하여 오류 정정
예) 학력사항의 데이터 내용 중 입학일이 졸업일 보다 나중일 경우 등
인력정보의 누락항목에 대한 보완
- 수집 가능한 범위 내에서 6개 주요항목기준(인력구분 우편번호 주소 소속기관명 전공 학위
등) 보완
- 27 -
구분 항목 세부항목
참여인력정보(41개)
기본정보(7개)주민등록번호 성명 자택주소 자택우편번호 자택전화번호
핸드폰번호 E-mail
소속기관사항(7개)소속기관명 부서명 직위명 사무실전화번호 기관주소 인
력구분 최초임용일
학력사항(10개)전공 취득대학 학위 입학일 졸업일 학과 취득국가 지도
교수명 학위논문명 학위취득일
경력사항(3개) 근무처명 직위명 근무기간
자격사항(3개) 자격발행처 자격증명 자격취득일
논문실적(8개)논문발표일 국문논문명 영문논문명 저자역할구분 발행처
학술지구분 학술지명 SCI여부
지식재산권(3개) 지식재산권명 출원_등록번호 특허구분
평가위원(11개)
소속학협회현황(3개) 담당업무 직위 학협회사항
훈포장사항(3개) 수상년월 수여기관명 훈포장명
저역서실적(5개) 국문저서명 영문저서명 발행년 발행처 저역서구분
정제 대상 정의
정제 대상 범위
- 연계시스템을 통해 등록변경되는 참여인력정보의 정제
정제 대상 항목
정제 수준 설정
lsquo속성값 전체 존재rsquo 데이터
- 공통사항 오류 데이터 정정 및 코드 매핑
- ① 중복 자료 중 데이터 신뢰성에 근거하여 통합 항목 누락 확인 및 보충 선별(성명 주민등록
번호) 형식 확인 (주소 전화번호 및 E-Mail)
- ② 중복 자료 중 최신 자료 선정 및 확인 형식 확인 (주소 전화번호)
- ③ ⑤~⑪ 중복 자료 중 데이터 신뢰성에 근거하여 통합
lsquo일부 또는 6개 미만rsquo 데이터
- lsquo속성값 전체 존재rsquo 데이터와 같은 방식으로 정제
오류 유형 정의 및 정제 형태
- 발생 가능한 오류 유형
- 28 -
오류 유형 세부 정제 지침 비고
데이터 내용 데이터 Type 오류
- 적합한 Type으로 수정 가능한 정도(의미상으
로는 유효한 경우)의 오류는 수정하고 그렇
지 않은 데이터는 삭제
데이터 형식 오류
- 데이터들 중 가장 많은 유형을 정규 형식으
로 보고 형식에 위배되는 데이터들은 정규
형식으로 변환
부점(구분자) 오류
- 실제 서비스 되는 데이터값과 비교하여 변환
과정에서 발생한 오류면 실제 데이터값으로
변환하고 원시 데이터 자체가 오류인 경우
에는 삭제 처리
데이터 코드 코드값 오류
- 일치 유사한 코드값으로 변환
- 유사 가장 적합한 코드값으로 변환
- 상이 lsquo기타rsquo코드값으로 분류 또는 삭제
데이터(not null)가 존재하지 않는 경우
데이터의 Type(문자형 숫자형)에 위배되는 값이 들어있는 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
정해진 법칙에 따른 번호가 아닌 경우
실제로 존재하지 않는 부점(구분자) 등이 입력되어 있는 경우
코드의 값이 정해진 범위를 벗어나는 경우
ex) 기관 코드와 인력시스템 사용 코드와의 매핑 오류
기관 데이터의 코드 항목 값이 잘못 입력되어 있는 경우
국문과 영문으로 구분되는 동일 데이터 항목에 잘못된 위치에 항목 값이 입력되어 있는 경우
ex) 논문실적정보의 국문제목에 영문제목이 입력되어 있는 경우
데이터가 복수로 존재하며 서로 상충되는 경우
ex) 유효하지 않은 주민등록번호의 중복
- 조치 가능한 데이터 정제 형태
수정 데이터 내용은 수정하지 않고 데이터 형태 및 특수문자 수정 정도 정제
삭제 데이터 값 삭제(Garbage 처리) 또는 레코드 삭제
위의 경우 원시 데이터 값은 관리를 위해 따로 보관
정제 제외 데이터 값이 누락이거나 오류로 판단되지만 정확한 데이터 내용을 알 수 없는 경
우 기준 데이터가 없으므로 정제 대상에서 제외 또한 별다른 오류로 보이지 않는
경우도 정제 대상에서 제외
오류 유형별 세부 정제 지침
- 29 -
논문제목 오류 - 논문제목1은 반드시 필수 입력으로 처리
중복 데이터들의 데이
터 값 상충 오류
- 변경될 수 없는 기본정보(이름 주민번호)의
경우는 기존 데이터 우선
- 변경 가능한 정보(기관명 논문 등)의 경우
최신 업데이트된 정보를 우선
구분 명(누락) 비고
기본정보 이메일 22719 기존 수집 데이터를 통해 보완
소속기관사항 있으나필드가 null인것
인력구분 15217 기관명이형전거DB 생성 완료 후 적용함
소속기관 우편번호
15977주소가 있는 경우 우편번호 찾기를 통해 보완주소가 없는 경우 기존 수집 데이터를 통해 보완
소속기관 주소
13512 기존 수집 데이터를 통해 보완
소속기관명 428기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
학력사항 있으나 필드가null인것
전공 38915기존 수집 데이터를 통해 보완하고 기관명이형전거DB로 매핑함
학위 34373기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
소속기관사항 없는것 22502 기존 수집 데이터를 통해 보완
학력사항 없는것 31952 기존 수집 데이터를 통해 보완
~은 lsquo발생 가능한 오류 유형rsquo 내용 참조
~은 lsquo조치 가능한 데이터 정제 형태rsquo 내용 참조
인력정보의 누락항목에 대한 보완
기타 (정보 식별자 부여)
- 데이터 정제 최종 단계에서 식별자 부여 체계에 따라 정보식별자(번호) 삽입
- 정보식별자(번호)는 식별체계 API에 의해 자동으로 부여 되며 식별 부여 체계는 사업단 내 식별
체계 담당자가 마련하여 제공
정제 작업 방식
중복 확인 기계작업
- SQL Query를 활용하여 중복 확인하며 중복된 데이터 중 1건을 제외하고 나머지를 표시함(기계
작업)
- 30 -
구분 항목 세부항목 정제항목 오류유형 정제지침
참여
인력
정보
(56개)
기본
정보
(12
개)
주민등록
번호
인물ID인물ID이 발급되지 않
는 경우
인물 중복확인이 가능한 기본 항목(주민등록
번호 성명)이 존재하지 않으면 정제대상에서
제외
식별체계로부터 정제 수행 후 일괄발급 입력
인물관리
번호
(KOI)
NA
정제이전 인물관리번호 일괄 생성하여 key로
활용
Null 여부만 확인하고 정제대상에서 제외
주민등록
번호
Null인 경우 정제대상에서 제외
중복되는 주민등록
번호의 경우
인물관리번호 성명이 상이하면 현행 데이터
를 유지
모두 정제대상에서 제외
유효하지 않은 주민등
록번호의 경우
자리수가 lsquo-rsquo포함한 14자리가 아닌 데이터는
정제대상에서 제외
이관 후 서비스대상에서 제외
데이터 통합 기계작업 + 수작업
- 중복으로 확인된 항목들의 리스트를 비교하여 통합
- 기계적으로 필드간의 충돌이 없음을 확인할 수 있는 항목은 자동 통합하고 기계적으로 충돌을 확
인할 수 없는 경우는 수작업으로 필드별 데이터 통합을 수행
- 최신 또는 최종 여부를 확인하여 통합해야 하는 경우 해당 데이터에 포함된 일자 데이터를 감안
하여 선별 통합(일자 및 기간의 충돌이 없는 경우 기계작업 충돌이 있는 데이터는 리스트 업 후
수작업)
형식 확인 기계작업 + 수작업
- E-Mail 주소 전화번호와 같은 형식이 어느 정도 정의된 데이터의 경우 기본 형식을 템플릿으로
지정
- 정형화되지 않은 데이터의 리스트를 추출하여 이 중 기계적으로 형식을 일치시키고(기계작업)
일치되지 않은 데이터를 수작업으로 확인하여 수정하거나 형식 불량 데이터 리스트로 따로 추출
(수작업)
142 오류 유형별 정제 지침
오류 유형별 정제 지침은 lsquo131 세부 항목별 오류 패턴유형 분석rsquo 을 대상으로 정제지침을 정의
인력데이터
항목별 정해진 규칙에 위배되는 값이 들어있는 경우
- 31 -
구분 항목 세부항목 정제항목 오류유형 정제지침
외국인 및 임시주민번호의 경우 lsquo-rsquo포함한 14
자리가 아닌 데이터는 정제대상에서 제외
표준 포맷으로 구성되
어 있지 않은 경우
lsquo년(2)월(2)일(2)-성별(1)고유번호(6)lsquo 14자 숫자
로 구성되도록 변경
공란 및 특수문자를 제거
성명
성명-한글
Null의 경우
성명-영문 성명-한자가 존재하면 해당 필드
로 이동성명-한글 영문 한자 모두 Null이면 정제대
상에서 제외
이관 후 서비스대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
공란 및 특수문자 숫자 이름이 아닌 경우 제거
예) 이름이 아닌 경우 oo - --
예) 공란의 경우 홍 길동 홍길 동
예) 숫자의 경우 홍길동2 -gt 숫자만 제거
성명-영문
Null의 경우 정제대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
특수문자 숫자 이름이 아닌 경우 제거
예) Lee HS =gt Lee HS영문성명의 범위를 벗어난 경우
예) Lee KHS영문성명이 아닌 경우 해당 필드로 이동하거
나 제거
성명-한자
Null의 경우 정제대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
공란 및 특수문자 숫자 이름이 아닌 경우 제거
예) 金鉉- 洙 =gt 金鉉洙
한문이 아닌 경우 해당 필드로 이동하거나 제거
자택주소기본주소
(주소1)
Null의 경우
우편번호가 존재하면 우편번호로 검색된 주
소 입력 단 우편번호 유효검사를 거친 우편번호만
대상으로 함
우편번호가 존재하지 않으면 정제대상에서 제외
우편번호의 주소와 상
이한 경우
가베지 데이터가 아닌 경우에는 정제대상에서 제외
예) 외국 주소는 유지
가베지 데이터인 경우
기존 데이터는 삭제하고 우편번호가 존재하
면 우편번호로 검색된 주소 입력
우편번호가 존재하지 않으면 기존 데이터 삭
제만 수행
- 32 -
구분 항목 세부항목 정제항목 오류유형 정제지침
상세주소
(주소2)
Null인 경우 정제대상에서 제외
주소정보가 아닌 경우주소정보가 아닌 가베지 데이터는 삭제
예) test 042-123-1234 등
자택우편
번호우편번호
Null인 경우
기본 주소지로 검색하여 입력
기본 주소가 오류데이터이거나 없는 경우는
정제대상에서 제외
우편번호 표준 형식이
아닌 경우
표준 포맷 시도군 구분(3자리)+lsquo-rsquo+지역구분(3
자리)
표준 포맷이 아닌 경우는 표준 포맷으로 변경
예) 300100=gt300-100
300 100=gt300-100
300100 =gt300-100
자리 수가 6자 이하이거나 가베지 데이터인
경우는 제거
우편번호가 old data
인 경우
현재 우편번호가 아닌 경우는 이전 우편번호
주소지를 기준으로 검색하여 입력하고 매핑되
지 않는 데이터의 경우는 삭제
자택전화
번호전화번호
Null인 경우
핸드폰번호가 존재할 경우 복제하여 입력 단 핸드폰 번호의 오류를 정제한 이후 처
리
전화번호가 표준 형식
이 아닌 경우
표준 포맷 국번(2~3자리)-지역전화번호(34자
리)-전화번호(4자리)포준 포맷으로 변경
예) 02-6746-1234 or 041-567-6789
국번은 지역별 국번 참조
내선번호는 유지
지역번호 없는 경우
국번 Null인 경우 자택 주소지의 시도 지역
번호를 입력
예) 6746-1234 이면서 서울 지역의 예
-gt 02-6746-1234
국가번호가포함된경우
(+)국가번호-국번-지역전화번호-전화번호의
형식으로 변경
예) +82-02-6746-1234
가베지 데이터의 경우
자리수가 작거나 크면 제거
예) 02-64-123 or 02-6746-123
숫자(특수문자 포함)가 아닌 문자이면 제거
전화번호 데이터가 아닌 경우 제거
핸드폰번호인 경우 전화번호핸드폰번호 표준포맷으로 변경
- 33 -
구분 항목 세부항목 정제항목 오류유형 정제지침
핸드폰번호 핸드폰번호
Null인 경우 정제 대상에서 제외
핸드폰번호가 표준 형
식이 아닌 경우
이동통신구분번호(3자리)-지역구분번호(34자
리)-전화번호(4자리)로 변경
예) 011-6746-1234 or 019-789-1234
이동통신구분번호는 이동통신사별 구분번호
참조 SK(011 017) KTF(016 018) KG(109)
010(공통)
국가번호가 포함된
경우
(+)국가번호-이동통신구분번호-지역구분번호-
전화번호의 형식으로 변경
예) +82-010-6746-1234
이동통신구분번호가
없는 경우
이동통신구분번호가 없는 경우는 가베지 데이
터으로 판단하여 제거
예) 672-1234의 경우
전화번호인 경우 전화번호핸드폰번호 표준포맷으로 변경
E-mail E-mail
Null인 경우 정제 대상에서 제외
표준 이메일 형식이
아닌 경우
표준 포맷 ID메일서버URI로 구성
예)admin1234daumnet kisti4530kistirekr
구분자 lsquorsquo lsquorsquo으로 변경 및 공란 제거
예) admindaumnet =gt admindaumnet
두 개이상의 이메일이 존재할 경우 앞에 것을
우선으로 유지함
예)admin1234daumnet kisti4530kistirekr
=gt admin1234daumnet
E-mail 데이터가 아닌
경우
E-mail 주소 데이터가 아닌 경우와 가베지 데
이터는 삭제
예) wwwkistirekr -- adminkisti 1 lsquorsquo
공란 등
소속
기관
사항
(11
개)
소속
기관명
소속기관
코드NA 코드 오류 유형 참조
소속
기관명
Null인 경우
소속기관코드가 존재하는 경우에는 해당 소속
기관코드의 명을 검색하여 입력하고 소속기관
코드가 존재하지 않으면 정제대상에서 제외
소속기관명이 NTIS
코드 내 명칭이 아
닌 경우
기관명이형전거DB의 대표기관명으로 변경
예) 서울대 -gt 서울대학교
- 34 -
구분 항목 세부항목 정제항목 오류유형 정제지침
단 기관명이형전거DB에 존재하지 않는 소속
기관명은 신규발급 요청하여 소속기관명을 유
지함
소속기관명이 아닌
경우
소속기관코드가 존재하는 경우에는 해당 소속
기관코드의 명을 검색하여 입력하고 소속기관
코드가 존재하지 않으면 정제대상에서 제외
부서명근무
부서명
Null인 경우 정제대상에서 제외
근무부서명이 아닌
경우
가베지 데이터인 경우만 삭제하고 이외의 경
우는 정제대상에서 제외
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
직위명
직위코드 NA 코드 오류 유형 참조
직위명
Null인 경우
직위코드가 존재하는 경우에는 해당 직위코드
의 명을 검색하여 입력하고 직위코드가 존재
하지 않으면 정제대상에서 제외
직위명이 직위코드 내
명칭이 아닌 경우
직위명이 직위코드내 존재하지 않으면 직위명
은 그대로 유지하고 직위코드는 기타(lsquo999rsquo)로
매핑함
직위명이 아닌 경우
직위코드가 존재하는 경우에는 해당 직위코드
의 명을 검색하여 입력하고 직위코드가 존재
하지 않으면 삭제
사무실
전화번호
사무실
전화
Null인 경우 정제대상에서 제외
전화번호가 표준 형식
이 아닌 경우
표준 포맷 국번(2~3자리)-지역전화번호(34자
리)-전화번호(4자리)포준 포맷으로 변경
예) 02-6746-1234 or 041-567-6789
국번은 지역별 국번 참조
내선번호는 유지
지역번호 없는 경우
국번 Null인 경우 소속기관 주소지의 시도
지역번호를 입력
예) 6746-1234 이면서 서울 지역의 예
-gt 02-6746-1234
국가번호가 포함된
경우
(+)국가번호-국번-지역전화번호-전화번호의
형식으로 변경
예) +82-02-6746-1234
- 35 -
구분 항목 세부항목 정제항목 오류유형 정제지침
가베지 데이터의 경우
자리수가 적거나 크면 제거
예) 02-64-123 or 02-6746-123
숫자(특수문자 포함)가 아닌 문자이면 제거
전화번호 데이터가 아닌 경우 제거
핸드폰번호인 경우 기본정보의 핸드폰번호로 이동
기관주소
기본주소
(주소1)
Null의 경우
우편번호가 존재하면 우편번호로 검색된 주
소 입력
단 우편번호 유효검사를 거친 우편번호만
대상으로 함
우편번호의 주소와 상
이한 경우
가베지 데이터가 아닌 경우에는 정제대상에서
제외
가베지 데이터인 경우기존 데이터는 삭제하고 우편번호가 존재하
면 우편번호로 검색된 주소 입력
상세주소
(주소2)
Null인 경우 정제대상에서 제외
주소정보가 아닌 경우주소정보가 아닌 가베지 데이터는 삭제
예) test 042-123-1234 등
우편번호
Null인 경우
기본 주소지로 검색하여 입력
기본 주소가 오류데이터이거나 없는 경우는
정제대상에서 제외
우편번호 표준 형식이
아닌 경우
표준 포맷 시도군 구분(3자리)+lsquo-rsquo+지역구분(3
자리)
표준 포맷이 아닌 경우는 표준 포맷으로 변경
예) 300100=gt300-100
300 100=gt300-100
300100 =gt300-100
자리 수가 6자 이하 이거나 가베지 데이터인
경우는 제거
우편번호가 old data
인 경우
현재 우편번호가 아닌 경우는 이전 우편번호
주소지를 기준으로 검색하여 입력하고 매핑되
지 않는 데이터의 경우는 삭제
인력
구분
인력
구분NA 기관명이형전거DB에 의해 매핑
최초
임용일
최초
임용일NA 날짜 오류 유형 참조
학력
사항전공
전공분야 NA 코드 오류 유형 참조
전공명 Null인 경우 정제대상에서 제외
- 36 -
구분 항목 세부항목 정제항목 오류유형 정제지침
(14
개)
전공명이 아닌 경우
가베지 데이터인 경우만 삭제하고 이외의 경
우는 정제대상에서 제외
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
취득대학
학위취득
대학코드NA 코드 오류 유형 참조
학위취득
대학명
Null인 경우
학위취득대학코드가 존재하는 경우에는 해당
학위취득대학코드의 명을 검색하여 입력하고
학위취득대학코드가 존재하지 않으면 정제대
상에서 제외
학위취득대학명이 학
위취득대학코드 내 명
칭이 아닌 경우
기관명이형전거DB의 대표기관명으로 매핑하
고 존재하지 않는 경우 신규 발급 요청하여
학위취득대학명을 유지함
학위취득대학명이 아
닌 경우
학위취득대학코드가 존재하는 경우에는 해당
학위취득대학코드의 명을 검색하여 입력하고
학위취득대학코드가 존재하지 않으면 삭제
학위 학위코드 NA 코드 오류 유형 참조입학일 입학년월 NA 날짜 오류 유형 참조졸업일 졸업년월 NA 날짜 오류 유형 참조
학과
학과코드 NA 코드 오류 유형 참조
학과명
Null인 경우 정제대상에서 제외
학과명이 학과코드내
명칭이 아닌 경우학과코드의 명으로 변경
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등
취득국가취득국가
코드NA 코드 오류 유형 참조
지도
교수명
지도
교수명
Null인 경우 정제대상에서 제외
이름이 아닌 경우 삭제하고 정제대상에서 제외
학위
논문명
최종학위
논문명1
Null인 경우 정제대상에서 제외
논문명1이 Null인경우논문제목1이 Null인 경우 논문제목2에서 이동
함
- 37 -
구분 항목 세부항목 정제항목 오류유형 정제지침
가베지 데이터인 경우
삭제
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
최종학위
논문명2
Null인 경우 정제대상에서 제외
논문명1이 Null인경우 논문제목1이 Null인 경우 논문제목1로 이동함
가베지 데이터인 경우
삭제
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터 문자열이지만 특정 문자가
반복된 데이터
학위
취득일
최종학위
취득일NA 날짜 오류 유형 정제지침 참조
경력
사항
(5개)
근무처명 근무처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
직위명
직위코드 NA 코드 오류 유형 정제지침 참조
직위명
Null인 경우 정제대상에서 제외
직위명이 직위코드내
명칭이 아닌 경우
직위명이 직위코드내 존재하지 않으면 직위명
은 그대로 유지하고 직위코드는 기타(lsquo999rsquo)로
매핑함
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
근무기간
근무
시작일NA 날짜 오류 유형 정제지침 참조
근무
종료일NA 날짜 오류 유형 정제지침 참조
자격
사항
(3개)
자격
발행처
자격
발행처
Null인 경우 정제대상에서 제외
가베지 데이터인 경우특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
- 38 -
구분 항목 세부항목 정제항목 오류유형 정제지침
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
자격증명 자격증명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
자격
취득일
자격
취득일NA 날짜 오류 유형 정제지침 참조
논문
실적
(8개)
논문
발표일
논문
발표일NA 날짜 오류 유형 정제지침 참조
국문
논문명
논문제목
국문
Null인 경우 정제대상에서 제외
필수
논문제목국문이 Null이고 논문제목영문이 Null
이 아닐 경우 논문제목영문을 논문제목국문으
로 이동시키고 논문제목영문은 Null로 갱신
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
영문
논문명
논문제목
영문
Null인 경우 정제대상에서 제외
필수
논문제목국문이 Null이고 논문제목영문이 Null
이 아닐 경우 논문제목영문을 논문제목국문으
로 이동시키고 논문제목영문은 Null로 갱신
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
저자역할
구분
저자역할
구분NA 코드 오류 유형 정제지침 참조
발행처 발행처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
- 39 -
구분 항목 세부항목 정제항목 오류유형 정제지침
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터학술지
구분
학술지구
분NA 코드 오류 유형 정제지침 참조
학술지명 학술지명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
SCI여부 SCI여부 NA 코드 오류 유형 정제지침 참조
지식
재산
권
(3개)
지식
재산권명
지식
재산권명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
출원_등
록번호
출원등록
번호
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
특허구분 특허구분 NA 코드 오류 유형 정제지침 참조
평가
위원
(13개)
소속
학협
회
현황
(5개)
담당업무 담당업무
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
직위 직위
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
- 40 -
구분 항목 세부항목 정제항목 오류유형 정제지침
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
학협회
사항
학협회명
Null인 경우 정제대상에서 제외
직위명이 포함되어 있
는 경우
직위명이 존재하지 않으면 직위명 항목에 복
사하고 직위명칭에 관련된 부분은 삭제 존재
한다면 관련 부분을 삭제
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
활동시작
일NA 날짜 오류 유형 정제지침 참조
활동종료
일NA 날짜 오류 유형 정제지침 참조
훈포
장
사항
(3개)
수상년월 수상년도 NA 날짜 오류 유형 정제지침 참조
수여
기관명
수여기관
명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
훈포장명 수상명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저역
서
실적
(5개)
저서명1 저서명1
Null인 경우 정제대상에서 제외
저서명1이 Null인 경
우저서명2를 저서명1로 저장
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저서명2 저서명2
Null인 경우 정제대상에서 제외
저서명1이 Null인 경
우저서명2를 저서명1로 저장
가베지 데이터인 경우 특수문자 숫자로만 구성되거나 그 외의 가베
- 41 -
구분 항목 세부항목 정제항목 오류유형 정제지침
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
발행년 발행년도 NA 날짜 오류 유형 정제지침 참조
발행처 발행처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저역서
구분
저역서
구분NA 코드 오류 유형 정제지침 참조
- 42 -
구분 항목 세부항목 정제항목 오류내역 정제지침
참여인력정보(11개)
소속기관사항(1개)
최초임용일최초임용일
YYYYMMDD
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
DD가 없는 경우 01일로 갱신
YYYYMMDD가 유
효하지 않은 경우
년도가 유효하면 월-gt01월 일-gt01
일로 갱신하고 년도 자체가 유효하
지 않으면 삭제
학력사항(3개)
입학일입학년월
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 03월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt03월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
졸업일졸업년월
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 02월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt02월로 갱신
하고 년도 자체가 유효하지 않으면
삭제입학년월보다 같
거나 작은 경우데이터 삭제
학위취득일
최종학위
취득일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효
하지 않은 경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
경력사항(2개)
근무기간근무시작일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
날짜로서 유효한 형태를 갖고 있지 않은 경우
- 43 -
구분 항목 세부항목 정제항목 오류내역 정제지침
제
근무종료일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
근무시작일보다
같거나 작은 경우
근무시작일에서 YYYYMM이 동일하
면 삭제하고 근무시작일에서 YYYY
은 동일하나 MM이 작을 경우에만
삭제
자격사항(1개)
자격취득일자격취득일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
논문실적(1개)
논문발표일논문발표일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효
하지 않은 경우
년도가 유효하면 월-gt01월로 갱신하고
년도자체가유효하지않으면삭제
소속학협회현황(2개)
학협회사항
활동시작일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경
우데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭제
활동종료일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하고
년도자체가 유효하지않으면 삭제
- 44 -
구분 항목 세부항목 정제항목 오류내역 정제지침
활동시작일보다
같거나 작은 경우
활동시작일에서 YYYYMM이 동일하
면 삭제하고 활동시작일에서 YYYY
은 동일하나 MM이 작을 경우에만
삭제
훈포장사항(1개)
수상년월수상년도
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 변경하고
년도자체가 유효하지않으면 삭제
평가위원(1개)
저역서실적(1개)
발행년발행년도
YYYY
Null인 경우 정제대상에서 제외
YYYY이 유효하지
않은 경우유효하지 않으면 삭제
구분 항목세부항목
정제항목 오류유형 정제지침
참여
인력
정보
(15개)
기본정보
(1개)
자택
우편번호
우편번호
기본주소
Null의 경우주소가 존재하면 주소지로 우편번호 검색
하여 우편번로를 입력(정제작업자)
우편번호와주소
정보가불일치
middot 기본 주소가 가베지 데이터가 아니고 상
세주소가 존재한다면 그대로 유지하고
가베지 데이터이면 우편번호 상 주소를
기본주소에 입력
상세주소가 존재하면서 오류 데이터가 아
닌 경우에는 기본주소의 변경은 하지 않으
며 기존의 우편번호를 주소지에 맞게 주소
검색하여 변경
소속기관
사항(4개)소속기관명
소속기관코드
소속기관명
Null인 경우 정제대상에서 제외
소속기관명만
존재하는 경우
기관명이형전거DB에서 검색하여 이형기관
코드 대표기관명으로 매핑하고 존재하지
않는 경우 신규 발급 요청하여 그대로 유
지함
시작일보다 종료일이 같거나 작은 경우 종료일을 삭제
날짜의 경우 본인의 생년월일보다 작을 수 없음
코드의 값이 정해진 범위를 벗어난 경우
- 45 -
구분 항목세부항목
정제항목 오류유형 정제지침
소속기관코드만
존재하는 경우
해당 소속기관코드를 기관명이형전거DB에
서 검색하여 소속기관명을 갱신하며 매핑
되지 않는 소속기관코드는 삭제
직위명직위코드
직위명
Null인 경우 정제대상에서 제외
직위명만 존재
하는 경우
직위명으로 동일 또는 유사한 직위코드를
검색하여 입력하고 직위코드 내 존재하지
않는 직위명칭이면 lsquo기타rsquo로 매핑
[직위코드] NTIS 직위코드 참조
직위코드만 존
재하는 경우
해당 직위코드를 NTIS 직위코드의 직위명
으로 검색하여 갱신하며 매핑되지 않는 직
위코드는 삭제
[직위코드] NTIS 직위코드 참조
기관주소 우편번호
Null의 경우
주소가 존재하면 주소지로 우편번호 검색
하여 입력
단 우편번호 내 기본주소만 가능
우편번호와 기
본주소가 불일
치
기본 주소가 가베지 데이터가 아니고 상세
주소가 존재한다면 그대로 유지하고 가베
지 데이터이면 우편번호 상 주소를 기본주
소에 입력상세주소가 존재하면서 오류 데이터가 아
닌 경우에는 기본주소의 변경은 하지 않으
며 기존의 우편번호를 주소지에 맞게 주소
검색하여 변경
인력(직업)
구분인력유형구분
Null인 경우 정제대상에서 제외인력유형구분
코드 범위를
벗어나는 경우
[인력구분코드] 대학교 연구소 산업계 기
타 등 구분코드 범위를 벗어나는 데이터는
Null로 갱신
학력사항
(5개)
전공전공코드
전공명
Null인 경우 정제대상에서 제외전공명만 존재
하는 경우
전공명으로 NTIS 전공코드를 검색하여 입
력
[전공코드] NTIS 전공코드 참조
전공코드만 존
재하는 경우
해당 전공분야코드를 NTIS 전공코드에서
전공명을 검색하여 갱신하며 매핑되지 않
는 전공코드는 삭제
[전공코드] NTIS 전공코드 참조
취득대학
학위취득대학
코드
학위취득대학명
Null인 경우 정제대상에서 제외
학위취득대학
명만 존재하는
경우
기관명이형전거DB에서 검색하여 이형기관
코드 대표기관명으로 매핑하고 존재하지
않는 경우 신규 발급 요청하여 그대로 유
지함
- 46 -
구분 항목세부항목
정제항목 오류유형 정제지침
학위취득대학
코드가 존재하
는 경우
해당 학위취득대학코드를 기관명이형전거
DB에서 검색하여 학위취득대학명을 갱신하
며 매핑되지 않는 학위취득대학코드는 삭
제
학위 학위코드
Null인 경우 정제대상에서 제외
학위코드 범위
를 벗어나는
경우
존재하는 학위코드가 NTIS 학위코드와 매
핑되는지 확인하고 멥핑되지 않는 학위코
드는 삭제
[학위코드] NTIS 학위코드 참조
학과학과코드
학과명
Null인 경우 정제대상에서 제외
학과명만 존재
하는 경우
학과명으로 동일 또는 유사한 NTIS 학과코
드를 검색하여 입력하고 NTIS 학과코드 내
존재하지 않는 학과명이면 기타 코드로 매
핑함
[학과코드] NTIS 학과코드 참조
학과코드만 존
재하는 경우
해당 학과코드를 NTIS 학과코드의 학과명
을 검색하여 갱신하며 매핑되지 않는 학과
코드는 삭제
[학과코드] NTIS 학과코드 참조
취득국가 취득국가코드
Null인 경우 정제대상에서 제외
취득국가코드
의 범위를 벗
어나는 경우
존재하는 국가코드가 NTIS 국가코드와 매
핑되는지 확인하고 멥핑되지 않는 국가코
드는 삭제
[국가코드] NTIS 국가코드 참조
경력사항
(2개)직위명
직위코드
직위명
Null인 경우 정제대상에서 제외
직위명만 존재
하는 경우
직위명으로 동일 또는 유사한 직위코드를
검색하여 입력하고 직위코드 내 존재하지
않는 직위명칭이면 lsquo기타rsquo로 매핑
[직위코드] NTIS 직위코드 참조
직위코드만 존
재하는 경우
해당 직위코드를 NTIS 직위코드의 직위명
으로 검색하여 갱신하며 매핑되지 않는 직
위코드는 삭제
[직위코드] NTIS 직위코드 참조
논문실적
(3개)
저자역할
구분저자역할구분
Null인 경우 정재 대상에서 제외
저자역할구분존재하는저자역할구분가 NTIS 저자역할구
- 47 -
구분 항목세부항목
정제항목 오류유형 정제지침
코드의 범위를
벗어나는 경우
분코드와 매핑되는지 확인하고 멥핑되지
않는 국가코드는 삭제
[역할구분코드] NTIS 저자역할구분코드 참
조
학술지
구분학술지구분
Null인 경우 정재 대상에서 제외
학술지구분코
드의 범위를
벗어나는 경우
존재하는 학술지구분코드가 NTIS 학술지
구분코드와 매핑되는지 확인하고 멥핑되지
않는 학술지구분코드는 삭제
[학술지구분코드] NTIS 저자역할구분코드
참조
SCI여부 SCI여부
Null인 경우 정재 대상에서 제외
SCI여부구분코
드의 범위를
벗어나는 경우
존재하는 SCI여부구분코드가 lsquo01 또는
02가 아닌 데이터는 Null로 갱신
[SCI여부구분코드] NTIS SCI여부구분코드
참조
지식
재산권
(1개)
특허구분 특허구분
Null인 경우 정제대상에서 제외
특허구분코드
의 범위를 벗
어나는 경우
존재하는 특허구분코드가 NTIS 특허구분
코드와 매핑되는지 확인하고 멥핑되지 않
는 특허구분코드는 삭제
[특허구분코드] NTIS 특허구분코드 참조
평가위원(1개)
저역서실적(1개)
저역서구분 저역서구분
Null인 경우 정제대상에서 제외
저역서구분코
드의 범위를
벗어나는 경우
존재하는 저역서구분코드가 NTIS 저역서
구분코드와 매핑되는지 확인하고 멥핑되지
않는 저역서구분코드는 삭제
[저역서구분코드] 1저서 2역서 中 택일
공통사항
- 매핑하고자 하는 기존 코드명(공란 및 특수문자 제거)으로 NTIS 표준 코드 內 한글코드명을 대
상으로 검색하여 동일한 코드명(11의 경우)은 시스템(SQL App 등)을 통해 미리 매핑하고 유사
한 코드명(1N의 경우)은 정제작업자가 선택한 코드로 입력하여 매핑 처리
- 코드 종류가 소수(3개 미만)인 경우 Source 데이터 내 등록되어 있는 코드 또는 코드명칭을 대
상으로 동일한 패턴별로 일괄 변환(SQL Query Excel)처리한 후 변환되지 않은 데이터는 삭제
- 코드가 가베지 데이터인 경우는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 영숫자가 아닌 특수문자로만 구성된 데이터 특정 문자가 반복된 코드와
관련되지 않은 데이터
- 48 -
구분 항목 이중등록검사항목 정제지침 비 고
참여
인력
정보
기본
정보주민등록번호()
주민등록번호가 동일한 인력데이
터가 2개 이상이면 시스템으로
추출하여 이중등록검사를 수행함
시스템 정제
소속기
관사항소속기관명()
인력별 동일한 소속기관사항 데이
터가 2개 이상이면 시스템으로
추출하여 1개만 남겨 놓고 나머지
는 오류 체크 필드에 표시함
시스템 정제
학력
사항
1 취득대학() 학위() 입학일
2 취득대학() 학위() 졸업일
3 취득대학() 학위() 전공
4 취득대학() 학위() 학과
5 취득대학() 학위() 학위취득일
인력별 동일한 학력사항 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
경력
사항
1 근무처명() 직위명 근무시작일
1 근무처명() 직위명 근무종료일
인력별 동일한 경력사항 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
논문
실적
1 논문명() 논문발표일 학술지명
2 논문명() 논문발표일 ISSN
3 논문명() ISSN 게재권집 게재
호
4 논문명() 학술지명 게재권집
게재호
인력별 동일한 논문실적 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
지식
재산권
1 출원_등록번호()
2 지식재산권명() 출원등록구분
특허구분() 출원국가
인력별 동일한 지식재산권 데이터
가 2개 이상이면 시스템으로 추
출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
시스템 정제
저역서
실적
1 ISBN
2 저역서명() 저역서구분() 발행
인력별 동일한 저역서실적 데이터
가 2개 이상이면 시스템으로 추시스템 정제
143 이중등록 유형별 정제지침
이중등록 정제 지침
- 이중등록에 대한 정제는 오류 유형 정제 및 코드 매핑 처리 후 수행함
- 이중등록에 대한 데이터는 최신 데이터를 우선으로 유지함
- 이중등록검사항목의 문자Type의 데이터는 공란제거 제거 후 이중등록검사를 수행함
- 대상데이터의 이중등록검사항목 중 1개 이상 항목이 Null인 경우 이외의 항목이 동일하
여도 이중등록 정제 대상에서 제외함
- 49 -
구분 항목 이중등록검사항목 정제지침 비 고
년 발행처출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
평가
위원
소속학
협회
현황
1 학협회명() 직위 시작일
2 학협회명() 직위 종료일
인력별 동일한 소속학협회현황
데이터가 2개 이상이면 시스템으
로 추출하여 1개만 남겨 놓고 나
머지는 오류 체크 필드에 표시함
시스템 정제
훈포장
사항훈포장명() 수상년월 수여기관명
인력별 동일한 훈포장사항 데이터
가 2개 이상이면 시스템으로 추
출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
시스템 정제
자격
사항
자격증명() 자격발행처 자격취득
일
인력별 동일한 데이터가 2개 이상
이면 시스템으로 추출하여 1개만
남겨 놓고 나머지는 오류 체크 필
드에 표시함
시스템 정제
15 데이터 정제 절차 및 작업지침
151 데이터 정제 절차
- 50 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
데이터
정제
준비
초기
데이터
구축
연계기관기반 정보취합
연계기관 인력데이터 구조(스키마 엔터티 정의)코드정보 등 통합 인력DB로의 이관을 위한 연계기관 제공 정보 취합
기관 협의 정보 제공 기반정보 분석
연계대상기관데이터 취합
통합하고자 하는 연계기관 인력데이터를 제공받아 Temp DB(연계기관데이터 구조와 동일)에등록
기관 협의 데이터제공 데이터 생성
연계기관
데이터 이관
준비
NTIS 표준 코드정보를KISTI로부터 제공받음 표준 코드 제공 코드 분석
기존 코드별 NTIS 표준코드 매핑 정의 표준코드매핑 작성
플래그성 매핑기준작성
기존 데이터에 표준 코드 반영 표준코드 매핑처리
표준 코드 적용결과 검토 데이터 확인
연계기관
데이터 분석
및 매핑계획
수립
연계기관 데이터 분석 데이터 분석 데이터 분석
연계기관 코드매핑 정의 기관 코드매핑 작성플래그성 매핑 기준 작성
테이블매핑 정의테이블 매핑정보확정
테이블 매핑(안) 작성
데이터
정제 기준
및
계획 수립
과학기술 인력정보 데이터 분석
정제 대상 RampD참여인력데이터 분석
정제 대상 항목 및 기준에 대한 정의
데이터 정제 내역검토
데이터 분석
데이터정제 내역작성
데이터 정제기준 및 절차협의
정제 대상 데이터 건수및 연계 기관 인력데이터 포함 범위 정제 항목 선정 정제 공정(정제 1차 검증 최종 확인) 확정
정제 범위 대상 확정 협의 진행
데이터 정제매뉴얼 작성
데이터정제매뉴얼구성내용
데이터정제개요및절차정의
정제대상정의및정제범위
정제항목별기준및예시
정제검증도구사용법
전환코드표
표준양식
정제매뉴얼 검토및 확정
정제매뉴얼 초안작성
상세일정계획수립
정제 량을 분석하여 투입인력대비 주월별 데이터 정제 계획대비 실적 산정
일정 검토 및 확정 일정계획 작성
152 정제 단계별 작업 지침
- 51 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
데이터 정제 작업 환경 구축
작업 환경 및작업자 구성 데이터 정제 환경 구성
작업자 모집
작업장 환경 구축(월평동)
데이터정제 작업교육실시
정제작업자 및 정제관리자를 대상으로 교육 실시 및교육결과서작성
작업자 정제작업교육 실시
데이터정제진행
정제 작업수행
데이터 정제및 검증 데이터 정제 추진결과
데이터 정제
정제결과 검증(작업자별 검증)
정제추진현황보고 실적 보고
실적 확인 및 이슈사항 협의
주별진척보고
이슈사항 및 문제점 보고
데이터정제완료
데이터 이관 및 검수
데이터 이관정제된 데이터를 작업DB에서 서비스DB 로이관
이관 확인 데이터 이관
데이터 검수(최종 확인)
RampD 참여인력 데이터(정제 결과물) 검사 (샘플링 검수)
검수(샘플링)검수 데이터 추출제공
153 항목별 정제작업 세부지침
공통사항 및 시스템정제
공통사항
1 정보유형별로 주요항목이 존재하지 않는 경우라도 기본 학력 소속기관사항은 삭제하지
않고 실적정보는 삭제 처리함
가 정보유형별로 경력정보 실적정보의 주요항목이 Null인 데이터는 삭제
나 기존데이터의 경우 학력 소속기관사항은 주요항목이 Null이지만 현황정보 제공 필드가
존재하면 유지함
학력사항 학위 전공 등 존재하면 유지
소속기관사항 우편번호 직위 등 존재하면 유지
2 코드 항목 값을 NTIS 코드정보 내 명칭으로 갱신함
가 소속기관명 학위취득대학명 학과명 전공명 직위명 등을 NTIS 표준코드로 매핑하여
코드값을 넣고 각 항목에 NTIS 코드정보 내 코드명으로 변환하여 갱신함
- 52 -
No원본데이터 정제 후
정제요령 비고코드 명 코드 명
1 한국타이어(주) AAB6793 (주)한국타이어
기관명이형전거DB에서
대표기관명과
이형기관코드로 매핑
2 연구원 B06 연구원 직위코드 매핑
3 가베지 데이터의 값을 삭제 처리함
가 정보유형별 각 항목에서 가베지 데이터에 대해 삭제 처리함
No원본데이터 정제 후
정제요령 비고데이터 데이터
1 test 가베지 처리
2 가베지 처리
3 - 가베지 처리
4 가베지 처리
5 blank 가베지 처리
6 가베지 처리
7 서울대학교 서울대학교 정제 처리
시스템정제
1 비교대상이 존재하지 않는 항목에 대해서는 시스템정제(Null처리) 한다
가 시스템정제 항목
항목 세부항목 비고소속기관 인력구분
학력사항취득국가학위
지식재산권 특허구분
저역서실적 저역서구분
논문실적저자역할구분학술지구분SCI여부
비 고
shy 날짜 데이터의 경우 생성일이 완료일보다 후에 있는 경우 생성일을 남
겨놓고 완료일 삭제
shy 년도 포맷의 경우 1900년도~현재(정제시점)을 기준으로 이전이나 이후는
Null 로 갱신
shy 날자 데이터의 경우 생년월일보다 빠른 경우는 삭제
기본정보
기본정보_주민등록번호 정제지침
1 주민등록번호가 null인 경우 정제대상에서 제외
- 53 -
2 주민등록번호가 유효하지 않은 lsquo-rsquo포함한 14자가 아닌경우 정제대상에서 제외
No원본데이터 정제 후
정제요령 비고주민번호 이름 주민번호 이름
1 090166-471ORHAN
NALCIOGLU090166-471
ORHAN
NALCIOGLU정제대상에서 제외
2 000000-1111111 홍길동 000000-1111111 홍길동 lsquo-rsquo포함 14자리는 유지
3 194912-100001F 요이치로스즈키 194912-100001F 요이치로스즈키주민번호에 영문자
포함(F) 데이터 유지
4 1234561234567 홍길동 123456-1234567 홍길동 lsquo-rsquo 추가
3 기타사항
가 주민번호에 특수문자 포함시 가베지 데이터 처리(삭제)
기본정보_성명 정제지침
1 각 항목(한글영문한자)에 맞는 데이터 값 확인
2 성명 이외의 가베지 데이터는 삭제
3 한글한자영문이름이 모두 null인 경우 데이터 유지(서비스 제외)
4 한글한자영문이름이 가베지 데이터인 경우 가베지 값 삭제 데이터 유지(서비스 제외)
5 한글한자영문 이름을 각 항목에 맞게 값을 이동(한글성명은 한글 영문성명은 영문 한
자성명은 한자)
6 한글한자영문 이름이 기업명 또는 법인명인 경우 데이터 삭제
No원본데이터 정제 후
정제요령 비고한글이름 영문이름 한글이름 영문이름
1 SK LEE SK LEE 맞는 항목으로 값을 이동
2 test -- 삭제
3홍길동
(영구참여제한자)HONG GD 홍길동 HONG GD
이름 외 가베지 데이터
삭제
영문성명이 성+이니셜은
유지
4 성진기계 기업 법인명 삭제
5 홍 길 동 HGD 홍길동 영문성명 삭제
공란 제거
기본정보_주소 우편번호 정제지침
1 우편번호와 주소 모두 null인 경우 정제대상에서 제외
2 우편번호가 표준 형식이 나닌 경우 표준 포맷으로 변경(lsquo-rsquo포함한 7자리)
- 54 -
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302230 302-230 표준 포맷으로 변경
3 우편번호는 null 이지만 주소는 존재하는 경우 주소를 검색하여 우편번호 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 대전 서구 정림동 302-230 대전 서구 정림동우편번호에서 검색하여
매핑한다
4 우편번호는 존재하나 주소가 null인 경우 우편번호에 해당하는 주소 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302-230 302-230 대전 서구 정림동우편번호에서 검색하여
기본주소까지 입력한다
5 우편번호와 주소 값이 가베지 데이터인 경우 가베지 처리
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 111-1 대구 수성구 가베지 처리
2 111 대전 서구 정림동 302-230 대전 서구 정림동
기존 가베지 우편번호
대신에 주소를 가지고
새로운 우편번호를
검색하여 매핑한다
6 우편번호 체계가 OLD 데이터인 경우 현 주소로(NTIS 우편번호체계) 검색하여 매핑
No원본데이터 정제 후
정제요령 비고우편번호 주소1 우편번호 주소
1 449-981경기도 용인시 수지읍 성복리
LG2차아파트201~208동448-981
경기 용인시 수지구 성복동
LG2차빌리지
우편번호에서 검색하여
현재 우편번호로 매핑함
7 기타사항
가 외국주소 데이터 유지 원칙
(1) 우편번호가 국내우편번호인 경우는 우편번호만 가베지 처리
(2) 기본주소에 국가명만 존재해도 데이터 유지
나 주소가 2개 이상인 경우 세부주소를 포함한 주소로 정제
다 기본주소와 상세주소 구분(우편번호 기준 원칙)
(1) 기본주소 우편번호를 검색하여 나온 해당 주소
(2) 상세주소 우편번호를 검색하여 나온 해당 주소 이외의 주소
- 55 -
No원본데이터 정제 후
정제요령 비고우편번호 주소1 주소2 우편번호 주소1 주소2
1
11 schlundt
annex columbia
mo 65211 usa
11 schlundt annex
columbia mo
65211 usa
외국주소는 유지
2 USA USA기본주소에 국가명만
존재해도 데이터 유지
3 137-764
서울 서초구
반포2동
반포주공아파트
0동 0호
137-764
서울 서초구
반포2동
반포주공아파트
0동 0호 기본주소와 상세주소 구분
기본정보_전화번호 핸드폰번호 정제지침
1 전화번호가 null인 경우 정제대상에서 제외
2 전화번호 기본포멧 유지
가 지역번호-국번-전화번호
나 +국가번호-지역번호-국번-전화번호
다 이동통신구분번호(3자리)-지역구분번호(34자리)-전화번호(4자리)
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 042)123-4567 010-1234567 042-123-4567 010-123-4567 기본포맷으로 변경
2 015-123-1234
SK(011 017) KTF(016
018) KG(109) 010(공통)
만 유지
3 +1-125-123-1234 +1-111-123-1215 +1-125-123-1234 +1-111-123-1215 외국전화번호는 유지
3 지역번호 없는 경우 주소지의 시도 지역번호를 입력
No원본데이터 정제 후
정제요령 비고자택 전화번호 주소 자택 전화번호 주소
1 6746-1234 서울 강남구 서초동 02-6746-1234 서울 강남구
서초동
주소지의 시도 지역번호를
입력
2 6746-1234 주소정보 없으므로 삭제
4 국가번호가 포함된 경우 ldquo(+)국가번호-국번-지역전화번호-전화번호ldquo 형태로 변경
No원본데이터 정제 후
정제요령 비고자택 전화번호 자택 전화번호
1 +82)02-6746-1234 +82-02-6746-1234
ldquo(+)국가번호-국번-지역전
화번호-전화번호ldquo 형태로
변경
5 전화번호 외 가베지 데이터는 삭제
- 56 -
가 텍스트 최소자릿수 미달(3자리 미만)등
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 02-64-123 010-111-111 자리수가 작으면 제거
6 데이터를 각 항목에 맞도록 이동 정제
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 010-2353-0416 042-123-0416 042-123-0416 010-2353-0416전화번호와 핸드폰 번호를
각 항목에 맞게 이동
7 기타사항
가 내선번호 및 과거지역번호 데이터 유지
나 전화번호가 2개 이상인 경우 앞의 전화번호를 우선으로 유지함
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 0431-123-1234 0431-123-1234 예전 지역번호는 유지
2 042-123-1234(100) 042-123-1234(100) 내선번호 유지
3 0431-123-1234 1235 0431-123-1234 앞의 전화번호를 우선으로
유지
기본정보_e-mail 정제지침
1 이메일 기본포멧 오류 및 내용상 무의미한 값 가베지 처리
No원본데이터 정제후
정제요령 비고e-mail e-mail
1 123123com 가베지 처리
2 1111111com 가베지 처리
3 123 가베지 처리
4 wwwkistirekr 가베지 처리
5 --- 가베지 처리
2 E-mail 2개 이상 존재 가베지 삭제 후 이상없는 값은 모두 유지
No원본데이터 정제후
정제요령 비고e-mail e-mail
1chhyangmdhanmailnet
chhyangdumcorkrrchhyangmdhanmailnet
앞의 이메일을 우선으로
유지함
2 abcdaumnet abcdaumnet이메일의 구분자가 누락된
경우 구분자 추가함
- 57 -
소속기관사항
소속기관_주소 우편번호 정제지침 ( 기본정보_주소 우편번호 정제지침 참조)
1 우편번호와 주소 모두 null인 경우 - 정제대상에서 제외
2 우편번호는 null 이지만 주소는 존재하는 경우 주소를 검색하여 우편번호 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 대전 서구 정림동 302-230 대전 서구 정림동우편번호에서 검색하여
매핑한다
3 우편번호는 존재하나 주소가 null인 경우 우편번호에 해당하는 주소 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302-230 302-230 대전 서구 정림동우편번호에서 검색하여
기본주소까지 입력한다
4 우편번호와 주소 값이 가베지 데이터인 경우 가베지 처리
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 111-1 가정교육학 가베지 처리
2 111 대전 서구 정림동 302-230 대전 서구 정림동기존 가베지 우편번호 대신에 주소를 가지고
새로운 우편번호를 검색하여 매핑한다
5 우편번호 체계가 OLD 데이터인 경우 현 주소로 검색하여 매핑
6 기타사항
가 외국주소 데이터 유지 원칙
(1)우편번호가 국내우편번호인 경우는 우편번호만 가베지 처리
(2)기본주소에 국가명만 존재해도 데이터 유지
나 주소가 2개 이상인 경우 소속기관명을 기준으로 정제(소속 기관이 소재한 주소만 유
지하고 그 외 주소는 가베지 처리)
다 기관 주소로 적합하지 않은 주소(자택주소)인 경우 유효한 주소로 정제(주소가 둘 이
상일 경우)
소속기관_사무실전화번호 팩스번호 정제지침 ( 기본정보_전화번호 핸드폰번호 정제지침 참조)
1 전화번호가 null인 경우 정제대상에서 제외
2 전화번호 기본포멧 유지
가 지역번호-국번-전화번호
- 58 -
나 +국가번호-지역번호-국번-전화번호
3 전화번호 외 가베지 데이터는 삭제
가 텍스트 최소자릿수 미달(3자리 미만)등
4 데이터를 각 항목에 맞도록 이동 정제
No원본데이터 정제 후
정제요령 비고사무실 전화번호 기본정보핸드폰 번호
1 010-2353-0416 010-2353-0416
사무실전화번호에
핸드폰번호 형태의
데이터가 있을 경우
삭제하고 기본정보의
핸드폰번호가 널일
경우에만 이동함
5 기타사항
가 내선번호 및 과거지역번호 데이터 유지
나 지역번호 누락시 주소항목에서 유추 기입(유추 불가시 널처리)
다 전화번호가 2개 이상인 경우 기존 데이터 유지
라 기준에 명시되지 않은 사항은 추후 사업주관기관과 협의하여 진행
소속기관_기관 부서명 직위 정제지침
1 기관 부서명 직위 모두 null인 경우 정제대상에서 제외
2 기관 직위는 NTIS 코드값에서 검색하여 매핑
3 인력구분은 기관명이형전거DB에 의해 자동 매핑함
No원본데이터 정제 후
정제요령 비고기관코드 기관명 기관코드 기관명
1 한국타이어(주) AAB6793 (주)한국타이어
기관명이형전거DB에서
대표기관명과
이형기관코드로 매핑
No원본데이터 정제 후
정제요령 비고직위코드 직위명 직위코드 직위명
1 교수 A01 교수NTIS 직위코드에서
검색하여 매핑한다
2 항해사 999 항해사
직위코드에 매핑되지
않으면 직위코드는 lsquo999rsquo로
매핑하고 직위명은 유지함
4 필드내 중복데이터가 존재할 경우 가베지 처리하고 각 필드와 부합하지 않는 데이터는
해당 필드로 이동
5 해당 필드내 부합되지 않는 데이터는 해당필드로 옮기고 가베지 처리
- 59 -
No원본데이터 정제 후
정제요령 비고직위코드 직위명 직위코드 직위명
1 비정규직 가베지 처리
6 기타사항
가 소속기관이 2개 이상인 경우
(1)주소 데이터를 참고하여 해당 기관명만 유지하고 이외의 데이터는 가베지 처리
(2)주소 데이터가 없는 경우에는 대학교 연구소 산업계 기타 기관 순으로 정제
나 항목별 값이 2개 이상인 경우 해당 필드에 기 입력된 값을 우선하여 유지하고 이외
의 데이터는 가베지 처리
다 기관명이형전거DB에 존재하지 않는 기관은 신규발급 요청 후 매핑
라 기준에 명시되지 않은 사항은 사업주관기관과 협의하여 진행
소속기관_최초임용일 정제지침
1 날짜 오류 유형 정제
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMMDD
No원본데이터 정제 후
정제요령 비고생년월일 최초임용일 생년월일 최초임용일
1 19500310 19451011 19500310날짜는 생년월일 보다
작을수 없으므로 삭제
2 19500310 20101010 19500310날짜는 현재보다 클수
없으므로 삭제
3 19500310 19000101 19500310 1900년 이전은 삭제
학력사항
학력사항_전공 정제지침
1 전공분야코드와 전공명 모두 null인 경우 정제대상에서 제외
2 전공명은 있으나 전공분야코드가 null인 경우 전공명을 검색하여 전공분야코드 입력
가 전공명과 정확히 일치하는 전공분야코드가 존재하는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 정보통신 D130700 정보통신 정보통신전공명과 일치하는
코드값을 매핑한다
나 전공명에 공백이 있는 경우
- 60 -
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 무기 화학 C060300 무기화학 무기화학공백제거후 일치하는
값을 찾아 매핑한다
다 정확히 일치하는 전공명이 검색되지 않는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 농생물학 F010300 농생물학 농생물근사치의코드값으로매
핑한다
2 생물 C070000 생물 생물학
3 화학전공 C060000 화학전공 화학
4 컴퓨터학과 D130000 컴퓨터학과 컴퓨터학
5 물리전공 C040000 물리전공 물리학
라 전공명이 영문일 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 Medicinal Chemistry C060519Medicinal
Chemistry의약화학
영문을 번역하여
코드값을 찾아
매핑한다
마 전공명칭의 중간에 구분기호 ( - () amp
및 등) 가 포함되어 있는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 미생물계통분류 C070901 미생물계통분류 미생물분류계통
구분기호와 낱말의
순서를 무시하고
매핑한다
2 동물학유전학 C071000 동물학유전학 동물학
구분기호를 기준으로
앞부분 부터 일치하는
순으로 매핑한다
3 병리학 폐암병리 E050000 병리학 폐암병리 병리학
4 환경생태생리 D110800 환경생태생리 환경생태
5 의약화학-약리 C060519 의약화학-약리 의약화학
6 전기공학(컴퓨터공학) D090000전기공학(컴퓨터공학
)전기공학
7 원격탐사amp지구물리 D140900 원격탐사amp지구물리 원격탐사
8 물리화학및 무기화학 C060300물리화학및
무기화학무기화학
바 상기 방법으로 매핑이 불가능한 경우
- 61 -
No
원본데이터 정제 후
코드매핑 결과 정제요령 비고학위취득대학코드
(코드값 없을경우)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 서울대학교 7006431 서울대학교 서울대학교 기관명이형전거DB를
이용하여
학위취득대학코드에는
이형기관코드
학위취득대학명에는
대표기관명을 매핑함
2 서울대학교
공과대학ZD13063 서울대학교 서울대학교
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 발사체 공력 해석 D049900 발사체 공력 해석 기타항공우주공학
전공명을 포괄하는
상위 코드값으로
매핑한다
2 SOLID
MECHANICSD020299
SOLID
MECHANICS기타고체및구조역학
사 원본데이터의 코드값이 오류인 경우(전공분야코드가 아닌 경우)
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 0160 건축공학 D150000 건축공학 건축공학
원문의 코드값을
가베지 처리 후
재매핑한다
3 전공명이 오류인 경우(전공명이 아닌 경우)
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고직위코드 직위명 직위코드 직위명
1 訣廢点뼈膀갹쳬窩 가베지 처리
2 석사학위 없음 가베지 처리
학력사항_취득대학 정제지침
기관명이형전거DB를 이용하여 학위취득대학코드 및 학위취득대학명 정제
1 학위취득대학코드와 학위취득대학명 모두 null인 경우 정제대상에서 제외
2 학위취득대학명은 존재하나 학위취득대학코드가 null인 경우 기관명이형전거DB에서 검
색하여 학위취득대학코드 입력
3 학위취득대학명 풀네임이 아닐때 학위취득대학코드가 null인 경우 - 기관명이형전거DB에
- 62 -
No
정제전 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(()내용이 모두
없을경우)
학위취득대학명학위취득대학코드
(검색코드입력)코드학위취득대학명
1 연세대학교(원주) ZD13266 연세대학교 연세대학교
기관명이형전거DB를
이용하여
학위취득대학코드에는
이형기관코드
학위취득대학명에는
대표기관명을 매핑함
No
정제전 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(기존 코드값)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 114800 서울대학교 7006431 서울대학교 서울대학교
학위취득대학명 검색
기존데이터 가베지
처리 후 검색된 코드
입력
No
정제전(표준대학명 설정) 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(표준대학명
기준설정)
학위취득대학명학위취득대학코드
(검색코드입력)학위취득대학명
1 가톨릭대학교가톨릭대학교(본
부)7001337 가톨릭대학교 가톨릭대학교
신규 발급 요청 후
코드 입력
No
정제전(개칭 외국취득대학명) 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(검색된값)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 부경대학교 부산수산대학교 7003010 부경대학교 부경대학교
인터넷
학위취득대학명
검색하여 검색된 코드
입력
2 東京大學 도쿄대학 JA0122 도쿄대학 東京大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
3 東京工業大學Tokyo Institute
of TechnologyJA0114
Tokyo Institute
of Technology東京工業大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
서 검색하여 학위취득대학코드 입력
4 기존 학위취득대학코드가 있는 경우 NTIS 코드값으로 변경
5 취득대학명 검색 후 취득대학코드가 없을 경우 학위취득대학명 신규 발급 요청 후 코드
기입
6 취득대학명이 개칭 혹은 외국취득대학명일 경우 검색해서 학위취득대학코드 기입함
- 63 -
4 早稻田大學(일본)와세다
대학JA0319 (일본)와세다 대학 早稻田大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
5 서울산업대학교 경기공업전문대학 7002623 경기공업전문대학 서울산업대학교
인터넷
학위취득대학명
검색하여 검색된 코드
입력
오탈자 정제요령
서울대하교 서울대학교 (오탈자 수정)
7 가베지값
가베지 정제요령
111ㄴㄴㄴ amp 김정구 없슴 등등 가베지 처리
8 오탈자
학력사항_학과 정제지침
1 학과코드와 학과명 모두 null인 경우 정제대상에서 제외
2 학과코드는 존재하나 학과명이 null인 경우 학과코드를 검색하여 학과명 입력
No원본데이터 정제 후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 0015 0015 가정 가정코드표에서 학과코드로
검색하여 매핑한다
3 학과명은 존재하나 학과코드가 null인 경우 학과명을 검색하여 학과코드 입력
가 학과코드표에 학과명과 정확히 일치하는 값을 찾아 매핑
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가정 0015 가정 가정코드표에서 학과명으로
검색하여 매핑한다
나 정확히 일치하는 학과명이 검색되지 않는 경우 근사값으로 매핑
- 64 -
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가축번식학번식공
학 전공명칭
전공필드가 Null인 경우
전공필드로 이동한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 건설공학대학원
박사후기9475
건설공학대학원박사
후기대학원
대학원의 경우 일치하는
값이 없으면 상위 개념으로
검색하여 매핑한다
2 이과대학
단과대학의 경우 일치값이
없으면 가베지 처리한다 -
학과명 삭제
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가정교육학 0040 가정교육학 가정교육 근사 값으로 매핑한다 유사
2 기계설계학전공 1260 기계설계학전공기계설계
기계설계학
검색값이 여러 개인 경우
일치도가 높은 값으로
매핑한다
유사
3 건축공학계열 0160 건축공학계열
건축공학
건축공학과
건축공학부
건축공학교육
일치도가 같은 여러 개의
값이 검색된 경우 글자수가
가장 적은 값으로
매핑한다
유사
일치도 높은 값을 매핑 한다하여 ldquo건축공학rdquo을 ldquo건축rdquo의 형태와 같이 학과 자체가 바뀔
수 있는 매핑을하지 않도록 주의한다
다 학과명칭의 중간에 구분기호(쉼표() 마침표() slash() and(amp) 등)가 있으면서 정확히
일치하는 학과명이 검색되지 않는 경우
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 전기 및
컴퓨터공학과0073
전기 및
컴퓨터공학과전기컴퓨터공학과
구분기호를 무시하고
매핑한다
2 생화학세포학 및
분자생물학과3240
생화학세포학 및
분자생물학과생화학
No 1의 결과가 없는 경우
구분기호를 기준으로
각각의 데이터를 검색하여
매핑한다
3 곡류과학식품공학 3715 곡류과학식품공학 식품공학구분기호를 기준으로
두번째의 값이 검색된 경우
라 학과코드가 Null 이고 학과명 필드에 전공명칭이 입력된 경우
(1) 전공필드가 Null인 경우 전공필드로 데이터를 이동하여 매핑하고 학과명 필드의 데이
터는 삭제한다
마 상기 방법으로 매핑이 불가능한 경우
- 65 -
3 요업공업 9999 요업공업 기타유사코드를 찾지 못한
경우 기타로 분류한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 명예박사 가베지 처리한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 공교 공업교육
공예교육
추정된 값이 하나일 때는
그 값으로 매핑 둘
이상이면 가베지 처리한다
2 IHE(Delft)
영문 약어의 경우 추정이
어려운 값은 가베지
처리한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 工學系硏究 가베지 처리한다
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1 추후입력 test 가베지 가베지 처리
2 미정 PH D 가베지 가베지 처리
3 기억안남 NA 가베지 가베지 처리
4 졸업시험으로 대체 null 가베지 가베지 처리
5 국문없음 no data 가베지 가베지 처리
6
공학박사(지능형
소프트웨어 전공)
or 공학사
(자동차기술사)
학위 및 기타정보 가베지 처리
7 박사 학위 가베지 처리
4 가베지 처리
가 학과명이 아닌 경우
나 약어인 경우
다 학과명인지 판단하기 난해한 한문 명칭의 경우
학력사항_학위논문명 정제지침
1 최종학위국문논문명과 최종학위영문논문명이 모두 null인 경우 정제대상에서 제외
2 논문명 필드에 기타 정보나 가베지 데이터가 존재하는 경우
- 66 -
8 영문참조 none 가베지 가베지 처리
9 aa 0 가베지 가베지 처리
10 가 x 가베지 가베지 처리
11 디지털경제학 Chemistry 학과 또는 전공정보 가베지 처리
12
학사학위시설계PR
OJECT날개2001-
gt청소년수련원테마
로 설계함
졸업 작품에 대한
정보가베지 처리
13
교회 건축물의
계획 및
설계(설계작품)
졸업 작품에 대한
정보가베지 처리
14압축기 관련
기술연수 연수 정보 가베지 처리
15
광통신 부품용
소재 연구관련
논문을 준비중임
준비중인 논문 가베지 처리
16 KISTI 영문 약어 가베지 처리
17 CFD 영문 약어 가베지 처리
18
H Atoms in
Photodissociations
and Chemical
Reactions(수소원자
의 광화학반응)
H atoms in
Phtodissociation
and Chemical
Reactions
H Atoms in
Photodissociation
s and Chemical
Reactions(수소원
자의 광화학반응)
H atoms in
Phtodissociation
and Chemical
Reactions
()안에기타정보가표
기됨
-유효데이터의표기
언어는동일하나내용
상다소의차이를보이
는경우
데이터 유지
19
김휘택김승욱김정
일서근택서정탁유
총일대퇴골
근위부의
방사선학적 형태-
정상 고관절과
대퇴골두 무혈성
괴사가 있는
고관절에서의 비교
대한정형외과학회
지
33(1)177-1851998
김휘택김승욱김
정일서근택서정
탁유총일대퇴골
근위부의
방사선학적 형태-
정상 고관절과
대퇴골두 무혈성
괴사가 있는
고관절에서의
비교
대한정형외과학회
지
33(1)177-185199
8
유효 데이터 전후에
기타 정보가 표기된
경우
데이터 유지
20
친환경
도시건축계획에
관한 연구
Oekologisch
orientierte
Stadtplanung in
Seoul
Suedkorea(독문
명)
친환경
도시건축계획에
관한 연구
Oekologisch
orientierte
Stadtplanung in
Seoul Suedkorea
국문영문논문명
필드에 모두
데이터가 있고
영문논문명 필드에
한글로 (언어)
표기가 되어 있는
경우
(언어) 부분만 가베지
처리
21
ZFS symmetry
and parameters
in MR(임시등록)
임시등록데이터의
경우가베지 처리
3 논문명의 후반부가 잘린 경우
- 67 -
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1 합성과 논문명의 남은 부분이
극히 짧음가베지 처리
2 경영통계에 관련 논문명의 남은 부분이
극히 짧음가베지 처리
3
계층구조를
이용한 문서
클러스터 제목의
자동생성 기법
cluster
계층구조를
이용한 문서
클러스터 제목의
자동생성 기법
논문명의 남은 부분이
극히 짧음(영문논문명)
영문논문명
가베지 처리
4암호화된 위상
마스크를 이용한
New visual
cryptography
method based on
optical
interference
암호화된 위상
마스크를 이용한
New visual
cryptography
method based on
optical interference
논문명이
어느정도(2단어 이상)
남아 있음(국문논문명)
데이터 유지
5
metathesis
polymerization of
~
metathesis
polymerization of
~
논문명이
어느정도(2단어 이상)
남아 있음
데이터 유지
6 보편형식On universal
forms보편형식
On universal
forms
가베지 여부를
판단하기 난해함데이터 유지
7
점성유동장내에서
의 최대양력 익형
설계
The Optimal
Design
점성유동장내에서
의 최대양력
익형 설계
The Optimal
Design
영문 논문명에
데이터의 일부 -
두단어 이상 남아 있음
데이터 유지
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문명
최종학위영문논
문명최종학위국문논문명 최종학위영문논문명
1
석사순니켈의수소
취성에미치는Fe및B
의영향에관한연구
박사기계적합금화
에의해제조된ABA
B2형금속수소화물
의전극특성에관한연
구
기계적 합금화에
의해 제조된 AB
AB2 형
금속수소화물의
전극 특성에 관한
연구
석사논문 박사논문이
동시에 입력
최종(박사)
논문명만
유지한다
2
초임계이산화탄소를
이용한 마늘로부터
지방산 추출에 관한
연구(석사)
식품저장기간을연장
할수있는기능성필름
개발을위한항균성물
질추출및흡착에관한
연구
식품저장 기간을
연장 할수있는
기능성 필름 개발을
위한 항균성 물질
추출및 흡착에 관한
연구
석사논문 추정불가
논문이 동시에 입력
후반부의
논문명만
유지한다
3
GIS를 이용한
대학캠퍼스
공간분석(석사논문)
현재 인터넷 GIS를
이용한 경관평가
논문 준비중
GIS를 이용한
대학캠퍼스
공간분석
후반부가 준비중인
논문인 경우
준비중인 논문
가베지 처리
4 논문명이 두개 이상인 경우
- 68 -
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문명
최종학위영문논
문명최종학위국문논문명 최종학위영문논문명
1
(영)A Shift-first
Strategy for
Generalized LR
Parsing
A Shift-first
Strategy for
Generalized LR
Parsing
A Shift-first
Strategy for
Generalized LR
Parsing
()안의 언어표기만
제외하고 동일한
데이터
국문논문명만
유지하고
영문논문제
삭제 처리
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1
3d 전자계에 대한
NMR 이동
계산(Theoretical
calculations of
NMR shifts for
3dⁿsystems)
3d 전자계에
대한 NMR 이동
계산
Theoretical
calculations of
NMR shifts for
3dⁿsystems
한쪽의 필드에
데이터가 모두
입력된 경우
해당 필드로 이동
3
AStudyonLandslid
eofCuttingandBank
ingSlopeKFRI
Road 林道
盛土面의
崩괴에關한硏究
AStudyonLandsli
deofCuttingandBa
nkingSlopeKFRI
Road 林道
盛土面의
崩괴에關한硏究
국문 영문 구분없이
유지함데이터 유지
9
家庭用電氣製品
の親環境設計過
程への畵像流體
計測の適用に關
する硏究(A
Study on the
Design of Home
Appliances for
Energy Saving
Using PIV)
家庭用電氣製品の
親環境設計過程へ
の畵像流體計測の
適用に關する硏究
(A Study on
the Design of
Home Appliances
for Energy
Saving Using
PIV)
한쪽의 필드에
영문과 기타외국어
논문명이 모두
입력된 경우
데이터를 구분할
기준이 없으므로
데이터를 유지하고
국문논문명 필드로
이동
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1中韓兩國外銷美國
主要商品之比較硏
중한양국
대미수출
中韓兩國外銷美國主
要商品之比較硏究
논문명 필드 내
논문의 언어를해당 필드로 이동
5 국문영문논문명이 동일하나 (언어)가 표기 되어 있는 경우
6 국문영문 필드에 데이터가 뒤섞여 있는 경우
가 국문 영문을 구분하지 않고 국문논문명은 널이 아니어야 함
나 국문논문명(필수)이 널이고 영문논문명이 널이 아닐 경우 국문논문명으로 영문논문명
을 이동
다 중국어 논문명은 명확히 구분이 되는 경우만 정제하여 영문논문명 필드로 이동 - 일문
논문명 국문 논문명과의 구분 난해
- 69 -
究(중한양국
대미수출
주요상품의
비교연구) [1991년
경영학석사 논문
중국어]
주요상품의
비교연구
표기하여 명확한
구분 가능
No원본데이터 정제 후
데이터 유형 정제요령 비고취득국가코드 취득국가코드
1 KZ NTIS 국가코드와 불일치 널처리
2 오류 데이터 널처리
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 Takashi Tsuruo PhD Takashi Tsuruo PhD
2 유영면(자동차 부품연구원) 유영면(자동차 부품연구원) (기타정보)가 표기된 경우 데이터 유지
3 신현경 김정회 (공동) 신현경 김정회 (공동) 2명 이상인 경우 데이터 유지
4高橋照男(TAKAHASHI
TERUO)
高橋照男(TAKAHASHI
TERUO)(병음)이 표기된 경우 데이터 유지
5 송지복 박사 송지복 박사
교수명 앞뒤에 호칭이 붙은 경우 데이터 유지
6 이와바교수 이와바교수
7 Dr HT Hahn Dr HT Hahn
8 ProfDr NWiberg ProfDr NWiberg
9 C S George Lee aaaaa C S George Lee지도교수명 뒤에 의미없이
알파벳이 반복 나열된 경우
반복 나열된 알파벳 가베지
처리
10J Desmaism aaaaa
DBernacheJ Desmaism DBernache
2인의 지도교수명 사이에
의미없는 알파벳의 반복이 온 경우aaaaa 를 로 치환한다
11 김해구 김해구지도교수명 전후에 의미없는
특수문자나 파자가 존재하는 경우
의미없는 문자 가베지 처리
- 단 성명이 완전하지 않은
학력사항_취득국가 정제지침
1 취득국가코드가 NTIS 코드가 아닐 경우
가 취득국가코드가 NTIS코드가 아니면 널처리함
학력사항_지도교수명 정제지침
1 Null인 경우 정제대상에서 제외
2 필드내 지도교수명 외 기타 정보가 표기된 경우
가 필드내 유효 데이터의 존재 유무만을 중요시 함 유효 데이터가 존재하는 경우 데이
터의 형식 등에 큰 의미를 두지 않음
- 70 -
상황에서 성명이 들어갈
부분에 나 특수문자가
표기된 경우 데이터 유지
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 주강 주강
이름이 정확한지 불확실한 경우올바른 데이터인지 판단이
불가능 하므로 데이터 유지
2 김양 김양
7 공란 공란
3 홍길동 홍길동
4 Hiroyuki KIDO Hiroyuki KIDO
5 DH Youn DH Youn
한국 사람인데
영어(미국식)_이니셜로 표기된
경우
데이터 유지
6 Liu Hung Wen Liu Hung Wen한국 사람인데 영어(한국식)로
표기된 경우데이터 유지
7 이인원이상수 이인원이상수 지도교수가 2인 이상인 경우의
구분기호데이터 유지
8 오정무김상돈 오정무김상돈
9 庄子哲雄 庄子哲雄
일본식 이름의 표기법 데이터 유지
10 가네꼬 준이찌 가네꼬 준이찌
11 Kajiuchi Toshio Kajiuchi Toshio
12 대림성행 대림성행
일본 한자를 한글로 표기 데이터 유지
13 장욕천선대삼 장욕천선대삼
14 목도정부 목도정부
15 불상 불상 유효 데이터 여부 판단 난해 데이터 유지
16 지반 자바 지반 자바 외국어 이름을 한글로 표기 데이터 유지
17 Luo Luo
한국 교수의 성만을 표기한
것인지 외국인 교수의 이름인지
판단 난해
데이터 유지
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 N 가베지 데이터 데이터 가베지 처리
2 NA
3 필드내 데이터가 유효 값인지 판단하기 난해한 경우
가 유효 값인가 유효하지 않은 값인가 판단 자체가 불가능한 경우가 대부분 이므로 데이
터 유지를 기본으로 함
4 필드내에 기타 정보나 가베지 데이터가 존재하는 경우
- 71 -
3 none
4 해당없음
5 알수없음
6 모름
8 김교수 호칭하는 대상이 포괄적인 경우 데이터 가베지 처리
9 농과대학 근무처 또는 전공 정보 데이터 가베지 처리
10 대학원 학위 또는 학과 정보 데이터 가베지 처리
11 교수님 직위 정보 데이터 가베지 처리
12 지도교수명 가베지 데이터 데이터 가베지 처리
11 Kajiuchi Toshio Kajiuchi Toshio
12 대림성행 대림성행 일본 한자를 한글로 표기 데이터 유지
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 19871801 198702 월(MM)이 유효하지 않은
경우 - 졸업년월02월로 갱신
2 19871301 198703 월(MM)이 유효하지 않은
경우 - 입학년월03월로 갱신
3 19871301 198701월(MM)이 유효하지 않은
경우 - 최종학위취득일01월로 갱신
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 10780301 년도(YYYY)가 유효하지
않은 경우 - 공통
데이터 가베지
처리
No 원본데이터 정제 후 오류사항 정제요령 비고
학력사항_날짜유형(입학일졸업일학위취득일)
1 기본 지침
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMM
다 날짜 데이터가 유효하지 않은 경우
(1) 년도(YYYY)가 유효하며 월(MM)이 유효하지 않는 경우 졸업월(MM)은 02로 입학월
(MM)은 03으로 그리고 최종학위취득일(MM)은 01로 갱신
(2) 년도(YYYY)가 유효하지 않은 경우 데이터 가베지 처리
(3) 년도(YYYY)의 유효 범위
rarr 졸업일 입학일 최종학위취득일 1900 lt 졸업일 입학일 최종학위취득일 lt 현재
라 MM(월)이 없는 경우 졸업년월은 02월로 입학년월은 03월로 갱신
- 72 -
졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 1987 198702 월(MM)이 없는 경우 -
졸업년월02월로 갱신
2 1987 198703 월(MM)이 없는 경우 -
입학년월03월로 갱신
3 1987 198701월(MM)이 없는 경우 -
최종학위취득일01월로 갱신
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 19820301 19820301 19820301 입학년월과 졸업년월이
동일입학년월 유지
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 0201
년도가 없음 년도로
간주하더라도 유효하지
않은 데이터
데이터 가베지
처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
1한성대학교
산업시스템공학부한성대학교 정제 정제 처리
2(주)한정화학
총무과부장(주)한정화학 부장 정제 정제 처리
3연세대학교 공과대학
화학공학전공
연세대학교
공과대학정제 정제 처리
4연합철강공업(주) 입사
(국제그룹공채)연합철강공업 정제 정제 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
마 [입학년월 gt= 졸업년월]인 경우 입학년월 유지 졸업년월 가베지 처리
바 YYYY(년도)가 없는 경우 데이터 가베지 처리 정제대상에서 제외
경력사항
경력사항_근무처명 정제지침
1 근무처명이 null인 경우 정제대상에서 제외
2 근무처명에 직위 전공값이 있는 경우
3 가베지 데이터
- 73 -
1 중학교 총무처 군복무 현역 등
가베지 데이터 가베지 처리
2 가 나 다 몰라 가베지 처리 등
3 00 제2청사 (주)ㅇㅇ건설 000공무원 등
4 111163년10년1년106866 등
5 WHO COO aaa dkff saa 등
6 미국 일본 등
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
1 日本産業技術合究所 日本産業技術合究所
오류
가베지 처리
2 고려대학교 보건대학원 역학 I 보건정보학과 고려대학교 보건대학원 정제 처리
3 환경공학 국가기술개발 선도사업 (G-7 연구환경공학 국가기술개발
선도사업 (G-7 연구가베지 처리
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 교수 A01 교수 교수직위명과 일치하는 코드값을
찾아 매핑
2 위촉연구원 B07 위촉연구원 위촉연구원
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 조교수부교수교
수A01
조교수부교수
교수교수
완전일치gt 일치도가 높은
직위명 순으로 매핑
2 시간강사연구조
교A05
시간강사연구조
교시간강사
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
4 기타
경력사항_직위명 정제지침
1 직위코드와 직위명 모두 null인 경우 정제대상에서 제외
2 직위명은 있으나 직위코드가 null인 경우 직위명 검색하여 직위코드 입력
가 직위명과 정확히 일치하는 직위코드값이 존재하는 경우
나 직위명에 직위가 복수인 경우
다 정확히 일치하는 직위명이 검색되지 않는 경우
- 74 -
1 주임교수 A01 주임교수 교수 근사치의 코드값으로 매핑
2 시간강의 A05 시간강의 시간강사
이형정의
표 첨부
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 Professor A01 Professor 교수영문을 번역하여 이형정의표에
의거 코드값을 찾아 매핑
이형정의
표 첨부
2 Research Fellow B20 Research Fellow 전문위원
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 간호사 999 간호사 기타직위명과 일치하는 코드명이
없을경우 기타코드값으로 매핑
2 계장 999 계장 기타
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 36 연구원 B06 연구원 연구원기존의 직위코드를 NTIS
직위코드로 대체
2 13 조교수 A03 조교수 조교수
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 등재 직위명은 가베지 처리
2 ㅁㅁㅁ
라 직위명이 영문일 경우
마 상기 방법으로 매핑이 불가능한 경우
3 직위명과 코드가 모두 존재하는 경우
4 직위명이 오류인 경우(직위명 가베지)
- 75 -
No NTIS코드 코드명(생성) 이형정의(원본데이터) 비고
1 A01 교수
Professor
Prof
Faculty
(대학의)Teacher
Teaching
TeachingFellowship
학장 학장보
부학장 학과주임
학과장 학부장
학생처장
대학원장대학원장보
(대학의)교직원(대학의)교원
총장부총장
2 A02 부교수
AssociateProfessor
AssociateResearchProfessor
AssociateVisitingProfessor
3 A03 조교수AssistantProf
AssistantProfessor
4 A04 전임강사FullTimeLecturer
Instructor
전문강사 전담강사
강의전임 강의전담
전임대우
5 A05 시간강사
시간강의
PartTimeLecturer
PartTimeInstructor
6 A06 강사(기타) 강의 출강
7 A10 명예교수Honorary[Emeritus]Professor
HonoraryVisitingProfessor
8 A11 석좌교수 Chair Professor
9 A12 강의교수
10 A13 겸임교수
겸직교수
adjunctprofessor
adjunctprof
AdjunctFaculty
11 A14 계약교수
12 A15 기금교수
13 A16 대우교수
14 A17 연구교수
ResearchProfessor
ResearchFaculty
FacultyResearch
teachingresearcher
15 A18 초빙교수
초청교수
InvitedProfessor
ProfessorInvite
16 A19 객원교수
Visitingfaculty
visitingprofessor
aprofessorextraordinary
17 A20 조교
조수
Tutor
Assistant
UniversityAssistant
GraduateAssistant
GraduateAssociate
Teachingfellow
TeachingAssistant
TeachingAssociate
FacultyAssociate
TA RA GRA GSRA
18 A21 대학원생박사과정
석사과정
별첨 이형정의표
- 76 -
postgraduate
19 A22 POST-DOC
연수과학자
연수연구원
포스트닥터
포닥
박사후연수
박사후과정
박사후연구원
Post-Dr
Postdoctor
postdoctoral
visitingscholar
visitingfellow
Researchassistant
ResearchAssociate
20 A23 POST_MAS
21 B01 수석연구원 Principal Research Engineer
22 B02 책임연구원
연구책임자
SeniorResearchEngineer
SeniorResearch
SeniorResearcher
SeniorResearchStaff
SeniorInvestigator
23 B03 주임연구원
연구주임
AssistantResearchEngineer
AssistantResearcher
assitantInvestigator
24 B04 전임연구원AssociateResearchEngineer
AssociateResearcher
25 B05 선임연구원 선임-연구소의
26 B06 연구원
연구소장 연구보조원
연구원보연구생
연구개발원연구조원
연구주임연구조수
연구부담당자연구자
연구실장연구보조
연구팀장연구요원
연구센터장연구부처장
연구부문장연구대리
연구단장연구연구진
연구회원연구활동
방문연구 연구수
(연구소연구원연구센터연구실의)-
실장팀장원장부원장소장부소장
선임단장그룹장본부장계장인턴
장장 등
GraduateFellow
(연구소의)-Fellow
Research
Researcher
ResearchStaff
ResearchEngineer
Investigator
27 B07 위촉연구원
VisitingResearcher
VisitingResearchEngineer
VisitingInvestigator
GuestResearcher
GuestInvestigator
28 B10 수석연구위원
29 B11 책임연구위원
30 B12 주임연구위원
31 B13 전임연구위원
32 B14 선임연구위원
33 B15 연구위원
34 B20 전문위원ResearchFellow
ReserchFellowship
35 B30 책임기술원책임기사
기술책임자
SeniorEngineer
ChiefEngineer
- 77 -
PrincipalEngineer
SeniorTechnical
36 B31 선임기술원 선임기사 선임엔지니어
37 B32 기술원
(주식회사의)-기사
엔지니어기술사
기술팀장기술센터장
기술직기술주임
기술담당기술처장
기술직사원
Engineer
Technician
TechnicalStaff
TechnologyStaff
38 C01 공무원
연구사연구관
주사주사보
보좌관기좌
기사보사무관
군무원서기관
이사관조사원
청장차관
자문관비서관
장관행정관
담당관기원
경찰분석관
서서서기보조무원
보건지소장보건소장
보건소영양사보건진료원
보건진료소장지도관
지도사보
(행정기관의)-토목급
(행정기관의)-심사관
(행정기관의)-지도원
(행정기관의)-지도사
(공공기관)-기사
(공사의)-급
39 C02 법조인
심판관변리사
재판관검찰관
변호사법무조정위원
법제이사법의관
법의학감식관
40 C03 의사
전문의전임의
전담의담당의
인턴레지던트
객원의공중보건의
수련의임상의
전공의주치의
의사보일반의
상담의인정의
지도의병원장봉직의
(병원의)-과장부장처장등
Clinician
Intern
Resident
Doctor
Attending
41 C04 교사 (초~고교의)-교원
42 C05 군인
(군관련)-교관소대장
병장교소령
소위대위
군의관의무관
군하사중위
중대장보충역
제대소령
참모의무자문관
기무사기무사보
기무관
43 D01 대표이사
CEO대표
사장법인장
President
44 D02 이사
부사장이사보이사대우
Director
viceDirector
associateDirector
VicePresident
SeniorExecutiveVicePresident
45 D03 전무SeniorManagingDirector
CFO
- 78 -
46 D04 상무 상무보
47 D05 부장
부장대리
DepartmentManager
GeneralManager
48 D06 차장
DeputyGeneralManager
DeputyDirectorGeneral
AssistantDirector
AssistantDirectorvice-chiefManager
49 D07 과장
Manager
GeneralManager
DepartmentManager
DeputyManager
50 D08 대리 Assistant Manager
51 D09 사원 회사원직원
52 999 기타
53 회원(삭제)
No원본데이터 정제 후
오류사항 정제요령 비고근무시작일 근무종료일 근무시작일 근무종료일
1 2005 2007 20050101 20070101 월 없음 월에 01 입력
No원본데이터 정제 후
오류사항 정제요령 비고생년월일 근무시작일 근무종료일 근무시작일 근무종료일
1 19500101 19000101 19400101 유효 범위 오류 삭제처리함
경력사항_날짜유형(근무시작일 근무종료일) 정제지침
1 기본 지침
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMM
다 날짜 데이터가 유효하지 않은 경우
(1) 년도(YYYY)가 유효하며 월(MM)이 유효하지 않는 경우 01로 입력
(2) 년도(YYYY)가 유효하지 않은 경우 데이터 가베지 처리
(3) 년도(YYYY)의 유효 범위
rarr 근무시작일 근무종료일 1900 lt 근무시작일 근무종료일 lt 현재
rarr 근무시작일 근무종료일 생년월일lt근무시작일 근무종료일
라 [근무시작일 gt= 근무종료일]인 경우 근무시작일 유지 근무종료일 가베지 처리
- 79 -
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1한국산업인력
관리공단
건설기계기
사1급1994-12-01
건설기계기사
1급
한국산업인
력관리공단1994-12-01 오류 해당필드로 이동
2치과의사면허
증1993-01-01 보건복지부
치과의사면허
증보건복지부 1993-01-01 오류 해당필드로 이동
3중등 2급
정교사자격증 문교부
중등 2급
정교사자격증문교부 오류 해당필드로 이동
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1워드 프로세서
2급
워드
프로세서
2급
1999-06-01워드
프로세서 2급 1999-06-01 중복 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 발행처 2004-03-01 가베지 가베지 처리
NO원본데이터(가베지) 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 111 222 0000 가베지 가베지 처리
2 상동
No원본데이터 정제 후
오류사항 정제요령 비고근무시작일 근무종료일 근무시작일 근무종료일
1 20050501 20040601 20050501 [근무시작일 gt=
근무종료일]인 경우
근무종료일 가베지
처리
자격사항
자격사항 정제지침
1 자격증명 자격발행처 자격취득일이 모두 null인 경우 정제대상에서 제외
가 자격증명값이 NULL인 경우 나머지 데이터(자격발행처 자격취득일) 모두 가베지 처
리
2 자격증명 자격발행처 자격취득일 각 필드값이 뒤바뀐 경우 처리방법
3 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값이 나올 경우 처리방법
4 자격증명 필드값이 NULL인 경우 처리방법
5 가베지값 처리방법
- 80 -
3 일본
4 없음
NO원본데이터(오탈자) 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 화공기사1급ssssssssssssss 화공기사1급
오탈자데이터 수정 및
가베지 처리
2 충북졍찰청
3 박물관amp8228미술관 정학예사 3급미술관
정학예사 3급
4초경U항공기조종사면허1111111111111
111111111111111111111증
초경량항공기
조종사면허증
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
1 1루프캐리어
이송장치
루프캐리어
이송장치1
루프캐리어
이송장치중복 가베지 처리
2 1 1019990060031101999006003
1 가베지 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
1 1특허등록 제
0290068호 가베지 가베지 처리
2 1 1313131 아자차카 가베지 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
6 기타 처리방법
지식재산권
지식재산권 정제지침
1 특허구분 출원등록번호 지식재산권명이 모두 null인 경우 정제대상에서 제외
가 지식재산권명이 NULL인 경우 나머지 데이터 모두 가베지 처리
2 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값 상이값이 나올 경우 처리방법
3 지식재산권명 필드값이 NULL 가베지값인 경우 처리방법
4 가베지값 처리방법가 출원등록번호 지식재산권명으로 볼 수 없는 데이터는 가베지 처리
- 81 -
1 3자리 이하의
숫자특허
가베지 가베지 처리
2 한국 드릴
3 완료 국제
4 미정 마바
5 이름 사아
6 출원중 파하
7 경상현 가나
8 미지정 다라
9 공개중 카타
10 미입수 혜천
NO원본데이터 정제 후
데이터 유형 정제요령 비고지식재산권명 지식재산권명
1 光微粒子の製造方法 光微粒子の製造方法 오탈자 가베지 처리
2 양자우물amp8228세선의 제작방법 양자우물amp8228세선의 제작방법 오탈자 가베지 처리
3 94-26592 94-26592 오탈자 가베지 처리
NO원본데이터 정제 후 데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 총무
아태물리학회(Associati
on of Asia-Pacific
Physical Societies)
아태물리학회(Associa
tion of Asia-Pacific
Physical Societies)
총무 오류 데이터 이동
2 ASG 없음 Member ASG Member 가베지 가베지 처리
NO원본데이터 정제 후 데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
5 기타 처리방법
소속학협회
소속학협회현황 정제지침
1 학협회명 직위 담당업무 모두 null인 경우 정제대상에서 제외
가 학협회명값이 NULL인 경우 나머지 데이터 모두 가베지 처리
2 학협회명 직위 담당업무 각 필드값이 뒤바뀐 경우
3 해당 필드에 이미 유효 값이 존재하는데 다른 필드값도 나올 경우
- 82 -
1대한병리학회
임상병리학회
대한병리학회
경남(부산)회장
대한병리학회
임상병리학회
대한병리학회
경남(부산)회장 중복 데이터 유지
명칭포함
유지
2한국자원공학회
이사 한국자원공학회 이사 오류 데이터 이동
3여성생명과학기
술포럼 회원운영위원 학술위원
여성생명과학기술
포럼운영위원 학술위원 중복 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 편집위원 가베지 가베지 처리
2 종신회원 명예회장 가베지 가베지 처리 학협회명 아님
3 회원 해당없음 가베지 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 ㄴㄴㄴ 111 eee 20 q 등
가베지 가베지 처리
2 없음 해당없슴 등재
3 화공기사 1 급 덕있으마
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 일본 학회 기타 가베지 처리
NO 원본데이터 정제 후 데이터 정제요령 비고
4 학협회명 필드값이 NULL값인 경우
5 가베지값
6 기타
훈포장사항
훈포장사항 정제지침
1 수여기관명 훈포장명이 모두 null인 경우 - 정제대상에서 제외
가 훈포장명이 NULL인 경우 나머지 데이터 모두 가베지로 처리
2 수여기관명 훈포장명 각 필드값이 뒤바뀐 경우
- 83 -
수여기관명 훈포장명 수여기관명 훈포장명 유형
1 장영실상 과학기술부 과학기술부 장영실상 오류 해당필드로 이동
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 대통령 대통령 대통령 대통령 중복 데이터 유지 대통령 상
2우수논문발표상 -
포스터 부문
우수논문발표상 -
포스터 부문
우수논문발표상 -
포스터 부문중복
데이터 가베지
처리
3 국무총리 표창 국무총리 표창 국무총리 국무총리 표창 중복데이터 가베지
처리
4 광혜학술상 광혜학술상 광혜학술상 중복데이터 가베지
처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 대한민국 정부 오류데이터 가베지
처리
훈포장명 데이터
null값
2 한국물리학회 한국물리학회 오류데이터 가베지
처리
훈포장명 데이터가
가베지값
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 222 111데이터 가베지 처리
2 회원 등재등
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 제어amp8228자동화amp8228시스템공학회 제어amp8228자동화amp8228시스템공학회오탈자
데이터 유지 수정
및 가베지 처리
파일생성 형식에
따른 오류
2 ㅈ조선대총장 조선대총장
3 해당 필드에 이미 유효 값이 존재하는데 다른 필드에서 동일값이 나올 경우
4 훈포장명 필드값이 NULL값인 경우
5 가베지값
6 기타
저역서실적
저역서실적 정제지침
- 84 -
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 3차원
인체해부도1 UBCare
3차원
인체해부도 1 UBCare 오류
해당필드로
이동
2신흥인터내
셔날
소아
청소년치과학1
소아
청소년치과학 1 신흥인터내셔날 오류
해당필드로
이동
3 動力學Engineering
Mechanics2 普文堂 動力學
Engine
ering
Mechan
ics
2 普文堂 한자명 그대로 유지
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1고분자
공학 II
고분자 공학
II1 희중당
고분자 공학
II 1 희중당 중복 가베지 처리
2 주조응고일본금속학회
[주조응고]2
반도출판
사
일본금속학회
[주조응고] 2 반도출판사 오류
해당필드로
이동
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 1
가베지전체 데이터
삭제
2물리강의(20
9쪽)일서 2 대웅
3 wjswktkdrjfo
qhdks rltnf1 생능출판사
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 Polymer Surface
Dynamics 공동저서
Polymer Surface
Dynamics 공동저서 이동 데이터 이동
2
The Handbook of
Groundwater
Engieering-지하수공학에
있어서 지리정보시스템
The Handbook of
Groundwater
Engieering-지하수공
학에 있어서
지하수공학에
있어서
지리정보시스템
The Handbook of
Groundwater Engieering중복 데이터 수정
1 국문저서명 영문저서명 저역서 구분 발행처명이 모두 null인 경우 - 정제대상에서 제외
가 국문저서명 영문저서명 둘 다 NULL인 경우 나머지 데이터 모두 가베지 처리
2 국문저서명 영문저서명 저역서구분 발행처명 각 필드값이 뒤바뀐 경우
3 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값 상이값 나올 경우
4 국문저서명 영문저서명 필드값이 NULL값이거나 가베지값인 경우
5 국문저서명이 널이고 영문저서명이 널일 아닐 경우 국문저서명으로 이동함
- 85 -
지리정보시스템
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 ㅁ 기지이전사업 기획서 YRPMPKOREA 기지이전사업 기획서 YRPMPKOREA 오자 가베지 처리
2 최신 EDICALS 최신 EDI CALS 오자 데이터 유지
3 보호 야동식물 보호 야생 동식물 오자
가능한
범위에서
수정
4 ISBN 1-59033-891-XInequality Theory and
Applications (III)
Inequality Theory and
Applications (III)가베지
가베지 처리
ISBN 필드로
이동
5 NHealth Insurance
Reform In Korea
Health Insurance
Reform In Korea가베지 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 1111 2 골든벨
가베지 가베지 처리
2
곽수동
고필옥
김무강
범문사
3 ㄷㄷㅁㅁ 1
4 (주)지학사 1 (주)지학사
6 오탈자
7 가베지 데이터
논문실적
논문실적 정제지침
1 최종학위국문논문명과 최종학위영문논문명이 모두 null인 경우 정제대상에서 제외
2 논문명 필드에 기타 정보나 가베지 데이터가 존재하는 경우
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 추후입력 가베지 가베지 처리
2 미정 가베지 가베지 처리
3 가베지 가베지 처리
- 86 -
구분 항목 세부항목 항목수단위별
가중치()
참여
인력
정보
기본정보
주민등록번호 성명 자택주소 자택
우편번호 자택전화번호 핸드폰번호
7 31
소속기관사항
소속기관명 부서명 직위명 사무실
전화번호 기관주소 최초임용일 인
력(직업)구분
7 185
학력사항
전공 취득대학 학위 입학일 졸업
일 학과 취득국가 지도교수명 학위
논문명 학위취득일
10 21
16 데이터 검수
161 데이터 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
162 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 87 -
구분 항목 세부항목 항목수단위별
가중치()
경력사항 근무처명 직위명 근무기간 3 45
자격사항 자격발행처 자격증명 자격취득일 3 25
논문실적
논문발표일 국문논문명 영문논문명
저자역할구분 발행처 학술지구분
학술지명 SCI여부
8 105
지식재산권 지식재산권명 출원_등록번호 특허구분 3 25
계 소계 41 905
평가
위원
소속학협회현황 담당업무 직위 학협회사항 3 3
훈포장사항 수상년월 수여기관명 훈포장명 3 25
저역서실적국문저서명 영문저서명 발행년 발
행처 저역서구분5 4
소계 11 95
계 52 100
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
150 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
성명 100자택주소 10자택우편번
호
20
자택전화번 10
항목별 오류율 산정 기준 정의
- 88 -
호
핸드폰번호 10E-mail 10소계 310
소속기
관사항
(7개)
소속기관명 100
부서명 05
직위명 20
사무실전화
번호
10
기관주소 30
인력(직업)구
분
10
최초임용일 10
소계 185
학력사
항
(10개)
전공 20
취득대학 100
학위 20
입학일 10
졸업일 10
학과 15
취득국가 15
지도교수명 05
학위논문명 05
학위취득일 10
소계 210
경력사
항
(3개)
근무처명 20
직위명 15
근무기간 10
소계 45
자격사
항
(3개)
자격발행처 05
자격증명 10
자격취득일 10
소계 25
논문실
적
(8개)
논문발표일 10논문명1 10
논문명2 05저자역할구
분
05
발행처 05학술지구분 05학술지명 10
SCI여부 05
소계 105
지식재
산권
지식재산권
명
10
- 89 -
(3개)
출원_등록번
호
05
특허구분 10소계 25
평가 소속학
협회현
황
(3개)
담당업무 05
위원 직위 05
(11개) 학협회사항 20
소계 30
훈포장
사항
(3개)
수상년월 10
수여기관명 05
훈포장명 10
소계 25
저역서
실적
(5개)
저역서명1 10
저역서명2 05
발행년 10
발행처 05
저역서구분 10
소계 40
계 1000
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 03
품질지표기준점수산정(데이터1
건기준)=오류유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 005
계 6개 오류유형 1
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
- 90 -
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
3000 3 055 150 000825
성명 10 2 035 100 000350자택주소 3 0 000 10 000000자택우편번
호
3 2 035 20 000233
자택전화번
호
4 0 000 10 000000
핸드폰번호 6 0 000 10 000000E-mail 9 0 000 10 000000소계 45 7 125 310 001408
소속기
관사항
(7개)
소속기관명 1000 20 100 000000부서명 80000 200 05 000000직위명 80000 200 20 000000사무실전화
번호
80000 200 10 000000
기관주소 80000 200 30 000000인력(직업)구
분
80000 200 10 000000
최초임용일 80000 200 10 000000소계 481000 1220 000 185 000000
계 1000 01
주민등록번호 한글성명 영문성명 한문성명자택우편번
호
630421-0000000 백중환Joong hwan
Baek
412220
(형식 015)
630421-0000000 백종석Baek Jong
Seok
6304210000000
(형식 015)백인열 Baek IN Youl 白寅烈 711-822
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
국가RampD참여인력 100000건 100000건 3000건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
검사물량 집계표 예시
오류율산정표 예시
검수데이터 예시
- 91 -
630421-0000000 백승호
(오기 02)백제훈
630421-0000000 백종완
630421-
(오기 02)백장선 Jangsun Baek
白壯선
(형식 015)
502-
(오기 02)
630421-0000000 백승호1213132
(오기 02)
630421-0000000 백석형
630421-0000000 백석형
품질지표별
기준점수의
합
055 035 035
데이터별 품질지표 기준 점수
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 03
품질지표기준점수산정(데이
터1건기준)=오류유형별점수
의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 005
계 6개 오류유형 1
- 92 -
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수
기관마다 다름
hurims에 각 기관별 인력관리번호와 NTIS 인력관리번호매핑표관리함
RNO 주민등록번호 필수
-포함한 14자리 일 경우만 연계함
주민등록번호는 기관마다 유일해야 하는데 특정기관은주민등록번호 1개 당 n개의 인력관리번호 존재하는 경우 있음
=gt 연계기관에 연락해서 주민번호 중복되지않게 요구해서 처리
=gt 현재는 맨 처음 해당 데이터의 인력관리번호만 유지
KOR_PSN_NM 한글성명 필수
한글성명은 처음 hurims에 insert될때만 반영하고 update될때는반영하지 않음
기관마다 실명인증을 안 하는 곳이 있기 때문에 같은주민번호인데 성명이 다른 경우가 있음
CHN_PSN_NM 한문성명(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
ENG_PSN_NM 영문이름(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
ZIP_CD 우편번호
(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
hurims에 우편번호||주소1||주소2가 널일 경우만 반영ADDR1 주소1ADDR2 주소2
HOME_TEL_NO 집전화(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
CP_NO 핸드폰번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
EMAIL E-mail(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
MSTR_CLS_CD1 부처(기관)코드1
123에 대중소의 코드를 넣는게 아니라 각각의 분류를 넣어야함
매핑정보가 없으면 반영 못함
1n으로 매핑되는 경우 처음 select 되는 최하위 분류로 매핑함
현재 ntis에는 분류명을 저장하는 필드가 없음=gt분류명은 반영안함
MSTR_CLS_NM1부처(기관)분류명1
MSTR_CLS_CD2부처(기관)분류코드2
MSTR_CLS_NM2부처(기관)분류명2
MSTR_CLS_CD3부처(기관)분류코드3
MSTR_CLS_NM3부처(기관)분류명3
17 데이터 이관
참여인력 기본정보 이관 방안
- 93 -
MP_TYPE 평가위원구분Y일 경우 평가위원 pool Db에 자동 등록함
=gt N 또는 Null일 경우 기존에 평가위원 이면 반영 안함
GENDER_DIV_CD 성별구분 없을 경우 주민번호로 판별
BDT 생년월일 없을 경우 주민번호로 판별INFO_OPEN_SLCT 정보공개구분 없을 경우 비공개로 저장
PINFO_OFR_USE_APR_YN
개인정보제공활용동의여부
N일 경우 최종수정일을 기준으로 기존 동의에서 비동의로변경함
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG 데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
HM_ID 인물ID 인물아이디는 기관에서 넣지 않아도 됨
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
ORG_NM 기관명 필수
hurims에 기관이형DB에 존재하면 대표기관명이형기관코드를 저장하고 없을 경우에는 기관명을그대로 hurims에 저장하고 정제 및 신규 발급을 통해매핑해야함
WORK_DEPT_NM 근무부서명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
POSITION_NM 직위명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
직위명으로 자동코드 매핑하고 직위코드가 없으면 기타999코드로 저장하고
직위명필드에는 연계기관의 직위명 그대로 저장함
ZIP_CD 우편번호
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
hurims에 우편번호||주소1||주소2가 널일 경우만 반영ADDR1 주소1ADDR2 주소2OFFICE_TEL_NO 사무실전화
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
중복체크 기준
- 주민등록번호(주민등록번호 성명이 없으면 반영하지 않음)
소속기관 사항 이관
- 94 -
FIRST_EMP_DT 최초임용일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MP_TYPE 인력구분기관에서 넣지 않아도 되고 기관이형DB에 의해 자동매핑됨
HOFF_DIV_CD 재직구분코드
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일경우에는 재직중으로 인정함
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장
ORD_NO 순번 필수 hurims의 순번으로 저장
DEGREE_ACQ_UNIV_NM 학위취득대학명 필수
hurims에 기관이형DB에 존재하면 대표기관명이형기관코드를 저장하고 없을 경우에는 기관명을그대로 hurims에 저장하고 정제 및 신규 발급을 통해매핑해야함
SDEPT_NM 학과명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
학과명으로 코드매핑하고 매핑안되면 학과명필드만반영함
매핑안된 학과명은 나중에 정제 작업에 의해 매핑함
MAJOR_NM 전공명 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
전공명으로 코드매핑하고 매핑안되면 전공명필드만반영함
매핑안된 전공명은 나중에 정제 작업에 의해 매핑함
GRAD_DT 졸업일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함ENT_DT 입학일 필수 날짜가 1900년 이전이거나 현재보다 크면 삭제함DEGREE_CD 학위구분 필수
ACQ_NAT_CD 취득국가코드(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
DEGREE_ACQ_DT 학위취득일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
소속기관명이 없을 경우 반영하지 않음
학력 사항 이관
- 95 -
ADVISOR_NM 지도교수명기관에서 넣지 않아도 되고 기관이형DB에 의해 자동매핑됨
KOR_THESIS_NM
학위논문제목국문
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일경우에는 재직중으로 인정함ENG_THESIS_NM
학위논문제목영문
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장
ORD_NO 순번 필수 hurims의 순번으로 저장
WORK_ORG_NM 근무처명 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
POSITION_NM 직위명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
WORK_START_DT 근무시작일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
WORK_END_DT 근무종료일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
학위취득대학명 학위가 없을 경우 반영하지 않음
경력 사항 이관
- 96 -
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
INSTIT_LST 학협회명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
POSITION_NM 직위 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용INSTIT_JOB_NM 담당업무
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
INSTIT_ACT_START_DT 학회활동시작일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
INSTIT_ACT_END_DT 학회활동종료일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
CERT_NM 자격증명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
CERT_ISSUE_ORG_NM 자격증발행처 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
CERT_ACQ_D 자격취득일 필수 중복 체크하는 기준에만 쓰임
근무처명이 없을 경우 반영하지 않음
소속 학협회 사항 이관
학협회명이 없을 경우 반영하지 않음
자격 사항 이관
- 97 -
Tinsert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
KOR_PAPER_NM 논문제목국문 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
ENG_PAPER_NM 논문제목영문
중복 체크하는 기준에만 쓰임
insert 할때만 적용
PAPER_PUB_DT 논문발표일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ROLE_SLCT 역할구분(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_ORG_NM 발행처명(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
JRNL_NM 학술지명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
JRNL_SLCT 학술지구분 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용SCI_TYPE_SLCT SCI여부
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
ISSN ISSN번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_BK 게재권집(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_ISSUE 게재호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
START_PG 시작페이지(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
END_PG 종료페이지 (최종수정일이 최신이고 널이 아님) 또는 (hurims가
자격증명이 없을 경우 반영하지 않음
논문실적 이관
- 98 -
널일)때 update에 반영CO_AUTHOR_NM 공동저자명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
PTAPP_SLCT 특허구분 필수(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PTAPP_REGIST_NO 출원등록번호 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
IPR_NM 지식재산권명 필수(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
ACQ_DT 취득일 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ACQ_SLCT 취득구분
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
공동활용항목에 없는데 널일경우 무엇으로 봐야하나(확인요)
PTAPP_REGIST_NAT_CD
출원등록국가코드
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일 경우에는 대한민국으로 자동 반영함(확인요)MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
논문명이 없을 경우 반영하지 않음
지식재산권실적 이관
- 99 -
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
TRNSWRT_SLCT 저역서구분 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
KOR_TRNSWRT_NM 국문저역서명 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
PUB_ORG_NM 발행처명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
PUB_YR 발행년도 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ISBN ISBN번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
AWARD_NM 수상명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
AWARD_ACQ_YM 수상년월 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
AWARD_GRANT_ORG_NM 수여기관 필수 중복 체크하는 기준에만 쓰임
지식재산권명 출원등록구분 특허구분 출원등록번호가 없을 경우 반영하지 않음
저역서실적 이관
저역서명 저역서구분이 없을 경우 반영하지 않음
훈포장실적 이관
- 100 -
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드 훈포장명이 없을 경우 반영하지 않음
- 101 -
2 인력정보 영문이력 입력 매뉴얼
21 개요
211 목표
연구자 이력정보 영문 번역을 통한 DB 구축(1000건)
- 영문이력 번역 대상 항목 선정
기본정보 재직기관 최종학위 경력사항 논문실적 연구실적 특허
- 영문이력정보 관리 기능 개발 및 영문이력DB 구축
- 영문이력DB에 대한 본인확인 안내메일 발송
인물정보에 대한 영문 검색서비스 제공
212 DB구축 공정
- 102 -
항 목 세 부 항 목 영문명 비고
기본(BasicInformation)
기본정보 영문성명 English Name - 한글이력정보와 공동 사용- 전문분야는lsquo08 개정 분류코드 영문명 활용
휴대전화(국가번호)
Cellular PhoneNumber
E-mail E-mail
개인홈페이지 Homepage
전문분야 전문(연구)분야 Research Field 1
Research Field 2
Research Field 3
검색키워드 전문분야명 입력
재직기관(organization)
기관명 Organization Name - 현재 재직기관사항 1개 입력
부서명 Department
직위 Job title(position)
우편번호 Postal Code
주소 Address
전화(국가번호) Telephone
팩스(국가번호) Fax
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) Degree Code
학위취득일 GraduationDate
학교명 School
전공명 Major
22 DB구축 목록 및 범위
221 DB구축대상 및 항목 정의
DB구축대상 수집된 영문 이력서 번역 및 희망자에 대한 이력정보 번역
- 수집된 이력서 번역
middot 수집된 한글이력서 반영하여 번역 수행
middot 수집된 영문이력서 입력
- 이력서 번역 대상자
middot 참여인력 또는 평가위원 서비스 대상자
middot 논문실적 경력사항 등의 데이터가 충실한 인력
DB구축 대상 항목 정의
- 103 -
경력(Career)
경력사항(CAREER)
시작년월 Start Date - 재직 경력으로 주요 경력입력 현 재직정보제외
종료년월 End Date
재직기관명 Organization Name
직위 Position(Job Title)
실적ResearchResult
논문실적(paper)
논문명 Title - 최근 5년 이내만 입력
저널명 Journal Name
게제(권)집 Volume
게제호 Number
시작페이지 Start Page
종료페이지 End Page
게제년월 Date of Publication
공동저자명 Co-Author
비고 Etc
연구실적ResearchProject
시작년월 Start Date
종료년월 End-Date
발주기관 Funding organization
참여구분(역할)-코드
Role
연구실적명 title
특허(patent)
출원등록구분-코
드
appliedregistered
출원등록번호 number
출원등록국가-코
드
National Code
특허출원명 Patent name
출원등록일자 Date
- 104 -
항 목 세 부 항 목 비고
기본(BasicInformation)
기 본정보
영문성명 - 각각 형태가 다른 영문성명을ldquoGilDong Hong 형태로 변경 필요
T
휴대전화(국가번호)
- 휴대전화를 표준형태로 변경 필요(외국 휴대전화만 국가번호 표시)middot 대한민국 010--middot 외국 +국가번호---
T
E-mail abctestcom 형태 T
개인홈페이지
입력 시 http을 제외하고 입력T
전 문분야
전문(연구)분야
- 전문분야는 lsquo08 개정 분류코드 영문명 활용
- 본인 확인에 의해 본인이 직접 선택하도록 함
- 검색키워드 필드에 전문분야명을 입력
재 직기관(organization)
기관명 - 대표기관명- 기관명이 주소정보에 포함되어 있는경우 존재
부서명 - 부서명이 주소정보에 포함되어 있는경우 존재
직위 - 여러개의 직위 존재우편번호 - 주소정보에 기관명 부서명 포함되어
있는 경우 존재- 영문우편번호DB를 이용 가능
주소
전화(국가번호)
- 전화번호를 표준형태로 변경 필요(외국 전화만 국가번호 표시)middot 대한민국 042--middot 외국 +국가번호---
T팩스(국가번호)
학력(Academiccarrer)
최 종학위(FinalDegree)
학위(코드) - 8 박사- 5 석사- 2 학사
C
학위취득일 - YYYY-MM-DD형태 D학교명 - 대표기관명전공명
경력(Career)
경 력사항(CAREER)
시작년월 - YYYY-MM형태 D종료년월 - YYYY-MM형태 D
재직기관명 - 부서명 포함직위 - 여러개의 직위 존재
실적ResearchResul
논 문실적(paper
논문명 - 영문제목 일부 존재저널명
23 데이터 분석 내역
231 세부 항목별 영문이력정보 분석
번역을 위한 영문이력정보 분석
∙ D 날짜형태변환 C 코드화 T 표준형태변환
- 105 -
t ) 게제(권)집
게제호시작페이지종료페이지게제년월 - YYYY-MM형태 D공동저자명 - 공동저자명이 구분자로 N명이상 존
재연 구실적ResearchProject
시작년월 - YYYY-MM형태 D
종료년월 - YYYY-MM형태 D발주기관참여구분(역할)-코드
A 연구책임자B 참여연구원
C
연구실적명 - 영문제목 일부 존재특허(patent)
출원등록구분
-코드C
출원등록번호출원등록국가
-코드C
특허출원명출원등록일자
- YYYY-MM-DD형태D
항 목 세 부 항 목
기본(BasicInformation)
기본정보 영문성명
휴대전화(국가번호)
개인홈페이지
전문분야 전문(연구)분야
재직기관(organization)
기관명
부서명
24 DB구축 절차 및 작업 지침
241 DB구축 지침
DB구축 내용
수집된 연구자 영문 이력서 입력을 통한 DB 구축
연구자 이력정보 영문 번역을 통한 DB 구축
DB구축 항목
DB구축 대상 항목
- 106 -
직위
우편번호
주소
전화(국가번호)
팩스(국가번호)
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드)
학위취득일
학교명
전공명
경력(Career)
경력사항(CAREER)
시작년월
종료년월
재직기관명
직위
실적ResearchResult
논문실적(paper)
논문명
저널명
게제(권)집
게제호
시작페이지
종료페이지
게제년월
공동저자명
비고
연구실적ResearchProject
시작년월
종료년월
발주기관
참여구분(역할)-코드
연구실적명
특허(patent)
출원등록구분-코드
출원등록번호
출원등록국가-코드
특허출원명
출원등록일자
- 107 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
DB구축
준비
계획 수립
번역대상자분석 번역대상자 데이터 분석 대상자 선정 분석 내역 작성
절차 협의선처리 번역 번역확인전문가검수 본인확인KISTI검수
DB구축 대상 확정
매뉴얼 작성
입력 매뉴얼 구성내용
DB구축 개요 및 절차정의
DB구축 대상정의 및 범위
입력 항목별 기준 및 예시
입력프로그램 사용법
전환 코드표
표준 양식
입력 매뉴얼 검토및 확정
입력 매뉴얼 초안작성
상세일정계획수립
입력 량을 분석하여 투입인력대비 주월별 입력 계획대비 실적 산정
일정 검토 및 확정 일정계획 작성
작업 환경구축
작업 환경 및번역자 구성 입력 환경 구성
번역자 선정
영문이력정보 관리기능 개발
입력 교육 실시
번역자를 대상으로 교육실시 및 교육결과서 작성
입력작업 교육 실시
DB구축진행
선처리번역번역확인전문가검수
선처리번역번역확인전문가검수
DB구축 추진결과번역 및 품질활동수행
추진현황보고 실적 보고실적 확인 및 이슈사항 협의
주별진척보고
이슈사항 및 문제점 보고
DB구축완료
서비스DB이관 검수및 납품
서비스DB이관
완료된 영문이력DB의서비스화 이관 확인 데이터 이관
데이터 검수(최종 확인)
영문이력 DB 검사 (샘플링 검수) 검수(샘플링)
검수 데이터 추출제공
242 DB구축 단계별 작업 지침
243 DB구축 항목별 세부지침(선처리)
공통사항
Ⅰ 공통사항
1 기존에 존재하는 영문명은 입력된 그대로 유지하되 일부 정제 필요
- 108 -
원본데이터 입력데이터 입력요령
H20 A2 H20 A2
- 서식에 의한 특수문자는 텍
스트 형태 그대로 입력함
k- iexcl k - ε
- 수식도구에 의한 특수문자는
특수문자표를 참조하여 호환되
는 경우에만 입력하고 그렇지
않으면 수식만 제외하고 입력
참고3 특수문자표
원본데이터 번역데이터 입력요령
문장의 첫 단어
이름장소 등 고유명사
직함칭호의 축약형
1인칭 주어
도시이름월요일휴일시대 등
단어의 시작글자 대문자 표기
책글노래영화제목 등
a an and at by for in
of로 시작할경우
a an and at by for in of
를 제외한 시작문자 대문자로
표기
장소를 지칭하는 고유명사
internet 등Internet 시작문자 대문자 표기
국가언어등을 지칭하는 단어
(고유명사 일반명사의 개념)시작문자 대문자 표기
교과 과목명 시작문자 소문자로 표기
외국기관명 외국대학명 논문제목 연구제목 등
2 한글영문 이외의 표기된 외국어는 그대로 유지
(단 한글영문을 일부 포함한 외국어는 번역 시행)
3 모든 항목은 좌우의 공백을 제거하고 입력
가 줄바꿈 문자나 좌우의 공백문자를 제거하고 입력
나 데이터 사이에 공백문자가 두 개 이상인 경우에는 공백문자를 한 개로 입력
4 휴대전화 및 전화번호는 대한민국의 경우에는 국가번호를 표시하지 않고 외국의 경우에
만 국가번호(+국가번호)를 표시함
5 특수문자의 입력
6 대소문자 규칙
가 번역의 경우 대소문자 표준 준수
해당 기관홈페이지에 표기되어있는 공식영문명칭의 대소문자에 따라 선처리 및 번역
단 번역 시 단어 시작글자만 대문자료 표기
- 109 -
사이트명 url 비고
NAVER 백과사전 http100navercom 기관명 홈페이지 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr기관명 홈페이지 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 기관명 검색서비스
KIS-Report httpwwwkisreportcom한국신용평가정보 기업보고서
국내일반기업 영문명 기재
KJTRANS httpwwwkjtranscokr학교 및 연구기관 분야별 검
색가능
영문표기kr httpwww영문표기kr 기관학교연구기관 검색가능
학위논문 원문 공동이용협의회 httpthesisorkr협의회 대학기관 목록
(연구 발주기관)
NDSL 연구실적 검색 httpscholarndslkrindexdo연구실적 검색 가능
(연구 발주기관)
Paper Searchnet httpwwwpapersearchnet논문 및 저널명 검색서비스
(연구 발주기관)
기관명
Ⅰ 소속기관사항(기관명) 학력사항(학교명) 경력사항(재직기관명) 연구실적(발주기관
명)
1 선처리 작업 수행 시 고려 사항
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
선처리 작업 시 기관명이 Full name 과 약어 기재를 원칙으로 함
단 약어가 존재하지 않을 경우 기재하지 않음
부서직위명을 포함하고 있을 경우 포함하여 선처리
단 소요시간이 길어질 경우 부서직위명 한글 그대로 입력)
업무명이나 업무설명이 포함된 경우 한글 그대로 입력 (추후 번역시 정제)
웹 검색 시 해당기관 홈페이지에 기재되어있는 영문을 우선순위로 선처리
웹 검색 및 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
2 기관명 웹 검색 url 목록
- 110 -
원문 번역 비고
상호명 ldquo(주)rdquo의 번역
상호명 ldquo(사)rdquo의 번역
상호명 ldquo(유)rdquo의 번역
상호명 ldquo(일)rdquo의 번역
상호명 ldquo(재)rdquo의 번역
Co LTd
Association
INC
Foundation
영국식 주식회사 표기 번역
기관명 약어의 경우
기관명(약어)
기관명
약어로 번역
Full name(약어) 번역
Full name 번역
약어가 존재하지 않을 경우
Full name만으로 번역
원문 번역 비고
((주)한일합섬Hanil Synthetic Fiber Co
Ltd
- 오탈자 정제
웹검색
원문DB의(rarr정제
(system2010)산자부과기부
(system2010)Ministry of
Commerce Industry and
EnergyMinistry of Science
and Technology
- 기관명n 괄호명칭 ()
웹검색
n개의 기관명 모두 선처리
()괄호안의 표기내용 기재
(주)부일건화(주)아해BUIL KEON WHA Co
LtdAhae Co Ltd
- 기관명n
웹검색
n개의 기관명 모두 선처리
(주)비츠로테크 공장장VITZRO TECH Co Ltd
Plant Manager
- 직위명 포함
웹검색
직위명 번역 선처리 기재
(재)전북생물산업진흥원Jeonbuk Bioindustry
Development Institute
-상호명 (재)
웹검색
해당기관 홈페이지 영문명기
검색 가능한 url은 추후 추가 가능
3 번역 시 고려사항
상호명 번역 지침
번역 시 고려사항
4 선처리 예
- 111 -
재
(캐나다) 오타와 대학교 (Canada)University of Ottawa
-괄호()
웹검색
괄호()내용 번역 선처리 기재
강원대학교 의과대학Kangwon National University
College of Medicine
-학과명
웹검색
학과명 번역 선처리 기재
국립 지바대학교(일본) National Chiba University(Japan)
-괄호()
웹검색
국립 번역 선처리 기재
괄호()내용 번역 선처리 기재
미국 Cornell대학교 Section of
Molecular Biology
USA Cornell College Section
of molecular Biology
-한글영문명
웹검색
미국 번역 선처리 기재
영문명 그대로 기재
엔에스(Natural Science Co) 공
동설립
NS(Natural Science Co
Ltd)
-괄호() 업무설명
웹검색
괄호() 영문명 그대로 유지
업무설명 ldquo공동설립rdquo 제거
웅진출판(주) 편집국 생태전집
부 - lsquo한국의 자연탐험rsquo 제작 참
여
Woongin Publications Co Ltd
Editorial ecological Colledted
Works
-부서명 업무설명
웹검색
부서명 번역 선처리 기재
업무설명 ldquolsquo한국의 자연탐험rsquo
제작참여rdquo 제거
11 국제산학연 공동기술개발지
원사업
Korea Association of Industry
Academy and Research
Institute(KAIARI) Business
support for academic-industrial
common technology
development
-괄호()
웹검색
국립 번역 선처리 기재
괄호()내용 번역 선처리 기재
기관명 코드 참조 첨부7 기관명 코드
- 112 -
사이트명 url 비고
NAVER 백과사전 http100navercom 통합 검색 서비스
NAVER 사전 httpendicnavercom 표준 영문직위 검색가능
KJTRANS httpwwwkjtranscokr학교 및 연구기관 분야별 검
색가능
영문표기kr httpwww영문표기kr 직위명 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr통합 검색 서비스
원문 번역 비고
교수 (학부장) Professor(Dean)
-직위명n 괄호() 직위명
웹 검색 및 직위표 코드참조
모두 번역 및 선처리
교학부장 겸 학과장 Dean Chair
-직위명n
웹 검색 및 직위표 코드참조
모두 번역 및 선처리
사원(전장설계부)Employee(Department of Wiring
Harness Design)
-직위명 부서명포함
웹 검색 및 직위표 코드참조
부서명 포함 번역 및 선처리
선임연구원(고주파제어시스템)Senior Researcher(High-Frequency
Wave)
-직위명 업무명
웹 검색 및 직위표 코드 참조
직위명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
직위가 n개의 경우 n개로 선처리
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당기관 홈페이지에 기재되어있는 직위 영문을 우선순위로 선처리
웹 검색 불가시 영문 직위명을 참조하여 번역
번역 작업 시 영문 직위명은 표준 영문 직위 표기에 따라 번역
웹 검색 및 영문직위표 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
2 직위명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
3 영문직위 번역 코드 참조
4 선처리 예
- 113 -
사이트명 url 비고
NAVER 백과사전 http100navercom 통합 검색 서비스
KJTRANS httpwwwkjtranscokr학교 및 전공명 검색가능
(자료실영어표현 강좌실)
영문표기kr httpwww영문표기kr 전공명 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr통합 검색 서비스
NAVER 사전 httpendicnavercom 표준 영문직위 검색가능
원문 번역 비고
전기전자전자통신공학Electrical Electronics Communications
Engineering
-전공명n
웹검색 및 코드표 참조
전공명n개 n갯수만큼 선처리
하수도 Sewerage-전공명
웹검색 및 코드표 참조
업무명 번역 및 선처리
연 구 원 ( R E S E A R C H
ASSORIATE)Research Associate
-직위명 영문명 포함 정제
웹 검색 및 직위표 코드참조
정제 AssocraterarrAssociate
괄호() 제거(동일한 영문명
전공명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
전공이 n개의 경우 n개로 선처리
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당학교 홈페이지에 기재되어있는 전공 영문을 우선순위로 선처리
웹 검색 및 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
ldquoOO학과rdquo 항목의 경우 동일한 ldquoOO학rdquo으로 선처리 번역으로 입력
동일한 한글명에 대한 학문 분야별 영문표기명이 다를 경우 표준명칭으로 선처리
2 전공명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
3 선처리 예
- 114 -
사이트명 url 비고
NDSL 논문실적 검색 httpscholarndslkrindexdo 논문검색시 저널명 발췌
과학기술학회마을httpsocietykistirekrmainht
ml학술지검색 메뉴 검색
KJTRANS httpwwwkjtranscokr 자료실
DBpiahttpwwwdbpiacokrpublicati
onview_resultasp저널명 및 논문 검색가능
구글httpwwwgooglecokr
httpscholargooglecokr저널명 및 논문 검색가능
국회도서관httpsu-libnanetgokrdlSear
chIndexphp논문 및 저널명 검색가능
휴리스틱알고리듬 Heuristuc Algorithm
-원문 정제
웹검색 및 코드표 참조
정제 ldquo알고리듬rdquorarrlsquo알고리즘ldquo
면역학(면역학) Immunology
-전공명n 괄호()명
웹검색 및 코드표 참조
괄호()명 제거(동일한용어)
19C영미시19C British and American
Poetry
-숫자영문명
웹검색 및 코드표 참조
19Crarr그대로 유지(19세기 표
현방식)
저널명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당 논문게재지 홈페이지의 영문 표기로 선처리
동일한 논문명으로 여러개의 저널명이 검색될 경우 게재권(게재호) 게재페이지 게재년
월 등을 확인후 선처리
웹 검색 시 영문명이 존재하지 않을 경우 번역
2 저널명 웹 검색 url 목록
- 115 -
NAVER 전문정보httpacademicnavercommain
nhn논문 및 저널명 검색서비스
Paper Searchnet httpwwwpapersearchnet 논문 및 저널명 검색서비스
SpringerLinkhttpwwwspringerlinkcomho
memainmpx논문 및 저널명 검색서비스
원문 번역 비고
Proc 대한조선학회 추계연구발
표회
Proc International Journal of
Naval Architecture and Ocean
Engineering(JNAOE) Fall
Conference
-원문 영문 포함 일부번역
웹검색
영문명 유지
일부번역 ldquo추계연구발표회rdquo
대한건축학회논문집제20권Journal of the Architectural
Institute of Korea
-부서명 업무설명
웹검색
부서명 번역 선처리 기재
업무설명 ldquolsquo한국의 자연탐험rsquo
제작참여rdquo 제거
대한두개안면성형외과학회Korean Cleft Palate-Craniofacial
Association
-공식 영문저널명 특수문자
웹검색
저널홈페이지에 기재된 특수
문자 포함 선처리
대한두개안면성형외과학회지
Journal of the Korean Cleft
Palate-Craniofacial Association(J
Korean Cleft Palate-Craniofac
Assoc)
-약어 저널명
웹검색
저널홈페이지에 기재된약어
선처리
대한토목학회 학술발표회 논문
집 CD-ROM
Proceedings of the Korean Society of
Civil Engineers(KSCE) Conference
Technical Journal CD-ROM
-약어 원문영문
웹검색
약어기재 영문명그대로 유지
표준
지침
Proceedings of
Journal of The 회차 Journal Name Conference 계절 년도(날짜) 개최지
예)Proceedings of
Journal of The 7th Journal Name Conference Fall 2009 09 12 Tokyo Japan
저널명
없음저널명이 없을 경우 원문 순서 그대로 번역
검색 가능한 url은 추후 추가 가능
3 선처리 예
4 저널명 번역시 표준 지침
5 저널명 번역시 유의 사항
- 116 -
원본데이터 번역데이터 입력요령
학술발표학술발표회
학술연구발표학술연구발표회
번역
Journal Name Conference 저널명 뒤에 기재
논문집요약집초록집논문
초록집 번역Proceedings of Journal Name 저널명 앞에 기재
OO학OO학회OO학회지 Journal of Journal name 저널명 앞에 기재
회차 계절 날짜 개최지OOth Journal Name Spring
2010 Seoul Korea
회차 저널명 앞에 기재
계절날짜개최지 저널명 다음
구신 저널명 선처리번역 웹으로 검색된 저널명을 기준 존재하지 않을 경우 신 저널명
6 저널명 대소문자 표기 지침
middot 단어의 첫글자 대문자 표기
244 DB구축 항목별 세부지침(번역)
기본정보
Ⅰ 영문성명
1 영문성명의 입력포맷 홍길동 =gt GilDong Hong
원본데이터 입력데이터 입력요령
HONGGILDONG
Gil-Dong Hong
Hong Gil-Dong
GilDong Hong - 영문성명 입력표준으로 변경
2 영문성명 번역시 고려사항
기존에 존재하는 영문명은 유지
논문실적의 영문명이 존재할 경우 영문명 입력
- 단 논문실적 항목의 공동저자명에 약어 축약어의 경우 영문성명은 Full name기재
번역시 로마자 표기법에 준수하여 번역
참고 로마자 표기법
- 117 -
원본데이터 입력데이터 입력요령
017)- 017-- - ldquo-rdquo구분자로 변경
+82-10-2497- 010-2497-
- 대한민국은 국가번호 제외하
고 입력
- 휴대폰구분번호 앞에 ldquo0rdquo표
시
1-11-- +1-11--- 외국의 휴대전화는 +국가번
호 붙여서 입력
011-123 입력하지 않음- 휴대전화번호가 완전하지 않
은 형태는 입력하지 않음
Ⅱ 휴대전화
1 휴대전화의 입력포맷
대한민국 휴대폰구분번호-국번-전화번호 (대한민국은 국가번호 제외하고 입력)
외국 +국가번호-휴대폰구분번호-국번-전화번호
Ⅲ E-mail
1 E-mail의 입력포맷 abctestcom
Ⅳ 개인홈페이지
1 개인홈페이지의 입력포맷 wwwhomepageurlcom (http 제외하고 입력)
2 한글 도메인의 경우 영문 도메인을 찾아 입력
Ⅴ 전문(연구)분야
1 전문(연구)분야의 코드 입력은 이력서 본인에 의해 과학기술표준분류별 전문분야를 선택
하도록 함
재직기관
Ⅰ 기관명(선처리 작업)
- 118 -
부서명 표현 항목 표현여부
Department of경력사항부서명 기재
전공명(학력사항) 삭제
College of경력사항부서명 기재
전공명(학력사항) 삭제
Ⅱ 부서명
1 번역 수행
번역 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
번역 작업 해당 기관홈페이지의 영문명을 우선순위로 번역
공식화된 영문명이 존재하지 않을 경우 부서명 참조
참조 부서명 코드
기관홈페이지 및 공식화된 영문명이 존재하지 않을 경우 번역수행
부서 영문명은 Department of 등으로 시작하며 약어 및 축약어 기재는 불가하며 모두
Full name 번역을 원칙으로 번역수행
Ⅲ 직위(선처리 작업)
Ⅳ 우편번호 주소
1 영문 우편번호DB 참조
2 주소의 기본주소와 상세주소를 합침
3 우편번호 및 영문 번역주소 검색
httpwwwkoreapostgokrservletkpppostPostInfo (우정사업본부)
4 검색된 번역 영문 주소 입력(단 기관명과 영문주소와 동일하지 않을 경우 기관명을기준)
5 존재하지 않는 상세주소의 경우 로마자 표기법에 준수하여 번역
참고 로마자 표기법
6 우편번호 입력시 웹검색과 원본이 다른 경우 원본그대로 우편번호 유지
(영문주소는 웹검색 그대로 번역 및 입력)
Ⅴ 전화 팩스
1 전화의 입력포맷
대한민국 지역번호-국번-전화번호(내선번호) lt= 대한민국은 국가번호 제외하고 입력
- 119 -
원본데이터 입력데이터 입력요령
042)- 042-- - ldquo-rdquo구분자로 변경
+82-31-2497- 031-2497-
- 대한민국은 국가번호 제외하
고 입력
- 지역번호 앞에 ldquo0rdquo 표시
1-11-- +1-11--- 외국의 전화번호는 +국가번
호 붙여서 입력
061-123 입력하지 않음- 전화번호가 완전하지 않은
형태는 입력하지 않음
02-123-1234(12) 02-123-1234(12) - 내선번호는 그대로 입력
외국 +국가번호-지역번호-국번-전화번호(내선번호)
학력사항
Ⅰ 학위취득일
1 학위취득일 입력포맷
ldquoYYYY-MM-DDrdquo 형태
Ⅱ 학교명(선처리 작업)
Ⅲ 전공명(선처리 작업)
경력사항
Ⅰ 시작년월 종료년월
1 시작년월 종료년월 입력포맷
ldquoYYYY-MMrdquo 형태
시작년월은 종료년월보다 작거나 같아야 함
- 120 -
사이트명 url 비고
NDSL 논문실적 검색 httpscholarndslkrindexdo 논문검색시 저널명 발췌
과학기술학회마을httpsocietykistirekrmainht
ml학술지검색 메뉴 검색
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr저널명 및 논문 검색가능
Ⅱ 재직기관명 직위(선처리 작업)
Ⅲ 직위(선처리 작업)
논문실적
Ⅰ 논문실적 형태
보통 논문제목 저널명 게재권 (게재호) 게재페이지 게재년월 공동저자명으로 작성
volume (Vol) ( 정기 간행물 1년분의 ) 권
issue(ISS)또는 No또는 (숫자) 게제호 예) Vol9 ISS 4 또는 v9 no4 또는 9(4)- 9
권 4호
Ⅱ 공동저자명
웹 검색을 통한 원문 출처의 번역 방식에 따라 입력
저자명과 저자명은 ldquo rdquo으로 구분자(마지막 입력 후 ldquo rdquo 입력)
번역 시 Full name으로 입력하며 로마자 표기법을 준수함
Ⅲ 논문명
1 번역 작업 수행
번역 작업 시 기존 논문 영문명은 그대로 유지하되 일부 정제 필요
웹 검색 시 해당 논문게재지 홈페이지의 영문 표기로 선처리
동일한 논문명으로 여러개의 저널명이 검색될 경우 게재권(게재호) 게재페이지 게재년
월 등을 확인 후 선처리
웹 검색 시 영문명이 존재하지 않을 경우 번역
2 논문명 웹 검색 url 목록
- 121 -
국회도서관httpsu-libnanetgokrdlSear
chIndexphp논문 및 저널명 검색가능
NAVER 전문정보httpacademicnavercommain
nhn논문 및 저널명 검색서비스
Paper Searchnet httpwwwpapersearchnet 논문 및 저널명 검색서비스
DBpiahttpwwwdbpiacokrpublicati
onview_resultasp저널명 및 논문 검색가능
SpringerLinkhttpwwwspringerlinkcomho
memainmpx논문 및 저널명 검색가능
검색 가능한 url은 추후 추가 가능
Ⅳ 저널명(선처리 작업)
연구실적
Ⅰ 시작년월 종료년월
1 시작년월 종료년월 입력포맷
ldquoYYYY-MMrdquo 형태
시작년월은 종료년월보다 작거나 같아야 함
Ⅱ 발주기관(선처리 작업)
Ⅲ 참여구분
1 참여구분 입력지침
연구책임자 참여연구원 중에서 선택하여 입력함(구분 불가능시 선택 안함)
Ⅳ 연구실적명
1 번역 작업수행
번역 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
번역 작업 시 웹검색을 통하여 정확한 연구실적명을 검색
웹 검색 시 공식화되어있는 영문을 우선순위로 번역
웹 검색 및 공식적으로 사용하는 연구실적명이 존재하지 않을 경우 번역
- 122 -
사이트명 url 비고
한국특허정보원httpwwwkiprisorkrkormai
nmainjsp국내특허실적 분야별 검색
구글 특허정보 검색서비스 httpwwwgooglecompatents해외 특허정보 검색서비스
(7백만개 이상 검색가능)
PCT 특허정보 검색서비스 httpwwwwipointpctdben PCT 특허 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 특허정보 검색서비스
사이트명 url 비고
NDSL 연구실적 검색 httpreportndslkrindexdo 연구실적 검색 가능
KJTRANS httpwwwkjtranscokr학교 및 연구기관 검색가능
(자료실영어표현 강좌실)
구글 httpwwwgooglecokr
NAVER 전문정보httpacademicnavercommain
nhn네이버 연구실적명 검색
Paper Searchnet httpwwwpapersearchnet 연구실적명 검색서비스
2 연구실적명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
특허실적
Ⅰ 출원등록구분
출원 등록 중에서 선택함
같은 특허에 대해 출원과 등록 모두 존재하면 등록정보만 입력함
출원 등록이 미구분시에는 선택하지 않음
Ⅱ 출원등록번호
특허 출원등록번호 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
Ⅲ 출원등록국가
- 123 -
사이트명 url 비고
한국특허정보원httpwwwkiprisorkrkormai
nmainjsp국내특허실적 분야별 검색
구글 특허정보 검색서비스 httpwwwgooglecompatents해외 특허정보 검색서비스
(7백만개 이상 검색가능)
PCT 특허정보 검색서비스 httpwwwwipointpctdben PCT 특허 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 특허정보 검색서비스
1 출원등록국가 입력지침
출원등록국가 코드를 찾아 입력
Ⅳ 특허출원명
1 특허출원명 번역지침
특허출원명 입력시 웹 검색을 우선으로 시행
웹 검색 후 영문명이 존재할 경우 그대로 입력
영문명이 존재하지 않을 경우 번역 시행
2 특허출원명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
Ⅴ 출원등록일자
1 출원등록일자 입력포맷
ldquoYYYY-MM-DDrdquo 형태
25 DB구축 검수
251 DB구축 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
- 자체적인 품질활동 점검표 작성등의 수행결과를 주기적으로 측정하여 품질목표를 달성
하도록 함
- 124 -
항 목 세 부 항 목 항목수 단위별가중치()
기본(BasicInformation)
기본정보 영문성명 5 15휴대전화(국가번호)E-mail개인홈페이지
전문(연구)분야-본인입력검색키워드
재직기관(organization)
기관명 7 20부서명직위우편번호
주소전화(국가번호)
검수 기준
- 에러율 전체 데이터(전체 항목 필드 기준)의 01 이하(품질목표 999)
- 에러 체크 방식 전체 데이터에서 본인확인 미완료 대상 중 무작위로 30 샘플링 하
여 검수
- lsquo10년도 10월 DB구축완료단계에 최종 검수 실시
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침
및 매뉴얼에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며
오류율 산정에서 제외함
검수방식 및 기준
- 수집된 영문이력서 원본 파일(hwp doc pdf 등)과 입력 완료된 영문이력DB를 육안검
사 함
- 오류 판단 기준은 KISTI가 작성한 DB구축 작업 지침서를 참조함
252 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 125 -
팩스(국가번호)
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) 4 15학위취득일학교명전공명
경력(Career)
경력사항(CAREER)
시작년월 4 15종료년월
재직기관명직위
실적ResearchResult
논문실적(paper)
논문명 9 15저널명게제(권)집게제호
시작페이지종료페이지게제년월공동저자명비고
연구실적ResearchProject
시작년월 5 10
종료년월발주기관참여구분(역할)-코드연구실적명
특허(patent)
출원등록구분-코드 5 10
출원등록번호
출원등록국가-코드
특허출원명출원등록일자
계 38 100
항 목 세부항목 검수대상
데이터수
오류데이터건
수
품질지표별
기준점수의 합
항목가중치
()
오류율산정
기본(BasicInformation)
기본정보(5개)
영문성명 30 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
단위별 가중치는 KISTI와 협의하여 결정함
항목별 오류율 산정 기준 정의
- 126 -
휴대전화(국가번호)
30
E-mail 30개인홈페이지
30
검색키워드
30
소계 150재직기관(o r gan ization)(7개)
기관명 40부서명 30
직위 30우편번호 10주소 30전화 (국가번호)
30
팩스(국가번호)
30
소계 200
학력(Academiccarrer)
최종학위(FinalDegree)(4개)
학위 (코드)
10
학위취득일
15
학교명 80전공명 45소계 150
경력(Career)
경력사항( C AREER)(4개)
시작년월 15
종료년월 15재직기관명
80
직위 40소계 150
실적ResearchResult
논문실적(paper)(9개)
논문명 40저널명 20
게제(권)집
20
게제호 20시작페이지
10
종료페이지
10
게제년월 10공동저자명
10
비고 10소계 150
연구실적(Researc
시작년월 15종료년월 15발주기관 20
- 127 -
hProject)(5개)
참여구분(역할 ) -코드
10
연구실적명
40
소계 100특허(patent)(5개)
출원등록구 분 - 코
드
10
출원 등록번호
20
출원등록국 가 - 코
드
35
특허 출원명
20
출원 등록일자
15
소계 100계 100
- 128 -
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형구분
오류요형별점수 비고
완전성
누락 - 코드 누락 02
품질지표기준점수산정(데이터1건기준)=오류
유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 01
유효성형식 - 패턴의 오류 02
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 02
계 6개 오류유형 1
기본정보
영문성명 휴대전화 E-mail 개인홈페이지 계
Hong Gil Dong
(형식 02)010-111- testcom
GilDong Hong+82-011-111-
(형식 02)
testcokr
(오기 02)
testcom
(오기 02)
(누락 02) 019-111_ testcokr testcokr
품질지표별
기준점수의 합04 02 02 02 1
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
국가RampD참여인력
영문이력DB
3000건 3000건 3000건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
검사물량 집계표 예시
검수데이터 예시
- 129 -
3 평가위원 데이터 최신성 유지 매뉴얼
31 최신성 유지 업무 개요
311 개요
평가위원 데이터 최신성 유지란 lsquo기 구축된 평가위원 DB 내의 각 데이터들이 가장 마지막
으로 업데이트된 시점을 기준으로 그 시점부터 현재까지의 기간 동안 누락된 대상 인력들
의 변경사항들을 해당데이터에 추가입력 및 수정해주는 것rsquo을 의미
또한 대상 인력의 변경사항 반영이외에도 기 입력된 데이터들의 내용을 검토하고 발견된
오류 및 누락정보에 대한 수정ㆍ보완 작업 역시 평가위원 데이터 최신성 유지의 일환
최신성 유지를 위해 먼저 대상 인력에 대한 정보 수집이 요구됨
- 130 -
312 최신성 유지 업무 절차
최신성 유지 업무 절차는 관리자와 담당자의 역할로 구분가능
관리자는 담당자의 업무할당 데이터 검수 업무보고 등을 수행하며 담당자는 할당된 대
상인력에 대한 데이터 수정 및 보완 작업 수행
최신성 유지 업무 절차를 순서별로 나열하면 다음과 같음
- 관리자는 대상인력에 대한 전체리스트를 작성하고 이를 각 담당자들에게 일정량씩 할당
- 담당자는 할당된 대상인력에 대한 정보를 수집하고 기 입력된 데이터와의 비교를 통해
변경사항에 대한 수정 및 추가입력
- 담당자는 대상인력에 대한 정보를 수집한 출처 및 기타 비고사항에 대한 의견 등을 작
성하여 할당량에 대한 작업 완료시 관리자에게 보고
- 관리자는 보고된 작업결과물을 취합하여 정리하고 대상인력에 대한 정보가 잘 수집되고
입력되었는지 검토하여 수정 및 보완
- 관리자는 일일별 완료된 작업 결과 및 비고사항을 작성된 양식에 따라 담당 책임자에게 보고
- 131 -
32 대상 인력(평가위원) 정보 수집 방법
대상 인력의 정보를 수집하기 위한 방법은 크게 3가지로 구분
- 대상 인력에게 이력파일 요청
- 웹검색(기관홈페이지 개인홈페이지 및 각종 포털사이트)
- 신문기사의 인사ㆍ동정 모니터링
321 대상 인력에게 이력파일 요청
E-Mail 등을 통해 대상 인력에게 본인의 데이터에 대한 직접 업데이트 또는 입력대행을
위한 이력파일의 전송 요청
정보의 수신 방법은 E-Mail 우편 등이며 가장 신뢰성 높은 정보
입력이 완료된 이력파일은 개인정보보호를 위해 별도로 보관되며 E-Mail 및 기타 인쇄
물 이외의 형태로 수신되었을 경우 반드시 출력하여 관리
입력 완료시 해당인력에게 연락하여 결과에 대한 확인 요청
322 웹검색(홈페이지 및 각종 포털사이트)
대상 인력의 가장 최신의 연락정보(전화번호 E-Mail FAX 등) 재직정보 등을 수집하기
위해 웹상에 공개되어 있는 정보를 수집하여 데이터에 반영
대상 인력의 데이터 내 소속기관사항 및 기본정보의 홈페이지 주소 등을 통하여 해당 기
관 홈페이지 및 개인 홈페이지에 접근하여 연락정보 경력정보 실적정보 등에 관한 정보
수집
이직(移職) 등으로 대상 인력의 현재 소재지 재직기관 등에 관한 정보가 누락되어 있을
시 각종 포털사이트를 활용하여 해당인력의 소재정보 수집 및 접근
인물정보제공사이트를 통해 대상 인력의 기본정보 경력정보 실적정보에 대한 수정ㆍ보
완
323 신문기사의 인사ㆍ동정 모니터링
대부분의 신문에서 주요 인물에 대한 인사ㆍ동정에 관한 정보를 매일 싣고 있음
주기적으로 인사ㆍ동정란의 모니터링을 통해 평가위원 데이터에 변경사항 반영
- 132 -
33 최신성 유지 업무 작업 지침
331 언론을 통해 발표 되는 인사동정 수정
평가위원만 해당
교육과학기술부
- 참여인력을 포함하여 인사동정 수정
- 직급은 장관 차관 국장 팀장 사무관 서기관 까지 수정
- 특히 교육과학기술부장관 제2차관 정책보좌관 국장은 꼼꼼하고 세심하게 수정할 것
332 현행화 작업 내용
수정은 기본정보 소속기관 학력사항 초중고학력 경력사항 소속학협회 논문 실적 연구
실적 저역서실적 훈포장사항 지식재산권 주요업적사항 자격사항 사진관리 등 전 항
목에 걸쳐 작업 함
해당 인물의 개인 홈페이지를 최우선으로 보고 그 다음으로 기관 홈페이지를 참고
해당 기관 홈페이지에서 정확히 알 수 없을 경우에는 코셉 조인스 로마켓 동아일보를
참고 할 것
경력사항은 경력의 년도와 날짜가 없더라도 신규 입력 함
기본정보
e-mail에서 (dot)가 아닌 (comma) 로 표기된 경우 변경
e-mail 주소가 2개일 때는 개인홈페이지에 적힌 메일주소가 우선 판단이 안 될 경우는
소속기관에서부여된 e-mail 주소로 기입
인적사항의 홈페이지정보에서 lsquohttprsquo 는 빼고 입력
소속기관
산학협력단
- 소속기관에서 제외(삭제)하고 경력사항에만 기입
- 산학협력단이 주소로 되어있는 기업은 소속기관에 그대로 두거나 기입해 줌
평가위원이 의과대학의 교수이자 병원의 교수(의사)인 경우는 소속기관을 의과 대학
의 교수로 기입하고 병원 근무사항은 경력사항에 기입
(ex 관동대학교 의과대학 정형외과학교실 교수 소속기관
관동대학교 명지병원 정형외과 전문의 경력사항)
소속기관이 대학과 병원 모두 입력되어 있는 경우 수정하지 않고 pass
소속기관은 의과대학이나 주소가 병원일 경우 수정하지 않고 pass
평가위원의 재직기관 홈페이지에서 해당 인물이 검색 되지 않을 경우
- 학교의 교수 명예교수 등은 pass
- 회사의 대표이사 회장 등은 직급은 공란으로 바꾸고 재직중으로 변경
( 대표이사 인사말 회장 인사말 등의 인물 이름이 다를 경우를 뜻함)
- 133 -
평가위원이 학sdot협회에 재직중인 경우
- 소속기관이 하나이고 학sdot협회라면 소속기관에 그대로 둠
- 소속기관이 2개 이상이고 그 중 한 곳이 학sdot협회일 때
학sdot협회를 제외한 소속기관에서 인물이 검색 되는 경우 학sdot협회 내역으로 옮김
학sdot협회를 제외한 소속기관에서 인물이 검색 되지 않고 학sdot협회에서만 검색 되는 경
우 학sdot협회를 제외한 소속기관 내역은 경력사항으로 옮김
학sdot협회를 제외한 소속기관과 학sdot협회 모두 인물이 검색 되지 않는 경우 수정하지
않고 pass
기타
- 직장주소에 집주소가 되어있으면 변경하고 집주소란에 직장주소가 되어있으면 그냥 둠
- 겸임교수직은 경력사항에 입력
소속기관에 기입된 경우 경력사항으로 이동
소속기관이 한 개이고 겸임교수일 경우 pass
- 인물의 직급이 모두 시간강사인 경우 담당자에게 인물key 전송
- 퇴직한 교수로 그 이후의 소속기관이 없는 사람은 재직여부를 lsquo퇴직rsquo으로 변경 후 저장
- 전화번호가 2개인 경우 (comma)로 구분
- 교수의 경우 학과부서 탭엔 단과대 아래의 레벨 모두 기입
(ex 생명과학부 생명공학전공 or 의학과 내과학교실)
학력사항
박사후과정(Post-Doc)은 생략 단 경력사항의 Post-Doc은 기입
논문실적
2006~2010년도 논문sdot연구실적만 입력
현재 HuRIMs에 저장된 가장 최근 년도부터 템플릿에 작업
(ex 개인홈페이지에는 2000년~2009년까지 논문사항이 입력되어있고 HuRIMs에는 2007
년 2월까지만 입력되어 있다면 2007년의 논문은 중복체크를 한 후 입력되지 않은 논문
들과 2008 2009년도 논문을 템플릿에 넣는다)
기타논문집은 학술논문으로 판단되는 것들만 기입
- 판단기준 대학 연구소 학회에서 발행한 논문들
동일한 제목으로 다른 발행처에 중복 기재된 경우
- 발행처 두 곳이 모두 학회일 때 중복하여 기입
- 발행처 두 곳이 학회amp연구소 학회amp대학 일 때 학회의 논문실적만 기입
출판중인 논문은 기재하지 않음
학회sdot협회sdot대학 등에서 발간된 저서 중 일부만 담당한 경우
- 일부 chap theme 만 담당했더라도 저역서실적에 기입
- 일부 작성한 부분의 제목이 논문의 형태를 띄고 있을 때(~에 관한 연구 고찰 등)는 논문
실적에 기입
- 134 -
훈포장사항
세계인명사전등재 내용 기입
감사장 감사패는 기입하지 않음
경력업적학협회 유형 정리
향우회 민방위 동창회 성직자협의회 등은 제외함
lsquoooo위원회rsquo가 들어가는 내용은 직급에 상관없이 업적사항으로 기입 단 기초기술 연구
회와 산업기술연구회는 정부조직이므로 경력사항에 기입
(ex 기록관리혁신전문위원회 회장 정보통신위원회 고문 rarr 업적)
위원회를 제외한 lsquo회rsquo는 직급에 상관없이 학sdot협회 활동사항으로 기입
(ex 한국원예치료협회 상임이사 한국화훼장식학회 편집위원 한국양액재배연구회 이사
한국화훼환경디자인교수연합회 이사 전국대학정보화협의회 이사 rarr 학sdot협회)
활동내역 중 자문 심의는 업적사항에 기입 단 협회 학회 연구회 등의 자문sdot심의는
학sdot협회 활동사항에 기입
활동내역 중 기업sdot학교의 고문은 경력사항에 기입
34 최신성 업무 대상
341 대상 및 범위
평가위원후보추천서비스에서 서비스 중인 평가위원 전체
평가위원 기본정보 경력정보 갱신 및 실적정보 추가입력 및 갱신
추가 입력 및 갱신을 위한 기초자료는 웹사이트에 공개된 정보 신문의 인물 동정기사
평가위원 본인이 제공하는 이력정보 임
342 검수 기준
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
- 최신성 유지 관리를 수행한 전체 데이터 중 3를 샘플링하여 출처별 내용이 최신성 유
지 관리 매뉴얼 기준으로 추가 입력 및 갱신되었는지 여부를 확인
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 135 -
구분 항목 세부항목 항목수단위별
가중치()
참여
인력
정보
기본정보
주민등록번호 성명 자택주소 자택
우편번호 자택전화번호 핸드폰번호
7 31
소속기관사항
소속기관명 부서명 직위명 사무실
전화번호 기관주소 최초임용일 인
력(직업)구분
7 185
학력사항
전공 취득대학 학위 입학일 졸업
일 학과 취득국가 지도교수명 학위
논문명 학위취득일
10 21
경력사항 근무처명 직위명 근무기간 3 45
자격사항 자격발행처 자격증명 자격취득일 3 25
논문실적
논문발표일 국문논문명 영문논문명
저자역할구분 발행처 학술지구분
학술지명 SCI여부
8 105
지식재산권 지식재산권명 출원_등록번호 특허구분 3 25
계 소계 41 905
평가
위원
소속학협회현황 담당업무 직위 학협회사항 3 3
훈포장사항 수상년월 수여기관명 훈포장명 3 25
저역서실적국문저서명 영문저서명 발행년 발
행처 저역서구분5 4
소계 11 95
계 52 100
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
343 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 136 -
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
150 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
성명 100자택주소 10자택우편번
호
20
자택전화번
호
10
핸드폰번호 10E-mail 10소계 310
소속기
관사항
(7개)
소속기관명 100
부서명 05
직위명 20
사무실전화
번호
10
기관주소 30
인력(직업)구
분
10
최초임용일 10
소계 185
학력사
항
(10개)
전공 20
취득대학 100
학위 20
입학일 10
졸업일 10
학과 15
취득국가 15
지도교수명 05
학위논문명 05
학위취득일 10
소계 210
항목별 오류율 산정 기준 정의
- 137 -
경력사
항
(3개)
근무처명 20
직위명 15
근무기간 10
소계 45
자격사
항
(3개)
자격발행처 05
자격증명 10
자격취득일 10
소계 25
논문실
적
(8개)
논문발표일 10논문명1 10
논문명2 05저자역할구
분
05
발행처 05학술지구분 05학술지명 10
SCI여부 05
소계 105
지식재
산권
(3개)
지식재산권
명
10
출원_등록번
호
05
특허구분 10소계 25
평가 소속학
협회현
황
(3개)
담당업무 05
위원 직위 05(11개) 학협회사항 20
소계 30
훈포장
사항
(3개)
수상년월 10
수여기관명 05
훈포장명 10
소계 25
저역서
실적
(5개)
저역서명1 10
저역서명2 05
발행년 10
발행처 05
저역서구분 10
소계 40
계 1000
- 138 -
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 및
출처 비교 오류03
품질지표기준점수산정(데이터1
건기준)=오류유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 맵핑 오류 005
계 6개 오류유형 1
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
3000 3 055 150 000825
성명 10 2 035 100 000350자택주소 3 0 000 10 000000
자택우편번
호
3 2 035 20 000233
자택전화번
호
4 0 000 10 000000
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
평가위원 Pool DB 23000건 23000건 690건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
출처 비교는 작업대상별 출처 리스트 참조
검사물량 집계표 예시
오류율산정표 예시
- 139 -
핸드폰번호 6 0 000 10 000000
E-mail 9 0 000 10 000000소계 45 7 125 310 001408
소속기
관사항
(7개)
소속기관명 1000 20 100 000000부서명 80000 200 05 000000직위명 80000 200 20 000000사무실전화
번호
80000 200 10 000000
기관주소 80000 200 30 000000인력(직업)구
분
80000 200 10 000000
최초임용일 80000 200 10 000000소계 481000 1220 000 185 000000
계 1000 01
주민등록번호 한글성명 영문성명 한문성명자택우편번
호
630421-0000000 백중환Joong hwan
Baek
412220
(형식 015)
630421-0000000 백종석Baek Jong
Seok
6304210000000
(형식 015)백인열 Baek IN Youl 白寅烈 711-822
630421-0000000 백승호
(오기 02)백제훈
630421-0000000 백종완
630421-
(오기 02)백장선 Jangsun Baek
白壯선
(형식 015)
502-
(오기 02)
630421-0000000 백승호1213132
(오기 02)
630421-0000000 백석형
630421-0000000 백석형
품질지표별
기준점수의
합
055 035 035
검수데이터 예시
- 140 -
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 및
출처 비교 오류03
품질지표기준점수산정(데이
터1건기준)=오류유형별점수
의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 맵핑 오류 005
계 6개 오류유형 1
데이터별 품질지표 기준 점수
35 입력 항목별 QampA (처리 방법 및 사례)
기본정보
- 정보공개여부
구 분 내 용
상황 및 질문ㆍ데이터 신규입력 시 정보공개여부 설정(공개 기본인적사항만 공
개 비공개)을 어떻게 해야 하는지
처리 방법
및 사례
- 대상인력의 입력대행요청에 의한 정보입력 시 정보공개여부는 해당인
력이 요청한 대로 설정
- 최신성 유지팀 자체 내에서 수집한 정보를 바탕으로 대상인력 데
이터를 신규생성 할 경우에는 lsquo기본인적사항만 공개rsquo로 설정
- 과학기술표준분류
구 분 내 용
상황 및 질문ㆍ데이터 입력 시 과학기술표준분류에 대한 처리는 어떻게 해야 하
는지
처리 방법
및 사례
- 과학기술표준분류는 정보관리자가 임의로 선택하거나 수정하지 않
음
- 141 -
소속기관사항
- 재직여부
번호 구 분 내 용
1
상황 및 질문
ㆍ대상인력이 이직(移職)하여 재직기관이 변경된 경우 전 재직기
관 정보의 재직여부를 퇴직으로 변경하고 현 재직기관 정보를
추가입력해야 하는지
처리 방법
및 사례
- 대상인력의 재직기관이 변경되었을 경우 전 재직기관 항목은 삭제
후 경력사항에 반영함
- 현 재직기관 정보 신규입력 후 이를 경력사항에 반영
2
상황 및 질문ㆍOO연구원에 재직중인 홍길동씨가 현재 과학기술부에서 파견근
무 중일 경우 이를 어떻게 처리해야 하는지
처리 방법
및 사례
- 먼저 원 소속인 OO연구원 소속기관사항의 재직여부에 lsquo재직중rsquo
에서 lsquo파견중rsquo으로 변경
- 또한 소속기관사항 항목을 추가시켜 파견기관인 lsquo과학기술부rsquo 직위
등의 정보 입력 후 재직여부를 lsquo재직중rsquo으로 선택
3
상황 및 질문ㆍ대상인력이 정년 등의 이유로 퇴직한 상태인 경우 소속기관사
항을 삭제해야 하는지
처리 방법
및 사례
- 대상인력이 퇴직한 상태이고 현재 다른 직업이 없는 경우 소속
기관사항은 삭제 시키지 않고 재직여부를 lsquo퇴직rsquo으로 변경
- 경력사항 항목에 퇴직일자 포함된 정보 추가
- 142 -
학력사항
- 전공명
구 분 내 용
상황 및 질문ㆍ대상인력의 학력정보를 수집하였으나 학과명만 표기 있는 경우 전
공명은 공란으로 두는지
처리 방법
및 사례
- 대상인력의 학과정보만 발견된 경우 일반적으로 전공명은 우선 학
과명과 동일하게 입력
ex) 학과명 경영학과 rarr 전공명 경영학
경력사항주요업적사항
- 경력사항주요업적사항 일반
구 분 내 용
상황 및 질문 ㆍ경력사항과 주요업적사항은 어떤 기준으로 구분하는지
처리 방법
및 사례
- 일반적으로 웹상 및 타기관 인력정보데이터를 통해 수집된 정보에
는 경력사항과 주요업적사항을 따로 구분하지 않은 경우가 대다수
- 본 시스템에서는 경력사항과 주요업적사항을 구분하여 입력
- 경력사항은 대상인력의 직업과 관련된 사항으로 구분
- 주요업적사항은 대상인력의 직업 이외의 대외적인 활동 즉 평가
자문위원 등 각종 위원활동 설계 시공 기술지도 등의 사항으로
구분
예외적으로 학위 이외의 교육과 관련된 사항은 경력사항에 입력
ex) OO대학 OO교육과정 수료이수
- 143 -
소속학협회
- 직위담당업무
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 소속학협회정보에 학회명 이외에 다른 사항이
기재되지 않은 경우 직위 및 담당업무 항목은 어떻게 처리하는지
처리 방법
및 사례
- 활동시작년월 및 학회종료년월에 관한 정보가 없을 시 이는 공란처
리하며 직위의 경우 다른 정보가 없는 경우 lsquo회원rsquo으로 입력
논문실적
- 학술지구분
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 논문실적 정보만으로 학술지구분(국내 및 국외
전문학술지 국내 및 국외 학술대회발표논문집 기타논문집)에 대
한 구분은 어떻게 하는지
처리 방법
및 사례
- 수집된 대상인력의 논문실적 정보의 상당수가 국내 및 국외 전문학
술지 및 학술대회발표논문집에 관한 구분이 되어 있지 않기 때문
에 학술지구분에 어려움을 겪을 수 있음
- 이에 대한 구분기준은 명확하게 한정짓기 어려운 부분이 있어 이
러한 경우 최신성 유지 업무 담당 책임자가 판단하여 처리하고 있
음
- 이에 대한 몇 가지 팁을 제시하자면 먼저 lsquoOO학회지rsquo lsquoJournal
ofrsquo 등의 용어가 해당정보에 삽입되어 있는 경우 대부분 전문학
술지로 구분할 수 있으며 lsquo학술대회rsquo lsquo발표대회rsquo lsquoProceeding
Conference Seminar Workshop등의 용어가 해당정보에 삽입되
어 있는 경우 이는 대부분 rsquo학술대회발표논문집으로 구분할 수 있
음
- 또한 학술대회발표논문집 중 국내와 국외의 구분은 해당 학술대회
가 열린 장소를 기준으로 함
ex) lsquoThe Internation Conference in Seoulrsquo의 경우 학술대회가 열린
장소가 대한민국의 서울이므로 국내 학술대회발표논문집으로
구분함
- 144 -
- 역할
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 논문실적 정보에 역할(단독 공동(제1) 공동(참
여) 공동(책임))이 구분되어 있지 않은 경우 이를 어떻게 처리해야
하는지
처리 방법
및 사례
- 현재 대상 인력의 연구실적과 관련하여 역할구분이 되어 있지 않은 정
보를 입력할 시 해당 연구의 특성을 고려하여 역할을 lsquo단독rsquo 혹은 lsquo공
동(제1)rsquo으로 임시 구분해 줌
- 공동저자명
구 분 내 용
상황 및 질문ㆍ수집된 대상 인력의 논문실적 정보 중 공동저자명 입력 시 10명 이
상이 넘어가는 공동저자명을 모두 넣어주어야 하는지
처리 방법
및 사례
- 공동저자명의 경우 한 연구실적에서 무수히 발생될 수 있는 공동저
자명을 일일이 입력을 해주고 있지는 않음
- 예를 들어 공동저자명이 15명일 경우 공동저자명에는 lsquo홍길동 김순희
이명수 박영희 등rsquo으로 한정시키고 전체저자수 항목에 저자를 포
함한 16명을 입력해 줌
- 논문실적 일반
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 논문실적 정보가 논문명만 있는 경우 이를 입
력해야 하는지
처리 방법
및 사례
- 대상인력의 논문실적 정보에 대한 추가 입력 기준은 아직 명확하
게 정해지지는 않은 상태
- 현재(2007년 7월 18일 기준)는 개재년월 및 논문명의 두 가지 정보 이
상이 존재할 시에만 추가입력을 해주고 있음
- 145 -
연구실적
- 연구기간
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 연구실적 정보에서 연구기간 항목이 종료년월
만 나와 있는 경우는 어떻게 처리하는지
처리 방법
및 사례
- 연구기간에 관한 정보가 종료년월만 나와 있는 경우 임시로 1년의
기간을 책정하여 시작년월을 입력
ex) lsquo2005년 8월 OO에 관한 연구rsquo라는 연구실적의 입력 시 연구기간
에서 시작년월은 2004년 9월 종료년월은 2005년 8월로 입력
- 참여구분
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 연구실적 정보에서 참여구분(연구책임자 공동연
구자)의 경우 이를 어떻게 구분하는지
처리 방법
및 사례
- 연구실적에 관한 정보에서 참여구분이 되어 있지 않은 경우에는 해
당인력의 다른 연구실적 등을 감안하여 참여구분을 하여야 하나
대상이 평가위원인 경우 lsquo연구책임자rsquo로 임시 구분하여 줌
지식재산권
- 취득구분
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 지식재산권 정보에서 취득구분(출원 등록)이
구분되어 있지 않은 경우 어떻게 처리하는지
처리 방법
및 사례
- 수집된 지식재산권 정보에서 취득구분이 되어 있지 않은 경우 임
시로 lsquo등록rsquo으로 선택하여 입력
- 특허구분
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 지식재산권 정보에서 특허구분(특허 실용신안
의장 상표 소프트웨어)이 구분되어 있지 않은 경우 어떻게 처리
하는지처리 방법
및 사례
- 수집된 지식재산권 정보에서 특허구분이 되어 있지 않은 경우 임
시로 lsquo특허rsquo로 선택하여 입력
- 146 -
첨부1 NTIS 코드 표준
NTIS 표준코드
정보공개구분
코드값 코드값 의미
1 공개
2 기본인적사항만공개3 비공개
인력(직업)구분
코드값 코드값 의미
1 대학교2 연구소
3 산업계9 기타
소속구분코드
코드값 코드값 의미
1 재직중2 퇴직
3 해외연수6 파견중
학위코드
코드값 코드값 의미
2 학사이하5 석사
7 박사수료8 박사
- 147 -
학술지구분
코드값 코드값 의미 비고
01 국외전문학술지 발표 학술지가 국외전문학술지에 게재
02 국외학술대회발표논문집 발표 학술지가 국외학술대회발표논문집에 게재
03 국내전문학술지 발표 학술지가 국내전문학술지에 게재
04 국내학술대회발표논문집 발표 학술지가 국내학술대회발표논문집에 게재
05 기타논문집 발표 학술지가 기타논문집에 게재
역할구분
코드값 코드값 의미
1 단독2 공동제1 주저자3 공저자4 교신(책임)저자
참여구분
코드값 코드값 의미
A 연구책임자B 참여연구원
저역서구분
코드값 코드값 의미
1 저서2 역서
발행지구분
코드값 코드값 의미
1 국내2 국외
취득구분
코드값 코드값 의미
01 특허출원02 특허등록
- 148 -
코드값 코드값 의미
9511 조경middot지역시스템공학부
특허구분
코드값 코드값 의미 비고
01 특허 산업재산권이 특허에 해당하는 경우
02 실용신안 산업재산권이 실용신안에 해당하는 경우
03 디자인 산업재산권이 디자인에 해당하는 경우
04 상표 산업재산권이 상표에 해당하는 경우
05 기타 산업재산권이 기타에 해당하는 경우06 프로그램(SW) 산업재산권이 프로그램에에 해당하는 경우07 저작권 산업재산권이 저작권에 해당하는 경우08 신기술 인증 산업재산권이 신기술 인증에 해당하는 경우09 신제품 인증 산업재산권이 신제품 인증에 해당하는 경우10 국제출원(PCT) 산업재산권이 국제출원(PCT)에 해당하는 경우11 서비스 산업재산권이 서비스에 해당하는 경우
업적구분
코드값 코드값 의미
1 평가위원
2 위원회활동3 자문4 설계5 시공6 기술지도9 기타
기관코드(기관명이형전거DB)
코드값 코드값 의미
ZE02400 엘에스엠트론(주)ZE02378 (주)지앤시바이오ZE02376 (주)하나아이엔씨ZE02374 센게이지러닝코리아(주)ZE02373 (주)루켄테크놀러지스ZE02372 (주)디투알컨설팅
ZE02367 (주)대흥이엔지ZE02366 (사)한국벤처산업연구원ZE02365 CSG(주)ZE02364 국제상사(주)전자기술연구소
학과코드
- 149 -
9510 생물정보학과
9509 나노과학기술학부9508 지능기계공학과9507 생명과학기술학부9506 의과학과9505 부동산정보9495 보건정보관리
9999 기타9475 대학원
코드값 코드값 의미 코드값 코드값 의미
A01 교수 B32 기술원A02 부교수 C01 공무원A03 조교수 C02 법조인A04 전임강사 C03 의사
A05 시간강사 C04 교사A06 강사(기타) C05 군인A10 명예교수 D01 대표이사A11 석좌교수 D02 이사A12 강의교수 D03 전무A13 겸임교수 D04 상무
A14 계약교수 D05 부장A15 기금교수 D06 차장A16 대우교수 D07 과장A17 연구교수 D08 대리A18 초빙교수 D09 사원A19 객원교수 D10 부사장
A20 조교 D11 상임이사A21 대학원생 Z01 위원A22 POST-DOC Z02 의원A23 POST_MAS Z03 실장A24 초청교수 Z04 학과장A25 외래교수 Z05 주임
B01 수석연구원 Z06 단장B02 책임연구원 Z07 팀장B03 주임연구원 Z08 회장B04 전임연구원 Z09 본부장B05 선임연구원 Z10 처장B06 연구원 Z11 학장
B07 위촉연구원 Z12 센터장B10 수석연구위원 Z13 소장B11 책임연구위원 Z14 부처장B12 주임연구위원 Z15 국장B13 전임연구위원 Z16 연구주임
직위코드
- 150 -
B14 선임연구위원 Z17 연구소장
B15 연구위원 Z18 원장B20 전문위원 Z19 부원장B30 책임기술원 999 기타B31 선임기술원
코드값 코드값 의미 비고
AD 안도라 ANDORRA
AE 아랍에미리트 UNITED ARAB EMIRATESAF 아프가니스탄 AFGHANISTANAG 앤티가 바부다 ANTIGUA AND BARBUDAAI 안길라 ANGUILLAAL 알바니아 ALBANIAAM 아르메니아 ARMENIA
전공분야코드
코드값 코드값 의미
E340600 구강해부학E340601 육안일반해부학E340602 신경해부학E340603 육안두경부일반해부학
E340604 두경부신경해부학E340605 두경부응용해부학E340700 치아형태학E340701 영구치치아형태학E340702 유치치아형태학E340703 치아교합학
국가코드
개인정보활용동의구분
코드값 코드값 의미
Y 동의N 비동의
- 2 -
구분 항목 세부항목
참여인력정보(42개)
기본정보(9개)주민등록번호 성명 인력구분 자택주소 자택우편번호 자
택전화번호 핸드폰번호 부처(기관)분류코드 E-mail
소속기관사항(6개)소속기관명 부서명 직위명 사무실전화번호 기관주소
최초임용일
학력사항(10개)전공 취득대학 학위 입학일 졸업일 학과 취득국가 지
도교수명 학위논문명 학위취득일
경력사항(3개) 근무처명 직위명 근무기간
자격사항(3개) 자격발행처 자격증명 자격취득일
논문실적(8개)논문발표일 국문논문명 영문논문명 저자역할구분 발
행처 학술지구분 학술지명 SCI여부
지식재산권(3개) 지식재산권명 출원_등록번호 특허구분
평가위원(10개)
소속학협회현황(3개) 담당업무 직위 학협회사항
훈포장사항(3개) 수상년월 수여기관명 훈포장명
저역서실적(4개) 국문저서명 발행년 발행처 저역서구분
13 정제 대상
정제 대상 범위
- 정보연계를 통해 수집되는 참여인력정보의 정제
정제 대상 항목 정의
주요 정제 대상 정의
구분 항목 세부항목
참여인력정보(12개)
기본정보(6개)주민등록번호 성명 인력구분 핸드폰번호 E-mail 부
처(기관)분류코드
소속기관사항(4개) 소속기관명 기관주소 사무실전화번호 직위명
학력사항(2개) 전공 학위
주요 정제 대상 항목이란 인력정보 서비스를 위해 기본적으로 필요한 최소한의 서비스 항목 Not
null값은 아니지만 최대한 많은 자료 수집이 필요한 항목
- 3 -
코드 대상 항목 정의
구분 항목 세부항목
참여인력정보(16개)
기본정보(3개) 자택우편번호 부처(기관)분류코드
소속기관사항(3개) 인력구분 소속기관명 직위명 기관우편번호
학력사항(4개) 전공 학위 학과 취득국가 취득대학
경력사항(2개) 직위명
논문실적(3개) 저자역할구분 학술지구분 SCI여부
지식재산권(1개) 특허구분
평가위원(1개)
저역서실적(1개) 저역서구분
코드 대상 항목이란 데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목
14 정제 수준
데이터 특성 및 정제 지침
- lsquo속성값 전체 존재rsquo 데이터
공통사항 오류 데이터 정정 및 코드 매핑
① 중복 자료 중 데이터 신뢰성에 근거하여 통합 필수 항목 누락 확인 및 보충 선별(성명 주
민등록번호) 형식 확인(주소 전화번호 및 E-Mail)
② 중복 자료 중 최신 자료 선정 및 확인 형식 확인 (주소 전화번호)
③ ⑤~⑪ 중복 자료 중 데이터 신뢰성에 근거하여 통합
번호는 lsquo정제 대상 항목 정의rsquo 표에서 각 항목에 붙여진 번호
- lsquo일부 또는 6개 미만rsquo 데이터
데이터 누락 정도를 판단하여 필요한 경우 해당 기관에 보완 요청
데이터 보완 후 lsquo속성값 전체 존재rsquo 데이터와 같은 방식으로 정제
오류 유형 정의 및 정제 형태
- 발생 가능한 오류 유형
주요 항목 중 데이터가 존재하지 않는 경우
데이터의 Type(문자형 숫자형)에 위배되는 값이 들어있는 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
정해진 법칙에 따른 번호가 아닌 경우
실제로 존재하지 않는 부점(구분자) 등이 입력되어 있는 경우
- 4 -
오류 유형 세부 정제 지침 비고
주요 항목 중 데이터가 null- 정제가 불가능하므로 정보 재수집
(해당 기관에 정보 제공 재요청)
데이터 Type 오류
- 적합한 Type으로 수정 가능한 정도(의미상으로는
유효한 경우)의 오류는 수정하고 그렇지 않은 데
이터는 삭제
데이터 형식 오류- 데이터들 중 가장 많은 유형을 정규 형식 정고 형
식에 위배되는 데이터들은 정규 형식으로 변환
부점(구분자) 오류
- 실제 서비스 되는 데이터값과 비교하여 변환 과정
에서 발생한 오류면 실제 데이터값으로 변환하고
원시 데이터 자체가 오류인 경우에는 삭제 처리
코드값 오류
- 일치 유사한 코드값으로 변환
- 유사 가장 적합한 코드값으로 변환
- 상이 lsquo기타rsquo코드값으로 분류 또는 삭제
논문제목 오류 - 논문제목1은 반드시 필수 입력으로 처리
중복 데이터들의 데이터 값
상충 오류
- 변경될 수 없는 기본정보(이름 주민번호)의 경우는
기존 데이터 우선
- 변경 가능한 정보(기관명 논문 등)의 경우 최신 업
데이트된 정보를 우선
코드의 값이 정해진 범위를 벗어나는 경우
ex) 기관 코드와 인력시스템 사용 코드와의 매핑 오류
기관 데이터의 코드 항목 값이 잘못 입력되어 있는 경우
국문과 영문으로 구분되는 동일 데이터 항목에 잘못된 위치에 항목 값이 입력되어 있는 경우
ex) 논문실적정보의 국문제목에 영문제목이 입력되어 있는 경우
데이터가 복수로 존재하며 서로 상충되는 경우
ex) 유효하지 않은 주민등록번호의 중복
- 조치 가능한 데이터 정제 형태
재수집 데이터를 제공한 기관에 재요청하여 부족한 데이터 내용을 재수집
수정 데이터 내용은 수정하지 않고 데이터 형태 및 특수문자 수정 정도의 정제
삭제 데이터 값 삭제(Garbage 처리) 또는 레코드 삭제
위의 경우 원시 데이터 값은 관리를 위해 따로 보관
정제 제외 데이터 값이 누락이거나 오류로 판단되지만 정확한 데이터 내용을 알 수 없는 경
우 기준 데이터가 없으므로 정제 대상에서 제외 또한 별다른 오류로 보이지 않는 경우도 정
제 대상에서 제외
오류 유형별 세부 정제 지침
~은 lsquo발생 가능한 오류 유형rsquo 내용 참조
~은 lsquo조치 가능한 데이터 정제 형태rsquo 내용 참조
- 5 -
구분 비고
기본정보 이메일 기존 수집 데이터를 통해 보완
소속기관사항 있으나필드가 null인것
인력구분 기관명이형전거DB 생성 완료 후 적용함
소속기관 우편번호주소가 있는 경우 우편번호 찾기를 통해 보완주소가 없는 경우 기존 수집 데이터를 통해 보완
소속기관 주소 기존 수집 데이터를 통해 보완
소속기관명기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
학력사항 있으나 필드가null인것
전공기존 수집 데이터를 통해 보완하고 기관명이형전거DB로 매핑함
학위기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
소속기관사항 없는것 기존 수집 데이터를 통해 보완
학력사항 없는것 기존 수집 데이터를 통해 보완
인력정보의 누락항목에 대한 보완(기존 서비스 데이터 기준)
기타 (정보 식별자 부여)
- 데이터 정제 최종 단계에서 식별자 부여 체계에 따라 정보식별자(번호) 삽입
- 정보식별자(번호)는 식별체계 API에 의해 자동으로 부여 되며 식별 부여 체계는 사업단 내 식별
체계 담당자가 마련하여 제공
고려 사항
- 정확한 항목매핑 후 작업이 진행되어야 함
- 정제데이터 관리는 임시테이블을 통해서 관리되며 다양한 에러 유형별로 체계적인 관리가 되어야 함
15 정제 작업 방식
중복 확인 기계작업
- 정제 도구에서 제공하는 중복 확인 기능을 이용하여 중복 항목의 리스트 작성(기계작업)
데이터 통합 기계작업 + 수작업
- 중복으로 확인된 항목들의 리스트를 비교하여 통합
- 기계적으로 필드간의 충돌이 없음을 확인할 수 있는 항목은 자동 통합하고 기계적으로 충돌을
- 6 -
확인할 수 없는 경우는 수작업으로 필드별 데이터 통합을 수행
- 최신 또는 최종 여부를 확인하여 통합해야 하는 경우 해당 데이터에 포함된 일자 데이터를 감안
하여 선별 통합(일자 및 기간의 충돌이 없는 경우 기계작업 충돌이 있는 데이터는 리스트 업
후 수작업)
필수 데이터 누락 확인 및 보충 선별 기계작업 + 수작업
- 소속기관명 E-mail 등과 같이 누락되지 말아야 할 항목을 설정하고 기계적으로 누락된 항목의
리스트를 추출(기계작업)
- 이 리스트에 대하여 보충 가능한 데이터는 보충하고 보충이 불가능한 경우 서비스 불가 리스트
로 따로 추출(수작업)
형식 확인 기계작업 + 수작업
- E-Mail 주소 전화번호와 같은 형식이 어느 정도 정의된 데이터의 경우 기본 형식을 템플릿으
로 지정
- 정형화되지 않은 데이터의 리스트를 추출하여 이 중 기계적으로 형식을 일치시키고(기계작업)
일치되지 않은 데이터를 수작업으로 확인하여 수정하거나 형식 불량 데이터 리스트로 따로 추
출(수작업)
16 데이터 검수
161 데이터 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
- 7 -
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
17 데이터 이관
171 NTIS 참여인력 DB 현황 및 데이터 흐름
NTIS 참여인력 DB는 물리적으로 각 연계기관과 NTIS의 데이터 연계를 위해 각 연계기
관에 구성된 연계기관 공동활용 DB와 RampD 참여인력을 관리하기 위한 인력DB RampD참여
인력 서비스 DB로 구성되어 있다
그림 3 NTIS DB 현황 및 데이터 흐름
172 NTIS DB 간 테이블 매핑
NTIS 참여인력 DB가 기능별로 분리되어 있음으로 인해 연계DB에서 인력 관리DB 간
항목 매핑 정의가 필요하다 DB 간 항목 매핑은 아래와 같다
정보구분 테이블명 수집DB 관리DB
인력정보
인력 기본정보 MP_BASIC THR_BASE
소속기관사항 HOFF_ORG THR_JAEJIK
학력사항 SCRE THR_SCHOOL
경력사항 CAREER THR_CAREER
논문실적 PAPER_OUT THR_PAPER
자격사항 CERT THR_LICENSE
지식재산권실적 IPR_OUT THR_PATENT
소속학협회현황 BLNG_INSTIT THR_ACTIVE
저역서실적 TRNSWRT_OUT THR_BOOK
훈포장사항 AWARD THR_MEDAL
- 8 -
항 목 세 부 항 목
기본
기본정보 영문성명 휴대전화 E-mail 개인홈페이지
전문분야 전문(연구)분야
재직기관 기관명 부서명 직위 주소 전화 팩스
학력 최종학위 학위 학위취득일 학교명 전공명
경력 경력사항 시작년월 종료년월 재직기관명 직위
실적
논문실적 논문명 저널명 게제(권)집 페이지 게제년월 공동저자명
연구실적 시작년월 종료년월 발주기관 참여구분(역할) 연구명
특허출원등록구분 출원등록번호 출원등록국가 특허출원명 출
원등록일자
173 데이터 이관
수집 DB에 전송되는 인력정보는 중복 인력이 존재 하며 동일인물의 정보일 지라도 각
기관별 보유 항목이 다르므로 관리DB로 이관을 위해 각 항목별 이관 방안이 필요하다 따
라서 별도의 방안을 마련하여 데이터 이관을 실시하도록 한다
2 인력정보 영문이력 입력 지침
21 영문이력 DB 구축 필요성
해외의 연구자 혹은 외국의 연구기관등에게 관련분야의 연구자문에 필요한 국내 연구전
문가 혹은 국제 공동연구활동 등을 지원하기 위한 국내 인물에 대한 영문검색 체널제공
인물정보에 대하여 영문DB구축을 수행하고 웹을 통한 영문검색을 지원함으로써 국제공
동연구를 지원하기 위한 기반을 조성
기존 개인정보 공동활용에 동의한 연구자들을 대상으로 파악한 영문이력DB 구축방법을
통해 인력정보에 대하여 영문화 작업을 수행
22 영문이력 DB 구축 대상
기본정보 학력사항 경력사항 논문실적 연구실적 특허실적 등
23 영문이력 DB 구축 항목
영문이력서 제공가능 인력에 대해 영문이력서를 제공받아 이를 바탕으로 영문 DB를 구
축하고 번역 요청자를 대상으로 번역을 통한 영문DB구축
- 9 -
항 목 세 부 항 목 영문명 비고
기본(BasicInformation)
기본정보 영문성명 English Name - 한글이력정보와 공동 사용- 전문분야는lsquo08 개정 분류코드 영문명 활용
휴대전화(국가번호)
Cellular PhoneNumber
E-mail E-mail
개인홈페이지 Homepage
전문분야 전문(연구)분야 Research Field 1
Research Field 2
Research Field 3
검색키워드 전문분야명
재직기관(organization)
기관명 Organization Name - 현재 재직기관사항 1개 입력
부서명 Department
직위 Job title(position)
우편번호 Postal Code
주소 Address
전화(국가번호) Telephone
팩스(국가번호) Fax
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) Degree Code
학위취득일 GraduationDate
학교명 School
전공명 Major
경력(Career)
경력사항(CAREER)
시작년월 Start Date - 재직 경력으로 주요 경력입력 현 재직정보제외
종료년월 End Date
재직기관명 Organization Name
직위 Position(Job Title)
실적ResearchResult
논문실적(paper)
논문명 Title - 최근 5년 이내만 입력저널명 Journal Name
게제(권)집 Volume
게제호 Number
시작페이지 Start Page
종료페이지 End Page
게제년월 Date of Publication
공동저자명 Co-Author
비고 Etc
연구실적ResearchProject
시작년월 Start Date
종료년월 End-Date
발주기관 Funding organization
참여구분(역할)-코드
Role
연구실적명 title
영문이력 구축 대상 항목 정의
- 10 -
특허(patent)
출원등록구분-코
드
appliedregistered
출원등록번호 number
출원등록국가-코
드
National Code
특허출원명 Patent name
출원등록일자 Date
코드 대상 항목(데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목)
코드 대상 항목 정의
항목 세부항목 코드
전문분야(3개) 전문(연구)분야NTIS 표준코드(국가과학기술
표준분류) 활용
학력사항(1개) 최종학위
2(학사)
5(석사)
8(박사)
연구실적(1개) 참여구분(역할)A(연구책임자)
B(참여연구원)
특허실적(2개)특허구분(출원등록)
01(출원)
02(등록)
등록국가 NTIS 표준코드 활용
코드 대상 항목이란 데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목
daggerNTIS 표준코드에 영문명을 포함하여 사용
24 영문이력 DB 수집 방법
E-mail을 통한 영문이력서 제공 요청 메일 발송
- 영문이력 DB 구축에 동의하고 영문이력서 제공이 가능한 연구자 대상
전화연락을 통한 이력서 수집
- 영문이력서 제공 요청 메일과 병행하여 영문이력서 제공동의자를 대상으로 영문이력
입력자들이 전화를 통하여 이력서 수집 요청
E-mail을 통한 영문이력서 번역 대행 안내 메일 발송
- 영문이력 DB 구축에 동의한 번역 요청 동의자를 대상으로 메일 발송
이력정보(한글)는 poolkistirekr을 통해 파일형태로 수집 관리함
이력정보(한글)는 메일을 통해서 파일형태(HWP MS-WORD PDF 등)로만 수집함
- 11 -
항 목 선처리 항목
기본 재직기관 기관명 직위
학력 최종학위 학교명 전공명
경력 경력사항 재직기관명 직위
실적논문실적 저널명
연구실적 발주기관
구분 선처리 방법
기관명
기관명(재직기관)
학교명(학력사항)
재직기관명(경력사항)
발주기관(연구실적)
- 웹검색(예 NAVER 백과사전 및 기관 홈페이지)
웹검색시는 출처 기록
- 웹검색 불가는 직접번역
직위직위(재직기관)
직위(경력사항)
- 직위에 대한 영문 코드표 참조
영문 코드표의 출처 기록
전공명 전공명(학력사항)- 전공명에 대한 영문 코드표 참조
영문 코드표의 출처 기록
저널명 저널명(논문실적)- 웹검색(예 httpsocietykistirekr)
웹검색시는 출처 기록
25 영문이력 DB 입력 방법
영문이력 입력
- 수집된 영문이력서는 입력자들이 등록수정 화면을 통해 직접 입력
영문이력 입력결과 확인
- 입력 완료된 영문이력서의 확인은 다른 입력자에 의해 입력결과를 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 본인확인
- 영문이력서의 입력 확인 완료 후 영문이력 본인에게 안내메일을 발송하여 확인
- 본인확인에 의해 수정 가능
26 영문이력 DB 번역 방법
영문이력 선처리 작업
- 영문이력 번역 수행 전 공통적인 항목에 대해 선처리 작업 수행
영문이력 번역
- 인력DB의 번역 대상자 및 수집된 이력서는 영문이력 관리 기능을 통해 번역 수행
- 12 -
영문이력 번역확인
- 번역 완료된 영문이력정보의 확인은 다른 번역자에 의해 번역결과를 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 전문가검수
- 번역확인 완료된 영문이력정보의 검수는 전문가에 의해 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 본인확인
- 영문이력정보의 번역 번역확인 전문가검수 완료 후 영문이력 본인에게 안내메일을
발송하여 확인
- 본인확인에 의해 수정 가능함
KISTI 검수
- KISTI 검수 절차를 거쳐 영문이력에 대해 서비스 제공
27 검수 확인
입력 및 번역 결과 보고
- 주간보고 영문이력 번역에 대한 현황을 매 주 보고
- 이슈사항보고 이슈사항 발생 시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 데이터(전체 항목 필드 기준)의 01 이하(품질목표 999)
- 오류 체크 방식 전체 데이터에서 본인확인 미완료 대상 중 무작위로 30 샘플링
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상
데이터건수) 항목가중치의 합산 결과가 01 이하
- 전문가검수는 모든 번역대상자를 대상으로 수행
- 번역확인 및 전문가검수 단계에서 자체적으로 품질 활동 수행
오류율 산정 기준
- 인력정보 영문이력에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며
오류율 산정에서 제외함
- 13 -
구분 항목 세부항목 세부항목 설명
참여인력정보(42개)
기본정보(8개)
주민등록번호 인력 고유의 주민등록번호
성명 인력 한글 영문 한자 성명
자택주소 인력 본인의 자택 주소
자택우편번호 인력 본인의 자택 우편번호
자택전화번호 인력 본인의 자택 전화번호
핸드폰번호 인력 본인의 핸드폰 번호
E-mail 인력 본인의 E-mail
부처(기관)분류코
드인력 본인의 부처(기관)분류코드
Ⅱ 인력정보 데이터 정제 매뉴얼
1 참여인력 데이터 정제 매뉴얼
11 개요
111 정제 목표
인력데이터는 연구관리전문기관에서 수집하여 통합 구축하므로 여러 기관에 중복으로 입력되어 있
는 경우에 이중등록 데이터가 존재할 수 있어 이를 NTIS에서 활용하기 위해서 정의된 중복기준에
따라 이중등록 확인 및 제거하는 데이터 정제를 절차에 따라 수행
연구관리전문기관의 인력정보관리시스템의 미비 또는 관리체계의 미흡으로 인해 발생된 누락데이
터 및 입력된 데이터의 오류를 수행 가능한 범위 내에서 작업자 및 시스템에 의한 오류 수정
연구관리전문기관별로 각각의 고유의 코드 및 항목체계를 활용하거나 코드가 필요한 항목에 코드
를 사용하지 않고 있는 실정이며 이러한 연구관리전문기관 인력데이터를 NTIS에서 활용하기 위
해서는 NTIS 통합 표준 코드 및 항목으로의 매핑
12 데이터 정제 목록 및 범위
121 데이터 정제대상 및 항목 정의
- 14 -
구분 항목 세부항목 세부항목 설명
소속기관사항(7개)
소속기관명 인력 본인의 현재 소속기관명칭
학과부서명 인력 본인의 소속기관 내 소속학과부서명
직위명 인력 본인의 소속기관 내 직위명칭
사무실전화번호 인력 본인의 소속기관 내 전화번호
기관주소 현재 소속기관의 우편번호 및 상세주소
인력구분 인력구분(대학교 연구소 산업계 기타)
최초임용일 현재 소속중인 기관에 최초 임용(근무)일
학력사항(10개)
전공 인력의 학위별 전공명
취득대학 인력의 학위별 출신 대학교명
학위학력정보의 학위종류예) 학사이하 석사 박사수료 박사
입학일 인력의 학위별 입학년월
졸업일 인력의 학위별 졸업년월
학과 인력의 학위별 출신 대학교 학과명
취득국가 인력의 학위별 출신 대학교 소재지(국가)
지도교수명 인력의 각 학위별 지도교수명
학위논문명 인력의 최종학위취득시 제출한 논문명
학위취득일 인력의 최종학위취득일
경력사항(3개)
근무처명인력의 전ㆍ현재 직업 및 교육과정의 기관명 및세부사항(학과 부서 등)
직위명인력의 전ㆍ현재 직업 및 교육과정의 직급 또는직위명
근무기간인력의 전ㆍ현재 직업 및 교육과정의 시작년월및 종료년월
자격사항(3개)
자격발행처 인력이 발급받은 자격증 등의 발급기관명
자격증명 인력이 발급받은 자격증 등의 자격명
자격취득일 인력이 발급받은 자격증 등의 발급년월
논문실적(8개)
논문발표일 인력이 저술한 논문을 게재하거나 발표한 년월
논문제목1 인력이 저술한 논문의 논문제목1
- 15 -
구분 항목 세부항목 세부항목 설명
논문제목2 인력이 저술한 논문의 논문제목2
저자역할구분
인력이 저술한 논문에 있어서의 역할정도예) 단독공동제1주저자공저자교신(책임)저자
발행처인력이 저술한 논문이 실린 간행물을 발행한 발행처
학술지구분
인력이 저술한 논문의 게재 및 발표형태와 장소에 관련하여 학술지구분예) 국외전문학술지 국외학술대회발표논문집 국내전문학술지 국내학술대회발표논문집 기타논문집
학술지명 인력이 저술한 논문이 실린 간행물의 명칭
SCI여부인력이 저술한 논문이 실린 간행물이 SCI에 수록된 간행물 구분
지식재산권(3개)
지식재산권명 인력이 출원하거나 등록한 지식재산권명
출원_등록번호인력이 출원하거나 등록한 지식재산권의 출원등록번호
특허구분
인력이 출원하거나 등록한 지식재산권의 종류예) 특허 실용신안 디자인 상표 기타 프로그램(SW)저작권 신기술 인증 신제품 인증 국제출원(PCT) 서비스
평가위원(11개)
소속학협회현황(3개)
담당업무인력의 전ㆍ현재 소속 학회 및 협회 내에서의 담당업무
직위 인력의 전ㆍ현재 소속 학회 및 협회 내에서의 직위
학협회사항 인력의 전ㆍ현재 소속 학회 및 협회명
훈포장사항(3개)
수상년월 인력이 훈장 포장 등을 수상한 년월
수여기관명 인력이 수상한 훈장 포장 등을 수여한 기관명
훈포장명 인력이 수상한 훈장 포장 등의 수상명
저역서실적(5개)
저서명1 인력이 저술하거나 역술한 도서의 제목1
저서명2 인력이 저술하거나 역술한 도서의 제목2
발행년 인력이 저술하거나 역술한 도서를 발행한 년도
발행처 인력이 저술하거나 역술한 도서를 발행한 장소
저역서구분 인력이 저술하거나 역술한 도서에 대한 구분 예) 저서 역서
- 16 -
구분 항목 세부항목 현행 DB 항목식별
항목비고
참여
인력
정보
(56개)
기본정보
(12개)
주민등록번호
인물ID NTIS 식별체계 생성
인물관리번호(KOI) 시스템 생성
주민등록번호 lsquo-rsquo포함 14자리
성명
성명-한글
성명-영문
성명-한자
자택주소기본주소(주소1) 우편번호 내 주소를 참조
상세주소(주소2)
자택우편번호 우편번호
자택전화번호 전화번호
핸드폰번호 핸드폰번호
E-mail E-mail
소속기관
사항
(11개)
소속기관명소속기관코드 소속기관명 기준 매핑
기관명이형전거DB 활용소속기관명
부서명 근무부서명
직위명직위코드 직위명 기준 매핑
NTIS 직위코드직위명
사무실전화번
호사무실전화
기관주소
우편번호
기본주소(주소1) 우편번호 내 주소를 참조
상세주소(주소2)
인력구분
인력유형구분
(대학교 연구소 산업
계 기타)
NTIS 인력구분코드
기관명이형전거DB 활용
최초임용일 최초임용일
학력사항
(14개)
전공전공분야 전공명 기준 매핑
NTIS 전공코드전공명
취득대학학위취득대학코드 학위취득대학명 기준 매핑
기관명이형전거DB 활용학위취득대학명
학위 학위코드 NTIS 학위코드
입학일 입학년월
졸업일 졸업년월
학과학과코드 학과명 기준 매핑
NTIS 학과코드학과명
취득국가 취득국가코드 NTIS 국가코드
지도교수명 지도교수명
정제 대상 항목
공동활용정보를 포함하는 현행 DB 구성 기준 69개 항목
- 17 -
구분 항목 세부항목 현행 DB 항목식별
항목비고
학위논문명최종학위논문명1
최종학위논문명2
학위취득일 최종학위취득일
경력사항
(5개)
근무처명 근무처명
직위명직위코드 직위명 기준 매핑
NTIS 직위코드직위명
근무기간근무시작일
근무종료일
자격사항
(3개)
자격발행처 자격발행처
자격증명 자격증명
자격취득일 자격취득일
논문실적
(8개)
논문발표일 논문발표일
논문제목1 논문제목1
논문제목2 논문제목2
저자역할구분 저자역할구분 NTIS 저자역할구분 코드
발행처 발행처명
학술지구분 학술지구분 NTIS 학술지구분코드
학술지명 학술지명
SCI여부 SCI여부 NTIS SCI 여부구분 코드
지식
재산권
(3개)
지식재산권명 지식재산권명
출원_등록번호 출원등록번호
특허구분 특허구분 NTIS 특허구분 코드
평가
위원
(13개)
소속학협
회
현황
(5개)
담당업무 담당업무
직위 직위 직위명
학협회사항
학협회명
활동시작일
활동종료일
훈포장
사항
(3개)
수상년월 수상년도
수여기관명 수여기관명
훈포장명 수상명
저역서
실적
(5개)
저역서명1 저역서명1
저역서명2 저역서명2
발행년 발행년도
발행처 발행처명
저역서구분 저역서구분 NTIS 저역서 구분 코드
- 18 -
구분 항목 세부항목 정제항목 오류유형 비고
참여
인력
정보
(56개)
기본정보
(12개)
주민등록번호
인물ID
-인물ID이 발급되지 않는 경우
예) 외국인 주민등록번호 유효하
지 않거나 중복된 경우
인물관리번호(KOI)1 포맷 오류
예) 자리수 lsquo-rsquo가 있는 경우
주민등록번호
-주민등록번호가유효하지않는경우
예) lsquo-rsquo포함한 14자리가 아닌경우
주민등록번호규칙에맞지않은경우
-중복되는 주민등록번호의 경우
-공란 및 특수문자가 있는 경우
이관 후 서비
스대상에서
제외
성명
성명-한글
-Null인 경우
-공란 및 특수문자 숫자가 있는
경우
-한글이 아닌 경우이관 후 성명
없으면 서비
스대상에서
제외
성명-영문
-공란 및 특수문자 숫자가 있는
경우
-영문성명의 범위를 벗어나는 경
우
예) Lee KHS
성명-한자
-공란 및 특수문자 숫자가 있는
경우
-한자가 아닌 경우
자택주소
기본주소(주소1)
-우편번호 존재하고 Null의 경우
-우편번호의 주소와 상이한 경우
-주소지 정보가 아닌 경우
상세주소(주소2)
-우편번호 및 기본주소 Null의
경우
-주소정보가 아닌 경우
자택우편번호 우편번호-우편번호 Null인 경우
-우편번호가 old data인 경우
자택전화번호 전화번호 -전화번호 Null인 경우
13 데이터 분석 내역
131 세부 항목별 오류 패턴유형 분석
인력데이터
항목별 정해진 규칙에 위배되는 값이 들어있는 경우
- 19 -
구분 항목 세부항목 정제항목 오류유형 비고
-전화번호가 표준 형식이 아닌
경우
-전화번호 데이터가 아닌 경우(지
역번호 없는 경우 포함)
-핸드폰번호인 경우
핸드폰번호 핸드폰번호
-핸드폰번호 Null인 경우
-핸드폰번호가 표준 형식이 아닌
경우
-핸드폰번호 데이터가 아닌 경우
(지역번호 없는 경우 포함)
-전화번호인 경우
E-mail E-mail
-E-mail Null인 경우
-표준 이메일 형식이 아닌 경우
-구분자가 잘못된 경우
-가베지 성 데이터 존재
소속기관
사항(11개)
소속기관명
소속기관코드 NA코드 오류
유형 참조
소속기관명-소속기관명이 기관명이형전거DB
내 대표기관명이 아닌 경우
대표기관명으
로 갱신
부서명 근무부서명 -근무부서명 Null인 경우
직위명
직위코드 NA코드 오류
유형 참조
직위명
-직위명 Null인 경우
-직위명이 직위코드 내 명칭이
아닌 경우
사무실전화번호 사무실전화
-전화번호 Null인 경우
-전화번호가 표준 형식이 아닌
경우
-전화번호 데이터가 아닌 경우(지
역번호 없는 경우 포함)
-핸드폰번호인 경우
기관주소
우편번호-우편번호 Null인 경우
-우편번호가 old data인 경우
기본주소(주소1)
-우편번호 존재하고 기본주소
Null의 경우
-우편번호의 주소와 상이한 경우
-주소지 정보가 아닌 경우
상세주소(주소2) -우편번호 및 기본주소 Null의
- 20 -
구분 항목 세부항목 정제항목 오류유형 비고
경우
-주소정보가 아닌 경우
인력구분 인력유형구분 NA코드 오류
유형 참조
최초임용일 최초임용일 NA날짜 오류
유형 참조
학력사항
(14개)
전공전공분야 NA 코드 오류
유형 참조전공명 -전공명 Null인 경우
취득대학
학위취득대학코드 NA코드 오류
유형 참조학위취득대학명 -학위취득대학명 Null인 경우
학위 학위코드 NA코드 오류
유형 참조
입학일 입학년월 NA날짜 오류
유형 참조
졸업일 졸업년월 NA날짜 오류
유형 참조
학과
학과코드 NA코드 오류
유형 참조학과명 -학과명 Null인 경우
취득국가 취득국가코드 NA코드 오류
유형 참조
지도교수명 지도교수명 -지도교수명 Null인 경우
학위논문명
최종학위논문명1 -가베지 데이터인 경우
최종학위논문명2 -가베지 데이터인 경우
학위취득일 최종학위취득일 NA날짜 오류
유형 참조
경력사항
(5개)
근무처명 근무처명-근무처명 Null인 경우
-가베지 데이터인 경우
직위명
직위코드 NA 코드 오류
유형 참조직위명 1 직위명 Null인 경우
근무기간
근무시작일 NA날짜 오류
유형 참조
근무종료일 NA날짜 오류
유형 참조
- 21 -
구분 항목 세부항목 정제항목 오류유형 비고
자격사항
(3개)
자격발행처 자격발행처-자격발행처 Null인 경우
-가베지 데이터인 경우
자격증명 자격증명-자격증명 Null인 경우
-가베지 데이터인 경우
자격취득일 자격취득일 NA날짜 오류
유형 참조
논문실적
(8개)
논문발표일 논문발표일 NA날짜 오류
유형 참조
논문명1 논문제목1 -가베지 데이터인 경우
논문명2 논문제목1 -가베지 데이터인 경우
저자역할구분 저자역할구분 NA코드 오류
유형 참조
발행처 발행처명-발행처명 Null인 경우
-가베지 데이터인 경우
학술지구분 학술지구분 NA코드 오류
유형 참조
학술지명 학술지명-학술지명 Null인 경우
-가베지 데이터인 경우
SCI여부 SCI여부 NA코드 오류
유형 참조
지식
재산권
(3개)
지식재산권명 지식재산권명-지식재산권명 Null인 경우
-가베지 데이터인 경우
출원_등록번호 출원등록번호-출원등록번호 Null인 경우
-가베지 데이터인 경우
특허구분 특허구분 NA코드 오류
유형 참조
평가
위원
(13개)
소속학
협회
현황
(5개)
담당업무 담당업무-담당업무 Null인 경우
-가베지 데이터인 경우
직위 직위-직위 Null인 경우
-가베지 데이터인 경우
학협회사항
학협회명
-학협회명 Null인 경우
-직위명이 포함된 경우
-가베지 데이터인 경우
활동시작일 NA날짜 오류
유형 참조
활동종료일 NA날짜 오류
유형 참조
- 22 -
구분 항목 세부항목 정제항목 오류유형 비고
훈포장
사항
(3개)
수상년월 수상년도 NA날짜 오류
유형 참조
수여기관명 수여기관명-수여기관명 Null인 경우
-가베지 데이터인 경우
훈포장명 수상명-수상명 Null인 경우
-가베지 데이터인 경우
저역서
실적
(5개)
저역서명
저역서명1 -가베지 데이터인 경우
저역서명2 -가베지 데이터인 경우
발행년 발행년도 NA날짜 오류
유형 참조
발행처 발행처명-발행처명 Null인 경우
-가베지 데이터인 경우
저역서구분 저역서구분 NA코드 오류
유형 참조
구분 항목 세부항목 정제항목 오류내역 비고
참여
인력
정보
(11개)
소속기관사항(1개) 최초임용일최초임용일
YYYYMMDD
-YYYY가 없는 경우(누락)
-MM이 없는 경우
-DD가 없는 경우
-YYYYMMDD이 유효하지
않은 경우
학력사항(3개)
입학일입학년월
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
졸업일졸업년월
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-입학년월보다 같거나 작
은 경우
학위취득일최종학위취득일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
- 23 -
구분 항목 세부항목 정제항목 오류내역 비고
경력사항(2개) 근무기간
근무시작일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
근무종료일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-근무시작일보다 같거나
작은 경우
자격사항(1개) 자격취득일자격취득일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
논문실적(1개) 논문발표일논문발표일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
소속학협회현황(2개) 학협회사항
활동시작일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
활동종료일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-활동시작일보다 같거나
작은 경우
훈포장사항(1개) 수상년월수상년도
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우평가
위원
(1개)
저역서실적(1개) 발행년발행년도
YYYY
-YYYY이 없는 경우(누락)
-YYYY이 유효하지 않은
경우
시작일보다 종료일이 같거나 작은 경우 종료일을 삭제
날짜의 경우 본인의 생년월일보다 작을 수 없음
- 24 -
구분 항목 세부항목 정제항목 오류유형 비고
참여
인력
정보
(14개)
기본
정보
(1개)
자택우편번호 우편번호-Null 경우
-우편번호와 주소정보가 불일치
외국주소는
유지
소속
기관
사항
(4개)
소속기관명소속기관코드
소속기관명
-소속기관명만 존재하는 경우
-소속기관코드가 기관명이형전거
DB의 이형기관코드가 아닌 경우
-소속기관명이 기관명이형전거DB
의 대표기관명이 아닌 경우
직위명직위코드
직위명
-직위명만 존재하는 경우
-직위명 직위코드가 존재하지 않
는 경우
기관주소 우편번호-Null의 경우
-우편번호와 주소정보가 불일치
인력구분 인력유형구분-기관명이형전거DB의 기관유형구
분과 불일치
학력
사항
(4개)
전공전공분야
전공명
-전공명만 존재하는 경우
-전공명 전공분야코드가 Null인 경우
취득대학학위취득대학코드
학위취득대학명
-학위취득대학명만 존재하는 경우
-학위취득대학코드가 기관명이형
전거DB의 이형기관코드가 아닌
경우
-학위취득대학명이 기관명이형전
거DB의 대표기관명이 아닌 경우
학위 학위코드
-학위코드가 Null인 경우
-학위코드가 구분 코드내 표함되
지 않는 경우
학과학과코드
학과명
-학과명만 존재하는 경우
-학과명 학과코드가 존재하지 않
는 경우
취득국가 취득국가코드
-Null인 경우
-기관 국가코드와 NTIS 국가코드
매핑 오류
경력
사항
(1개)
직위명직위코드
직위명
-직위명만 존재하는 경우
-직위명 직위코드가 Null인 경우
코드의 값이 정해진 범위를 벗어난 경우
- 25 -
구분 항목 세부항목 정제항목 오류유형 비고
논문
실적
(3개)
저자역할구분 저자역할구분
-Null인 경우
-저자역할구분이 구분 코드 내 포
함되지 않은 경우
학술지구분 학술지구분
-학술지구분이 Null인 경우
-학술지구분이 구분 코드내 포함
되지 않은 경우
SCI여부 SCI여부
-Null인 경우
-SCI여부가 구분코드 내 포함되지
않은 경우
지식
재산
권
(1개)
특허구분 특허구분
-Null인 경우
-특허구분이 구분 코드내 포함되
지 않은 경우
평가
위원
(1개)
저역
서
실적
(1개)
저역서구분 저역서구분
-Null인 경우
-저역서구분이 구분 코드 내 포함
되지 않은 경우
구분 항목 이중등록 검사 항목 기준 비고
참여인력
기본정보 주민등록번호() 주민등록번호는 유일해야 함
소속기관사항 소속기관명()소속기관명(대표기관명) 유일
해야 함
학력사항
1 취득대학() 학위() 입학일
2 취득대학() 학위() 졸업일
3 취득대학() 학위() 전공
4 취득대학() 학위() 학과
5 취득대학() 학위() 학위취득일
취득대학은 대표기관명으로
비교 함
경력사항1 근무처명() 직위명 근무시작일
1 근무처명() 직위명 근무종료일
논문실적
1 논문명() 논문발표일 학술지명
2 논문명() 논문발표일 ISSN
3 논문명() ISSN 게재권집 게재호
4 논문명() 학술지명 게재권집 게재호
132 이중등록 유형 분석
이중등록 정제 기준 정의( 주키)
- 26 -
구분 항목 이중등록 검사 항목 기준 비고
지식재산권
1 출원_등록번호()
2 지식재산권명() 출원등록구분() 특허구분
() 출원국가
저역서실적1 ISBN
2 저역서명() 저역서구분() 발행년 발행처
평가위원
소속학협회현황1 학협회명() 직위 시작일
1 학협회명() 직위 종료일
훈포장사항 훈포장명() 수상년월 수여기관명
자격사항 자격증명() 자격발행처 자격취득일
이중등록 데이터 분석 방법
- 데이터 정제 결과 데이터를 대상으로 기본정보는 주민등록번호 이외의 정보는 이중등록 검사 항
목을 기준으로 하여 시스템 정제를 통해 인력별 동일한 데이터가 존재하는지를 파악함
14 데이터 정제 기준
141 정제 지침
정제 내용
수집된 인력 정보를 등록하기 위한 데이터 분류 및 분석
여러 기관에 중복 입력된 인력정보에 대한 중복제거 및 데이터 취합
중복제거 후 취합 된 데이터는 확인 정정
- 학력사항 경력사항 등의 정보 이중 등록
- 기관별 인력정보 중 소속기관 상이
각 기관별 코드 및 항목에 대해 통합 인력DB의 코드 및 항목에 맞게 매핑
- 각 기관 고유의 코드 및 항목을 표준 코드 및 항목과 매핑 작업 필요
- 소속기관 전공 등 코드가 필요한 항목에 코드를 활용하지 않는 기관의 데이터는 표준 코드에
맞게 데이터 변환 필요
기본정보 경력정보 실적정보 등 인력정보에 대한 오류데이터 정정
- 각 항목의 데이터 내용을 검토하여 오류 정정
예) 학력사항의 데이터 내용 중 입학일이 졸업일 보다 나중일 경우 등
인력정보의 누락항목에 대한 보완
- 수집 가능한 범위 내에서 6개 주요항목기준(인력구분 우편번호 주소 소속기관명 전공 학위
등) 보완
- 27 -
구분 항목 세부항목
참여인력정보(41개)
기본정보(7개)주민등록번호 성명 자택주소 자택우편번호 자택전화번호
핸드폰번호 E-mail
소속기관사항(7개)소속기관명 부서명 직위명 사무실전화번호 기관주소 인
력구분 최초임용일
학력사항(10개)전공 취득대학 학위 입학일 졸업일 학과 취득국가 지도
교수명 학위논문명 학위취득일
경력사항(3개) 근무처명 직위명 근무기간
자격사항(3개) 자격발행처 자격증명 자격취득일
논문실적(8개)논문발표일 국문논문명 영문논문명 저자역할구분 발행처
학술지구분 학술지명 SCI여부
지식재산권(3개) 지식재산권명 출원_등록번호 특허구분
평가위원(11개)
소속학협회현황(3개) 담당업무 직위 학협회사항
훈포장사항(3개) 수상년월 수여기관명 훈포장명
저역서실적(5개) 국문저서명 영문저서명 발행년 발행처 저역서구분
정제 대상 정의
정제 대상 범위
- 연계시스템을 통해 등록변경되는 참여인력정보의 정제
정제 대상 항목
정제 수준 설정
lsquo속성값 전체 존재rsquo 데이터
- 공통사항 오류 데이터 정정 및 코드 매핑
- ① 중복 자료 중 데이터 신뢰성에 근거하여 통합 항목 누락 확인 및 보충 선별(성명 주민등록
번호) 형식 확인 (주소 전화번호 및 E-Mail)
- ② 중복 자료 중 최신 자료 선정 및 확인 형식 확인 (주소 전화번호)
- ③ ⑤~⑪ 중복 자료 중 데이터 신뢰성에 근거하여 통합
lsquo일부 또는 6개 미만rsquo 데이터
- lsquo속성값 전체 존재rsquo 데이터와 같은 방식으로 정제
오류 유형 정의 및 정제 형태
- 발생 가능한 오류 유형
- 28 -
오류 유형 세부 정제 지침 비고
데이터 내용 데이터 Type 오류
- 적합한 Type으로 수정 가능한 정도(의미상으
로는 유효한 경우)의 오류는 수정하고 그렇
지 않은 데이터는 삭제
데이터 형식 오류
- 데이터들 중 가장 많은 유형을 정규 형식으
로 보고 형식에 위배되는 데이터들은 정규
형식으로 변환
부점(구분자) 오류
- 실제 서비스 되는 데이터값과 비교하여 변환
과정에서 발생한 오류면 실제 데이터값으로
변환하고 원시 데이터 자체가 오류인 경우
에는 삭제 처리
데이터 코드 코드값 오류
- 일치 유사한 코드값으로 변환
- 유사 가장 적합한 코드값으로 변환
- 상이 lsquo기타rsquo코드값으로 분류 또는 삭제
데이터(not null)가 존재하지 않는 경우
데이터의 Type(문자형 숫자형)에 위배되는 값이 들어있는 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
정해진 법칙에 따른 번호가 아닌 경우
실제로 존재하지 않는 부점(구분자) 등이 입력되어 있는 경우
코드의 값이 정해진 범위를 벗어나는 경우
ex) 기관 코드와 인력시스템 사용 코드와의 매핑 오류
기관 데이터의 코드 항목 값이 잘못 입력되어 있는 경우
국문과 영문으로 구분되는 동일 데이터 항목에 잘못된 위치에 항목 값이 입력되어 있는 경우
ex) 논문실적정보의 국문제목에 영문제목이 입력되어 있는 경우
데이터가 복수로 존재하며 서로 상충되는 경우
ex) 유효하지 않은 주민등록번호의 중복
- 조치 가능한 데이터 정제 형태
수정 데이터 내용은 수정하지 않고 데이터 형태 및 특수문자 수정 정도 정제
삭제 데이터 값 삭제(Garbage 처리) 또는 레코드 삭제
위의 경우 원시 데이터 값은 관리를 위해 따로 보관
정제 제외 데이터 값이 누락이거나 오류로 판단되지만 정확한 데이터 내용을 알 수 없는 경
우 기준 데이터가 없으므로 정제 대상에서 제외 또한 별다른 오류로 보이지 않는
경우도 정제 대상에서 제외
오류 유형별 세부 정제 지침
- 29 -
논문제목 오류 - 논문제목1은 반드시 필수 입력으로 처리
중복 데이터들의 데이
터 값 상충 오류
- 변경될 수 없는 기본정보(이름 주민번호)의
경우는 기존 데이터 우선
- 변경 가능한 정보(기관명 논문 등)의 경우
최신 업데이트된 정보를 우선
구분 명(누락) 비고
기본정보 이메일 22719 기존 수집 데이터를 통해 보완
소속기관사항 있으나필드가 null인것
인력구분 15217 기관명이형전거DB 생성 완료 후 적용함
소속기관 우편번호
15977주소가 있는 경우 우편번호 찾기를 통해 보완주소가 없는 경우 기존 수집 데이터를 통해 보완
소속기관 주소
13512 기존 수집 데이터를 통해 보완
소속기관명 428기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
학력사항 있으나 필드가null인것
전공 38915기존 수집 데이터를 통해 보완하고 기관명이형전거DB로 매핑함
학위 34373기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
소속기관사항 없는것 22502 기존 수집 데이터를 통해 보완
학력사항 없는것 31952 기존 수집 데이터를 통해 보완
~은 lsquo발생 가능한 오류 유형rsquo 내용 참조
~은 lsquo조치 가능한 데이터 정제 형태rsquo 내용 참조
인력정보의 누락항목에 대한 보완
기타 (정보 식별자 부여)
- 데이터 정제 최종 단계에서 식별자 부여 체계에 따라 정보식별자(번호) 삽입
- 정보식별자(번호)는 식별체계 API에 의해 자동으로 부여 되며 식별 부여 체계는 사업단 내 식별
체계 담당자가 마련하여 제공
정제 작업 방식
중복 확인 기계작업
- SQL Query를 활용하여 중복 확인하며 중복된 데이터 중 1건을 제외하고 나머지를 표시함(기계
작업)
- 30 -
구분 항목 세부항목 정제항목 오류유형 정제지침
참여
인력
정보
(56개)
기본
정보
(12
개)
주민등록
번호
인물ID인물ID이 발급되지 않
는 경우
인물 중복확인이 가능한 기본 항목(주민등록
번호 성명)이 존재하지 않으면 정제대상에서
제외
식별체계로부터 정제 수행 후 일괄발급 입력
인물관리
번호
(KOI)
NA
정제이전 인물관리번호 일괄 생성하여 key로
활용
Null 여부만 확인하고 정제대상에서 제외
주민등록
번호
Null인 경우 정제대상에서 제외
중복되는 주민등록
번호의 경우
인물관리번호 성명이 상이하면 현행 데이터
를 유지
모두 정제대상에서 제외
유효하지 않은 주민등
록번호의 경우
자리수가 lsquo-rsquo포함한 14자리가 아닌 데이터는
정제대상에서 제외
이관 후 서비스대상에서 제외
데이터 통합 기계작업 + 수작업
- 중복으로 확인된 항목들의 리스트를 비교하여 통합
- 기계적으로 필드간의 충돌이 없음을 확인할 수 있는 항목은 자동 통합하고 기계적으로 충돌을 확
인할 수 없는 경우는 수작업으로 필드별 데이터 통합을 수행
- 최신 또는 최종 여부를 확인하여 통합해야 하는 경우 해당 데이터에 포함된 일자 데이터를 감안
하여 선별 통합(일자 및 기간의 충돌이 없는 경우 기계작업 충돌이 있는 데이터는 리스트 업 후
수작업)
형식 확인 기계작업 + 수작업
- E-Mail 주소 전화번호와 같은 형식이 어느 정도 정의된 데이터의 경우 기본 형식을 템플릿으로
지정
- 정형화되지 않은 데이터의 리스트를 추출하여 이 중 기계적으로 형식을 일치시키고(기계작업)
일치되지 않은 데이터를 수작업으로 확인하여 수정하거나 형식 불량 데이터 리스트로 따로 추출
(수작업)
142 오류 유형별 정제 지침
오류 유형별 정제 지침은 lsquo131 세부 항목별 오류 패턴유형 분석rsquo 을 대상으로 정제지침을 정의
인력데이터
항목별 정해진 규칙에 위배되는 값이 들어있는 경우
- 31 -
구분 항목 세부항목 정제항목 오류유형 정제지침
외국인 및 임시주민번호의 경우 lsquo-rsquo포함한 14
자리가 아닌 데이터는 정제대상에서 제외
표준 포맷으로 구성되
어 있지 않은 경우
lsquo년(2)월(2)일(2)-성별(1)고유번호(6)lsquo 14자 숫자
로 구성되도록 변경
공란 및 특수문자를 제거
성명
성명-한글
Null의 경우
성명-영문 성명-한자가 존재하면 해당 필드
로 이동성명-한글 영문 한자 모두 Null이면 정제대
상에서 제외
이관 후 서비스대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
공란 및 특수문자 숫자 이름이 아닌 경우 제거
예) 이름이 아닌 경우 oo - --
예) 공란의 경우 홍 길동 홍길 동
예) 숫자의 경우 홍길동2 -gt 숫자만 제거
성명-영문
Null의 경우 정제대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
특수문자 숫자 이름이 아닌 경우 제거
예) Lee HS =gt Lee HS영문성명의 범위를 벗어난 경우
예) Lee KHS영문성명이 아닌 경우 해당 필드로 이동하거
나 제거
성명-한자
Null의 경우 정제대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
공란 및 특수문자 숫자 이름이 아닌 경우 제거
예) 金鉉- 洙 =gt 金鉉洙
한문이 아닌 경우 해당 필드로 이동하거나 제거
자택주소기본주소
(주소1)
Null의 경우
우편번호가 존재하면 우편번호로 검색된 주
소 입력 단 우편번호 유효검사를 거친 우편번호만
대상으로 함
우편번호가 존재하지 않으면 정제대상에서 제외
우편번호의 주소와 상
이한 경우
가베지 데이터가 아닌 경우에는 정제대상에서 제외
예) 외국 주소는 유지
가베지 데이터인 경우
기존 데이터는 삭제하고 우편번호가 존재하
면 우편번호로 검색된 주소 입력
우편번호가 존재하지 않으면 기존 데이터 삭
제만 수행
- 32 -
구분 항목 세부항목 정제항목 오류유형 정제지침
상세주소
(주소2)
Null인 경우 정제대상에서 제외
주소정보가 아닌 경우주소정보가 아닌 가베지 데이터는 삭제
예) test 042-123-1234 등
자택우편
번호우편번호
Null인 경우
기본 주소지로 검색하여 입력
기본 주소가 오류데이터이거나 없는 경우는
정제대상에서 제외
우편번호 표준 형식이
아닌 경우
표준 포맷 시도군 구분(3자리)+lsquo-rsquo+지역구분(3
자리)
표준 포맷이 아닌 경우는 표준 포맷으로 변경
예) 300100=gt300-100
300 100=gt300-100
300100 =gt300-100
자리 수가 6자 이하이거나 가베지 데이터인
경우는 제거
우편번호가 old data
인 경우
현재 우편번호가 아닌 경우는 이전 우편번호
주소지를 기준으로 검색하여 입력하고 매핑되
지 않는 데이터의 경우는 삭제
자택전화
번호전화번호
Null인 경우
핸드폰번호가 존재할 경우 복제하여 입력 단 핸드폰 번호의 오류를 정제한 이후 처
리
전화번호가 표준 형식
이 아닌 경우
표준 포맷 국번(2~3자리)-지역전화번호(34자
리)-전화번호(4자리)포준 포맷으로 변경
예) 02-6746-1234 or 041-567-6789
국번은 지역별 국번 참조
내선번호는 유지
지역번호 없는 경우
국번 Null인 경우 자택 주소지의 시도 지역
번호를 입력
예) 6746-1234 이면서 서울 지역의 예
-gt 02-6746-1234
국가번호가포함된경우
(+)국가번호-국번-지역전화번호-전화번호의
형식으로 변경
예) +82-02-6746-1234
가베지 데이터의 경우
자리수가 작거나 크면 제거
예) 02-64-123 or 02-6746-123
숫자(특수문자 포함)가 아닌 문자이면 제거
전화번호 데이터가 아닌 경우 제거
핸드폰번호인 경우 전화번호핸드폰번호 표준포맷으로 변경
- 33 -
구분 항목 세부항목 정제항목 오류유형 정제지침
핸드폰번호 핸드폰번호
Null인 경우 정제 대상에서 제외
핸드폰번호가 표준 형
식이 아닌 경우
이동통신구분번호(3자리)-지역구분번호(34자
리)-전화번호(4자리)로 변경
예) 011-6746-1234 or 019-789-1234
이동통신구분번호는 이동통신사별 구분번호
참조 SK(011 017) KTF(016 018) KG(109)
010(공통)
국가번호가 포함된
경우
(+)국가번호-이동통신구분번호-지역구분번호-
전화번호의 형식으로 변경
예) +82-010-6746-1234
이동통신구분번호가
없는 경우
이동통신구분번호가 없는 경우는 가베지 데이
터으로 판단하여 제거
예) 672-1234의 경우
전화번호인 경우 전화번호핸드폰번호 표준포맷으로 변경
E-mail E-mail
Null인 경우 정제 대상에서 제외
표준 이메일 형식이
아닌 경우
표준 포맷 ID메일서버URI로 구성
예)admin1234daumnet kisti4530kistirekr
구분자 lsquorsquo lsquorsquo으로 변경 및 공란 제거
예) admindaumnet =gt admindaumnet
두 개이상의 이메일이 존재할 경우 앞에 것을
우선으로 유지함
예)admin1234daumnet kisti4530kistirekr
=gt admin1234daumnet
E-mail 데이터가 아닌
경우
E-mail 주소 데이터가 아닌 경우와 가베지 데
이터는 삭제
예) wwwkistirekr -- adminkisti 1 lsquorsquo
공란 등
소속
기관
사항
(11
개)
소속
기관명
소속기관
코드NA 코드 오류 유형 참조
소속
기관명
Null인 경우
소속기관코드가 존재하는 경우에는 해당 소속
기관코드의 명을 검색하여 입력하고 소속기관
코드가 존재하지 않으면 정제대상에서 제외
소속기관명이 NTIS
코드 내 명칭이 아
닌 경우
기관명이형전거DB의 대표기관명으로 변경
예) 서울대 -gt 서울대학교
- 34 -
구분 항목 세부항목 정제항목 오류유형 정제지침
단 기관명이형전거DB에 존재하지 않는 소속
기관명은 신규발급 요청하여 소속기관명을 유
지함
소속기관명이 아닌
경우
소속기관코드가 존재하는 경우에는 해당 소속
기관코드의 명을 검색하여 입력하고 소속기관
코드가 존재하지 않으면 정제대상에서 제외
부서명근무
부서명
Null인 경우 정제대상에서 제외
근무부서명이 아닌
경우
가베지 데이터인 경우만 삭제하고 이외의 경
우는 정제대상에서 제외
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
직위명
직위코드 NA 코드 오류 유형 참조
직위명
Null인 경우
직위코드가 존재하는 경우에는 해당 직위코드
의 명을 검색하여 입력하고 직위코드가 존재
하지 않으면 정제대상에서 제외
직위명이 직위코드 내
명칭이 아닌 경우
직위명이 직위코드내 존재하지 않으면 직위명
은 그대로 유지하고 직위코드는 기타(lsquo999rsquo)로
매핑함
직위명이 아닌 경우
직위코드가 존재하는 경우에는 해당 직위코드
의 명을 검색하여 입력하고 직위코드가 존재
하지 않으면 삭제
사무실
전화번호
사무실
전화
Null인 경우 정제대상에서 제외
전화번호가 표준 형식
이 아닌 경우
표준 포맷 국번(2~3자리)-지역전화번호(34자
리)-전화번호(4자리)포준 포맷으로 변경
예) 02-6746-1234 or 041-567-6789
국번은 지역별 국번 참조
내선번호는 유지
지역번호 없는 경우
국번 Null인 경우 소속기관 주소지의 시도
지역번호를 입력
예) 6746-1234 이면서 서울 지역의 예
-gt 02-6746-1234
국가번호가 포함된
경우
(+)국가번호-국번-지역전화번호-전화번호의
형식으로 변경
예) +82-02-6746-1234
- 35 -
구분 항목 세부항목 정제항목 오류유형 정제지침
가베지 데이터의 경우
자리수가 적거나 크면 제거
예) 02-64-123 or 02-6746-123
숫자(특수문자 포함)가 아닌 문자이면 제거
전화번호 데이터가 아닌 경우 제거
핸드폰번호인 경우 기본정보의 핸드폰번호로 이동
기관주소
기본주소
(주소1)
Null의 경우
우편번호가 존재하면 우편번호로 검색된 주
소 입력
단 우편번호 유효검사를 거친 우편번호만
대상으로 함
우편번호의 주소와 상
이한 경우
가베지 데이터가 아닌 경우에는 정제대상에서
제외
가베지 데이터인 경우기존 데이터는 삭제하고 우편번호가 존재하
면 우편번호로 검색된 주소 입력
상세주소
(주소2)
Null인 경우 정제대상에서 제외
주소정보가 아닌 경우주소정보가 아닌 가베지 데이터는 삭제
예) test 042-123-1234 등
우편번호
Null인 경우
기본 주소지로 검색하여 입력
기본 주소가 오류데이터이거나 없는 경우는
정제대상에서 제외
우편번호 표준 형식이
아닌 경우
표준 포맷 시도군 구분(3자리)+lsquo-rsquo+지역구분(3
자리)
표준 포맷이 아닌 경우는 표준 포맷으로 변경
예) 300100=gt300-100
300 100=gt300-100
300100 =gt300-100
자리 수가 6자 이하 이거나 가베지 데이터인
경우는 제거
우편번호가 old data
인 경우
현재 우편번호가 아닌 경우는 이전 우편번호
주소지를 기준으로 검색하여 입력하고 매핑되
지 않는 데이터의 경우는 삭제
인력
구분
인력
구분NA 기관명이형전거DB에 의해 매핑
최초
임용일
최초
임용일NA 날짜 오류 유형 참조
학력
사항전공
전공분야 NA 코드 오류 유형 참조
전공명 Null인 경우 정제대상에서 제외
- 36 -
구분 항목 세부항목 정제항목 오류유형 정제지침
(14
개)
전공명이 아닌 경우
가베지 데이터인 경우만 삭제하고 이외의 경
우는 정제대상에서 제외
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
취득대학
학위취득
대학코드NA 코드 오류 유형 참조
학위취득
대학명
Null인 경우
학위취득대학코드가 존재하는 경우에는 해당
학위취득대학코드의 명을 검색하여 입력하고
학위취득대학코드가 존재하지 않으면 정제대
상에서 제외
학위취득대학명이 학
위취득대학코드 내 명
칭이 아닌 경우
기관명이형전거DB의 대표기관명으로 매핑하
고 존재하지 않는 경우 신규 발급 요청하여
학위취득대학명을 유지함
학위취득대학명이 아
닌 경우
학위취득대학코드가 존재하는 경우에는 해당
학위취득대학코드의 명을 검색하여 입력하고
학위취득대학코드가 존재하지 않으면 삭제
학위 학위코드 NA 코드 오류 유형 참조입학일 입학년월 NA 날짜 오류 유형 참조졸업일 졸업년월 NA 날짜 오류 유형 참조
학과
학과코드 NA 코드 오류 유형 참조
학과명
Null인 경우 정제대상에서 제외
학과명이 학과코드내
명칭이 아닌 경우학과코드의 명으로 변경
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등
취득국가취득국가
코드NA 코드 오류 유형 참조
지도
교수명
지도
교수명
Null인 경우 정제대상에서 제외
이름이 아닌 경우 삭제하고 정제대상에서 제외
학위
논문명
최종학위
논문명1
Null인 경우 정제대상에서 제외
논문명1이 Null인경우논문제목1이 Null인 경우 논문제목2에서 이동
함
- 37 -
구분 항목 세부항목 정제항목 오류유형 정제지침
가베지 데이터인 경우
삭제
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
최종학위
논문명2
Null인 경우 정제대상에서 제외
논문명1이 Null인경우 논문제목1이 Null인 경우 논문제목1로 이동함
가베지 데이터인 경우
삭제
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터 문자열이지만 특정 문자가
반복된 데이터
학위
취득일
최종학위
취득일NA 날짜 오류 유형 정제지침 참조
경력
사항
(5개)
근무처명 근무처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
직위명
직위코드 NA 코드 오류 유형 정제지침 참조
직위명
Null인 경우 정제대상에서 제외
직위명이 직위코드내
명칭이 아닌 경우
직위명이 직위코드내 존재하지 않으면 직위명
은 그대로 유지하고 직위코드는 기타(lsquo999rsquo)로
매핑함
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
근무기간
근무
시작일NA 날짜 오류 유형 정제지침 참조
근무
종료일NA 날짜 오류 유형 정제지침 참조
자격
사항
(3개)
자격
발행처
자격
발행처
Null인 경우 정제대상에서 제외
가베지 데이터인 경우특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
- 38 -
구분 항목 세부항목 정제항목 오류유형 정제지침
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
자격증명 자격증명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
자격
취득일
자격
취득일NA 날짜 오류 유형 정제지침 참조
논문
실적
(8개)
논문
발표일
논문
발표일NA 날짜 오류 유형 정제지침 참조
국문
논문명
논문제목
국문
Null인 경우 정제대상에서 제외
필수
논문제목국문이 Null이고 논문제목영문이 Null
이 아닐 경우 논문제목영문을 논문제목국문으
로 이동시키고 논문제목영문은 Null로 갱신
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
영문
논문명
논문제목
영문
Null인 경우 정제대상에서 제외
필수
논문제목국문이 Null이고 논문제목영문이 Null
이 아닐 경우 논문제목영문을 논문제목국문으
로 이동시키고 논문제목영문은 Null로 갱신
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
저자역할
구분
저자역할
구분NA 코드 오류 유형 정제지침 참조
발행처 발행처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
- 39 -
구분 항목 세부항목 정제항목 오류유형 정제지침
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터학술지
구분
학술지구
분NA 코드 오류 유형 정제지침 참조
학술지명 학술지명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
SCI여부 SCI여부 NA 코드 오류 유형 정제지침 참조
지식
재산
권
(3개)
지식
재산권명
지식
재산권명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
출원_등
록번호
출원등록
번호
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
특허구분 특허구분 NA 코드 오류 유형 정제지침 참조
평가
위원
(13개)
소속
학협
회
현황
(5개)
담당업무 담당업무
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
직위 직위
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
- 40 -
구분 항목 세부항목 정제항목 오류유형 정제지침
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
학협회
사항
학협회명
Null인 경우 정제대상에서 제외
직위명이 포함되어 있
는 경우
직위명이 존재하지 않으면 직위명 항목에 복
사하고 직위명칭에 관련된 부분은 삭제 존재
한다면 관련 부분을 삭제
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
활동시작
일NA 날짜 오류 유형 정제지침 참조
활동종료
일NA 날짜 오류 유형 정제지침 참조
훈포
장
사항
(3개)
수상년월 수상년도 NA 날짜 오류 유형 정제지침 참조
수여
기관명
수여기관
명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
훈포장명 수상명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저역
서
실적
(5개)
저서명1 저서명1
Null인 경우 정제대상에서 제외
저서명1이 Null인 경
우저서명2를 저서명1로 저장
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저서명2 저서명2
Null인 경우 정제대상에서 제외
저서명1이 Null인 경
우저서명2를 저서명1로 저장
가베지 데이터인 경우 특수문자 숫자로만 구성되거나 그 외의 가베
- 41 -
구분 항목 세부항목 정제항목 오류유형 정제지침
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
발행년 발행년도 NA 날짜 오류 유형 정제지침 참조
발행처 발행처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저역서
구분
저역서
구분NA 코드 오류 유형 정제지침 참조
- 42 -
구분 항목 세부항목 정제항목 오류내역 정제지침
참여인력정보(11개)
소속기관사항(1개)
최초임용일최초임용일
YYYYMMDD
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
DD가 없는 경우 01일로 갱신
YYYYMMDD가 유
효하지 않은 경우
년도가 유효하면 월-gt01월 일-gt01
일로 갱신하고 년도 자체가 유효하
지 않으면 삭제
학력사항(3개)
입학일입학년월
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 03월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt03월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
졸업일졸업년월
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 02월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt02월로 갱신
하고 년도 자체가 유효하지 않으면
삭제입학년월보다 같
거나 작은 경우데이터 삭제
학위취득일
최종학위
취득일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효
하지 않은 경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
경력사항(2개)
근무기간근무시작일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
날짜로서 유효한 형태를 갖고 있지 않은 경우
- 43 -
구분 항목 세부항목 정제항목 오류내역 정제지침
제
근무종료일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
근무시작일보다
같거나 작은 경우
근무시작일에서 YYYYMM이 동일하
면 삭제하고 근무시작일에서 YYYY
은 동일하나 MM이 작을 경우에만
삭제
자격사항(1개)
자격취득일자격취득일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
논문실적(1개)
논문발표일논문발표일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효
하지 않은 경우
년도가 유효하면 월-gt01월로 갱신하고
년도자체가유효하지않으면삭제
소속학협회현황(2개)
학협회사항
활동시작일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경
우데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭제
활동종료일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하고
년도자체가 유효하지않으면 삭제
- 44 -
구분 항목 세부항목 정제항목 오류내역 정제지침
활동시작일보다
같거나 작은 경우
활동시작일에서 YYYYMM이 동일하
면 삭제하고 활동시작일에서 YYYY
은 동일하나 MM이 작을 경우에만
삭제
훈포장사항(1개)
수상년월수상년도
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 변경하고
년도자체가 유효하지않으면 삭제
평가위원(1개)
저역서실적(1개)
발행년발행년도
YYYY
Null인 경우 정제대상에서 제외
YYYY이 유효하지
않은 경우유효하지 않으면 삭제
구분 항목세부항목
정제항목 오류유형 정제지침
참여
인력
정보
(15개)
기본정보
(1개)
자택
우편번호
우편번호
기본주소
Null의 경우주소가 존재하면 주소지로 우편번호 검색
하여 우편번로를 입력(정제작업자)
우편번호와주소
정보가불일치
middot 기본 주소가 가베지 데이터가 아니고 상
세주소가 존재한다면 그대로 유지하고
가베지 데이터이면 우편번호 상 주소를
기본주소에 입력
상세주소가 존재하면서 오류 데이터가 아
닌 경우에는 기본주소의 변경은 하지 않으
며 기존의 우편번호를 주소지에 맞게 주소
검색하여 변경
소속기관
사항(4개)소속기관명
소속기관코드
소속기관명
Null인 경우 정제대상에서 제외
소속기관명만
존재하는 경우
기관명이형전거DB에서 검색하여 이형기관
코드 대표기관명으로 매핑하고 존재하지
않는 경우 신규 발급 요청하여 그대로 유
지함
시작일보다 종료일이 같거나 작은 경우 종료일을 삭제
날짜의 경우 본인의 생년월일보다 작을 수 없음
코드의 값이 정해진 범위를 벗어난 경우
- 45 -
구분 항목세부항목
정제항목 오류유형 정제지침
소속기관코드만
존재하는 경우
해당 소속기관코드를 기관명이형전거DB에
서 검색하여 소속기관명을 갱신하며 매핑
되지 않는 소속기관코드는 삭제
직위명직위코드
직위명
Null인 경우 정제대상에서 제외
직위명만 존재
하는 경우
직위명으로 동일 또는 유사한 직위코드를
검색하여 입력하고 직위코드 내 존재하지
않는 직위명칭이면 lsquo기타rsquo로 매핑
[직위코드] NTIS 직위코드 참조
직위코드만 존
재하는 경우
해당 직위코드를 NTIS 직위코드의 직위명
으로 검색하여 갱신하며 매핑되지 않는 직
위코드는 삭제
[직위코드] NTIS 직위코드 참조
기관주소 우편번호
Null의 경우
주소가 존재하면 주소지로 우편번호 검색
하여 입력
단 우편번호 내 기본주소만 가능
우편번호와 기
본주소가 불일
치
기본 주소가 가베지 데이터가 아니고 상세
주소가 존재한다면 그대로 유지하고 가베
지 데이터이면 우편번호 상 주소를 기본주
소에 입력상세주소가 존재하면서 오류 데이터가 아
닌 경우에는 기본주소의 변경은 하지 않으
며 기존의 우편번호를 주소지에 맞게 주소
검색하여 변경
인력(직업)
구분인력유형구분
Null인 경우 정제대상에서 제외인력유형구분
코드 범위를
벗어나는 경우
[인력구분코드] 대학교 연구소 산업계 기
타 등 구분코드 범위를 벗어나는 데이터는
Null로 갱신
학력사항
(5개)
전공전공코드
전공명
Null인 경우 정제대상에서 제외전공명만 존재
하는 경우
전공명으로 NTIS 전공코드를 검색하여 입
력
[전공코드] NTIS 전공코드 참조
전공코드만 존
재하는 경우
해당 전공분야코드를 NTIS 전공코드에서
전공명을 검색하여 갱신하며 매핑되지 않
는 전공코드는 삭제
[전공코드] NTIS 전공코드 참조
취득대학
학위취득대학
코드
학위취득대학명
Null인 경우 정제대상에서 제외
학위취득대학
명만 존재하는
경우
기관명이형전거DB에서 검색하여 이형기관
코드 대표기관명으로 매핑하고 존재하지
않는 경우 신규 발급 요청하여 그대로 유
지함
- 46 -
구분 항목세부항목
정제항목 오류유형 정제지침
학위취득대학
코드가 존재하
는 경우
해당 학위취득대학코드를 기관명이형전거
DB에서 검색하여 학위취득대학명을 갱신하
며 매핑되지 않는 학위취득대학코드는 삭
제
학위 학위코드
Null인 경우 정제대상에서 제외
학위코드 범위
를 벗어나는
경우
존재하는 학위코드가 NTIS 학위코드와 매
핑되는지 확인하고 멥핑되지 않는 학위코
드는 삭제
[학위코드] NTIS 학위코드 참조
학과학과코드
학과명
Null인 경우 정제대상에서 제외
학과명만 존재
하는 경우
학과명으로 동일 또는 유사한 NTIS 학과코
드를 검색하여 입력하고 NTIS 학과코드 내
존재하지 않는 학과명이면 기타 코드로 매
핑함
[학과코드] NTIS 학과코드 참조
학과코드만 존
재하는 경우
해당 학과코드를 NTIS 학과코드의 학과명
을 검색하여 갱신하며 매핑되지 않는 학과
코드는 삭제
[학과코드] NTIS 학과코드 참조
취득국가 취득국가코드
Null인 경우 정제대상에서 제외
취득국가코드
의 범위를 벗
어나는 경우
존재하는 국가코드가 NTIS 국가코드와 매
핑되는지 확인하고 멥핑되지 않는 국가코
드는 삭제
[국가코드] NTIS 국가코드 참조
경력사항
(2개)직위명
직위코드
직위명
Null인 경우 정제대상에서 제외
직위명만 존재
하는 경우
직위명으로 동일 또는 유사한 직위코드를
검색하여 입력하고 직위코드 내 존재하지
않는 직위명칭이면 lsquo기타rsquo로 매핑
[직위코드] NTIS 직위코드 참조
직위코드만 존
재하는 경우
해당 직위코드를 NTIS 직위코드의 직위명
으로 검색하여 갱신하며 매핑되지 않는 직
위코드는 삭제
[직위코드] NTIS 직위코드 참조
논문실적
(3개)
저자역할
구분저자역할구분
Null인 경우 정재 대상에서 제외
저자역할구분존재하는저자역할구분가 NTIS 저자역할구
- 47 -
구분 항목세부항목
정제항목 오류유형 정제지침
코드의 범위를
벗어나는 경우
분코드와 매핑되는지 확인하고 멥핑되지
않는 국가코드는 삭제
[역할구분코드] NTIS 저자역할구분코드 참
조
학술지
구분학술지구분
Null인 경우 정재 대상에서 제외
학술지구분코
드의 범위를
벗어나는 경우
존재하는 학술지구분코드가 NTIS 학술지
구분코드와 매핑되는지 확인하고 멥핑되지
않는 학술지구분코드는 삭제
[학술지구분코드] NTIS 저자역할구분코드
참조
SCI여부 SCI여부
Null인 경우 정재 대상에서 제외
SCI여부구분코
드의 범위를
벗어나는 경우
존재하는 SCI여부구분코드가 lsquo01 또는
02가 아닌 데이터는 Null로 갱신
[SCI여부구분코드] NTIS SCI여부구분코드
참조
지식
재산권
(1개)
특허구분 특허구분
Null인 경우 정제대상에서 제외
특허구분코드
의 범위를 벗
어나는 경우
존재하는 특허구분코드가 NTIS 특허구분
코드와 매핑되는지 확인하고 멥핑되지 않
는 특허구분코드는 삭제
[특허구분코드] NTIS 특허구분코드 참조
평가위원(1개)
저역서실적(1개)
저역서구분 저역서구분
Null인 경우 정제대상에서 제외
저역서구분코
드의 범위를
벗어나는 경우
존재하는 저역서구분코드가 NTIS 저역서
구분코드와 매핑되는지 확인하고 멥핑되지
않는 저역서구분코드는 삭제
[저역서구분코드] 1저서 2역서 中 택일
공통사항
- 매핑하고자 하는 기존 코드명(공란 및 특수문자 제거)으로 NTIS 표준 코드 內 한글코드명을 대
상으로 검색하여 동일한 코드명(11의 경우)은 시스템(SQL App 등)을 통해 미리 매핑하고 유사
한 코드명(1N의 경우)은 정제작업자가 선택한 코드로 입력하여 매핑 처리
- 코드 종류가 소수(3개 미만)인 경우 Source 데이터 내 등록되어 있는 코드 또는 코드명칭을 대
상으로 동일한 패턴별로 일괄 변환(SQL Query Excel)처리한 후 변환되지 않은 데이터는 삭제
- 코드가 가베지 데이터인 경우는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 영숫자가 아닌 특수문자로만 구성된 데이터 특정 문자가 반복된 코드와
관련되지 않은 데이터
- 48 -
구분 항목 이중등록검사항목 정제지침 비 고
참여
인력
정보
기본
정보주민등록번호()
주민등록번호가 동일한 인력데이
터가 2개 이상이면 시스템으로
추출하여 이중등록검사를 수행함
시스템 정제
소속기
관사항소속기관명()
인력별 동일한 소속기관사항 데이
터가 2개 이상이면 시스템으로
추출하여 1개만 남겨 놓고 나머지
는 오류 체크 필드에 표시함
시스템 정제
학력
사항
1 취득대학() 학위() 입학일
2 취득대학() 학위() 졸업일
3 취득대학() 학위() 전공
4 취득대학() 학위() 학과
5 취득대학() 학위() 학위취득일
인력별 동일한 학력사항 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
경력
사항
1 근무처명() 직위명 근무시작일
1 근무처명() 직위명 근무종료일
인력별 동일한 경력사항 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
논문
실적
1 논문명() 논문발표일 학술지명
2 논문명() 논문발표일 ISSN
3 논문명() ISSN 게재권집 게재
호
4 논문명() 학술지명 게재권집
게재호
인력별 동일한 논문실적 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
지식
재산권
1 출원_등록번호()
2 지식재산권명() 출원등록구분
특허구분() 출원국가
인력별 동일한 지식재산권 데이터
가 2개 이상이면 시스템으로 추
출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
시스템 정제
저역서
실적
1 ISBN
2 저역서명() 저역서구분() 발행
인력별 동일한 저역서실적 데이터
가 2개 이상이면 시스템으로 추시스템 정제
143 이중등록 유형별 정제지침
이중등록 정제 지침
- 이중등록에 대한 정제는 오류 유형 정제 및 코드 매핑 처리 후 수행함
- 이중등록에 대한 데이터는 최신 데이터를 우선으로 유지함
- 이중등록검사항목의 문자Type의 데이터는 공란제거 제거 후 이중등록검사를 수행함
- 대상데이터의 이중등록검사항목 중 1개 이상 항목이 Null인 경우 이외의 항목이 동일하
여도 이중등록 정제 대상에서 제외함
- 49 -
구분 항목 이중등록검사항목 정제지침 비 고
년 발행처출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
평가
위원
소속학
협회
현황
1 학협회명() 직위 시작일
2 학협회명() 직위 종료일
인력별 동일한 소속학협회현황
데이터가 2개 이상이면 시스템으
로 추출하여 1개만 남겨 놓고 나
머지는 오류 체크 필드에 표시함
시스템 정제
훈포장
사항훈포장명() 수상년월 수여기관명
인력별 동일한 훈포장사항 데이터
가 2개 이상이면 시스템으로 추
출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
시스템 정제
자격
사항
자격증명() 자격발행처 자격취득
일
인력별 동일한 데이터가 2개 이상
이면 시스템으로 추출하여 1개만
남겨 놓고 나머지는 오류 체크 필
드에 표시함
시스템 정제
15 데이터 정제 절차 및 작업지침
151 데이터 정제 절차
- 50 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
데이터
정제
준비
초기
데이터
구축
연계기관기반 정보취합
연계기관 인력데이터 구조(스키마 엔터티 정의)코드정보 등 통합 인력DB로의 이관을 위한 연계기관 제공 정보 취합
기관 협의 정보 제공 기반정보 분석
연계대상기관데이터 취합
통합하고자 하는 연계기관 인력데이터를 제공받아 Temp DB(연계기관데이터 구조와 동일)에등록
기관 협의 데이터제공 데이터 생성
연계기관
데이터 이관
준비
NTIS 표준 코드정보를KISTI로부터 제공받음 표준 코드 제공 코드 분석
기존 코드별 NTIS 표준코드 매핑 정의 표준코드매핑 작성
플래그성 매핑기준작성
기존 데이터에 표준 코드 반영 표준코드 매핑처리
표준 코드 적용결과 검토 데이터 확인
연계기관
데이터 분석
및 매핑계획
수립
연계기관 데이터 분석 데이터 분석 데이터 분석
연계기관 코드매핑 정의 기관 코드매핑 작성플래그성 매핑 기준 작성
테이블매핑 정의테이블 매핑정보확정
테이블 매핑(안) 작성
데이터
정제 기준
및
계획 수립
과학기술 인력정보 데이터 분석
정제 대상 RampD참여인력데이터 분석
정제 대상 항목 및 기준에 대한 정의
데이터 정제 내역검토
데이터 분석
데이터정제 내역작성
데이터 정제기준 및 절차협의
정제 대상 데이터 건수및 연계 기관 인력데이터 포함 범위 정제 항목 선정 정제 공정(정제 1차 검증 최종 확인) 확정
정제 범위 대상 확정 협의 진행
데이터 정제매뉴얼 작성
데이터정제매뉴얼구성내용
데이터정제개요및절차정의
정제대상정의및정제범위
정제항목별기준및예시
정제검증도구사용법
전환코드표
표준양식
정제매뉴얼 검토및 확정
정제매뉴얼 초안작성
상세일정계획수립
정제 량을 분석하여 투입인력대비 주월별 데이터 정제 계획대비 실적 산정
일정 검토 및 확정 일정계획 작성
152 정제 단계별 작업 지침
- 51 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
데이터 정제 작업 환경 구축
작업 환경 및작업자 구성 데이터 정제 환경 구성
작업자 모집
작업장 환경 구축(월평동)
데이터정제 작업교육실시
정제작업자 및 정제관리자를 대상으로 교육 실시 및교육결과서작성
작업자 정제작업교육 실시
데이터정제진행
정제 작업수행
데이터 정제및 검증 데이터 정제 추진결과
데이터 정제
정제결과 검증(작업자별 검증)
정제추진현황보고 실적 보고
실적 확인 및 이슈사항 협의
주별진척보고
이슈사항 및 문제점 보고
데이터정제완료
데이터 이관 및 검수
데이터 이관정제된 데이터를 작업DB에서 서비스DB 로이관
이관 확인 데이터 이관
데이터 검수(최종 확인)
RampD 참여인력 데이터(정제 결과물) 검사 (샘플링 검수)
검수(샘플링)검수 데이터 추출제공
153 항목별 정제작업 세부지침
공통사항 및 시스템정제
공통사항
1 정보유형별로 주요항목이 존재하지 않는 경우라도 기본 학력 소속기관사항은 삭제하지
않고 실적정보는 삭제 처리함
가 정보유형별로 경력정보 실적정보의 주요항목이 Null인 데이터는 삭제
나 기존데이터의 경우 학력 소속기관사항은 주요항목이 Null이지만 현황정보 제공 필드가
존재하면 유지함
학력사항 학위 전공 등 존재하면 유지
소속기관사항 우편번호 직위 등 존재하면 유지
2 코드 항목 값을 NTIS 코드정보 내 명칭으로 갱신함
가 소속기관명 학위취득대학명 학과명 전공명 직위명 등을 NTIS 표준코드로 매핑하여
코드값을 넣고 각 항목에 NTIS 코드정보 내 코드명으로 변환하여 갱신함
- 52 -
No원본데이터 정제 후
정제요령 비고코드 명 코드 명
1 한국타이어(주) AAB6793 (주)한국타이어
기관명이형전거DB에서
대표기관명과
이형기관코드로 매핑
2 연구원 B06 연구원 직위코드 매핑
3 가베지 데이터의 값을 삭제 처리함
가 정보유형별 각 항목에서 가베지 데이터에 대해 삭제 처리함
No원본데이터 정제 후
정제요령 비고데이터 데이터
1 test 가베지 처리
2 가베지 처리
3 - 가베지 처리
4 가베지 처리
5 blank 가베지 처리
6 가베지 처리
7 서울대학교 서울대학교 정제 처리
시스템정제
1 비교대상이 존재하지 않는 항목에 대해서는 시스템정제(Null처리) 한다
가 시스템정제 항목
항목 세부항목 비고소속기관 인력구분
학력사항취득국가학위
지식재산권 특허구분
저역서실적 저역서구분
논문실적저자역할구분학술지구분SCI여부
비 고
shy 날짜 데이터의 경우 생성일이 완료일보다 후에 있는 경우 생성일을 남
겨놓고 완료일 삭제
shy 년도 포맷의 경우 1900년도~현재(정제시점)을 기준으로 이전이나 이후는
Null 로 갱신
shy 날자 데이터의 경우 생년월일보다 빠른 경우는 삭제
기본정보
기본정보_주민등록번호 정제지침
1 주민등록번호가 null인 경우 정제대상에서 제외
- 53 -
2 주민등록번호가 유효하지 않은 lsquo-rsquo포함한 14자가 아닌경우 정제대상에서 제외
No원본데이터 정제 후
정제요령 비고주민번호 이름 주민번호 이름
1 090166-471ORHAN
NALCIOGLU090166-471
ORHAN
NALCIOGLU정제대상에서 제외
2 000000-1111111 홍길동 000000-1111111 홍길동 lsquo-rsquo포함 14자리는 유지
3 194912-100001F 요이치로스즈키 194912-100001F 요이치로스즈키주민번호에 영문자
포함(F) 데이터 유지
4 1234561234567 홍길동 123456-1234567 홍길동 lsquo-rsquo 추가
3 기타사항
가 주민번호에 특수문자 포함시 가베지 데이터 처리(삭제)
기본정보_성명 정제지침
1 각 항목(한글영문한자)에 맞는 데이터 값 확인
2 성명 이외의 가베지 데이터는 삭제
3 한글한자영문이름이 모두 null인 경우 데이터 유지(서비스 제외)
4 한글한자영문이름이 가베지 데이터인 경우 가베지 값 삭제 데이터 유지(서비스 제외)
5 한글한자영문 이름을 각 항목에 맞게 값을 이동(한글성명은 한글 영문성명은 영문 한
자성명은 한자)
6 한글한자영문 이름이 기업명 또는 법인명인 경우 데이터 삭제
No원본데이터 정제 후
정제요령 비고한글이름 영문이름 한글이름 영문이름
1 SK LEE SK LEE 맞는 항목으로 값을 이동
2 test -- 삭제
3홍길동
(영구참여제한자)HONG GD 홍길동 HONG GD
이름 외 가베지 데이터
삭제
영문성명이 성+이니셜은
유지
4 성진기계 기업 법인명 삭제
5 홍 길 동 HGD 홍길동 영문성명 삭제
공란 제거
기본정보_주소 우편번호 정제지침
1 우편번호와 주소 모두 null인 경우 정제대상에서 제외
2 우편번호가 표준 형식이 나닌 경우 표준 포맷으로 변경(lsquo-rsquo포함한 7자리)
- 54 -
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302230 302-230 표준 포맷으로 변경
3 우편번호는 null 이지만 주소는 존재하는 경우 주소를 검색하여 우편번호 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 대전 서구 정림동 302-230 대전 서구 정림동우편번호에서 검색하여
매핑한다
4 우편번호는 존재하나 주소가 null인 경우 우편번호에 해당하는 주소 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302-230 302-230 대전 서구 정림동우편번호에서 검색하여
기본주소까지 입력한다
5 우편번호와 주소 값이 가베지 데이터인 경우 가베지 처리
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 111-1 대구 수성구 가베지 처리
2 111 대전 서구 정림동 302-230 대전 서구 정림동
기존 가베지 우편번호
대신에 주소를 가지고
새로운 우편번호를
검색하여 매핑한다
6 우편번호 체계가 OLD 데이터인 경우 현 주소로(NTIS 우편번호체계) 검색하여 매핑
No원본데이터 정제 후
정제요령 비고우편번호 주소1 우편번호 주소
1 449-981경기도 용인시 수지읍 성복리
LG2차아파트201~208동448-981
경기 용인시 수지구 성복동
LG2차빌리지
우편번호에서 검색하여
현재 우편번호로 매핑함
7 기타사항
가 외국주소 데이터 유지 원칙
(1) 우편번호가 국내우편번호인 경우는 우편번호만 가베지 처리
(2) 기본주소에 국가명만 존재해도 데이터 유지
나 주소가 2개 이상인 경우 세부주소를 포함한 주소로 정제
다 기본주소와 상세주소 구분(우편번호 기준 원칙)
(1) 기본주소 우편번호를 검색하여 나온 해당 주소
(2) 상세주소 우편번호를 검색하여 나온 해당 주소 이외의 주소
- 55 -
No원본데이터 정제 후
정제요령 비고우편번호 주소1 주소2 우편번호 주소1 주소2
1
11 schlundt
annex columbia
mo 65211 usa
11 schlundt annex
columbia mo
65211 usa
외국주소는 유지
2 USA USA기본주소에 국가명만
존재해도 데이터 유지
3 137-764
서울 서초구
반포2동
반포주공아파트
0동 0호
137-764
서울 서초구
반포2동
반포주공아파트
0동 0호 기본주소와 상세주소 구분
기본정보_전화번호 핸드폰번호 정제지침
1 전화번호가 null인 경우 정제대상에서 제외
2 전화번호 기본포멧 유지
가 지역번호-국번-전화번호
나 +국가번호-지역번호-국번-전화번호
다 이동통신구분번호(3자리)-지역구분번호(34자리)-전화번호(4자리)
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 042)123-4567 010-1234567 042-123-4567 010-123-4567 기본포맷으로 변경
2 015-123-1234
SK(011 017) KTF(016
018) KG(109) 010(공통)
만 유지
3 +1-125-123-1234 +1-111-123-1215 +1-125-123-1234 +1-111-123-1215 외국전화번호는 유지
3 지역번호 없는 경우 주소지의 시도 지역번호를 입력
No원본데이터 정제 후
정제요령 비고자택 전화번호 주소 자택 전화번호 주소
1 6746-1234 서울 강남구 서초동 02-6746-1234 서울 강남구
서초동
주소지의 시도 지역번호를
입력
2 6746-1234 주소정보 없으므로 삭제
4 국가번호가 포함된 경우 ldquo(+)국가번호-국번-지역전화번호-전화번호ldquo 형태로 변경
No원본데이터 정제 후
정제요령 비고자택 전화번호 자택 전화번호
1 +82)02-6746-1234 +82-02-6746-1234
ldquo(+)국가번호-국번-지역전
화번호-전화번호ldquo 형태로
변경
5 전화번호 외 가베지 데이터는 삭제
- 56 -
가 텍스트 최소자릿수 미달(3자리 미만)등
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 02-64-123 010-111-111 자리수가 작으면 제거
6 데이터를 각 항목에 맞도록 이동 정제
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 010-2353-0416 042-123-0416 042-123-0416 010-2353-0416전화번호와 핸드폰 번호를
각 항목에 맞게 이동
7 기타사항
가 내선번호 및 과거지역번호 데이터 유지
나 전화번호가 2개 이상인 경우 앞의 전화번호를 우선으로 유지함
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 0431-123-1234 0431-123-1234 예전 지역번호는 유지
2 042-123-1234(100) 042-123-1234(100) 내선번호 유지
3 0431-123-1234 1235 0431-123-1234 앞의 전화번호를 우선으로
유지
기본정보_e-mail 정제지침
1 이메일 기본포멧 오류 및 내용상 무의미한 값 가베지 처리
No원본데이터 정제후
정제요령 비고e-mail e-mail
1 123123com 가베지 처리
2 1111111com 가베지 처리
3 123 가베지 처리
4 wwwkistirekr 가베지 처리
5 --- 가베지 처리
2 E-mail 2개 이상 존재 가베지 삭제 후 이상없는 값은 모두 유지
No원본데이터 정제후
정제요령 비고e-mail e-mail
1chhyangmdhanmailnet
chhyangdumcorkrrchhyangmdhanmailnet
앞의 이메일을 우선으로
유지함
2 abcdaumnet abcdaumnet이메일의 구분자가 누락된
경우 구분자 추가함
- 57 -
소속기관사항
소속기관_주소 우편번호 정제지침 ( 기본정보_주소 우편번호 정제지침 참조)
1 우편번호와 주소 모두 null인 경우 - 정제대상에서 제외
2 우편번호는 null 이지만 주소는 존재하는 경우 주소를 검색하여 우편번호 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 대전 서구 정림동 302-230 대전 서구 정림동우편번호에서 검색하여
매핑한다
3 우편번호는 존재하나 주소가 null인 경우 우편번호에 해당하는 주소 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302-230 302-230 대전 서구 정림동우편번호에서 검색하여
기본주소까지 입력한다
4 우편번호와 주소 값이 가베지 데이터인 경우 가베지 처리
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 111-1 가정교육학 가베지 처리
2 111 대전 서구 정림동 302-230 대전 서구 정림동기존 가베지 우편번호 대신에 주소를 가지고
새로운 우편번호를 검색하여 매핑한다
5 우편번호 체계가 OLD 데이터인 경우 현 주소로 검색하여 매핑
6 기타사항
가 외국주소 데이터 유지 원칙
(1)우편번호가 국내우편번호인 경우는 우편번호만 가베지 처리
(2)기본주소에 국가명만 존재해도 데이터 유지
나 주소가 2개 이상인 경우 소속기관명을 기준으로 정제(소속 기관이 소재한 주소만 유
지하고 그 외 주소는 가베지 처리)
다 기관 주소로 적합하지 않은 주소(자택주소)인 경우 유효한 주소로 정제(주소가 둘 이
상일 경우)
소속기관_사무실전화번호 팩스번호 정제지침 ( 기본정보_전화번호 핸드폰번호 정제지침 참조)
1 전화번호가 null인 경우 정제대상에서 제외
2 전화번호 기본포멧 유지
가 지역번호-국번-전화번호
- 58 -
나 +국가번호-지역번호-국번-전화번호
3 전화번호 외 가베지 데이터는 삭제
가 텍스트 최소자릿수 미달(3자리 미만)등
4 데이터를 각 항목에 맞도록 이동 정제
No원본데이터 정제 후
정제요령 비고사무실 전화번호 기본정보핸드폰 번호
1 010-2353-0416 010-2353-0416
사무실전화번호에
핸드폰번호 형태의
데이터가 있을 경우
삭제하고 기본정보의
핸드폰번호가 널일
경우에만 이동함
5 기타사항
가 내선번호 및 과거지역번호 데이터 유지
나 지역번호 누락시 주소항목에서 유추 기입(유추 불가시 널처리)
다 전화번호가 2개 이상인 경우 기존 데이터 유지
라 기준에 명시되지 않은 사항은 추후 사업주관기관과 협의하여 진행
소속기관_기관 부서명 직위 정제지침
1 기관 부서명 직위 모두 null인 경우 정제대상에서 제외
2 기관 직위는 NTIS 코드값에서 검색하여 매핑
3 인력구분은 기관명이형전거DB에 의해 자동 매핑함
No원본데이터 정제 후
정제요령 비고기관코드 기관명 기관코드 기관명
1 한국타이어(주) AAB6793 (주)한국타이어
기관명이형전거DB에서
대표기관명과
이형기관코드로 매핑
No원본데이터 정제 후
정제요령 비고직위코드 직위명 직위코드 직위명
1 교수 A01 교수NTIS 직위코드에서
검색하여 매핑한다
2 항해사 999 항해사
직위코드에 매핑되지
않으면 직위코드는 lsquo999rsquo로
매핑하고 직위명은 유지함
4 필드내 중복데이터가 존재할 경우 가베지 처리하고 각 필드와 부합하지 않는 데이터는
해당 필드로 이동
5 해당 필드내 부합되지 않는 데이터는 해당필드로 옮기고 가베지 처리
- 59 -
No원본데이터 정제 후
정제요령 비고직위코드 직위명 직위코드 직위명
1 비정규직 가베지 처리
6 기타사항
가 소속기관이 2개 이상인 경우
(1)주소 데이터를 참고하여 해당 기관명만 유지하고 이외의 데이터는 가베지 처리
(2)주소 데이터가 없는 경우에는 대학교 연구소 산업계 기타 기관 순으로 정제
나 항목별 값이 2개 이상인 경우 해당 필드에 기 입력된 값을 우선하여 유지하고 이외
의 데이터는 가베지 처리
다 기관명이형전거DB에 존재하지 않는 기관은 신규발급 요청 후 매핑
라 기준에 명시되지 않은 사항은 사업주관기관과 협의하여 진행
소속기관_최초임용일 정제지침
1 날짜 오류 유형 정제
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMMDD
No원본데이터 정제 후
정제요령 비고생년월일 최초임용일 생년월일 최초임용일
1 19500310 19451011 19500310날짜는 생년월일 보다
작을수 없으므로 삭제
2 19500310 20101010 19500310날짜는 현재보다 클수
없으므로 삭제
3 19500310 19000101 19500310 1900년 이전은 삭제
학력사항
학력사항_전공 정제지침
1 전공분야코드와 전공명 모두 null인 경우 정제대상에서 제외
2 전공명은 있으나 전공분야코드가 null인 경우 전공명을 검색하여 전공분야코드 입력
가 전공명과 정확히 일치하는 전공분야코드가 존재하는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 정보통신 D130700 정보통신 정보통신전공명과 일치하는
코드값을 매핑한다
나 전공명에 공백이 있는 경우
- 60 -
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 무기 화학 C060300 무기화학 무기화학공백제거후 일치하는
값을 찾아 매핑한다
다 정확히 일치하는 전공명이 검색되지 않는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 농생물학 F010300 농생물학 농생물근사치의코드값으로매
핑한다
2 생물 C070000 생물 생물학
3 화학전공 C060000 화학전공 화학
4 컴퓨터학과 D130000 컴퓨터학과 컴퓨터학
5 물리전공 C040000 물리전공 물리학
라 전공명이 영문일 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 Medicinal Chemistry C060519Medicinal
Chemistry의약화학
영문을 번역하여
코드값을 찾아
매핑한다
마 전공명칭의 중간에 구분기호 ( - () amp
및 등) 가 포함되어 있는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 미생물계통분류 C070901 미생물계통분류 미생물분류계통
구분기호와 낱말의
순서를 무시하고
매핑한다
2 동물학유전학 C071000 동물학유전학 동물학
구분기호를 기준으로
앞부분 부터 일치하는
순으로 매핑한다
3 병리학 폐암병리 E050000 병리학 폐암병리 병리학
4 환경생태생리 D110800 환경생태생리 환경생태
5 의약화학-약리 C060519 의약화학-약리 의약화학
6 전기공학(컴퓨터공학) D090000전기공학(컴퓨터공학
)전기공학
7 원격탐사amp지구물리 D140900 원격탐사amp지구물리 원격탐사
8 물리화학및 무기화학 C060300물리화학및
무기화학무기화학
바 상기 방법으로 매핑이 불가능한 경우
- 61 -
No
원본데이터 정제 후
코드매핑 결과 정제요령 비고학위취득대학코드
(코드값 없을경우)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 서울대학교 7006431 서울대학교 서울대학교 기관명이형전거DB를
이용하여
학위취득대학코드에는
이형기관코드
학위취득대학명에는
대표기관명을 매핑함
2 서울대학교
공과대학ZD13063 서울대학교 서울대학교
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 발사체 공력 해석 D049900 발사체 공력 해석 기타항공우주공학
전공명을 포괄하는
상위 코드값으로
매핑한다
2 SOLID
MECHANICSD020299
SOLID
MECHANICS기타고체및구조역학
사 원본데이터의 코드값이 오류인 경우(전공분야코드가 아닌 경우)
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 0160 건축공학 D150000 건축공학 건축공학
원문의 코드값을
가베지 처리 후
재매핑한다
3 전공명이 오류인 경우(전공명이 아닌 경우)
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고직위코드 직위명 직위코드 직위명
1 訣廢点뼈膀갹쳬窩 가베지 처리
2 석사학위 없음 가베지 처리
학력사항_취득대학 정제지침
기관명이형전거DB를 이용하여 학위취득대학코드 및 학위취득대학명 정제
1 학위취득대학코드와 학위취득대학명 모두 null인 경우 정제대상에서 제외
2 학위취득대학명은 존재하나 학위취득대학코드가 null인 경우 기관명이형전거DB에서 검
색하여 학위취득대학코드 입력
3 학위취득대학명 풀네임이 아닐때 학위취득대학코드가 null인 경우 - 기관명이형전거DB에
- 62 -
No
정제전 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(()내용이 모두
없을경우)
학위취득대학명학위취득대학코드
(검색코드입력)코드학위취득대학명
1 연세대학교(원주) ZD13266 연세대학교 연세대학교
기관명이형전거DB를
이용하여
학위취득대학코드에는
이형기관코드
학위취득대학명에는
대표기관명을 매핑함
No
정제전 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(기존 코드값)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 114800 서울대학교 7006431 서울대학교 서울대학교
학위취득대학명 검색
기존데이터 가베지
처리 후 검색된 코드
입력
No
정제전(표준대학명 설정) 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(표준대학명
기준설정)
학위취득대학명학위취득대학코드
(검색코드입력)학위취득대학명
1 가톨릭대학교가톨릭대학교(본
부)7001337 가톨릭대학교 가톨릭대학교
신규 발급 요청 후
코드 입력
No
정제전(개칭 외국취득대학명) 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(검색된값)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 부경대학교 부산수산대학교 7003010 부경대학교 부경대학교
인터넷
학위취득대학명
검색하여 검색된 코드
입력
2 東京大學 도쿄대학 JA0122 도쿄대학 東京大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
3 東京工業大學Tokyo Institute
of TechnologyJA0114
Tokyo Institute
of Technology東京工業大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
서 검색하여 학위취득대학코드 입력
4 기존 학위취득대학코드가 있는 경우 NTIS 코드값으로 변경
5 취득대학명 검색 후 취득대학코드가 없을 경우 학위취득대학명 신규 발급 요청 후 코드
기입
6 취득대학명이 개칭 혹은 외국취득대학명일 경우 검색해서 학위취득대학코드 기입함
- 63 -
4 早稻田大學(일본)와세다
대학JA0319 (일본)와세다 대학 早稻田大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
5 서울산업대학교 경기공업전문대학 7002623 경기공업전문대학 서울산업대학교
인터넷
학위취득대학명
검색하여 검색된 코드
입력
오탈자 정제요령
서울대하교 서울대학교 (오탈자 수정)
7 가베지값
가베지 정제요령
111ㄴㄴㄴ amp 김정구 없슴 등등 가베지 처리
8 오탈자
학력사항_학과 정제지침
1 학과코드와 학과명 모두 null인 경우 정제대상에서 제외
2 학과코드는 존재하나 학과명이 null인 경우 학과코드를 검색하여 학과명 입력
No원본데이터 정제 후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 0015 0015 가정 가정코드표에서 학과코드로
검색하여 매핑한다
3 학과명은 존재하나 학과코드가 null인 경우 학과명을 검색하여 학과코드 입력
가 학과코드표에 학과명과 정확히 일치하는 값을 찾아 매핑
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가정 0015 가정 가정코드표에서 학과명으로
검색하여 매핑한다
나 정확히 일치하는 학과명이 검색되지 않는 경우 근사값으로 매핑
- 64 -
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가축번식학번식공
학 전공명칭
전공필드가 Null인 경우
전공필드로 이동한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 건설공학대학원
박사후기9475
건설공학대학원박사
후기대학원
대학원의 경우 일치하는
값이 없으면 상위 개념으로
검색하여 매핑한다
2 이과대학
단과대학의 경우 일치값이
없으면 가베지 처리한다 -
학과명 삭제
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가정교육학 0040 가정교육학 가정교육 근사 값으로 매핑한다 유사
2 기계설계학전공 1260 기계설계학전공기계설계
기계설계학
검색값이 여러 개인 경우
일치도가 높은 값으로
매핑한다
유사
3 건축공학계열 0160 건축공학계열
건축공학
건축공학과
건축공학부
건축공학교육
일치도가 같은 여러 개의
값이 검색된 경우 글자수가
가장 적은 값으로
매핑한다
유사
일치도 높은 값을 매핑 한다하여 ldquo건축공학rdquo을 ldquo건축rdquo의 형태와 같이 학과 자체가 바뀔
수 있는 매핑을하지 않도록 주의한다
다 학과명칭의 중간에 구분기호(쉼표() 마침표() slash() and(amp) 등)가 있으면서 정확히
일치하는 학과명이 검색되지 않는 경우
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 전기 및
컴퓨터공학과0073
전기 및
컴퓨터공학과전기컴퓨터공학과
구분기호를 무시하고
매핑한다
2 생화학세포학 및
분자생물학과3240
생화학세포학 및
분자생물학과생화학
No 1의 결과가 없는 경우
구분기호를 기준으로
각각의 데이터를 검색하여
매핑한다
3 곡류과학식품공학 3715 곡류과학식품공학 식품공학구분기호를 기준으로
두번째의 값이 검색된 경우
라 학과코드가 Null 이고 학과명 필드에 전공명칭이 입력된 경우
(1) 전공필드가 Null인 경우 전공필드로 데이터를 이동하여 매핑하고 학과명 필드의 데이
터는 삭제한다
마 상기 방법으로 매핑이 불가능한 경우
- 65 -
3 요업공업 9999 요업공업 기타유사코드를 찾지 못한
경우 기타로 분류한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 명예박사 가베지 처리한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 공교 공업교육
공예교육
추정된 값이 하나일 때는
그 값으로 매핑 둘
이상이면 가베지 처리한다
2 IHE(Delft)
영문 약어의 경우 추정이
어려운 값은 가베지
처리한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 工學系硏究 가베지 처리한다
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1 추후입력 test 가베지 가베지 처리
2 미정 PH D 가베지 가베지 처리
3 기억안남 NA 가베지 가베지 처리
4 졸업시험으로 대체 null 가베지 가베지 처리
5 국문없음 no data 가베지 가베지 처리
6
공학박사(지능형
소프트웨어 전공)
or 공학사
(자동차기술사)
학위 및 기타정보 가베지 처리
7 박사 학위 가베지 처리
4 가베지 처리
가 학과명이 아닌 경우
나 약어인 경우
다 학과명인지 판단하기 난해한 한문 명칭의 경우
학력사항_학위논문명 정제지침
1 최종학위국문논문명과 최종학위영문논문명이 모두 null인 경우 정제대상에서 제외
2 논문명 필드에 기타 정보나 가베지 데이터가 존재하는 경우
- 66 -
8 영문참조 none 가베지 가베지 처리
9 aa 0 가베지 가베지 처리
10 가 x 가베지 가베지 처리
11 디지털경제학 Chemistry 학과 또는 전공정보 가베지 처리
12
학사학위시설계PR
OJECT날개2001-
gt청소년수련원테마
로 설계함
졸업 작품에 대한
정보가베지 처리
13
교회 건축물의
계획 및
설계(설계작품)
졸업 작품에 대한
정보가베지 처리
14압축기 관련
기술연수 연수 정보 가베지 처리
15
광통신 부품용
소재 연구관련
논문을 준비중임
준비중인 논문 가베지 처리
16 KISTI 영문 약어 가베지 처리
17 CFD 영문 약어 가베지 처리
18
H Atoms in
Photodissociations
and Chemical
Reactions(수소원자
의 광화학반응)
H atoms in
Phtodissociation
and Chemical
Reactions
H Atoms in
Photodissociation
s and Chemical
Reactions(수소원
자의 광화학반응)
H atoms in
Phtodissociation
and Chemical
Reactions
()안에기타정보가표
기됨
-유효데이터의표기
언어는동일하나내용
상다소의차이를보이
는경우
데이터 유지
19
김휘택김승욱김정
일서근택서정탁유
총일대퇴골
근위부의
방사선학적 형태-
정상 고관절과
대퇴골두 무혈성
괴사가 있는
고관절에서의 비교
대한정형외과학회
지
33(1)177-1851998
김휘택김승욱김
정일서근택서정
탁유총일대퇴골
근위부의
방사선학적 형태-
정상 고관절과
대퇴골두 무혈성
괴사가 있는
고관절에서의
비교
대한정형외과학회
지
33(1)177-185199
8
유효 데이터 전후에
기타 정보가 표기된
경우
데이터 유지
20
친환경
도시건축계획에
관한 연구
Oekologisch
orientierte
Stadtplanung in
Seoul
Suedkorea(독문
명)
친환경
도시건축계획에
관한 연구
Oekologisch
orientierte
Stadtplanung in
Seoul Suedkorea
국문영문논문명
필드에 모두
데이터가 있고
영문논문명 필드에
한글로 (언어)
표기가 되어 있는
경우
(언어) 부분만 가베지
처리
21
ZFS symmetry
and parameters
in MR(임시등록)
임시등록데이터의
경우가베지 처리
3 논문명의 후반부가 잘린 경우
- 67 -
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1 합성과 논문명의 남은 부분이
극히 짧음가베지 처리
2 경영통계에 관련 논문명의 남은 부분이
극히 짧음가베지 처리
3
계층구조를
이용한 문서
클러스터 제목의
자동생성 기법
cluster
계층구조를
이용한 문서
클러스터 제목의
자동생성 기법
논문명의 남은 부분이
극히 짧음(영문논문명)
영문논문명
가베지 처리
4암호화된 위상
마스크를 이용한
New visual
cryptography
method based on
optical
interference
암호화된 위상
마스크를 이용한
New visual
cryptography
method based on
optical interference
논문명이
어느정도(2단어 이상)
남아 있음(국문논문명)
데이터 유지
5
metathesis
polymerization of
~
metathesis
polymerization of
~
논문명이
어느정도(2단어 이상)
남아 있음
데이터 유지
6 보편형식On universal
forms보편형식
On universal
forms
가베지 여부를
판단하기 난해함데이터 유지
7
점성유동장내에서
의 최대양력 익형
설계
The Optimal
Design
점성유동장내에서
의 최대양력
익형 설계
The Optimal
Design
영문 논문명에
데이터의 일부 -
두단어 이상 남아 있음
데이터 유지
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문명
최종학위영문논
문명최종학위국문논문명 최종학위영문논문명
1
석사순니켈의수소
취성에미치는Fe및B
의영향에관한연구
박사기계적합금화
에의해제조된ABA
B2형금속수소화물
의전극특성에관한연
구
기계적 합금화에
의해 제조된 AB
AB2 형
금속수소화물의
전극 특성에 관한
연구
석사논문 박사논문이
동시에 입력
최종(박사)
논문명만
유지한다
2
초임계이산화탄소를
이용한 마늘로부터
지방산 추출에 관한
연구(석사)
식품저장기간을연장
할수있는기능성필름
개발을위한항균성물
질추출및흡착에관한
연구
식품저장 기간을
연장 할수있는
기능성 필름 개발을
위한 항균성 물질
추출및 흡착에 관한
연구
석사논문 추정불가
논문이 동시에 입력
후반부의
논문명만
유지한다
3
GIS를 이용한
대학캠퍼스
공간분석(석사논문)
현재 인터넷 GIS를
이용한 경관평가
논문 준비중
GIS를 이용한
대학캠퍼스
공간분석
후반부가 준비중인
논문인 경우
준비중인 논문
가베지 처리
4 논문명이 두개 이상인 경우
- 68 -
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문명
최종학위영문논
문명최종학위국문논문명 최종학위영문논문명
1
(영)A Shift-first
Strategy for
Generalized LR
Parsing
A Shift-first
Strategy for
Generalized LR
Parsing
A Shift-first
Strategy for
Generalized LR
Parsing
()안의 언어표기만
제외하고 동일한
데이터
국문논문명만
유지하고
영문논문제
삭제 처리
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1
3d 전자계에 대한
NMR 이동
계산(Theoretical
calculations of
NMR shifts for
3dⁿsystems)
3d 전자계에
대한 NMR 이동
계산
Theoretical
calculations of
NMR shifts for
3dⁿsystems
한쪽의 필드에
데이터가 모두
입력된 경우
해당 필드로 이동
3
AStudyonLandslid
eofCuttingandBank
ingSlopeKFRI
Road 林道
盛土面의
崩괴에關한硏究
AStudyonLandsli
deofCuttingandBa
nkingSlopeKFRI
Road 林道
盛土面의
崩괴에關한硏究
국문 영문 구분없이
유지함데이터 유지
9
家庭用電氣製品
の親環境設計過
程への畵像流體
計測の適用に關
する硏究(A
Study on the
Design of Home
Appliances for
Energy Saving
Using PIV)
家庭用電氣製品の
親環境設計過程へ
の畵像流體計測の
適用に關する硏究
(A Study on
the Design of
Home Appliances
for Energy
Saving Using
PIV)
한쪽의 필드에
영문과 기타외국어
논문명이 모두
입력된 경우
데이터를 구분할
기준이 없으므로
데이터를 유지하고
국문논문명 필드로
이동
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1中韓兩國外銷美國
主要商品之比較硏
중한양국
대미수출
中韓兩國外銷美國主
要商品之比較硏究
논문명 필드 내
논문의 언어를해당 필드로 이동
5 국문영문논문명이 동일하나 (언어)가 표기 되어 있는 경우
6 국문영문 필드에 데이터가 뒤섞여 있는 경우
가 국문 영문을 구분하지 않고 국문논문명은 널이 아니어야 함
나 국문논문명(필수)이 널이고 영문논문명이 널이 아닐 경우 국문논문명으로 영문논문명
을 이동
다 중국어 논문명은 명확히 구분이 되는 경우만 정제하여 영문논문명 필드로 이동 - 일문
논문명 국문 논문명과의 구분 난해
- 69 -
究(중한양국
대미수출
주요상품의
비교연구) [1991년
경영학석사 논문
중국어]
주요상품의
비교연구
표기하여 명확한
구분 가능
No원본데이터 정제 후
데이터 유형 정제요령 비고취득국가코드 취득국가코드
1 KZ NTIS 국가코드와 불일치 널처리
2 오류 데이터 널처리
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 Takashi Tsuruo PhD Takashi Tsuruo PhD
2 유영면(자동차 부품연구원) 유영면(자동차 부품연구원) (기타정보)가 표기된 경우 데이터 유지
3 신현경 김정회 (공동) 신현경 김정회 (공동) 2명 이상인 경우 데이터 유지
4高橋照男(TAKAHASHI
TERUO)
高橋照男(TAKAHASHI
TERUO)(병음)이 표기된 경우 데이터 유지
5 송지복 박사 송지복 박사
교수명 앞뒤에 호칭이 붙은 경우 데이터 유지
6 이와바교수 이와바교수
7 Dr HT Hahn Dr HT Hahn
8 ProfDr NWiberg ProfDr NWiberg
9 C S George Lee aaaaa C S George Lee지도교수명 뒤에 의미없이
알파벳이 반복 나열된 경우
반복 나열된 알파벳 가베지
처리
10J Desmaism aaaaa
DBernacheJ Desmaism DBernache
2인의 지도교수명 사이에
의미없는 알파벳의 반복이 온 경우aaaaa 를 로 치환한다
11 김해구 김해구지도교수명 전후에 의미없는
특수문자나 파자가 존재하는 경우
의미없는 문자 가베지 처리
- 단 성명이 완전하지 않은
학력사항_취득국가 정제지침
1 취득국가코드가 NTIS 코드가 아닐 경우
가 취득국가코드가 NTIS코드가 아니면 널처리함
학력사항_지도교수명 정제지침
1 Null인 경우 정제대상에서 제외
2 필드내 지도교수명 외 기타 정보가 표기된 경우
가 필드내 유효 데이터의 존재 유무만을 중요시 함 유효 데이터가 존재하는 경우 데이
터의 형식 등에 큰 의미를 두지 않음
- 70 -
상황에서 성명이 들어갈
부분에 나 특수문자가
표기된 경우 데이터 유지
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 주강 주강
이름이 정확한지 불확실한 경우올바른 데이터인지 판단이
불가능 하므로 데이터 유지
2 김양 김양
7 공란 공란
3 홍길동 홍길동
4 Hiroyuki KIDO Hiroyuki KIDO
5 DH Youn DH Youn
한국 사람인데
영어(미국식)_이니셜로 표기된
경우
데이터 유지
6 Liu Hung Wen Liu Hung Wen한국 사람인데 영어(한국식)로
표기된 경우데이터 유지
7 이인원이상수 이인원이상수 지도교수가 2인 이상인 경우의
구분기호데이터 유지
8 오정무김상돈 오정무김상돈
9 庄子哲雄 庄子哲雄
일본식 이름의 표기법 데이터 유지
10 가네꼬 준이찌 가네꼬 준이찌
11 Kajiuchi Toshio Kajiuchi Toshio
12 대림성행 대림성행
일본 한자를 한글로 표기 데이터 유지
13 장욕천선대삼 장욕천선대삼
14 목도정부 목도정부
15 불상 불상 유효 데이터 여부 판단 난해 데이터 유지
16 지반 자바 지반 자바 외국어 이름을 한글로 표기 데이터 유지
17 Luo Luo
한국 교수의 성만을 표기한
것인지 외국인 교수의 이름인지
판단 난해
데이터 유지
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 N 가베지 데이터 데이터 가베지 처리
2 NA
3 필드내 데이터가 유효 값인지 판단하기 난해한 경우
가 유효 값인가 유효하지 않은 값인가 판단 자체가 불가능한 경우가 대부분 이므로 데이
터 유지를 기본으로 함
4 필드내에 기타 정보나 가베지 데이터가 존재하는 경우
- 71 -
3 none
4 해당없음
5 알수없음
6 모름
8 김교수 호칭하는 대상이 포괄적인 경우 데이터 가베지 처리
9 농과대학 근무처 또는 전공 정보 데이터 가베지 처리
10 대학원 학위 또는 학과 정보 데이터 가베지 처리
11 교수님 직위 정보 데이터 가베지 처리
12 지도교수명 가베지 데이터 데이터 가베지 처리
11 Kajiuchi Toshio Kajiuchi Toshio
12 대림성행 대림성행 일본 한자를 한글로 표기 데이터 유지
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 19871801 198702 월(MM)이 유효하지 않은
경우 - 졸업년월02월로 갱신
2 19871301 198703 월(MM)이 유효하지 않은
경우 - 입학년월03월로 갱신
3 19871301 198701월(MM)이 유효하지 않은
경우 - 최종학위취득일01월로 갱신
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 10780301 년도(YYYY)가 유효하지
않은 경우 - 공통
데이터 가베지
처리
No 원본데이터 정제 후 오류사항 정제요령 비고
학력사항_날짜유형(입학일졸업일학위취득일)
1 기본 지침
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMM
다 날짜 데이터가 유효하지 않은 경우
(1) 년도(YYYY)가 유효하며 월(MM)이 유효하지 않는 경우 졸업월(MM)은 02로 입학월
(MM)은 03으로 그리고 최종학위취득일(MM)은 01로 갱신
(2) 년도(YYYY)가 유효하지 않은 경우 데이터 가베지 처리
(3) 년도(YYYY)의 유효 범위
rarr 졸업일 입학일 최종학위취득일 1900 lt 졸업일 입학일 최종학위취득일 lt 현재
라 MM(월)이 없는 경우 졸업년월은 02월로 입학년월은 03월로 갱신
- 72 -
졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 1987 198702 월(MM)이 없는 경우 -
졸업년월02월로 갱신
2 1987 198703 월(MM)이 없는 경우 -
입학년월03월로 갱신
3 1987 198701월(MM)이 없는 경우 -
최종학위취득일01월로 갱신
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 19820301 19820301 19820301 입학년월과 졸업년월이
동일입학년월 유지
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 0201
년도가 없음 년도로
간주하더라도 유효하지
않은 데이터
데이터 가베지
처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
1한성대학교
산업시스템공학부한성대학교 정제 정제 처리
2(주)한정화학
총무과부장(주)한정화학 부장 정제 정제 처리
3연세대학교 공과대학
화학공학전공
연세대학교
공과대학정제 정제 처리
4연합철강공업(주) 입사
(국제그룹공채)연합철강공업 정제 정제 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
마 [입학년월 gt= 졸업년월]인 경우 입학년월 유지 졸업년월 가베지 처리
바 YYYY(년도)가 없는 경우 데이터 가베지 처리 정제대상에서 제외
경력사항
경력사항_근무처명 정제지침
1 근무처명이 null인 경우 정제대상에서 제외
2 근무처명에 직위 전공값이 있는 경우
3 가베지 데이터
- 73 -
1 중학교 총무처 군복무 현역 등
가베지 데이터 가베지 처리
2 가 나 다 몰라 가베지 처리 등
3 00 제2청사 (주)ㅇㅇ건설 000공무원 등
4 111163년10년1년106866 등
5 WHO COO aaa dkff saa 등
6 미국 일본 등
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
1 日本産業技術合究所 日本産業技術合究所
오류
가베지 처리
2 고려대학교 보건대학원 역학 I 보건정보학과 고려대학교 보건대학원 정제 처리
3 환경공학 국가기술개발 선도사업 (G-7 연구환경공학 국가기술개발
선도사업 (G-7 연구가베지 처리
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 교수 A01 교수 교수직위명과 일치하는 코드값을
찾아 매핑
2 위촉연구원 B07 위촉연구원 위촉연구원
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 조교수부교수교
수A01
조교수부교수
교수교수
완전일치gt 일치도가 높은
직위명 순으로 매핑
2 시간강사연구조
교A05
시간강사연구조
교시간강사
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
4 기타
경력사항_직위명 정제지침
1 직위코드와 직위명 모두 null인 경우 정제대상에서 제외
2 직위명은 있으나 직위코드가 null인 경우 직위명 검색하여 직위코드 입력
가 직위명과 정확히 일치하는 직위코드값이 존재하는 경우
나 직위명에 직위가 복수인 경우
다 정확히 일치하는 직위명이 검색되지 않는 경우
- 74 -
1 주임교수 A01 주임교수 교수 근사치의 코드값으로 매핑
2 시간강의 A05 시간강의 시간강사
이형정의
표 첨부
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 Professor A01 Professor 교수영문을 번역하여 이형정의표에
의거 코드값을 찾아 매핑
이형정의
표 첨부
2 Research Fellow B20 Research Fellow 전문위원
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 간호사 999 간호사 기타직위명과 일치하는 코드명이
없을경우 기타코드값으로 매핑
2 계장 999 계장 기타
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 36 연구원 B06 연구원 연구원기존의 직위코드를 NTIS
직위코드로 대체
2 13 조교수 A03 조교수 조교수
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 등재 직위명은 가베지 처리
2 ㅁㅁㅁ
라 직위명이 영문일 경우
마 상기 방법으로 매핑이 불가능한 경우
3 직위명과 코드가 모두 존재하는 경우
4 직위명이 오류인 경우(직위명 가베지)
- 75 -
No NTIS코드 코드명(생성) 이형정의(원본데이터) 비고
1 A01 교수
Professor
Prof
Faculty
(대학의)Teacher
Teaching
TeachingFellowship
학장 학장보
부학장 학과주임
학과장 학부장
학생처장
대학원장대학원장보
(대학의)교직원(대학의)교원
총장부총장
2 A02 부교수
AssociateProfessor
AssociateResearchProfessor
AssociateVisitingProfessor
3 A03 조교수AssistantProf
AssistantProfessor
4 A04 전임강사FullTimeLecturer
Instructor
전문강사 전담강사
강의전임 강의전담
전임대우
5 A05 시간강사
시간강의
PartTimeLecturer
PartTimeInstructor
6 A06 강사(기타) 강의 출강
7 A10 명예교수Honorary[Emeritus]Professor
HonoraryVisitingProfessor
8 A11 석좌교수 Chair Professor
9 A12 강의교수
10 A13 겸임교수
겸직교수
adjunctprofessor
adjunctprof
AdjunctFaculty
11 A14 계약교수
12 A15 기금교수
13 A16 대우교수
14 A17 연구교수
ResearchProfessor
ResearchFaculty
FacultyResearch
teachingresearcher
15 A18 초빙교수
초청교수
InvitedProfessor
ProfessorInvite
16 A19 객원교수
Visitingfaculty
visitingprofessor
aprofessorextraordinary
17 A20 조교
조수
Tutor
Assistant
UniversityAssistant
GraduateAssistant
GraduateAssociate
Teachingfellow
TeachingAssistant
TeachingAssociate
FacultyAssociate
TA RA GRA GSRA
18 A21 대학원생박사과정
석사과정
별첨 이형정의표
- 76 -
postgraduate
19 A22 POST-DOC
연수과학자
연수연구원
포스트닥터
포닥
박사후연수
박사후과정
박사후연구원
Post-Dr
Postdoctor
postdoctoral
visitingscholar
visitingfellow
Researchassistant
ResearchAssociate
20 A23 POST_MAS
21 B01 수석연구원 Principal Research Engineer
22 B02 책임연구원
연구책임자
SeniorResearchEngineer
SeniorResearch
SeniorResearcher
SeniorResearchStaff
SeniorInvestigator
23 B03 주임연구원
연구주임
AssistantResearchEngineer
AssistantResearcher
assitantInvestigator
24 B04 전임연구원AssociateResearchEngineer
AssociateResearcher
25 B05 선임연구원 선임-연구소의
26 B06 연구원
연구소장 연구보조원
연구원보연구생
연구개발원연구조원
연구주임연구조수
연구부담당자연구자
연구실장연구보조
연구팀장연구요원
연구센터장연구부처장
연구부문장연구대리
연구단장연구연구진
연구회원연구활동
방문연구 연구수
(연구소연구원연구센터연구실의)-
실장팀장원장부원장소장부소장
선임단장그룹장본부장계장인턴
장장 등
GraduateFellow
(연구소의)-Fellow
Research
Researcher
ResearchStaff
ResearchEngineer
Investigator
27 B07 위촉연구원
VisitingResearcher
VisitingResearchEngineer
VisitingInvestigator
GuestResearcher
GuestInvestigator
28 B10 수석연구위원
29 B11 책임연구위원
30 B12 주임연구위원
31 B13 전임연구위원
32 B14 선임연구위원
33 B15 연구위원
34 B20 전문위원ResearchFellow
ReserchFellowship
35 B30 책임기술원책임기사
기술책임자
SeniorEngineer
ChiefEngineer
- 77 -
PrincipalEngineer
SeniorTechnical
36 B31 선임기술원 선임기사 선임엔지니어
37 B32 기술원
(주식회사의)-기사
엔지니어기술사
기술팀장기술센터장
기술직기술주임
기술담당기술처장
기술직사원
Engineer
Technician
TechnicalStaff
TechnologyStaff
38 C01 공무원
연구사연구관
주사주사보
보좌관기좌
기사보사무관
군무원서기관
이사관조사원
청장차관
자문관비서관
장관행정관
담당관기원
경찰분석관
서서서기보조무원
보건지소장보건소장
보건소영양사보건진료원
보건진료소장지도관
지도사보
(행정기관의)-토목급
(행정기관의)-심사관
(행정기관의)-지도원
(행정기관의)-지도사
(공공기관)-기사
(공사의)-급
39 C02 법조인
심판관변리사
재판관검찰관
변호사법무조정위원
법제이사법의관
법의학감식관
40 C03 의사
전문의전임의
전담의담당의
인턴레지던트
객원의공중보건의
수련의임상의
전공의주치의
의사보일반의
상담의인정의
지도의병원장봉직의
(병원의)-과장부장처장등
Clinician
Intern
Resident
Doctor
Attending
41 C04 교사 (초~고교의)-교원
42 C05 군인
(군관련)-교관소대장
병장교소령
소위대위
군의관의무관
군하사중위
중대장보충역
제대소령
참모의무자문관
기무사기무사보
기무관
43 D01 대표이사
CEO대표
사장법인장
President
44 D02 이사
부사장이사보이사대우
Director
viceDirector
associateDirector
VicePresident
SeniorExecutiveVicePresident
45 D03 전무SeniorManagingDirector
CFO
- 78 -
46 D04 상무 상무보
47 D05 부장
부장대리
DepartmentManager
GeneralManager
48 D06 차장
DeputyGeneralManager
DeputyDirectorGeneral
AssistantDirector
AssistantDirectorvice-chiefManager
49 D07 과장
Manager
GeneralManager
DepartmentManager
DeputyManager
50 D08 대리 Assistant Manager
51 D09 사원 회사원직원
52 999 기타
53 회원(삭제)
No원본데이터 정제 후
오류사항 정제요령 비고근무시작일 근무종료일 근무시작일 근무종료일
1 2005 2007 20050101 20070101 월 없음 월에 01 입력
No원본데이터 정제 후
오류사항 정제요령 비고생년월일 근무시작일 근무종료일 근무시작일 근무종료일
1 19500101 19000101 19400101 유효 범위 오류 삭제처리함
경력사항_날짜유형(근무시작일 근무종료일) 정제지침
1 기본 지침
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMM
다 날짜 데이터가 유효하지 않은 경우
(1) 년도(YYYY)가 유효하며 월(MM)이 유효하지 않는 경우 01로 입력
(2) 년도(YYYY)가 유효하지 않은 경우 데이터 가베지 처리
(3) 년도(YYYY)의 유효 범위
rarr 근무시작일 근무종료일 1900 lt 근무시작일 근무종료일 lt 현재
rarr 근무시작일 근무종료일 생년월일lt근무시작일 근무종료일
라 [근무시작일 gt= 근무종료일]인 경우 근무시작일 유지 근무종료일 가베지 처리
- 79 -
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1한국산업인력
관리공단
건설기계기
사1급1994-12-01
건설기계기사
1급
한국산업인
력관리공단1994-12-01 오류 해당필드로 이동
2치과의사면허
증1993-01-01 보건복지부
치과의사면허
증보건복지부 1993-01-01 오류 해당필드로 이동
3중등 2급
정교사자격증 문교부
중등 2급
정교사자격증문교부 오류 해당필드로 이동
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1워드 프로세서
2급
워드
프로세서
2급
1999-06-01워드
프로세서 2급 1999-06-01 중복 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 발행처 2004-03-01 가베지 가베지 처리
NO원본데이터(가베지) 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 111 222 0000 가베지 가베지 처리
2 상동
No원본데이터 정제 후
오류사항 정제요령 비고근무시작일 근무종료일 근무시작일 근무종료일
1 20050501 20040601 20050501 [근무시작일 gt=
근무종료일]인 경우
근무종료일 가베지
처리
자격사항
자격사항 정제지침
1 자격증명 자격발행처 자격취득일이 모두 null인 경우 정제대상에서 제외
가 자격증명값이 NULL인 경우 나머지 데이터(자격발행처 자격취득일) 모두 가베지 처
리
2 자격증명 자격발행처 자격취득일 각 필드값이 뒤바뀐 경우 처리방법
3 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값이 나올 경우 처리방법
4 자격증명 필드값이 NULL인 경우 처리방법
5 가베지값 처리방법
- 80 -
3 일본
4 없음
NO원본데이터(오탈자) 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 화공기사1급ssssssssssssss 화공기사1급
오탈자데이터 수정 및
가베지 처리
2 충북졍찰청
3 박물관amp8228미술관 정학예사 3급미술관
정학예사 3급
4초경U항공기조종사면허1111111111111
111111111111111111111증
초경량항공기
조종사면허증
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
1 1루프캐리어
이송장치
루프캐리어
이송장치1
루프캐리어
이송장치중복 가베지 처리
2 1 1019990060031101999006003
1 가베지 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
1 1특허등록 제
0290068호 가베지 가베지 처리
2 1 1313131 아자차카 가베지 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
6 기타 처리방법
지식재산권
지식재산권 정제지침
1 특허구분 출원등록번호 지식재산권명이 모두 null인 경우 정제대상에서 제외
가 지식재산권명이 NULL인 경우 나머지 데이터 모두 가베지 처리
2 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값 상이값이 나올 경우 처리방법
3 지식재산권명 필드값이 NULL 가베지값인 경우 처리방법
4 가베지값 처리방법가 출원등록번호 지식재산권명으로 볼 수 없는 데이터는 가베지 처리
- 81 -
1 3자리 이하의
숫자특허
가베지 가베지 처리
2 한국 드릴
3 완료 국제
4 미정 마바
5 이름 사아
6 출원중 파하
7 경상현 가나
8 미지정 다라
9 공개중 카타
10 미입수 혜천
NO원본데이터 정제 후
데이터 유형 정제요령 비고지식재산권명 지식재산권명
1 光微粒子の製造方法 光微粒子の製造方法 오탈자 가베지 처리
2 양자우물amp8228세선의 제작방법 양자우물amp8228세선의 제작방법 오탈자 가베지 처리
3 94-26592 94-26592 오탈자 가베지 처리
NO원본데이터 정제 후 데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 총무
아태물리학회(Associati
on of Asia-Pacific
Physical Societies)
아태물리학회(Associa
tion of Asia-Pacific
Physical Societies)
총무 오류 데이터 이동
2 ASG 없음 Member ASG Member 가베지 가베지 처리
NO원본데이터 정제 후 데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
5 기타 처리방법
소속학협회
소속학협회현황 정제지침
1 학협회명 직위 담당업무 모두 null인 경우 정제대상에서 제외
가 학협회명값이 NULL인 경우 나머지 데이터 모두 가베지 처리
2 학협회명 직위 담당업무 각 필드값이 뒤바뀐 경우
3 해당 필드에 이미 유효 값이 존재하는데 다른 필드값도 나올 경우
- 82 -
1대한병리학회
임상병리학회
대한병리학회
경남(부산)회장
대한병리학회
임상병리학회
대한병리학회
경남(부산)회장 중복 데이터 유지
명칭포함
유지
2한국자원공학회
이사 한국자원공학회 이사 오류 데이터 이동
3여성생명과학기
술포럼 회원운영위원 학술위원
여성생명과학기술
포럼운영위원 학술위원 중복 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 편집위원 가베지 가베지 처리
2 종신회원 명예회장 가베지 가베지 처리 학협회명 아님
3 회원 해당없음 가베지 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 ㄴㄴㄴ 111 eee 20 q 등
가베지 가베지 처리
2 없음 해당없슴 등재
3 화공기사 1 급 덕있으마
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 일본 학회 기타 가베지 처리
NO 원본데이터 정제 후 데이터 정제요령 비고
4 학협회명 필드값이 NULL값인 경우
5 가베지값
6 기타
훈포장사항
훈포장사항 정제지침
1 수여기관명 훈포장명이 모두 null인 경우 - 정제대상에서 제외
가 훈포장명이 NULL인 경우 나머지 데이터 모두 가베지로 처리
2 수여기관명 훈포장명 각 필드값이 뒤바뀐 경우
- 83 -
수여기관명 훈포장명 수여기관명 훈포장명 유형
1 장영실상 과학기술부 과학기술부 장영실상 오류 해당필드로 이동
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 대통령 대통령 대통령 대통령 중복 데이터 유지 대통령 상
2우수논문발표상 -
포스터 부문
우수논문발표상 -
포스터 부문
우수논문발표상 -
포스터 부문중복
데이터 가베지
처리
3 국무총리 표창 국무총리 표창 국무총리 국무총리 표창 중복데이터 가베지
처리
4 광혜학술상 광혜학술상 광혜학술상 중복데이터 가베지
처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 대한민국 정부 오류데이터 가베지
처리
훈포장명 데이터
null값
2 한국물리학회 한국물리학회 오류데이터 가베지
처리
훈포장명 데이터가
가베지값
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 222 111데이터 가베지 처리
2 회원 등재등
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 제어amp8228자동화amp8228시스템공학회 제어amp8228자동화amp8228시스템공학회오탈자
데이터 유지 수정
및 가베지 처리
파일생성 형식에
따른 오류
2 ㅈ조선대총장 조선대총장
3 해당 필드에 이미 유효 값이 존재하는데 다른 필드에서 동일값이 나올 경우
4 훈포장명 필드값이 NULL값인 경우
5 가베지값
6 기타
저역서실적
저역서실적 정제지침
- 84 -
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 3차원
인체해부도1 UBCare
3차원
인체해부도 1 UBCare 오류
해당필드로
이동
2신흥인터내
셔날
소아
청소년치과학1
소아
청소년치과학 1 신흥인터내셔날 오류
해당필드로
이동
3 動力學Engineering
Mechanics2 普文堂 動力學
Engine
ering
Mechan
ics
2 普文堂 한자명 그대로 유지
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1고분자
공학 II
고분자 공학
II1 희중당
고분자 공학
II 1 희중당 중복 가베지 처리
2 주조응고일본금속학회
[주조응고]2
반도출판
사
일본금속학회
[주조응고] 2 반도출판사 오류
해당필드로
이동
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 1
가베지전체 데이터
삭제
2물리강의(20
9쪽)일서 2 대웅
3 wjswktkdrjfo
qhdks rltnf1 생능출판사
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 Polymer Surface
Dynamics 공동저서
Polymer Surface
Dynamics 공동저서 이동 데이터 이동
2
The Handbook of
Groundwater
Engieering-지하수공학에
있어서 지리정보시스템
The Handbook of
Groundwater
Engieering-지하수공
학에 있어서
지하수공학에
있어서
지리정보시스템
The Handbook of
Groundwater Engieering중복 데이터 수정
1 국문저서명 영문저서명 저역서 구분 발행처명이 모두 null인 경우 - 정제대상에서 제외
가 국문저서명 영문저서명 둘 다 NULL인 경우 나머지 데이터 모두 가베지 처리
2 국문저서명 영문저서명 저역서구분 발행처명 각 필드값이 뒤바뀐 경우
3 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값 상이값 나올 경우
4 국문저서명 영문저서명 필드값이 NULL값이거나 가베지값인 경우
5 국문저서명이 널이고 영문저서명이 널일 아닐 경우 국문저서명으로 이동함
- 85 -
지리정보시스템
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 ㅁ 기지이전사업 기획서 YRPMPKOREA 기지이전사업 기획서 YRPMPKOREA 오자 가베지 처리
2 최신 EDICALS 최신 EDI CALS 오자 데이터 유지
3 보호 야동식물 보호 야생 동식물 오자
가능한
범위에서
수정
4 ISBN 1-59033-891-XInequality Theory and
Applications (III)
Inequality Theory and
Applications (III)가베지
가베지 처리
ISBN 필드로
이동
5 NHealth Insurance
Reform In Korea
Health Insurance
Reform In Korea가베지 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 1111 2 골든벨
가베지 가베지 처리
2
곽수동
고필옥
김무강
범문사
3 ㄷㄷㅁㅁ 1
4 (주)지학사 1 (주)지학사
6 오탈자
7 가베지 데이터
논문실적
논문실적 정제지침
1 최종학위국문논문명과 최종학위영문논문명이 모두 null인 경우 정제대상에서 제외
2 논문명 필드에 기타 정보나 가베지 데이터가 존재하는 경우
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 추후입력 가베지 가베지 처리
2 미정 가베지 가베지 처리
3 가베지 가베지 처리
- 86 -
구분 항목 세부항목 항목수단위별
가중치()
참여
인력
정보
기본정보
주민등록번호 성명 자택주소 자택
우편번호 자택전화번호 핸드폰번호
7 31
소속기관사항
소속기관명 부서명 직위명 사무실
전화번호 기관주소 최초임용일 인
력(직업)구분
7 185
학력사항
전공 취득대학 학위 입학일 졸업
일 학과 취득국가 지도교수명 학위
논문명 학위취득일
10 21
16 데이터 검수
161 데이터 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
162 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 87 -
구분 항목 세부항목 항목수단위별
가중치()
경력사항 근무처명 직위명 근무기간 3 45
자격사항 자격발행처 자격증명 자격취득일 3 25
논문실적
논문발표일 국문논문명 영문논문명
저자역할구분 발행처 학술지구분
학술지명 SCI여부
8 105
지식재산권 지식재산권명 출원_등록번호 특허구분 3 25
계 소계 41 905
평가
위원
소속학협회현황 담당업무 직위 학협회사항 3 3
훈포장사항 수상년월 수여기관명 훈포장명 3 25
저역서실적국문저서명 영문저서명 발행년 발
행처 저역서구분5 4
소계 11 95
계 52 100
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
150 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
성명 100자택주소 10자택우편번
호
20
자택전화번 10
항목별 오류율 산정 기준 정의
- 88 -
호
핸드폰번호 10E-mail 10소계 310
소속기
관사항
(7개)
소속기관명 100
부서명 05
직위명 20
사무실전화
번호
10
기관주소 30
인력(직업)구
분
10
최초임용일 10
소계 185
학력사
항
(10개)
전공 20
취득대학 100
학위 20
입학일 10
졸업일 10
학과 15
취득국가 15
지도교수명 05
학위논문명 05
학위취득일 10
소계 210
경력사
항
(3개)
근무처명 20
직위명 15
근무기간 10
소계 45
자격사
항
(3개)
자격발행처 05
자격증명 10
자격취득일 10
소계 25
논문실
적
(8개)
논문발표일 10논문명1 10
논문명2 05저자역할구
분
05
발행처 05학술지구분 05학술지명 10
SCI여부 05
소계 105
지식재
산권
지식재산권
명
10
- 89 -
(3개)
출원_등록번
호
05
특허구분 10소계 25
평가 소속학
협회현
황
(3개)
담당업무 05
위원 직위 05
(11개) 학협회사항 20
소계 30
훈포장
사항
(3개)
수상년월 10
수여기관명 05
훈포장명 10
소계 25
저역서
실적
(5개)
저역서명1 10
저역서명2 05
발행년 10
발행처 05
저역서구분 10
소계 40
계 1000
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 03
품질지표기준점수산정(데이터1
건기준)=오류유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 005
계 6개 오류유형 1
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
- 90 -
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
3000 3 055 150 000825
성명 10 2 035 100 000350자택주소 3 0 000 10 000000자택우편번
호
3 2 035 20 000233
자택전화번
호
4 0 000 10 000000
핸드폰번호 6 0 000 10 000000E-mail 9 0 000 10 000000소계 45 7 125 310 001408
소속기
관사항
(7개)
소속기관명 1000 20 100 000000부서명 80000 200 05 000000직위명 80000 200 20 000000사무실전화
번호
80000 200 10 000000
기관주소 80000 200 30 000000인력(직업)구
분
80000 200 10 000000
최초임용일 80000 200 10 000000소계 481000 1220 000 185 000000
계 1000 01
주민등록번호 한글성명 영문성명 한문성명자택우편번
호
630421-0000000 백중환Joong hwan
Baek
412220
(형식 015)
630421-0000000 백종석Baek Jong
Seok
6304210000000
(형식 015)백인열 Baek IN Youl 白寅烈 711-822
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
국가RampD참여인력 100000건 100000건 3000건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
검사물량 집계표 예시
오류율산정표 예시
검수데이터 예시
- 91 -
630421-0000000 백승호
(오기 02)백제훈
630421-0000000 백종완
630421-
(오기 02)백장선 Jangsun Baek
白壯선
(형식 015)
502-
(오기 02)
630421-0000000 백승호1213132
(오기 02)
630421-0000000 백석형
630421-0000000 백석형
품질지표별
기준점수의
합
055 035 035
데이터별 품질지표 기준 점수
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 03
품질지표기준점수산정(데이
터1건기준)=오류유형별점수
의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 005
계 6개 오류유형 1
- 92 -
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수
기관마다 다름
hurims에 각 기관별 인력관리번호와 NTIS 인력관리번호매핑표관리함
RNO 주민등록번호 필수
-포함한 14자리 일 경우만 연계함
주민등록번호는 기관마다 유일해야 하는데 특정기관은주민등록번호 1개 당 n개의 인력관리번호 존재하는 경우 있음
=gt 연계기관에 연락해서 주민번호 중복되지않게 요구해서 처리
=gt 현재는 맨 처음 해당 데이터의 인력관리번호만 유지
KOR_PSN_NM 한글성명 필수
한글성명은 처음 hurims에 insert될때만 반영하고 update될때는반영하지 않음
기관마다 실명인증을 안 하는 곳이 있기 때문에 같은주민번호인데 성명이 다른 경우가 있음
CHN_PSN_NM 한문성명(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
ENG_PSN_NM 영문이름(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
ZIP_CD 우편번호
(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
hurims에 우편번호||주소1||주소2가 널일 경우만 반영ADDR1 주소1ADDR2 주소2
HOME_TEL_NO 집전화(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
CP_NO 핸드폰번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
EMAIL E-mail(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
MSTR_CLS_CD1 부처(기관)코드1
123에 대중소의 코드를 넣는게 아니라 각각의 분류를 넣어야함
매핑정보가 없으면 반영 못함
1n으로 매핑되는 경우 처음 select 되는 최하위 분류로 매핑함
현재 ntis에는 분류명을 저장하는 필드가 없음=gt분류명은 반영안함
MSTR_CLS_NM1부처(기관)분류명1
MSTR_CLS_CD2부처(기관)분류코드2
MSTR_CLS_NM2부처(기관)분류명2
MSTR_CLS_CD3부처(기관)분류코드3
MSTR_CLS_NM3부처(기관)분류명3
17 데이터 이관
참여인력 기본정보 이관 방안
- 93 -
MP_TYPE 평가위원구분Y일 경우 평가위원 pool Db에 자동 등록함
=gt N 또는 Null일 경우 기존에 평가위원 이면 반영 안함
GENDER_DIV_CD 성별구분 없을 경우 주민번호로 판별
BDT 생년월일 없을 경우 주민번호로 판별INFO_OPEN_SLCT 정보공개구분 없을 경우 비공개로 저장
PINFO_OFR_USE_APR_YN
개인정보제공활용동의여부
N일 경우 최종수정일을 기준으로 기존 동의에서 비동의로변경함
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG 데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
HM_ID 인물ID 인물아이디는 기관에서 넣지 않아도 됨
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
ORG_NM 기관명 필수
hurims에 기관이형DB에 존재하면 대표기관명이형기관코드를 저장하고 없을 경우에는 기관명을그대로 hurims에 저장하고 정제 및 신규 발급을 통해매핑해야함
WORK_DEPT_NM 근무부서명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
POSITION_NM 직위명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
직위명으로 자동코드 매핑하고 직위코드가 없으면 기타999코드로 저장하고
직위명필드에는 연계기관의 직위명 그대로 저장함
ZIP_CD 우편번호
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
hurims에 우편번호||주소1||주소2가 널일 경우만 반영ADDR1 주소1ADDR2 주소2OFFICE_TEL_NO 사무실전화
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
중복체크 기준
- 주민등록번호(주민등록번호 성명이 없으면 반영하지 않음)
소속기관 사항 이관
- 94 -
FIRST_EMP_DT 최초임용일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MP_TYPE 인력구분기관에서 넣지 않아도 되고 기관이형DB에 의해 자동매핑됨
HOFF_DIV_CD 재직구분코드
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일경우에는 재직중으로 인정함
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장
ORD_NO 순번 필수 hurims의 순번으로 저장
DEGREE_ACQ_UNIV_NM 학위취득대학명 필수
hurims에 기관이형DB에 존재하면 대표기관명이형기관코드를 저장하고 없을 경우에는 기관명을그대로 hurims에 저장하고 정제 및 신규 발급을 통해매핑해야함
SDEPT_NM 학과명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
학과명으로 코드매핑하고 매핑안되면 학과명필드만반영함
매핑안된 학과명은 나중에 정제 작업에 의해 매핑함
MAJOR_NM 전공명 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
전공명으로 코드매핑하고 매핑안되면 전공명필드만반영함
매핑안된 전공명은 나중에 정제 작업에 의해 매핑함
GRAD_DT 졸업일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함ENT_DT 입학일 필수 날짜가 1900년 이전이거나 현재보다 크면 삭제함DEGREE_CD 학위구분 필수
ACQ_NAT_CD 취득국가코드(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
DEGREE_ACQ_DT 학위취득일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
소속기관명이 없을 경우 반영하지 않음
학력 사항 이관
- 95 -
ADVISOR_NM 지도교수명기관에서 넣지 않아도 되고 기관이형DB에 의해 자동매핑됨
KOR_THESIS_NM
학위논문제목국문
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일경우에는 재직중으로 인정함ENG_THESIS_NM
학위논문제목영문
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장
ORD_NO 순번 필수 hurims의 순번으로 저장
WORK_ORG_NM 근무처명 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
POSITION_NM 직위명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
WORK_START_DT 근무시작일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
WORK_END_DT 근무종료일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
학위취득대학명 학위가 없을 경우 반영하지 않음
경력 사항 이관
- 96 -
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
INSTIT_LST 학협회명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
POSITION_NM 직위 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용INSTIT_JOB_NM 담당업무
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
INSTIT_ACT_START_DT 학회활동시작일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
INSTIT_ACT_END_DT 학회활동종료일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
CERT_NM 자격증명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
CERT_ISSUE_ORG_NM 자격증발행처 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
CERT_ACQ_D 자격취득일 필수 중복 체크하는 기준에만 쓰임
근무처명이 없을 경우 반영하지 않음
소속 학협회 사항 이관
학협회명이 없을 경우 반영하지 않음
자격 사항 이관
- 97 -
Tinsert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
KOR_PAPER_NM 논문제목국문 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
ENG_PAPER_NM 논문제목영문
중복 체크하는 기준에만 쓰임
insert 할때만 적용
PAPER_PUB_DT 논문발표일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ROLE_SLCT 역할구분(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_ORG_NM 발행처명(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
JRNL_NM 학술지명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
JRNL_SLCT 학술지구분 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용SCI_TYPE_SLCT SCI여부
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
ISSN ISSN번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_BK 게재권집(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_ISSUE 게재호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
START_PG 시작페이지(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
END_PG 종료페이지 (최종수정일이 최신이고 널이 아님) 또는 (hurims가
자격증명이 없을 경우 반영하지 않음
논문실적 이관
- 98 -
널일)때 update에 반영CO_AUTHOR_NM 공동저자명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
PTAPP_SLCT 특허구분 필수(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PTAPP_REGIST_NO 출원등록번호 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
IPR_NM 지식재산권명 필수(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
ACQ_DT 취득일 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ACQ_SLCT 취득구분
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
공동활용항목에 없는데 널일경우 무엇으로 봐야하나(확인요)
PTAPP_REGIST_NAT_CD
출원등록국가코드
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일 경우에는 대한민국으로 자동 반영함(확인요)MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
논문명이 없을 경우 반영하지 않음
지식재산권실적 이관
- 99 -
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
TRNSWRT_SLCT 저역서구분 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
KOR_TRNSWRT_NM 국문저역서명 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
PUB_ORG_NM 발행처명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
PUB_YR 발행년도 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ISBN ISBN번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
AWARD_NM 수상명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
AWARD_ACQ_YM 수상년월 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
AWARD_GRANT_ORG_NM 수여기관 필수 중복 체크하는 기준에만 쓰임
지식재산권명 출원등록구분 특허구분 출원등록번호가 없을 경우 반영하지 않음
저역서실적 이관
저역서명 저역서구분이 없을 경우 반영하지 않음
훈포장실적 이관
- 100 -
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드 훈포장명이 없을 경우 반영하지 않음
- 101 -
2 인력정보 영문이력 입력 매뉴얼
21 개요
211 목표
연구자 이력정보 영문 번역을 통한 DB 구축(1000건)
- 영문이력 번역 대상 항목 선정
기본정보 재직기관 최종학위 경력사항 논문실적 연구실적 특허
- 영문이력정보 관리 기능 개발 및 영문이력DB 구축
- 영문이력DB에 대한 본인확인 안내메일 발송
인물정보에 대한 영문 검색서비스 제공
212 DB구축 공정
- 102 -
항 목 세 부 항 목 영문명 비고
기본(BasicInformation)
기본정보 영문성명 English Name - 한글이력정보와 공동 사용- 전문분야는lsquo08 개정 분류코드 영문명 활용
휴대전화(국가번호)
Cellular PhoneNumber
E-mail E-mail
개인홈페이지 Homepage
전문분야 전문(연구)분야 Research Field 1
Research Field 2
Research Field 3
검색키워드 전문분야명 입력
재직기관(organization)
기관명 Organization Name - 현재 재직기관사항 1개 입력
부서명 Department
직위 Job title(position)
우편번호 Postal Code
주소 Address
전화(국가번호) Telephone
팩스(국가번호) Fax
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) Degree Code
학위취득일 GraduationDate
학교명 School
전공명 Major
22 DB구축 목록 및 범위
221 DB구축대상 및 항목 정의
DB구축대상 수집된 영문 이력서 번역 및 희망자에 대한 이력정보 번역
- 수집된 이력서 번역
middot 수집된 한글이력서 반영하여 번역 수행
middot 수집된 영문이력서 입력
- 이력서 번역 대상자
middot 참여인력 또는 평가위원 서비스 대상자
middot 논문실적 경력사항 등의 데이터가 충실한 인력
DB구축 대상 항목 정의
- 103 -
경력(Career)
경력사항(CAREER)
시작년월 Start Date - 재직 경력으로 주요 경력입력 현 재직정보제외
종료년월 End Date
재직기관명 Organization Name
직위 Position(Job Title)
실적ResearchResult
논문실적(paper)
논문명 Title - 최근 5년 이내만 입력
저널명 Journal Name
게제(권)집 Volume
게제호 Number
시작페이지 Start Page
종료페이지 End Page
게제년월 Date of Publication
공동저자명 Co-Author
비고 Etc
연구실적ResearchProject
시작년월 Start Date
종료년월 End-Date
발주기관 Funding organization
참여구분(역할)-코드
Role
연구실적명 title
특허(patent)
출원등록구분-코
드
appliedregistered
출원등록번호 number
출원등록국가-코
드
National Code
특허출원명 Patent name
출원등록일자 Date
- 104 -
항 목 세 부 항 목 비고
기본(BasicInformation)
기 본정보
영문성명 - 각각 형태가 다른 영문성명을ldquoGilDong Hong 형태로 변경 필요
T
휴대전화(국가번호)
- 휴대전화를 표준형태로 변경 필요(외국 휴대전화만 국가번호 표시)middot 대한민국 010--middot 외국 +국가번호---
T
E-mail abctestcom 형태 T
개인홈페이지
입력 시 http을 제외하고 입력T
전 문분야
전문(연구)분야
- 전문분야는 lsquo08 개정 분류코드 영문명 활용
- 본인 확인에 의해 본인이 직접 선택하도록 함
- 검색키워드 필드에 전문분야명을 입력
재 직기관(organization)
기관명 - 대표기관명- 기관명이 주소정보에 포함되어 있는경우 존재
부서명 - 부서명이 주소정보에 포함되어 있는경우 존재
직위 - 여러개의 직위 존재우편번호 - 주소정보에 기관명 부서명 포함되어
있는 경우 존재- 영문우편번호DB를 이용 가능
주소
전화(국가번호)
- 전화번호를 표준형태로 변경 필요(외국 전화만 국가번호 표시)middot 대한민국 042--middot 외국 +국가번호---
T팩스(국가번호)
학력(Academiccarrer)
최 종학위(FinalDegree)
학위(코드) - 8 박사- 5 석사- 2 학사
C
학위취득일 - YYYY-MM-DD형태 D학교명 - 대표기관명전공명
경력(Career)
경 력사항(CAREER)
시작년월 - YYYY-MM형태 D종료년월 - YYYY-MM형태 D
재직기관명 - 부서명 포함직위 - 여러개의 직위 존재
실적ResearchResul
논 문실적(paper
논문명 - 영문제목 일부 존재저널명
23 데이터 분석 내역
231 세부 항목별 영문이력정보 분석
번역을 위한 영문이력정보 분석
∙ D 날짜형태변환 C 코드화 T 표준형태변환
- 105 -
t ) 게제(권)집
게제호시작페이지종료페이지게제년월 - YYYY-MM형태 D공동저자명 - 공동저자명이 구분자로 N명이상 존
재연 구실적ResearchProject
시작년월 - YYYY-MM형태 D
종료년월 - YYYY-MM형태 D발주기관참여구분(역할)-코드
A 연구책임자B 참여연구원
C
연구실적명 - 영문제목 일부 존재특허(patent)
출원등록구분
-코드C
출원등록번호출원등록국가
-코드C
특허출원명출원등록일자
- YYYY-MM-DD형태D
항 목 세 부 항 목
기본(BasicInformation)
기본정보 영문성명
휴대전화(국가번호)
개인홈페이지
전문분야 전문(연구)분야
재직기관(organization)
기관명
부서명
24 DB구축 절차 및 작업 지침
241 DB구축 지침
DB구축 내용
수집된 연구자 영문 이력서 입력을 통한 DB 구축
연구자 이력정보 영문 번역을 통한 DB 구축
DB구축 항목
DB구축 대상 항목
- 106 -
직위
우편번호
주소
전화(국가번호)
팩스(국가번호)
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드)
학위취득일
학교명
전공명
경력(Career)
경력사항(CAREER)
시작년월
종료년월
재직기관명
직위
실적ResearchResult
논문실적(paper)
논문명
저널명
게제(권)집
게제호
시작페이지
종료페이지
게제년월
공동저자명
비고
연구실적ResearchProject
시작년월
종료년월
발주기관
참여구분(역할)-코드
연구실적명
특허(patent)
출원등록구분-코드
출원등록번호
출원등록국가-코드
특허출원명
출원등록일자
- 107 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
DB구축
준비
계획 수립
번역대상자분석 번역대상자 데이터 분석 대상자 선정 분석 내역 작성
절차 협의선처리 번역 번역확인전문가검수 본인확인KISTI검수
DB구축 대상 확정
매뉴얼 작성
입력 매뉴얼 구성내용
DB구축 개요 및 절차정의
DB구축 대상정의 및 범위
입력 항목별 기준 및 예시
입력프로그램 사용법
전환 코드표
표준 양식
입력 매뉴얼 검토및 확정
입력 매뉴얼 초안작성
상세일정계획수립
입력 량을 분석하여 투입인력대비 주월별 입력 계획대비 실적 산정
일정 검토 및 확정 일정계획 작성
작업 환경구축
작업 환경 및번역자 구성 입력 환경 구성
번역자 선정
영문이력정보 관리기능 개발
입력 교육 실시
번역자를 대상으로 교육실시 및 교육결과서 작성
입력작업 교육 실시
DB구축진행
선처리번역번역확인전문가검수
선처리번역번역확인전문가검수
DB구축 추진결과번역 및 품질활동수행
추진현황보고 실적 보고실적 확인 및 이슈사항 협의
주별진척보고
이슈사항 및 문제점 보고
DB구축완료
서비스DB이관 검수및 납품
서비스DB이관
완료된 영문이력DB의서비스화 이관 확인 데이터 이관
데이터 검수(최종 확인)
영문이력 DB 검사 (샘플링 검수) 검수(샘플링)
검수 데이터 추출제공
242 DB구축 단계별 작업 지침
243 DB구축 항목별 세부지침(선처리)
공통사항
Ⅰ 공통사항
1 기존에 존재하는 영문명은 입력된 그대로 유지하되 일부 정제 필요
- 108 -
원본데이터 입력데이터 입력요령
H20 A2 H20 A2
- 서식에 의한 특수문자는 텍
스트 형태 그대로 입력함
k- iexcl k - ε
- 수식도구에 의한 특수문자는
특수문자표를 참조하여 호환되
는 경우에만 입력하고 그렇지
않으면 수식만 제외하고 입력
참고3 특수문자표
원본데이터 번역데이터 입력요령
문장의 첫 단어
이름장소 등 고유명사
직함칭호의 축약형
1인칭 주어
도시이름월요일휴일시대 등
단어의 시작글자 대문자 표기
책글노래영화제목 등
a an and at by for in
of로 시작할경우
a an and at by for in of
를 제외한 시작문자 대문자로
표기
장소를 지칭하는 고유명사
internet 등Internet 시작문자 대문자 표기
국가언어등을 지칭하는 단어
(고유명사 일반명사의 개념)시작문자 대문자 표기
교과 과목명 시작문자 소문자로 표기
외국기관명 외국대학명 논문제목 연구제목 등
2 한글영문 이외의 표기된 외국어는 그대로 유지
(단 한글영문을 일부 포함한 외국어는 번역 시행)
3 모든 항목은 좌우의 공백을 제거하고 입력
가 줄바꿈 문자나 좌우의 공백문자를 제거하고 입력
나 데이터 사이에 공백문자가 두 개 이상인 경우에는 공백문자를 한 개로 입력
4 휴대전화 및 전화번호는 대한민국의 경우에는 국가번호를 표시하지 않고 외국의 경우에
만 국가번호(+국가번호)를 표시함
5 특수문자의 입력
6 대소문자 규칙
가 번역의 경우 대소문자 표준 준수
해당 기관홈페이지에 표기되어있는 공식영문명칭의 대소문자에 따라 선처리 및 번역
단 번역 시 단어 시작글자만 대문자료 표기
- 109 -
사이트명 url 비고
NAVER 백과사전 http100navercom 기관명 홈페이지 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr기관명 홈페이지 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 기관명 검색서비스
KIS-Report httpwwwkisreportcom한국신용평가정보 기업보고서
국내일반기업 영문명 기재
KJTRANS httpwwwkjtranscokr학교 및 연구기관 분야별 검
색가능
영문표기kr httpwww영문표기kr 기관학교연구기관 검색가능
학위논문 원문 공동이용협의회 httpthesisorkr협의회 대학기관 목록
(연구 발주기관)
NDSL 연구실적 검색 httpscholarndslkrindexdo연구실적 검색 가능
(연구 발주기관)
Paper Searchnet httpwwwpapersearchnet논문 및 저널명 검색서비스
(연구 발주기관)
기관명
Ⅰ 소속기관사항(기관명) 학력사항(학교명) 경력사항(재직기관명) 연구실적(발주기관
명)
1 선처리 작업 수행 시 고려 사항
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
선처리 작업 시 기관명이 Full name 과 약어 기재를 원칙으로 함
단 약어가 존재하지 않을 경우 기재하지 않음
부서직위명을 포함하고 있을 경우 포함하여 선처리
단 소요시간이 길어질 경우 부서직위명 한글 그대로 입력)
업무명이나 업무설명이 포함된 경우 한글 그대로 입력 (추후 번역시 정제)
웹 검색 시 해당기관 홈페이지에 기재되어있는 영문을 우선순위로 선처리
웹 검색 및 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
2 기관명 웹 검색 url 목록
- 110 -
원문 번역 비고
상호명 ldquo(주)rdquo의 번역
상호명 ldquo(사)rdquo의 번역
상호명 ldquo(유)rdquo의 번역
상호명 ldquo(일)rdquo의 번역
상호명 ldquo(재)rdquo의 번역
Co LTd
Association
INC
Foundation
영국식 주식회사 표기 번역
기관명 약어의 경우
기관명(약어)
기관명
약어로 번역
Full name(약어) 번역
Full name 번역
약어가 존재하지 않을 경우
Full name만으로 번역
원문 번역 비고
((주)한일합섬Hanil Synthetic Fiber Co
Ltd
- 오탈자 정제
웹검색
원문DB의(rarr정제
(system2010)산자부과기부
(system2010)Ministry of
Commerce Industry and
EnergyMinistry of Science
and Technology
- 기관명n 괄호명칭 ()
웹검색
n개의 기관명 모두 선처리
()괄호안의 표기내용 기재
(주)부일건화(주)아해BUIL KEON WHA Co
LtdAhae Co Ltd
- 기관명n
웹검색
n개의 기관명 모두 선처리
(주)비츠로테크 공장장VITZRO TECH Co Ltd
Plant Manager
- 직위명 포함
웹검색
직위명 번역 선처리 기재
(재)전북생물산업진흥원Jeonbuk Bioindustry
Development Institute
-상호명 (재)
웹검색
해당기관 홈페이지 영문명기
검색 가능한 url은 추후 추가 가능
3 번역 시 고려사항
상호명 번역 지침
번역 시 고려사항
4 선처리 예
- 111 -
재
(캐나다) 오타와 대학교 (Canada)University of Ottawa
-괄호()
웹검색
괄호()내용 번역 선처리 기재
강원대학교 의과대학Kangwon National University
College of Medicine
-학과명
웹검색
학과명 번역 선처리 기재
국립 지바대학교(일본) National Chiba University(Japan)
-괄호()
웹검색
국립 번역 선처리 기재
괄호()내용 번역 선처리 기재
미국 Cornell대학교 Section of
Molecular Biology
USA Cornell College Section
of molecular Biology
-한글영문명
웹검색
미국 번역 선처리 기재
영문명 그대로 기재
엔에스(Natural Science Co) 공
동설립
NS(Natural Science Co
Ltd)
-괄호() 업무설명
웹검색
괄호() 영문명 그대로 유지
업무설명 ldquo공동설립rdquo 제거
웅진출판(주) 편집국 생태전집
부 - lsquo한국의 자연탐험rsquo 제작 참
여
Woongin Publications Co Ltd
Editorial ecological Colledted
Works
-부서명 업무설명
웹검색
부서명 번역 선처리 기재
업무설명 ldquolsquo한국의 자연탐험rsquo
제작참여rdquo 제거
11 국제산학연 공동기술개발지
원사업
Korea Association of Industry
Academy and Research
Institute(KAIARI) Business
support for academic-industrial
common technology
development
-괄호()
웹검색
국립 번역 선처리 기재
괄호()내용 번역 선처리 기재
기관명 코드 참조 첨부7 기관명 코드
- 112 -
사이트명 url 비고
NAVER 백과사전 http100navercom 통합 검색 서비스
NAVER 사전 httpendicnavercom 표준 영문직위 검색가능
KJTRANS httpwwwkjtranscokr학교 및 연구기관 분야별 검
색가능
영문표기kr httpwww영문표기kr 직위명 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr통합 검색 서비스
원문 번역 비고
교수 (학부장) Professor(Dean)
-직위명n 괄호() 직위명
웹 검색 및 직위표 코드참조
모두 번역 및 선처리
교학부장 겸 학과장 Dean Chair
-직위명n
웹 검색 및 직위표 코드참조
모두 번역 및 선처리
사원(전장설계부)Employee(Department of Wiring
Harness Design)
-직위명 부서명포함
웹 검색 및 직위표 코드참조
부서명 포함 번역 및 선처리
선임연구원(고주파제어시스템)Senior Researcher(High-Frequency
Wave)
-직위명 업무명
웹 검색 및 직위표 코드 참조
직위명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
직위가 n개의 경우 n개로 선처리
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당기관 홈페이지에 기재되어있는 직위 영문을 우선순위로 선처리
웹 검색 불가시 영문 직위명을 참조하여 번역
번역 작업 시 영문 직위명은 표준 영문 직위 표기에 따라 번역
웹 검색 및 영문직위표 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
2 직위명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
3 영문직위 번역 코드 참조
4 선처리 예
- 113 -
사이트명 url 비고
NAVER 백과사전 http100navercom 통합 검색 서비스
KJTRANS httpwwwkjtranscokr학교 및 전공명 검색가능
(자료실영어표현 강좌실)
영문표기kr httpwww영문표기kr 전공명 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr통합 검색 서비스
NAVER 사전 httpendicnavercom 표준 영문직위 검색가능
원문 번역 비고
전기전자전자통신공학Electrical Electronics Communications
Engineering
-전공명n
웹검색 및 코드표 참조
전공명n개 n갯수만큼 선처리
하수도 Sewerage-전공명
웹검색 및 코드표 참조
업무명 번역 및 선처리
연 구 원 ( R E S E A R C H
ASSORIATE)Research Associate
-직위명 영문명 포함 정제
웹 검색 및 직위표 코드참조
정제 AssocraterarrAssociate
괄호() 제거(동일한 영문명
전공명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
전공이 n개의 경우 n개로 선처리
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당학교 홈페이지에 기재되어있는 전공 영문을 우선순위로 선처리
웹 검색 및 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
ldquoOO학과rdquo 항목의 경우 동일한 ldquoOO학rdquo으로 선처리 번역으로 입력
동일한 한글명에 대한 학문 분야별 영문표기명이 다를 경우 표준명칭으로 선처리
2 전공명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
3 선처리 예
- 114 -
사이트명 url 비고
NDSL 논문실적 검색 httpscholarndslkrindexdo 논문검색시 저널명 발췌
과학기술학회마을httpsocietykistirekrmainht
ml학술지검색 메뉴 검색
KJTRANS httpwwwkjtranscokr 자료실
DBpiahttpwwwdbpiacokrpublicati
onview_resultasp저널명 및 논문 검색가능
구글httpwwwgooglecokr
httpscholargooglecokr저널명 및 논문 검색가능
국회도서관httpsu-libnanetgokrdlSear
chIndexphp논문 및 저널명 검색가능
휴리스틱알고리듬 Heuristuc Algorithm
-원문 정제
웹검색 및 코드표 참조
정제 ldquo알고리듬rdquorarrlsquo알고리즘ldquo
면역학(면역학) Immunology
-전공명n 괄호()명
웹검색 및 코드표 참조
괄호()명 제거(동일한용어)
19C영미시19C British and American
Poetry
-숫자영문명
웹검색 및 코드표 참조
19Crarr그대로 유지(19세기 표
현방식)
저널명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당 논문게재지 홈페이지의 영문 표기로 선처리
동일한 논문명으로 여러개의 저널명이 검색될 경우 게재권(게재호) 게재페이지 게재년
월 등을 확인후 선처리
웹 검색 시 영문명이 존재하지 않을 경우 번역
2 저널명 웹 검색 url 목록
- 115 -
NAVER 전문정보httpacademicnavercommain
nhn논문 및 저널명 검색서비스
Paper Searchnet httpwwwpapersearchnet 논문 및 저널명 검색서비스
SpringerLinkhttpwwwspringerlinkcomho
memainmpx논문 및 저널명 검색서비스
원문 번역 비고
Proc 대한조선학회 추계연구발
표회
Proc International Journal of
Naval Architecture and Ocean
Engineering(JNAOE) Fall
Conference
-원문 영문 포함 일부번역
웹검색
영문명 유지
일부번역 ldquo추계연구발표회rdquo
대한건축학회논문집제20권Journal of the Architectural
Institute of Korea
-부서명 업무설명
웹검색
부서명 번역 선처리 기재
업무설명 ldquolsquo한국의 자연탐험rsquo
제작참여rdquo 제거
대한두개안면성형외과학회Korean Cleft Palate-Craniofacial
Association
-공식 영문저널명 특수문자
웹검색
저널홈페이지에 기재된 특수
문자 포함 선처리
대한두개안면성형외과학회지
Journal of the Korean Cleft
Palate-Craniofacial Association(J
Korean Cleft Palate-Craniofac
Assoc)
-약어 저널명
웹검색
저널홈페이지에 기재된약어
선처리
대한토목학회 학술발표회 논문
집 CD-ROM
Proceedings of the Korean Society of
Civil Engineers(KSCE) Conference
Technical Journal CD-ROM
-약어 원문영문
웹검색
약어기재 영문명그대로 유지
표준
지침
Proceedings of
Journal of The 회차 Journal Name Conference 계절 년도(날짜) 개최지
예)Proceedings of
Journal of The 7th Journal Name Conference Fall 2009 09 12 Tokyo Japan
저널명
없음저널명이 없을 경우 원문 순서 그대로 번역
검색 가능한 url은 추후 추가 가능
3 선처리 예
4 저널명 번역시 표준 지침
5 저널명 번역시 유의 사항
- 116 -
원본데이터 번역데이터 입력요령
학술발표학술발표회
학술연구발표학술연구발표회
번역
Journal Name Conference 저널명 뒤에 기재
논문집요약집초록집논문
초록집 번역Proceedings of Journal Name 저널명 앞에 기재
OO학OO학회OO학회지 Journal of Journal name 저널명 앞에 기재
회차 계절 날짜 개최지OOth Journal Name Spring
2010 Seoul Korea
회차 저널명 앞에 기재
계절날짜개최지 저널명 다음
구신 저널명 선처리번역 웹으로 검색된 저널명을 기준 존재하지 않을 경우 신 저널명
6 저널명 대소문자 표기 지침
middot 단어의 첫글자 대문자 표기
244 DB구축 항목별 세부지침(번역)
기본정보
Ⅰ 영문성명
1 영문성명의 입력포맷 홍길동 =gt GilDong Hong
원본데이터 입력데이터 입력요령
HONGGILDONG
Gil-Dong Hong
Hong Gil-Dong
GilDong Hong - 영문성명 입력표준으로 변경
2 영문성명 번역시 고려사항
기존에 존재하는 영문명은 유지
논문실적의 영문명이 존재할 경우 영문명 입력
- 단 논문실적 항목의 공동저자명에 약어 축약어의 경우 영문성명은 Full name기재
번역시 로마자 표기법에 준수하여 번역
참고 로마자 표기법
- 117 -
원본데이터 입력데이터 입력요령
017)- 017-- - ldquo-rdquo구분자로 변경
+82-10-2497- 010-2497-
- 대한민국은 국가번호 제외하
고 입력
- 휴대폰구분번호 앞에 ldquo0rdquo표
시
1-11-- +1-11--- 외국의 휴대전화는 +국가번
호 붙여서 입력
011-123 입력하지 않음- 휴대전화번호가 완전하지 않
은 형태는 입력하지 않음
Ⅱ 휴대전화
1 휴대전화의 입력포맷
대한민국 휴대폰구분번호-국번-전화번호 (대한민국은 국가번호 제외하고 입력)
외국 +국가번호-휴대폰구분번호-국번-전화번호
Ⅲ E-mail
1 E-mail의 입력포맷 abctestcom
Ⅳ 개인홈페이지
1 개인홈페이지의 입력포맷 wwwhomepageurlcom (http 제외하고 입력)
2 한글 도메인의 경우 영문 도메인을 찾아 입력
Ⅴ 전문(연구)분야
1 전문(연구)분야의 코드 입력은 이력서 본인에 의해 과학기술표준분류별 전문분야를 선택
하도록 함
재직기관
Ⅰ 기관명(선처리 작업)
- 118 -
부서명 표현 항목 표현여부
Department of경력사항부서명 기재
전공명(학력사항) 삭제
College of경력사항부서명 기재
전공명(학력사항) 삭제
Ⅱ 부서명
1 번역 수행
번역 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
번역 작업 해당 기관홈페이지의 영문명을 우선순위로 번역
공식화된 영문명이 존재하지 않을 경우 부서명 참조
참조 부서명 코드
기관홈페이지 및 공식화된 영문명이 존재하지 않을 경우 번역수행
부서 영문명은 Department of 등으로 시작하며 약어 및 축약어 기재는 불가하며 모두
Full name 번역을 원칙으로 번역수행
Ⅲ 직위(선처리 작업)
Ⅳ 우편번호 주소
1 영문 우편번호DB 참조
2 주소의 기본주소와 상세주소를 합침
3 우편번호 및 영문 번역주소 검색
httpwwwkoreapostgokrservletkpppostPostInfo (우정사업본부)
4 검색된 번역 영문 주소 입력(단 기관명과 영문주소와 동일하지 않을 경우 기관명을기준)
5 존재하지 않는 상세주소의 경우 로마자 표기법에 준수하여 번역
참고 로마자 표기법
6 우편번호 입력시 웹검색과 원본이 다른 경우 원본그대로 우편번호 유지
(영문주소는 웹검색 그대로 번역 및 입력)
Ⅴ 전화 팩스
1 전화의 입력포맷
대한민국 지역번호-국번-전화번호(내선번호) lt= 대한민국은 국가번호 제외하고 입력
- 119 -
원본데이터 입력데이터 입력요령
042)- 042-- - ldquo-rdquo구분자로 변경
+82-31-2497- 031-2497-
- 대한민국은 국가번호 제외하
고 입력
- 지역번호 앞에 ldquo0rdquo 표시
1-11-- +1-11--- 외국의 전화번호는 +국가번
호 붙여서 입력
061-123 입력하지 않음- 전화번호가 완전하지 않은
형태는 입력하지 않음
02-123-1234(12) 02-123-1234(12) - 내선번호는 그대로 입력
외국 +국가번호-지역번호-국번-전화번호(내선번호)
학력사항
Ⅰ 학위취득일
1 학위취득일 입력포맷
ldquoYYYY-MM-DDrdquo 형태
Ⅱ 학교명(선처리 작업)
Ⅲ 전공명(선처리 작업)
경력사항
Ⅰ 시작년월 종료년월
1 시작년월 종료년월 입력포맷
ldquoYYYY-MMrdquo 형태
시작년월은 종료년월보다 작거나 같아야 함
- 120 -
사이트명 url 비고
NDSL 논문실적 검색 httpscholarndslkrindexdo 논문검색시 저널명 발췌
과학기술학회마을httpsocietykistirekrmainht
ml학술지검색 메뉴 검색
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr저널명 및 논문 검색가능
Ⅱ 재직기관명 직위(선처리 작업)
Ⅲ 직위(선처리 작업)
논문실적
Ⅰ 논문실적 형태
보통 논문제목 저널명 게재권 (게재호) 게재페이지 게재년월 공동저자명으로 작성
volume (Vol) ( 정기 간행물 1년분의 ) 권
issue(ISS)또는 No또는 (숫자) 게제호 예) Vol9 ISS 4 또는 v9 no4 또는 9(4)- 9
권 4호
Ⅱ 공동저자명
웹 검색을 통한 원문 출처의 번역 방식에 따라 입력
저자명과 저자명은 ldquo rdquo으로 구분자(마지막 입력 후 ldquo rdquo 입력)
번역 시 Full name으로 입력하며 로마자 표기법을 준수함
Ⅲ 논문명
1 번역 작업 수행
번역 작업 시 기존 논문 영문명은 그대로 유지하되 일부 정제 필요
웹 검색 시 해당 논문게재지 홈페이지의 영문 표기로 선처리
동일한 논문명으로 여러개의 저널명이 검색될 경우 게재권(게재호) 게재페이지 게재년
월 등을 확인 후 선처리
웹 검색 시 영문명이 존재하지 않을 경우 번역
2 논문명 웹 검색 url 목록
- 121 -
국회도서관httpsu-libnanetgokrdlSear
chIndexphp논문 및 저널명 검색가능
NAVER 전문정보httpacademicnavercommain
nhn논문 및 저널명 검색서비스
Paper Searchnet httpwwwpapersearchnet 논문 및 저널명 검색서비스
DBpiahttpwwwdbpiacokrpublicati
onview_resultasp저널명 및 논문 검색가능
SpringerLinkhttpwwwspringerlinkcomho
memainmpx논문 및 저널명 검색가능
검색 가능한 url은 추후 추가 가능
Ⅳ 저널명(선처리 작업)
연구실적
Ⅰ 시작년월 종료년월
1 시작년월 종료년월 입력포맷
ldquoYYYY-MMrdquo 형태
시작년월은 종료년월보다 작거나 같아야 함
Ⅱ 발주기관(선처리 작업)
Ⅲ 참여구분
1 참여구분 입력지침
연구책임자 참여연구원 중에서 선택하여 입력함(구분 불가능시 선택 안함)
Ⅳ 연구실적명
1 번역 작업수행
번역 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
번역 작업 시 웹검색을 통하여 정확한 연구실적명을 검색
웹 검색 시 공식화되어있는 영문을 우선순위로 번역
웹 검색 및 공식적으로 사용하는 연구실적명이 존재하지 않을 경우 번역
- 122 -
사이트명 url 비고
한국특허정보원httpwwwkiprisorkrkormai
nmainjsp국내특허실적 분야별 검색
구글 특허정보 검색서비스 httpwwwgooglecompatents해외 특허정보 검색서비스
(7백만개 이상 검색가능)
PCT 특허정보 검색서비스 httpwwwwipointpctdben PCT 특허 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 특허정보 검색서비스
사이트명 url 비고
NDSL 연구실적 검색 httpreportndslkrindexdo 연구실적 검색 가능
KJTRANS httpwwwkjtranscokr학교 및 연구기관 검색가능
(자료실영어표현 강좌실)
구글 httpwwwgooglecokr
NAVER 전문정보httpacademicnavercommain
nhn네이버 연구실적명 검색
Paper Searchnet httpwwwpapersearchnet 연구실적명 검색서비스
2 연구실적명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
특허실적
Ⅰ 출원등록구분
출원 등록 중에서 선택함
같은 특허에 대해 출원과 등록 모두 존재하면 등록정보만 입력함
출원 등록이 미구분시에는 선택하지 않음
Ⅱ 출원등록번호
특허 출원등록번호 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
Ⅲ 출원등록국가
- 123 -
사이트명 url 비고
한국특허정보원httpwwwkiprisorkrkormai
nmainjsp국내특허실적 분야별 검색
구글 특허정보 검색서비스 httpwwwgooglecompatents해외 특허정보 검색서비스
(7백만개 이상 검색가능)
PCT 특허정보 검색서비스 httpwwwwipointpctdben PCT 특허 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 특허정보 검색서비스
1 출원등록국가 입력지침
출원등록국가 코드를 찾아 입력
Ⅳ 특허출원명
1 특허출원명 번역지침
특허출원명 입력시 웹 검색을 우선으로 시행
웹 검색 후 영문명이 존재할 경우 그대로 입력
영문명이 존재하지 않을 경우 번역 시행
2 특허출원명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
Ⅴ 출원등록일자
1 출원등록일자 입력포맷
ldquoYYYY-MM-DDrdquo 형태
25 DB구축 검수
251 DB구축 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
- 자체적인 품질활동 점검표 작성등의 수행결과를 주기적으로 측정하여 품질목표를 달성
하도록 함
- 124 -
항 목 세 부 항 목 항목수 단위별가중치()
기본(BasicInformation)
기본정보 영문성명 5 15휴대전화(국가번호)E-mail개인홈페이지
전문(연구)분야-본인입력검색키워드
재직기관(organization)
기관명 7 20부서명직위우편번호
주소전화(국가번호)
검수 기준
- 에러율 전체 데이터(전체 항목 필드 기준)의 01 이하(품질목표 999)
- 에러 체크 방식 전체 데이터에서 본인확인 미완료 대상 중 무작위로 30 샘플링 하
여 검수
- lsquo10년도 10월 DB구축완료단계에 최종 검수 실시
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침
및 매뉴얼에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며
오류율 산정에서 제외함
검수방식 및 기준
- 수집된 영문이력서 원본 파일(hwp doc pdf 등)과 입력 완료된 영문이력DB를 육안검
사 함
- 오류 판단 기준은 KISTI가 작성한 DB구축 작업 지침서를 참조함
252 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 125 -
팩스(국가번호)
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) 4 15학위취득일학교명전공명
경력(Career)
경력사항(CAREER)
시작년월 4 15종료년월
재직기관명직위
실적ResearchResult
논문실적(paper)
논문명 9 15저널명게제(권)집게제호
시작페이지종료페이지게제년월공동저자명비고
연구실적ResearchProject
시작년월 5 10
종료년월발주기관참여구분(역할)-코드연구실적명
특허(patent)
출원등록구분-코드 5 10
출원등록번호
출원등록국가-코드
특허출원명출원등록일자
계 38 100
항 목 세부항목 검수대상
데이터수
오류데이터건
수
품질지표별
기준점수의 합
항목가중치
()
오류율산정
기본(BasicInformation)
기본정보(5개)
영문성명 30 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
단위별 가중치는 KISTI와 협의하여 결정함
항목별 오류율 산정 기준 정의
- 126 -
휴대전화(국가번호)
30
E-mail 30개인홈페이지
30
검색키워드
30
소계 150재직기관(o r gan ization)(7개)
기관명 40부서명 30
직위 30우편번호 10주소 30전화 (국가번호)
30
팩스(국가번호)
30
소계 200
학력(Academiccarrer)
최종학위(FinalDegree)(4개)
학위 (코드)
10
학위취득일
15
학교명 80전공명 45소계 150
경력(Career)
경력사항( C AREER)(4개)
시작년월 15
종료년월 15재직기관명
80
직위 40소계 150
실적ResearchResult
논문실적(paper)(9개)
논문명 40저널명 20
게제(권)집
20
게제호 20시작페이지
10
종료페이지
10
게제년월 10공동저자명
10
비고 10소계 150
연구실적(Researc
시작년월 15종료년월 15발주기관 20
- 127 -
hProject)(5개)
참여구분(역할 ) -코드
10
연구실적명
40
소계 100특허(patent)(5개)
출원등록구 분 - 코
드
10
출원 등록번호
20
출원등록국 가 - 코
드
35
특허 출원명
20
출원 등록일자
15
소계 100계 100
- 128 -
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형구분
오류요형별점수 비고
완전성
누락 - 코드 누락 02
품질지표기준점수산정(데이터1건기준)=오류
유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 01
유효성형식 - 패턴의 오류 02
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 02
계 6개 오류유형 1
기본정보
영문성명 휴대전화 E-mail 개인홈페이지 계
Hong Gil Dong
(형식 02)010-111- testcom
GilDong Hong+82-011-111-
(형식 02)
testcokr
(오기 02)
testcom
(오기 02)
(누락 02) 019-111_ testcokr testcokr
품질지표별
기준점수의 합04 02 02 02 1
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
국가RampD참여인력
영문이력DB
3000건 3000건 3000건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
검사물량 집계표 예시
검수데이터 예시
- 129 -
3 평가위원 데이터 최신성 유지 매뉴얼
31 최신성 유지 업무 개요
311 개요
평가위원 데이터 최신성 유지란 lsquo기 구축된 평가위원 DB 내의 각 데이터들이 가장 마지막
으로 업데이트된 시점을 기준으로 그 시점부터 현재까지의 기간 동안 누락된 대상 인력들
의 변경사항들을 해당데이터에 추가입력 및 수정해주는 것rsquo을 의미
또한 대상 인력의 변경사항 반영이외에도 기 입력된 데이터들의 내용을 검토하고 발견된
오류 및 누락정보에 대한 수정ㆍ보완 작업 역시 평가위원 데이터 최신성 유지의 일환
최신성 유지를 위해 먼저 대상 인력에 대한 정보 수집이 요구됨
- 130 -
312 최신성 유지 업무 절차
최신성 유지 업무 절차는 관리자와 담당자의 역할로 구분가능
관리자는 담당자의 업무할당 데이터 검수 업무보고 등을 수행하며 담당자는 할당된 대
상인력에 대한 데이터 수정 및 보완 작업 수행
최신성 유지 업무 절차를 순서별로 나열하면 다음과 같음
- 관리자는 대상인력에 대한 전체리스트를 작성하고 이를 각 담당자들에게 일정량씩 할당
- 담당자는 할당된 대상인력에 대한 정보를 수집하고 기 입력된 데이터와의 비교를 통해
변경사항에 대한 수정 및 추가입력
- 담당자는 대상인력에 대한 정보를 수집한 출처 및 기타 비고사항에 대한 의견 등을 작
성하여 할당량에 대한 작업 완료시 관리자에게 보고
- 관리자는 보고된 작업결과물을 취합하여 정리하고 대상인력에 대한 정보가 잘 수집되고
입력되었는지 검토하여 수정 및 보완
- 관리자는 일일별 완료된 작업 결과 및 비고사항을 작성된 양식에 따라 담당 책임자에게 보고
- 131 -
32 대상 인력(평가위원) 정보 수집 방법
대상 인력의 정보를 수집하기 위한 방법은 크게 3가지로 구분
- 대상 인력에게 이력파일 요청
- 웹검색(기관홈페이지 개인홈페이지 및 각종 포털사이트)
- 신문기사의 인사ㆍ동정 모니터링
321 대상 인력에게 이력파일 요청
E-Mail 등을 통해 대상 인력에게 본인의 데이터에 대한 직접 업데이트 또는 입력대행을
위한 이력파일의 전송 요청
정보의 수신 방법은 E-Mail 우편 등이며 가장 신뢰성 높은 정보
입력이 완료된 이력파일은 개인정보보호를 위해 별도로 보관되며 E-Mail 및 기타 인쇄
물 이외의 형태로 수신되었을 경우 반드시 출력하여 관리
입력 완료시 해당인력에게 연락하여 결과에 대한 확인 요청
322 웹검색(홈페이지 및 각종 포털사이트)
대상 인력의 가장 최신의 연락정보(전화번호 E-Mail FAX 등) 재직정보 등을 수집하기
위해 웹상에 공개되어 있는 정보를 수집하여 데이터에 반영
대상 인력의 데이터 내 소속기관사항 및 기본정보의 홈페이지 주소 등을 통하여 해당 기
관 홈페이지 및 개인 홈페이지에 접근하여 연락정보 경력정보 실적정보 등에 관한 정보
수집
이직(移職) 등으로 대상 인력의 현재 소재지 재직기관 등에 관한 정보가 누락되어 있을
시 각종 포털사이트를 활용하여 해당인력의 소재정보 수집 및 접근
인물정보제공사이트를 통해 대상 인력의 기본정보 경력정보 실적정보에 대한 수정ㆍ보
완
323 신문기사의 인사ㆍ동정 모니터링
대부분의 신문에서 주요 인물에 대한 인사ㆍ동정에 관한 정보를 매일 싣고 있음
주기적으로 인사ㆍ동정란의 모니터링을 통해 평가위원 데이터에 변경사항 반영
- 132 -
33 최신성 유지 업무 작업 지침
331 언론을 통해 발표 되는 인사동정 수정
평가위원만 해당
교육과학기술부
- 참여인력을 포함하여 인사동정 수정
- 직급은 장관 차관 국장 팀장 사무관 서기관 까지 수정
- 특히 교육과학기술부장관 제2차관 정책보좌관 국장은 꼼꼼하고 세심하게 수정할 것
332 현행화 작업 내용
수정은 기본정보 소속기관 학력사항 초중고학력 경력사항 소속학협회 논문 실적 연구
실적 저역서실적 훈포장사항 지식재산권 주요업적사항 자격사항 사진관리 등 전 항
목에 걸쳐 작업 함
해당 인물의 개인 홈페이지를 최우선으로 보고 그 다음으로 기관 홈페이지를 참고
해당 기관 홈페이지에서 정확히 알 수 없을 경우에는 코셉 조인스 로마켓 동아일보를
참고 할 것
경력사항은 경력의 년도와 날짜가 없더라도 신규 입력 함
기본정보
e-mail에서 (dot)가 아닌 (comma) 로 표기된 경우 변경
e-mail 주소가 2개일 때는 개인홈페이지에 적힌 메일주소가 우선 판단이 안 될 경우는
소속기관에서부여된 e-mail 주소로 기입
인적사항의 홈페이지정보에서 lsquohttprsquo 는 빼고 입력
소속기관
산학협력단
- 소속기관에서 제외(삭제)하고 경력사항에만 기입
- 산학협력단이 주소로 되어있는 기업은 소속기관에 그대로 두거나 기입해 줌
평가위원이 의과대학의 교수이자 병원의 교수(의사)인 경우는 소속기관을 의과 대학
의 교수로 기입하고 병원 근무사항은 경력사항에 기입
(ex 관동대학교 의과대학 정형외과학교실 교수 소속기관
관동대학교 명지병원 정형외과 전문의 경력사항)
소속기관이 대학과 병원 모두 입력되어 있는 경우 수정하지 않고 pass
소속기관은 의과대학이나 주소가 병원일 경우 수정하지 않고 pass
평가위원의 재직기관 홈페이지에서 해당 인물이 검색 되지 않을 경우
- 학교의 교수 명예교수 등은 pass
- 회사의 대표이사 회장 등은 직급은 공란으로 바꾸고 재직중으로 변경
( 대표이사 인사말 회장 인사말 등의 인물 이름이 다를 경우를 뜻함)
- 133 -
평가위원이 학sdot협회에 재직중인 경우
- 소속기관이 하나이고 학sdot협회라면 소속기관에 그대로 둠
- 소속기관이 2개 이상이고 그 중 한 곳이 학sdot협회일 때
학sdot협회를 제외한 소속기관에서 인물이 검색 되는 경우 학sdot협회 내역으로 옮김
학sdot협회를 제외한 소속기관에서 인물이 검색 되지 않고 학sdot협회에서만 검색 되는 경
우 학sdot협회를 제외한 소속기관 내역은 경력사항으로 옮김
학sdot협회를 제외한 소속기관과 학sdot협회 모두 인물이 검색 되지 않는 경우 수정하지
않고 pass
기타
- 직장주소에 집주소가 되어있으면 변경하고 집주소란에 직장주소가 되어있으면 그냥 둠
- 겸임교수직은 경력사항에 입력
소속기관에 기입된 경우 경력사항으로 이동
소속기관이 한 개이고 겸임교수일 경우 pass
- 인물의 직급이 모두 시간강사인 경우 담당자에게 인물key 전송
- 퇴직한 교수로 그 이후의 소속기관이 없는 사람은 재직여부를 lsquo퇴직rsquo으로 변경 후 저장
- 전화번호가 2개인 경우 (comma)로 구분
- 교수의 경우 학과부서 탭엔 단과대 아래의 레벨 모두 기입
(ex 생명과학부 생명공학전공 or 의학과 내과학교실)
학력사항
박사후과정(Post-Doc)은 생략 단 경력사항의 Post-Doc은 기입
논문실적
2006~2010년도 논문sdot연구실적만 입력
현재 HuRIMs에 저장된 가장 최근 년도부터 템플릿에 작업
(ex 개인홈페이지에는 2000년~2009년까지 논문사항이 입력되어있고 HuRIMs에는 2007
년 2월까지만 입력되어 있다면 2007년의 논문은 중복체크를 한 후 입력되지 않은 논문
들과 2008 2009년도 논문을 템플릿에 넣는다)
기타논문집은 학술논문으로 판단되는 것들만 기입
- 판단기준 대학 연구소 학회에서 발행한 논문들
동일한 제목으로 다른 발행처에 중복 기재된 경우
- 발행처 두 곳이 모두 학회일 때 중복하여 기입
- 발행처 두 곳이 학회amp연구소 학회amp대학 일 때 학회의 논문실적만 기입
출판중인 논문은 기재하지 않음
학회sdot협회sdot대학 등에서 발간된 저서 중 일부만 담당한 경우
- 일부 chap theme 만 담당했더라도 저역서실적에 기입
- 일부 작성한 부분의 제목이 논문의 형태를 띄고 있을 때(~에 관한 연구 고찰 등)는 논문
실적에 기입
- 134 -
훈포장사항
세계인명사전등재 내용 기입
감사장 감사패는 기입하지 않음
경력업적학협회 유형 정리
향우회 민방위 동창회 성직자협의회 등은 제외함
lsquoooo위원회rsquo가 들어가는 내용은 직급에 상관없이 업적사항으로 기입 단 기초기술 연구
회와 산업기술연구회는 정부조직이므로 경력사항에 기입
(ex 기록관리혁신전문위원회 회장 정보통신위원회 고문 rarr 업적)
위원회를 제외한 lsquo회rsquo는 직급에 상관없이 학sdot협회 활동사항으로 기입
(ex 한국원예치료협회 상임이사 한국화훼장식학회 편집위원 한국양액재배연구회 이사
한국화훼환경디자인교수연합회 이사 전국대학정보화협의회 이사 rarr 학sdot협회)
활동내역 중 자문 심의는 업적사항에 기입 단 협회 학회 연구회 등의 자문sdot심의는
학sdot협회 활동사항에 기입
활동내역 중 기업sdot학교의 고문은 경력사항에 기입
34 최신성 업무 대상
341 대상 및 범위
평가위원후보추천서비스에서 서비스 중인 평가위원 전체
평가위원 기본정보 경력정보 갱신 및 실적정보 추가입력 및 갱신
추가 입력 및 갱신을 위한 기초자료는 웹사이트에 공개된 정보 신문의 인물 동정기사
평가위원 본인이 제공하는 이력정보 임
342 검수 기준
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
- 최신성 유지 관리를 수행한 전체 데이터 중 3를 샘플링하여 출처별 내용이 최신성 유
지 관리 매뉴얼 기준으로 추가 입력 및 갱신되었는지 여부를 확인
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 135 -
구분 항목 세부항목 항목수단위별
가중치()
참여
인력
정보
기본정보
주민등록번호 성명 자택주소 자택
우편번호 자택전화번호 핸드폰번호
7 31
소속기관사항
소속기관명 부서명 직위명 사무실
전화번호 기관주소 최초임용일 인
력(직업)구분
7 185
학력사항
전공 취득대학 학위 입학일 졸업
일 학과 취득국가 지도교수명 학위
논문명 학위취득일
10 21
경력사항 근무처명 직위명 근무기간 3 45
자격사항 자격발행처 자격증명 자격취득일 3 25
논문실적
논문발표일 국문논문명 영문논문명
저자역할구분 발행처 학술지구분
학술지명 SCI여부
8 105
지식재산권 지식재산권명 출원_등록번호 특허구분 3 25
계 소계 41 905
평가
위원
소속학협회현황 담당업무 직위 학협회사항 3 3
훈포장사항 수상년월 수여기관명 훈포장명 3 25
저역서실적국문저서명 영문저서명 발행년 발
행처 저역서구분5 4
소계 11 95
계 52 100
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
343 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 136 -
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
150 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
성명 100자택주소 10자택우편번
호
20
자택전화번
호
10
핸드폰번호 10E-mail 10소계 310
소속기
관사항
(7개)
소속기관명 100
부서명 05
직위명 20
사무실전화
번호
10
기관주소 30
인력(직업)구
분
10
최초임용일 10
소계 185
학력사
항
(10개)
전공 20
취득대학 100
학위 20
입학일 10
졸업일 10
학과 15
취득국가 15
지도교수명 05
학위논문명 05
학위취득일 10
소계 210
항목별 오류율 산정 기준 정의
- 137 -
경력사
항
(3개)
근무처명 20
직위명 15
근무기간 10
소계 45
자격사
항
(3개)
자격발행처 05
자격증명 10
자격취득일 10
소계 25
논문실
적
(8개)
논문발표일 10논문명1 10
논문명2 05저자역할구
분
05
발행처 05학술지구분 05학술지명 10
SCI여부 05
소계 105
지식재
산권
(3개)
지식재산권
명
10
출원_등록번
호
05
특허구분 10소계 25
평가 소속학
협회현
황
(3개)
담당업무 05
위원 직위 05(11개) 학협회사항 20
소계 30
훈포장
사항
(3개)
수상년월 10
수여기관명 05
훈포장명 10
소계 25
저역서
실적
(5개)
저역서명1 10
저역서명2 05
발행년 10
발행처 05
저역서구분 10
소계 40
계 1000
- 138 -
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 및
출처 비교 오류03
품질지표기준점수산정(데이터1
건기준)=오류유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 맵핑 오류 005
계 6개 오류유형 1
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
3000 3 055 150 000825
성명 10 2 035 100 000350자택주소 3 0 000 10 000000
자택우편번
호
3 2 035 20 000233
자택전화번
호
4 0 000 10 000000
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
평가위원 Pool DB 23000건 23000건 690건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
출처 비교는 작업대상별 출처 리스트 참조
검사물량 집계표 예시
오류율산정표 예시
- 139 -
핸드폰번호 6 0 000 10 000000
E-mail 9 0 000 10 000000소계 45 7 125 310 001408
소속기
관사항
(7개)
소속기관명 1000 20 100 000000부서명 80000 200 05 000000직위명 80000 200 20 000000사무실전화
번호
80000 200 10 000000
기관주소 80000 200 30 000000인력(직업)구
분
80000 200 10 000000
최초임용일 80000 200 10 000000소계 481000 1220 000 185 000000
계 1000 01
주민등록번호 한글성명 영문성명 한문성명자택우편번
호
630421-0000000 백중환Joong hwan
Baek
412220
(형식 015)
630421-0000000 백종석Baek Jong
Seok
6304210000000
(형식 015)백인열 Baek IN Youl 白寅烈 711-822
630421-0000000 백승호
(오기 02)백제훈
630421-0000000 백종완
630421-
(오기 02)백장선 Jangsun Baek
白壯선
(형식 015)
502-
(오기 02)
630421-0000000 백승호1213132
(오기 02)
630421-0000000 백석형
630421-0000000 백석형
품질지표별
기준점수의
합
055 035 035
검수데이터 예시
- 140 -
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 및
출처 비교 오류03
품질지표기준점수산정(데이
터1건기준)=오류유형별점수
의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 맵핑 오류 005
계 6개 오류유형 1
데이터별 품질지표 기준 점수
35 입력 항목별 QampA (처리 방법 및 사례)
기본정보
- 정보공개여부
구 분 내 용
상황 및 질문ㆍ데이터 신규입력 시 정보공개여부 설정(공개 기본인적사항만 공
개 비공개)을 어떻게 해야 하는지
처리 방법
및 사례
- 대상인력의 입력대행요청에 의한 정보입력 시 정보공개여부는 해당인
력이 요청한 대로 설정
- 최신성 유지팀 자체 내에서 수집한 정보를 바탕으로 대상인력 데
이터를 신규생성 할 경우에는 lsquo기본인적사항만 공개rsquo로 설정
- 과학기술표준분류
구 분 내 용
상황 및 질문ㆍ데이터 입력 시 과학기술표준분류에 대한 처리는 어떻게 해야 하
는지
처리 방법
및 사례
- 과학기술표준분류는 정보관리자가 임의로 선택하거나 수정하지 않
음
- 141 -
소속기관사항
- 재직여부
번호 구 분 내 용
1
상황 및 질문
ㆍ대상인력이 이직(移職)하여 재직기관이 변경된 경우 전 재직기
관 정보의 재직여부를 퇴직으로 변경하고 현 재직기관 정보를
추가입력해야 하는지
처리 방법
및 사례
- 대상인력의 재직기관이 변경되었을 경우 전 재직기관 항목은 삭제
후 경력사항에 반영함
- 현 재직기관 정보 신규입력 후 이를 경력사항에 반영
2
상황 및 질문ㆍOO연구원에 재직중인 홍길동씨가 현재 과학기술부에서 파견근
무 중일 경우 이를 어떻게 처리해야 하는지
처리 방법
및 사례
- 먼저 원 소속인 OO연구원 소속기관사항의 재직여부에 lsquo재직중rsquo
에서 lsquo파견중rsquo으로 변경
- 또한 소속기관사항 항목을 추가시켜 파견기관인 lsquo과학기술부rsquo 직위
등의 정보 입력 후 재직여부를 lsquo재직중rsquo으로 선택
3
상황 및 질문ㆍ대상인력이 정년 등의 이유로 퇴직한 상태인 경우 소속기관사
항을 삭제해야 하는지
처리 방법
및 사례
- 대상인력이 퇴직한 상태이고 현재 다른 직업이 없는 경우 소속
기관사항은 삭제 시키지 않고 재직여부를 lsquo퇴직rsquo으로 변경
- 경력사항 항목에 퇴직일자 포함된 정보 추가
- 142 -
학력사항
- 전공명
구 분 내 용
상황 및 질문ㆍ대상인력의 학력정보를 수집하였으나 학과명만 표기 있는 경우 전
공명은 공란으로 두는지
처리 방법
및 사례
- 대상인력의 학과정보만 발견된 경우 일반적으로 전공명은 우선 학
과명과 동일하게 입력
ex) 학과명 경영학과 rarr 전공명 경영학
경력사항주요업적사항
- 경력사항주요업적사항 일반
구 분 내 용
상황 및 질문 ㆍ경력사항과 주요업적사항은 어떤 기준으로 구분하는지
처리 방법
및 사례
- 일반적으로 웹상 및 타기관 인력정보데이터를 통해 수집된 정보에
는 경력사항과 주요업적사항을 따로 구분하지 않은 경우가 대다수
- 본 시스템에서는 경력사항과 주요업적사항을 구분하여 입력
- 경력사항은 대상인력의 직업과 관련된 사항으로 구분
- 주요업적사항은 대상인력의 직업 이외의 대외적인 활동 즉 평가
자문위원 등 각종 위원활동 설계 시공 기술지도 등의 사항으로
구분
예외적으로 학위 이외의 교육과 관련된 사항은 경력사항에 입력
ex) OO대학 OO교육과정 수료이수
- 143 -
소속학협회
- 직위담당업무
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 소속학협회정보에 학회명 이외에 다른 사항이
기재되지 않은 경우 직위 및 담당업무 항목은 어떻게 처리하는지
처리 방법
및 사례
- 활동시작년월 및 학회종료년월에 관한 정보가 없을 시 이는 공란처
리하며 직위의 경우 다른 정보가 없는 경우 lsquo회원rsquo으로 입력
논문실적
- 학술지구분
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 논문실적 정보만으로 학술지구분(국내 및 국외
전문학술지 국내 및 국외 학술대회발표논문집 기타논문집)에 대
한 구분은 어떻게 하는지
처리 방법
및 사례
- 수집된 대상인력의 논문실적 정보의 상당수가 국내 및 국외 전문학
술지 및 학술대회발표논문집에 관한 구분이 되어 있지 않기 때문
에 학술지구분에 어려움을 겪을 수 있음
- 이에 대한 구분기준은 명확하게 한정짓기 어려운 부분이 있어 이
러한 경우 최신성 유지 업무 담당 책임자가 판단하여 처리하고 있
음
- 이에 대한 몇 가지 팁을 제시하자면 먼저 lsquoOO학회지rsquo lsquoJournal
ofrsquo 등의 용어가 해당정보에 삽입되어 있는 경우 대부분 전문학
술지로 구분할 수 있으며 lsquo학술대회rsquo lsquo발표대회rsquo lsquoProceeding
Conference Seminar Workshop등의 용어가 해당정보에 삽입되
어 있는 경우 이는 대부분 rsquo학술대회발표논문집으로 구분할 수 있
음
- 또한 학술대회발표논문집 중 국내와 국외의 구분은 해당 학술대회
가 열린 장소를 기준으로 함
ex) lsquoThe Internation Conference in Seoulrsquo의 경우 학술대회가 열린
장소가 대한민국의 서울이므로 국내 학술대회발표논문집으로
구분함
- 144 -
- 역할
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 논문실적 정보에 역할(단독 공동(제1) 공동(참
여) 공동(책임))이 구분되어 있지 않은 경우 이를 어떻게 처리해야
하는지
처리 방법
및 사례
- 현재 대상 인력의 연구실적과 관련하여 역할구분이 되어 있지 않은 정
보를 입력할 시 해당 연구의 특성을 고려하여 역할을 lsquo단독rsquo 혹은 lsquo공
동(제1)rsquo으로 임시 구분해 줌
- 공동저자명
구 분 내 용
상황 및 질문ㆍ수집된 대상 인력의 논문실적 정보 중 공동저자명 입력 시 10명 이
상이 넘어가는 공동저자명을 모두 넣어주어야 하는지
처리 방법
및 사례
- 공동저자명의 경우 한 연구실적에서 무수히 발생될 수 있는 공동저
자명을 일일이 입력을 해주고 있지는 않음
- 예를 들어 공동저자명이 15명일 경우 공동저자명에는 lsquo홍길동 김순희
이명수 박영희 등rsquo으로 한정시키고 전체저자수 항목에 저자를 포
함한 16명을 입력해 줌
- 논문실적 일반
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 논문실적 정보가 논문명만 있는 경우 이를 입
력해야 하는지
처리 방법
및 사례
- 대상인력의 논문실적 정보에 대한 추가 입력 기준은 아직 명확하
게 정해지지는 않은 상태
- 현재(2007년 7월 18일 기준)는 개재년월 및 논문명의 두 가지 정보 이
상이 존재할 시에만 추가입력을 해주고 있음
- 145 -
연구실적
- 연구기간
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 연구실적 정보에서 연구기간 항목이 종료년월
만 나와 있는 경우는 어떻게 처리하는지
처리 방법
및 사례
- 연구기간에 관한 정보가 종료년월만 나와 있는 경우 임시로 1년의
기간을 책정하여 시작년월을 입력
ex) lsquo2005년 8월 OO에 관한 연구rsquo라는 연구실적의 입력 시 연구기간
에서 시작년월은 2004년 9월 종료년월은 2005년 8월로 입력
- 참여구분
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 연구실적 정보에서 참여구분(연구책임자 공동연
구자)의 경우 이를 어떻게 구분하는지
처리 방법
및 사례
- 연구실적에 관한 정보에서 참여구분이 되어 있지 않은 경우에는 해
당인력의 다른 연구실적 등을 감안하여 참여구분을 하여야 하나
대상이 평가위원인 경우 lsquo연구책임자rsquo로 임시 구분하여 줌
지식재산권
- 취득구분
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 지식재산권 정보에서 취득구분(출원 등록)이
구분되어 있지 않은 경우 어떻게 처리하는지
처리 방법
및 사례
- 수집된 지식재산권 정보에서 취득구분이 되어 있지 않은 경우 임
시로 lsquo등록rsquo으로 선택하여 입력
- 특허구분
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 지식재산권 정보에서 특허구분(특허 실용신안
의장 상표 소프트웨어)이 구분되어 있지 않은 경우 어떻게 처리
하는지처리 방법
및 사례
- 수집된 지식재산권 정보에서 특허구분이 되어 있지 않은 경우 임
시로 lsquo특허rsquo로 선택하여 입력
- 146 -
첨부1 NTIS 코드 표준
NTIS 표준코드
정보공개구분
코드값 코드값 의미
1 공개
2 기본인적사항만공개3 비공개
인력(직업)구분
코드값 코드값 의미
1 대학교2 연구소
3 산업계9 기타
소속구분코드
코드값 코드값 의미
1 재직중2 퇴직
3 해외연수6 파견중
학위코드
코드값 코드값 의미
2 학사이하5 석사
7 박사수료8 박사
- 147 -
학술지구분
코드값 코드값 의미 비고
01 국외전문학술지 발표 학술지가 국외전문학술지에 게재
02 국외학술대회발표논문집 발표 학술지가 국외학술대회발표논문집에 게재
03 국내전문학술지 발표 학술지가 국내전문학술지에 게재
04 국내학술대회발표논문집 발표 학술지가 국내학술대회발표논문집에 게재
05 기타논문집 발표 학술지가 기타논문집에 게재
역할구분
코드값 코드값 의미
1 단독2 공동제1 주저자3 공저자4 교신(책임)저자
참여구분
코드값 코드값 의미
A 연구책임자B 참여연구원
저역서구분
코드값 코드값 의미
1 저서2 역서
발행지구분
코드값 코드값 의미
1 국내2 국외
취득구분
코드값 코드값 의미
01 특허출원02 특허등록
- 148 -
코드값 코드값 의미
9511 조경middot지역시스템공학부
특허구분
코드값 코드값 의미 비고
01 특허 산업재산권이 특허에 해당하는 경우
02 실용신안 산업재산권이 실용신안에 해당하는 경우
03 디자인 산업재산권이 디자인에 해당하는 경우
04 상표 산업재산권이 상표에 해당하는 경우
05 기타 산업재산권이 기타에 해당하는 경우06 프로그램(SW) 산업재산권이 프로그램에에 해당하는 경우07 저작권 산업재산권이 저작권에 해당하는 경우08 신기술 인증 산업재산권이 신기술 인증에 해당하는 경우09 신제품 인증 산업재산권이 신제품 인증에 해당하는 경우10 국제출원(PCT) 산업재산권이 국제출원(PCT)에 해당하는 경우11 서비스 산업재산권이 서비스에 해당하는 경우
업적구분
코드값 코드값 의미
1 평가위원
2 위원회활동3 자문4 설계5 시공6 기술지도9 기타
기관코드(기관명이형전거DB)
코드값 코드값 의미
ZE02400 엘에스엠트론(주)ZE02378 (주)지앤시바이오ZE02376 (주)하나아이엔씨ZE02374 센게이지러닝코리아(주)ZE02373 (주)루켄테크놀러지스ZE02372 (주)디투알컨설팅
ZE02367 (주)대흥이엔지ZE02366 (사)한국벤처산업연구원ZE02365 CSG(주)ZE02364 국제상사(주)전자기술연구소
학과코드
- 149 -
9510 생물정보학과
9509 나노과학기술학부9508 지능기계공학과9507 생명과학기술학부9506 의과학과9505 부동산정보9495 보건정보관리
9999 기타9475 대학원
코드값 코드값 의미 코드값 코드값 의미
A01 교수 B32 기술원A02 부교수 C01 공무원A03 조교수 C02 법조인A04 전임강사 C03 의사
A05 시간강사 C04 교사A06 강사(기타) C05 군인A10 명예교수 D01 대표이사A11 석좌교수 D02 이사A12 강의교수 D03 전무A13 겸임교수 D04 상무
A14 계약교수 D05 부장A15 기금교수 D06 차장A16 대우교수 D07 과장A17 연구교수 D08 대리A18 초빙교수 D09 사원A19 객원교수 D10 부사장
A20 조교 D11 상임이사A21 대학원생 Z01 위원A22 POST-DOC Z02 의원A23 POST_MAS Z03 실장A24 초청교수 Z04 학과장A25 외래교수 Z05 주임
B01 수석연구원 Z06 단장B02 책임연구원 Z07 팀장B03 주임연구원 Z08 회장B04 전임연구원 Z09 본부장B05 선임연구원 Z10 처장B06 연구원 Z11 학장
B07 위촉연구원 Z12 센터장B10 수석연구위원 Z13 소장B11 책임연구위원 Z14 부처장B12 주임연구위원 Z15 국장B13 전임연구위원 Z16 연구주임
직위코드
- 150 -
B14 선임연구위원 Z17 연구소장
B15 연구위원 Z18 원장B20 전문위원 Z19 부원장B30 책임기술원 999 기타B31 선임기술원
코드값 코드값 의미 비고
AD 안도라 ANDORRA
AE 아랍에미리트 UNITED ARAB EMIRATESAF 아프가니스탄 AFGHANISTANAG 앤티가 바부다 ANTIGUA AND BARBUDAAI 안길라 ANGUILLAAL 알바니아 ALBANIAAM 아르메니아 ARMENIA
전공분야코드
코드값 코드값 의미
E340600 구강해부학E340601 육안일반해부학E340602 신경해부학E340603 육안두경부일반해부학
E340604 두경부신경해부학E340605 두경부응용해부학E340700 치아형태학E340701 영구치치아형태학E340702 유치치아형태학E340703 치아교합학
국가코드
개인정보활용동의구분
코드값 코드값 의미
Y 동의N 비동의
- 3 -
코드 대상 항목 정의
구분 항목 세부항목
참여인력정보(16개)
기본정보(3개) 자택우편번호 부처(기관)분류코드
소속기관사항(3개) 인력구분 소속기관명 직위명 기관우편번호
학력사항(4개) 전공 학위 학과 취득국가 취득대학
경력사항(2개) 직위명
논문실적(3개) 저자역할구분 학술지구분 SCI여부
지식재산권(1개) 특허구분
평가위원(1개)
저역서실적(1개) 저역서구분
코드 대상 항목이란 데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목
14 정제 수준
데이터 특성 및 정제 지침
- lsquo속성값 전체 존재rsquo 데이터
공통사항 오류 데이터 정정 및 코드 매핑
① 중복 자료 중 데이터 신뢰성에 근거하여 통합 필수 항목 누락 확인 및 보충 선별(성명 주
민등록번호) 형식 확인(주소 전화번호 및 E-Mail)
② 중복 자료 중 최신 자료 선정 및 확인 형식 확인 (주소 전화번호)
③ ⑤~⑪ 중복 자료 중 데이터 신뢰성에 근거하여 통합
번호는 lsquo정제 대상 항목 정의rsquo 표에서 각 항목에 붙여진 번호
- lsquo일부 또는 6개 미만rsquo 데이터
데이터 누락 정도를 판단하여 필요한 경우 해당 기관에 보완 요청
데이터 보완 후 lsquo속성값 전체 존재rsquo 데이터와 같은 방식으로 정제
오류 유형 정의 및 정제 형태
- 발생 가능한 오류 유형
주요 항목 중 데이터가 존재하지 않는 경우
데이터의 Type(문자형 숫자형)에 위배되는 값이 들어있는 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
정해진 법칙에 따른 번호가 아닌 경우
실제로 존재하지 않는 부점(구분자) 등이 입력되어 있는 경우
- 4 -
오류 유형 세부 정제 지침 비고
주요 항목 중 데이터가 null- 정제가 불가능하므로 정보 재수집
(해당 기관에 정보 제공 재요청)
데이터 Type 오류
- 적합한 Type으로 수정 가능한 정도(의미상으로는
유효한 경우)의 오류는 수정하고 그렇지 않은 데
이터는 삭제
데이터 형식 오류- 데이터들 중 가장 많은 유형을 정규 형식 정고 형
식에 위배되는 데이터들은 정규 형식으로 변환
부점(구분자) 오류
- 실제 서비스 되는 데이터값과 비교하여 변환 과정
에서 발생한 오류면 실제 데이터값으로 변환하고
원시 데이터 자체가 오류인 경우에는 삭제 처리
코드값 오류
- 일치 유사한 코드값으로 변환
- 유사 가장 적합한 코드값으로 변환
- 상이 lsquo기타rsquo코드값으로 분류 또는 삭제
논문제목 오류 - 논문제목1은 반드시 필수 입력으로 처리
중복 데이터들의 데이터 값
상충 오류
- 변경될 수 없는 기본정보(이름 주민번호)의 경우는
기존 데이터 우선
- 변경 가능한 정보(기관명 논문 등)의 경우 최신 업
데이트된 정보를 우선
코드의 값이 정해진 범위를 벗어나는 경우
ex) 기관 코드와 인력시스템 사용 코드와의 매핑 오류
기관 데이터의 코드 항목 값이 잘못 입력되어 있는 경우
국문과 영문으로 구분되는 동일 데이터 항목에 잘못된 위치에 항목 값이 입력되어 있는 경우
ex) 논문실적정보의 국문제목에 영문제목이 입력되어 있는 경우
데이터가 복수로 존재하며 서로 상충되는 경우
ex) 유효하지 않은 주민등록번호의 중복
- 조치 가능한 데이터 정제 형태
재수집 데이터를 제공한 기관에 재요청하여 부족한 데이터 내용을 재수집
수정 데이터 내용은 수정하지 않고 데이터 형태 및 특수문자 수정 정도의 정제
삭제 데이터 값 삭제(Garbage 처리) 또는 레코드 삭제
위의 경우 원시 데이터 값은 관리를 위해 따로 보관
정제 제외 데이터 값이 누락이거나 오류로 판단되지만 정확한 데이터 내용을 알 수 없는 경
우 기준 데이터가 없으므로 정제 대상에서 제외 또한 별다른 오류로 보이지 않는 경우도 정
제 대상에서 제외
오류 유형별 세부 정제 지침
~은 lsquo발생 가능한 오류 유형rsquo 내용 참조
~은 lsquo조치 가능한 데이터 정제 형태rsquo 내용 참조
- 5 -
구분 비고
기본정보 이메일 기존 수집 데이터를 통해 보완
소속기관사항 있으나필드가 null인것
인력구분 기관명이형전거DB 생성 완료 후 적용함
소속기관 우편번호주소가 있는 경우 우편번호 찾기를 통해 보완주소가 없는 경우 기존 수집 데이터를 통해 보완
소속기관 주소 기존 수집 데이터를 통해 보완
소속기관명기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
학력사항 있으나 필드가null인것
전공기존 수집 데이터를 통해 보완하고 기관명이형전거DB로 매핑함
학위기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
소속기관사항 없는것 기존 수집 데이터를 통해 보완
학력사항 없는것 기존 수집 데이터를 통해 보완
인력정보의 누락항목에 대한 보완(기존 서비스 데이터 기준)
기타 (정보 식별자 부여)
- 데이터 정제 최종 단계에서 식별자 부여 체계에 따라 정보식별자(번호) 삽입
- 정보식별자(번호)는 식별체계 API에 의해 자동으로 부여 되며 식별 부여 체계는 사업단 내 식별
체계 담당자가 마련하여 제공
고려 사항
- 정확한 항목매핑 후 작업이 진행되어야 함
- 정제데이터 관리는 임시테이블을 통해서 관리되며 다양한 에러 유형별로 체계적인 관리가 되어야 함
15 정제 작업 방식
중복 확인 기계작업
- 정제 도구에서 제공하는 중복 확인 기능을 이용하여 중복 항목의 리스트 작성(기계작업)
데이터 통합 기계작업 + 수작업
- 중복으로 확인된 항목들의 리스트를 비교하여 통합
- 기계적으로 필드간의 충돌이 없음을 확인할 수 있는 항목은 자동 통합하고 기계적으로 충돌을
- 6 -
확인할 수 없는 경우는 수작업으로 필드별 데이터 통합을 수행
- 최신 또는 최종 여부를 확인하여 통합해야 하는 경우 해당 데이터에 포함된 일자 데이터를 감안
하여 선별 통합(일자 및 기간의 충돌이 없는 경우 기계작업 충돌이 있는 데이터는 리스트 업
후 수작업)
필수 데이터 누락 확인 및 보충 선별 기계작업 + 수작업
- 소속기관명 E-mail 등과 같이 누락되지 말아야 할 항목을 설정하고 기계적으로 누락된 항목의
리스트를 추출(기계작업)
- 이 리스트에 대하여 보충 가능한 데이터는 보충하고 보충이 불가능한 경우 서비스 불가 리스트
로 따로 추출(수작업)
형식 확인 기계작업 + 수작업
- E-Mail 주소 전화번호와 같은 형식이 어느 정도 정의된 데이터의 경우 기본 형식을 템플릿으
로 지정
- 정형화되지 않은 데이터의 리스트를 추출하여 이 중 기계적으로 형식을 일치시키고(기계작업)
일치되지 않은 데이터를 수작업으로 확인하여 수정하거나 형식 불량 데이터 리스트로 따로 추
출(수작업)
16 데이터 검수
161 데이터 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
- 7 -
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
17 데이터 이관
171 NTIS 참여인력 DB 현황 및 데이터 흐름
NTIS 참여인력 DB는 물리적으로 각 연계기관과 NTIS의 데이터 연계를 위해 각 연계기
관에 구성된 연계기관 공동활용 DB와 RampD 참여인력을 관리하기 위한 인력DB RampD참여
인력 서비스 DB로 구성되어 있다
그림 3 NTIS DB 현황 및 데이터 흐름
172 NTIS DB 간 테이블 매핑
NTIS 참여인력 DB가 기능별로 분리되어 있음으로 인해 연계DB에서 인력 관리DB 간
항목 매핑 정의가 필요하다 DB 간 항목 매핑은 아래와 같다
정보구분 테이블명 수집DB 관리DB
인력정보
인력 기본정보 MP_BASIC THR_BASE
소속기관사항 HOFF_ORG THR_JAEJIK
학력사항 SCRE THR_SCHOOL
경력사항 CAREER THR_CAREER
논문실적 PAPER_OUT THR_PAPER
자격사항 CERT THR_LICENSE
지식재산권실적 IPR_OUT THR_PATENT
소속학협회현황 BLNG_INSTIT THR_ACTIVE
저역서실적 TRNSWRT_OUT THR_BOOK
훈포장사항 AWARD THR_MEDAL
- 8 -
항 목 세 부 항 목
기본
기본정보 영문성명 휴대전화 E-mail 개인홈페이지
전문분야 전문(연구)분야
재직기관 기관명 부서명 직위 주소 전화 팩스
학력 최종학위 학위 학위취득일 학교명 전공명
경력 경력사항 시작년월 종료년월 재직기관명 직위
실적
논문실적 논문명 저널명 게제(권)집 페이지 게제년월 공동저자명
연구실적 시작년월 종료년월 발주기관 참여구분(역할) 연구명
특허출원등록구분 출원등록번호 출원등록국가 특허출원명 출
원등록일자
173 데이터 이관
수집 DB에 전송되는 인력정보는 중복 인력이 존재 하며 동일인물의 정보일 지라도 각
기관별 보유 항목이 다르므로 관리DB로 이관을 위해 각 항목별 이관 방안이 필요하다 따
라서 별도의 방안을 마련하여 데이터 이관을 실시하도록 한다
2 인력정보 영문이력 입력 지침
21 영문이력 DB 구축 필요성
해외의 연구자 혹은 외국의 연구기관등에게 관련분야의 연구자문에 필요한 국내 연구전
문가 혹은 국제 공동연구활동 등을 지원하기 위한 국내 인물에 대한 영문검색 체널제공
인물정보에 대하여 영문DB구축을 수행하고 웹을 통한 영문검색을 지원함으로써 국제공
동연구를 지원하기 위한 기반을 조성
기존 개인정보 공동활용에 동의한 연구자들을 대상으로 파악한 영문이력DB 구축방법을
통해 인력정보에 대하여 영문화 작업을 수행
22 영문이력 DB 구축 대상
기본정보 학력사항 경력사항 논문실적 연구실적 특허실적 등
23 영문이력 DB 구축 항목
영문이력서 제공가능 인력에 대해 영문이력서를 제공받아 이를 바탕으로 영문 DB를 구
축하고 번역 요청자를 대상으로 번역을 통한 영문DB구축
- 9 -
항 목 세 부 항 목 영문명 비고
기본(BasicInformation)
기본정보 영문성명 English Name - 한글이력정보와 공동 사용- 전문분야는lsquo08 개정 분류코드 영문명 활용
휴대전화(국가번호)
Cellular PhoneNumber
E-mail E-mail
개인홈페이지 Homepage
전문분야 전문(연구)분야 Research Field 1
Research Field 2
Research Field 3
검색키워드 전문분야명
재직기관(organization)
기관명 Organization Name - 현재 재직기관사항 1개 입력
부서명 Department
직위 Job title(position)
우편번호 Postal Code
주소 Address
전화(국가번호) Telephone
팩스(국가번호) Fax
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) Degree Code
학위취득일 GraduationDate
학교명 School
전공명 Major
경력(Career)
경력사항(CAREER)
시작년월 Start Date - 재직 경력으로 주요 경력입력 현 재직정보제외
종료년월 End Date
재직기관명 Organization Name
직위 Position(Job Title)
실적ResearchResult
논문실적(paper)
논문명 Title - 최근 5년 이내만 입력저널명 Journal Name
게제(권)집 Volume
게제호 Number
시작페이지 Start Page
종료페이지 End Page
게제년월 Date of Publication
공동저자명 Co-Author
비고 Etc
연구실적ResearchProject
시작년월 Start Date
종료년월 End-Date
발주기관 Funding organization
참여구분(역할)-코드
Role
연구실적명 title
영문이력 구축 대상 항목 정의
- 10 -
특허(patent)
출원등록구분-코
드
appliedregistered
출원등록번호 number
출원등록국가-코
드
National Code
특허출원명 Patent name
출원등록일자 Date
코드 대상 항목(데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목)
코드 대상 항목 정의
항목 세부항목 코드
전문분야(3개) 전문(연구)분야NTIS 표준코드(국가과학기술
표준분류) 활용
학력사항(1개) 최종학위
2(학사)
5(석사)
8(박사)
연구실적(1개) 참여구분(역할)A(연구책임자)
B(참여연구원)
특허실적(2개)특허구분(출원등록)
01(출원)
02(등록)
등록국가 NTIS 표준코드 활용
코드 대상 항목이란 데이터의 속성 중 사전에 기호화 되어 정의되어야 하는 항목
daggerNTIS 표준코드에 영문명을 포함하여 사용
24 영문이력 DB 수집 방법
E-mail을 통한 영문이력서 제공 요청 메일 발송
- 영문이력 DB 구축에 동의하고 영문이력서 제공이 가능한 연구자 대상
전화연락을 통한 이력서 수집
- 영문이력서 제공 요청 메일과 병행하여 영문이력서 제공동의자를 대상으로 영문이력
입력자들이 전화를 통하여 이력서 수집 요청
E-mail을 통한 영문이력서 번역 대행 안내 메일 발송
- 영문이력 DB 구축에 동의한 번역 요청 동의자를 대상으로 메일 발송
이력정보(한글)는 poolkistirekr을 통해 파일형태로 수집 관리함
이력정보(한글)는 메일을 통해서 파일형태(HWP MS-WORD PDF 등)로만 수집함
- 11 -
항 목 선처리 항목
기본 재직기관 기관명 직위
학력 최종학위 학교명 전공명
경력 경력사항 재직기관명 직위
실적논문실적 저널명
연구실적 발주기관
구분 선처리 방법
기관명
기관명(재직기관)
학교명(학력사항)
재직기관명(경력사항)
발주기관(연구실적)
- 웹검색(예 NAVER 백과사전 및 기관 홈페이지)
웹검색시는 출처 기록
- 웹검색 불가는 직접번역
직위직위(재직기관)
직위(경력사항)
- 직위에 대한 영문 코드표 참조
영문 코드표의 출처 기록
전공명 전공명(학력사항)- 전공명에 대한 영문 코드표 참조
영문 코드표의 출처 기록
저널명 저널명(논문실적)- 웹검색(예 httpsocietykistirekr)
웹검색시는 출처 기록
25 영문이력 DB 입력 방법
영문이력 입력
- 수집된 영문이력서는 입력자들이 등록수정 화면을 통해 직접 입력
영문이력 입력결과 확인
- 입력 완료된 영문이력서의 확인은 다른 입력자에 의해 입력결과를 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 본인확인
- 영문이력서의 입력 확인 완료 후 영문이력 본인에게 안내메일을 발송하여 확인
- 본인확인에 의해 수정 가능
26 영문이력 DB 번역 방법
영문이력 선처리 작업
- 영문이력 번역 수행 전 공통적인 항목에 대해 선처리 작업 수행
영문이력 번역
- 인력DB의 번역 대상자 및 수집된 이력서는 영문이력 관리 기능을 통해 번역 수행
- 12 -
영문이력 번역확인
- 번역 완료된 영문이력정보의 확인은 다른 번역자에 의해 번역결과를 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 전문가검수
- 번역확인 완료된 영문이력정보의 검수는 전문가에 의해 확인
- 육안으로 확인하고 오류 발견 후 바로 수정하여 조치
- 품질활동 점검표 작성 등의 수행결과를 주기적으로 측정하여 품질목표를 달성
영문이력 본인확인
- 영문이력정보의 번역 번역확인 전문가검수 완료 후 영문이력 본인에게 안내메일을
발송하여 확인
- 본인확인에 의해 수정 가능함
KISTI 검수
- KISTI 검수 절차를 거쳐 영문이력에 대해 서비스 제공
27 검수 확인
입력 및 번역 결과 보고
- 주간보고 영문이력 번역에 대한 현황을 매 주 보고
- 이슈사항보고 이슈사항 발생 시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 데이터(전체 항목 필드 기준)의 01 이하(품질목표 999)
- 오류 체크 방식 전체 데이터에서 본인확인 미완료 대상 중 무작위로 30 샘플링
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상
데이터건수) 항목가중치의 합산 결과가 01 이하
- 전문가검수는 모든 번역대상자를 대상으로 수행
- 번역확인 및 전문가검수 단계에서 자체적으로 품질 활동 수행
오류율 산정 기준
- 인력정보 영문이력에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며
오류율 산정에서 제외함
- 13 -
구분 항목 세부항목 세부항목 설명
참여인력정보(42개)
기본정보(8개)
주민등록번호 인력 고유의 주민등록번호
성명 인력 한글 영문 한자 성명
자택주소 인력 본인의 자택 주소
자택우편번호 인력 본인의 자택 우편번호
자택전화번호 인력 본인의 자택 전화번호
핸드폰번호 인력 본인의 핸드폰 번호
E-mail 인력 본인의 E-mail
부처(기관)분류코
드인력 본인의 부처(기관)분류코드
Ⅱ 인력정보 데이터 정제 매뉴얼
1 참여인력 데이터 정제 매뉴얼
11 개요
111 정제 목표
인력데이터는 연구관리전문기관에서 수집하여 통합 구축하므로 여러 기관에 중복으로 입력되어 있
는 경우에 이중등록 데이터가 존재할 수 있어 이를 NTIS에서 활용하기 위해서 정의된 중복기준에
따라 이중등록 확인 및 제거하는 데이터 정제를 절차에 따라 수행
연구관리전문기관의 인력정보관리시스템의 미비 또는 관리체계의 미흡으로 인해 발생된 누락데이
터 및 입력된 데이터의 오류를 수행 가능한 범위 내에서 작업자 및 시스템에 의한 오류 수정
연구관리전문기관별로 각각의 고유의 코드 및 항목체계를 활용하거나 코드가 필요한 항목에 코드
를 사용하지 않고 있는 실정이며 이러한 연구관리전문기관 인력데이터를 NTIS에서 활용하기 위
해서는 NTIS 통합 표준 코드 및 항목으로의 매핑
12 데이터 정제 목록 및 범위
121 데이터 정제대상 및 항목 정의
- 14 -
구분 항목 세부항목 세부항목 설명
소속기관사항(7개)
소속기관명 인력 본인의 현재 소속기관명칭
학과부서명 인력 본인의 소속기관 내 소속학과부서명
직위명 인력 본인의 소속기관 내 직위명칭
사무실전화번호 인력 본인의 소속기관 내 전화번호
기관주소 현재 소속기관의 우편번호 및 상세주소
인력구분 인력구분(대학교 연구소 산업계 기타)
최초임용일 현재 소속중인 기관에 최초 임용(근무)일
학력사항(10개)
전공 인력의 학위별 전공명
취득대학 인력의 학위별 출신 대학교명
학위학력정보의 학위종류예) 학사이하 석사 박사수료 박사
입학일 인력의 학위별 입학년월
졸업일 인력의 학위별 졸업년월
학과 인력의 학위별 출신 대학교 학과명
취득국가 인력의 학위별 출신 대학교 소재지(국가)
지도교수명 인력의 각 학위별 지도교수명
학위논문명 인력의 최종학위취득시 제출한 논문명
학위취득일 인력의 최종학위취득일
경력사항(3개)
근무처명인력의 전ㆍ현재 직업 및 교육과정의 기관명 및세부사항(학과 부서 등)
직위명인력의 전ㆍ현재 직업 및 교육과정의 직급 또는직위명
근무기간인력의 전ㆍ현재 직업 및 교육과정의 시작년월및 종료년월
자격사항(3개)
자격발행처 인력이 발급받은 자격증 등의 발급기관명
자격증명 인력이 발급받은 자격증 등의 자격명
자격취득일 인력이 발급받은 자격증 등의 발급년월
논문실적(8개)
논문발표일 인력이 저술한 논문을 게재하거나 발표한 년월
논문제목1 인력이 저술한 논문의 논문제목1
- 15 -
구분 항목 세부항목 세부항목 설명
논문제목2 인력이 저술한 논문의 논문제목2
저자역할구분
인력이 저술한 논문에 있어서의 역할정도예) 단독공동제1주저자공저자교신(책임)저자
발행처인력이 저술한 논문이 실린 간행물을 발행한 발행처
학술지구분
인력이 저술한 논문의 게재 및 발표형태와 장소에 관련하여 학술지구분예) 국외전문학술지 국외학술대회발표논문집 국내전문학술지 국내학술대회발표논문집 기타논문집
학술지명 인력이 저술한 논문이 실린 간행물의 명칭
SCI여부인력이 저술한 논문이 실린 간행물이 SCI에 수록된 간행물 구분
지식재산권(3개)
지식재산권명 인력이 출원하거나 등록한 지식재산권명
출원_등록번호인력이 출원하거나 등록한 지식재산권의 출원등록번호
특허구분
인력이 출원하거나 등록한 지식재산권의 종류예) 특허 실용신안 디자인 상표 기타 프로그램(SW)저작권 신기술 인증 신제품 인증 국제출원(PCT) 서비스
평가위원(11개)
소속학협회현황(3개)
담당업무인력의 전ㆍ현재 소속 학회 및 협회 내에서의 담당업무
직위 인력의 전ㆍ현재 소속 학회 및 협회 내에서의 직위
학협회사항 인력의 전ㆍ현재 소속 학회 및 협회명
훈포장사항(3개)
수상년월 인력이 훈장 포장 등을 수상한 년월
수여기관명 인력이 수상한 훈장 포장 등을 수여한 기관명
훈포장명 인력이 수상한 훈장 포장 등의 수상명
저역서실적(5개)
저서명1 인력이 저술하거나 역술한 도서의 제목1
저서명2 인력이 저술하거나 역술한 도서의 제목2
발행년 인력이 저술하거나 역술한 도서를 발행한 년도
발행처 인력이 저술하거나 역술한 도서를 발행한 장소
저역서구분 인력이 저술하거나 역술한 도서에 대한 구분 예) 저서 역서
- 16 -
구분 항목 세부항목 현행 DB 항목식별
항목비고
참여
인력
정보
(56개)
기본정보
(12개)
주민등록번호
인물ID NTIS 식별체계 생성
인물관리번호(KOI) 시스템 생성
주민등록번호 lsquo-rsquo포함 14자리
성명
성명-한글
성명-영문
성명-한자
자택주소기본주소(주소1) 우편번호 내 주소를 참조
상세주소(주소2)
자택우편번호 우편번호
자택전화번호 전화번호
핸드폰번호 핸드폰번호
E-mail E-mail
소속기관
사항
(11개)
소속기관명소속기관코드 소속기관명 기준 매핑
기관명이형전거DB 활용소속기관명
부서명 근무부서명
직위명직위코드 직위명 기준 매핑
NTIS 직위코드직위명
사무실전화번
호사무실전화
기관주소
우편번호
기본주소(주소1) 우편번호 내 주소를 참조
상세주소(주소2)
인력구분
인력유형구분
(대학교 연구소 산업
계 기타)
NTIS 인력구분코드
기관명이형전거DB 활용
최초임용일 최초임용일
학력사항
(14개)
전공전공분야 전공명 기준 매핑
NTIS 전공코드전공명
취득대학학위취득대학코드 학위취득대학명 기준 매핑
기관명이형전거DB 활용학위취득대학명
학위 학위코드 NTIS 학위코드
입학일 입학년월
졸업일 졸업년월
학과학과코드 학과명 기준 매핑
NTIS 학과코드학과명
취득국가 취득국가코드 NTIS 국가코드
지도교수명 지도교수명
정제 대상 항목
공동활용정보를 포함하는 현행 DB 구성 기준 69개 항목
- 17 -
구분 항목 세부항목 현행 DB 항목식별
항목비고
학위논문명최종학위논문명1
최종학위논문명2
학위취득일 최종학위취득일
경력사항
(5개)
근무처명 근무처명
직위명직위코드 직위명 기준 매핑
NTIS 직위코드직위명
근무기간근무시작일
근무종료일
자격사항
(3개)
자격발행처 자격발행처
자격증명 자격증명
자격취득일 자격취득일
논문실적
(8개)
논문발표일 논문발표일
논문제목1 논문제목1
논문제목2 논문제목2
저자역할구분 저자역할구분 NTIS 저자역할구분 코드
발행처 발행처명
학술지구분 학술지구분 NTIS 학술지구분코드
학술지명 학술지명
SCI여부 SCI여부 NTIS SCI 여부구분 코드
지식
재산권
(3개)
지식재산권명 지식재산권명
출원_등록번호 출원등록번호
특허구분 특허구분 NTIS 특허구분 코드
평가
위원
(13개)
소속학협
회
현황
(5개)
담당업무 담당업무
직위 직위 직위명
학협회사항
학협회명
활동시작일
활동종료일
훈포장
사항
(3개)
수상년월 수상년도
수여기관명 수여기관명
훈포장명 수상명
저역서
실적
(5개)
저역서명1 저역서명1
저역서명2 저역서명2
발행년 발행년도
발행처 발행처명
저역서구분 저역서구분 NTIS 저역서 구분 코드
- 18 -
구분 항목 세부항목 정제항목 오류유형 비고
참여
인력
정보
(56개)
기본정보
(12개)
주민등록번호
인물ID
-인물ID이 발급되지 않는 경우
예) 외국인 주민등록번호 유효하
지 않거나 중복된 경우
인물관리번호(KOI)1 포맷 오류
예) 자리수 lsquo-rsquo가 있는 경우
주민등록번호
-주민등록번호가유효하지않는경우
예) lsquo-rsquo포함한 14자리가 아닌경우
주민등록번호규칙에맞지않은경우
-중복되는 주민등록번호의 경우
-공란 및 특수문자가 있는 경우
이관 후 서비
스대상에서
제외
성명
성명-한글
-Null인 경우
-공란 및 특수문자 숫자가 있는
경우
-한글이 아닌 경우이관 후 성명
없으면 서비
스대상에서
제외
성명-영문
-공란 및 특수문자 숫자가 있는
경우
-영문성명의 범위를 벗어나는 경
우
예) Lee KHS
성명-한자
-공란 및 특수문자 숫자가 있는
경우
-한자가 아닌 경우
자택주소
기본주소(주소1)
-우편번호 존재하고 Null의 경우
-우편번호의 주소와 상이한 경우
-주소지 정보가 아닌 경우
상세주소(주소2)
-우편번호 및 기본주소 Null의
경우
-주소정보가 아닌 경우
자택우편번호 우편번호-우편번호 Null인 경우
-우편번호가 old data인 경우
자택전화번호 전화번호 -전화번호 Null인 경우
13 데이터 분석 내역
131 세부 항목별 오류 패턴유형 분석
인력데이터
항목별 정해진 규칙에 위배되는 값이 들어있는 경우
- 19 -
구분 항목 세부항목 정제항목 오류유형 비고
-전화번호가 표준 형식이 아닌
경우
-전화번호 데이터가 아닌 경우(지
역번호 없는 경우 포함)
-핸드폰번호인 경우
핸드폰번호 핸드폰번호
-핸드폰번호 Null인 경우
-핸드폰번호가 표준 형식이 아닌
경우
-핸드폰번호 데이터가 아닌 경우
(지역번호 없는 경우 포함)
-전화번호인 경우
E-mail E-mail
-E-mail Null인 경우
-표준 이메일 형식이 아닌 경우
-구분자가 잘못된 경우
-가베지 성 데이터 존재
소속기관
사항(11개)
소속기관명
소속기관코드 NA코드 오류
유형 참조
소속기관명-소속기관명이 기관명이형전거DB
내 대표기관명이 아닌 경우
대표기관명으
로 갱신
부서명 근무부서명 -근무부서명 Null인 경우
직위명
직위코드 NA코드 오류
유형 참조
직위명
-직위명 Null인 경우
-직위명이 직위코드 내 명칭이
아닌 경우
사무실전화번호 사무실전화
-전화번호 Null인 경우
-전화번호가 표준 형식이 아닌
경우
-전화번호 데이터가 아닌 경우(지
역번호 없는 경우 포함)
-핸드폰번호인 경우
기관주소
우편번호-우편번호 Null인 경우
-우편번호가 old data인 경우
기본주소(주소1)
-우편번호 존재하고 기본주소
Null의 경우
-우편번호의 주소와 상이한 경우
-주소지 정보가 아닌 경우
상세주소(주소2) -우편번호 및 기본주소 Null의
- 20 -
구분 항목 세부항목 정제항목 오류유형 비고
경우
-주소정보가 아닌 경우
인력구분 인력유형구분 NA코드 오류
유형 참조
최초임용일 최초임용일 NA날짜 오류
유형 참조
학력사항
(14개)
전공전공분야 NA 코드 오류
유형 참조전공명 -전공명 Null인 경우
취득대학
학위취득대학코드 NA코드 오류
유형 참조학위취득대학명 -학위취득대학명 Null인 경우
학위 학위코드 NA코드 오류
유형 참조
입학일 입학년월 NA날짜 오류
유형 참조
졸업일 졸업년월 NA날짜 오류
유형 참조
학과
학과코드 NA코드 오류
유형 참조학과명 -학과명 Null인 경우
취득국가 취득국가코드 NA코드 오류
유형 참조
지도교수명 지도교수명 -지도교수명 Null인 경우
학위논문명
최종학위논문명1 -가베지 데이터인 경우
최종학위논문명2 -가베지 데이터인 경우
학위취득일 최종학위취득일 NA날짜 오류
유형 참조
경력사항
(5개)
근무처명 근무처명-근무처명 Null인 경우
-가베지 데이터인 경우
직위명
직위코드 NA 코드 오류
유형 참조직위명 1 직위명 Null인 경우
근무기간
근무시작일 NA날짜 오류
유형 참조
근무종료일 NA날짜 오류
유형 참조
- 21 -
구분 항목 세부항목 정제항목 오류유형 비고
자격사항
(3개)
자격발행처 자격발행처-자격발행처 Null인 경우
-가베지 데이터인 경우
자격증명 자격증명-자격증명 Null인 경우
-가베지 데이터인 경우
자격취득일 자격취득일 NA날짜 오류
유형 참조
논문실적
(8개)
논문발표일 논문발표일 NA날짜 오류
유형 참조
논문명1 논문제목1 -가베지 데이터인 경우
논문명2 논문제목1 -가베지 데이터인 경우
저자역할구분 저자역할구분 NA코드 오류
유형 참조
발행처 발행처명-발행처명 Null인 경우
-가베지 데이터인 경우
학술지구분 학술지구분 NA코드 오류
유형 참조
학술지명 학술지명-학술지명 Null인 경우
-가베지 데이터인 경우
SCI여부 SCI여부 NA코드 오류
유형 참조
지식
재산권
(3개)
지식재산권명 지식재산권명-지식재산권명 Null인 경우
-가베지 데이터인 경우
출원_등록번호 출원등록번호-출원등록번호 Null인 경우
-가베지 데이터인 경우
특허구분 특허구분 NA코드 오류
유형 참조
평가
위원
(13개)
소속학
협회
현황
(5개)
담당업무 담당업무-담당업무 Null인 경우
-가베지 데이터인 경우
직위 직위-직위 Null인 경우
-가베지 데이터인 경우
학협회사항
학협회명
-학협회명 Null인 경우
-직위명이 포함된 경우
-가베지 데이터인 경우
활동시작일 NA날짜 오류
유형 참조
활동종료일 NA날짜 오류
유형 참조
- 22 -
구분 항목 세부항목 정제항목 오류유형 비고
훈포장
사항
(3개)
수상년월 수상년도 NA날짜 오류
유형 참조
수여기관명 수여기관명-수여기관명 Null인 경우
-가베지 데이터인 경우
훈포장명 수상명-수상명 Null인 경우
-가베지 데이터인 경우
저역서
실적
(5개)
저역서명
저역서명1 -가베지 데이터인 경우
저역서명2 -가베지 데이터인 경우
발행년 발행년도 NA날짜 오류
유형 참조
발행처 발행처명-발행처명 Null인 경우
-가베지 데이터인 경우
저역서구분 저역서구분 NA코드 오류
유형 참조
구분 항목 세부항목 정제항목 오류내역 비고
참여
인력
정보
(11개)
소속기관사항(1개) 최초임용일최초임용일
YYYYMMDD
-YYYY가 없는 경우(누락)
-MM이 없는 경우
-DD가 없는 경우
-YYYYMMDD이 유효하지
않은 경우
학력사항(3개)
입학일입학년월
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
졸업일졸업년월
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-입학년월보다 같거나 작
은 경우
학위취득일최종학위취득일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
- 23 -
구분 항목 세부항목 정제항목 오류내역 비고
경력사항(2개) 근무기간
근무시작일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
근무종료일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-근무시작일보다 같거나
작은 경우
자격사항(1개) 자격취득일자격취득일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
논문실적(1개) 논문발표일논문발표일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
소속학협회현황(2개) 학협회사항
활동시작일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
활동종료일
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우
-활동시작일보다 같거나
작은 경우
훈포장사항(1개) 수상년월수상년도
YYYYMM
-YYYY이 없는 경우(누락)
-MM이 없는 경우
-YYYYMM이 유효하지 않
은 경우평가
위원
(1개)
저역서실적(1개) 발행년발행년도
YYYY
-YYYY이 없는 경우(누락)
-YYYY이 유효하지 않은
경우
시작일보다 종료일이 같거나 작은 경우 종료일을 삭제
날짜의 경우 본인의 생년월일보다 작을 수 없음
- 24 -
구분 항목 세부항목 정제항목 오류유형 비고
참여
인력
정보
(14개)
기본
정보
(1개)
자택우편번호 우편번호-Null 경우
-우편번호와 주소정보가 불일치
외국주소는
유지
소속
기관
사항
(4개)
소속기관명소속기관코드
소속기관명
-소속기관명만 존재하는 경우
-소속기관코드가 기관명이형전거
DB의 이형기관코드가 아닌 경우
-소속기관명이 기관명이형전거DB
의 대표기관명이 아닌 경우
직위명직위코드
직위명
-직위명만 존재하는 경우
-직위명 직위코드가 존재하지 않
는 경우
기관주소 우편번호-Null의 경우
-우편번호와 주소정보가 불일치
인력구분 인력유형구분-기관명이형전거DB의 기관유형구
분과 불일치
학력
사항
(4개)
전공전공분야
전공명
-전공명만 존재하는 경우
-전공명 전공분야코드가 Null인 경우
취득대학학위취득대학코드
학위취득대학명
-학위취득대학명만 존재하는 경우
-학위취득대학코드가 기관명이형
전거DB의 이형기관코드가 아닌
경우
-학위취득대학명이 기관명이형전
거DB의 대표기관명이 아닌 경우
학위 학위코드
-학위코드가 Null인 경우
-학위코드가 구분 코드내 표함되
지 않는 경우
학과학과코드
학과명
-학과명만 존재하는 경우
-학과명 학과코드가 존재하지 않
는 경우
취득국가 취득국가코드
-Null인 경우
-기관 국가코드와 NTIS 국가코드
매핑 오류
경력
사항
(1개)
직위명직위코드
직위명
-직위명만 존재하는 경우
-직위명 직위코드가 Null인 경우
코드의 값이 정해진 범위를 벗어난 경우
- 25 -
구분 항목 세부항목 정제항목 오류유형 비고
논문
실적
(3개)
저자역할구분 저자역할구분
-Null인 경우
-저자역할구분이 구분 코드 내 포
함되지 않은 경우
학술지구분 학술지구분
-학술지구분이 Null인 경우
-학술지구분이 구분 코드내 포함
되지 않은 경우
SCI여부 SCI여부
-Null인 경우
-SCI여부가 구분코드 내 포함되지
않은 경우
지식
재산
권
(1개)
특허구분 특허구분
-Null인 경우
-특허구분이 구분 코드내 포함되
지 않은 경우
평가
위원
(1개)
저역
서
실적
(1개)
저역서구분 저역서구분
-Null인 경우
-저역서구분이 구분 코드 내 포함
되지 않은 경우
구분 항목 이중등록 검사 항목 기준 비고
참여인력
기본정보 주민등록번호() 주민등록번호는 유일해야 함
소속기관사항 소속기관명()소속기관명(대표기관명) 유일
해야 함
학력사항
1 취득대학() 학위() 입학일
2 취득대학() 학위() 졸업일
3 취득대학() 학위() 전공
4 취득대학() 학위() 학과
5 취득대학() 학위() 학위취득일
취득대학은 대표기관명으로
비교 함
경력사항1 근무처명() 직위명 근무시작일
1 근무처명() 직위명 근무종료일
논문실적
1 논문명() 논문발표일 학술지명
2 논문명() 논문발표일 ISSN
3 논문명() ISSN 게재권집 게재호
4 논문명() 학술지명 게재권집 게재호
132 이중등록 유형 분석
이중등록 정제 기준 정의( 주키)
- 26 -
구분 항목 이중등록 검사 항목 기준 비고
지식재산권
1 출원_등록번호()
2 지식재산권명() 출원등록구분() 특허구분
() 출원국가
저역서실적1 ISBN
2 저역서명() 저역서구분() 발행년 발행처
평가위원
소속학협회현황1 학협회명() 직위 시작일
1 학협회명() 직위 종료일
훈포장사항 훈포장명() 수상년월 수여기관명
자격사항 자격증명() 자격발행처 자격취득일
이중등록 데이터 분석 방법
- 데이터 정제 결과 데이터를 대상으로 기본정보는 주민등록번호 이외의 정보는 이중등록 검사 항
목을 기준으로 하여 시스템 정제를 통해 인력별 동일한 데이터가 존재하는지를 파악함
14 데이터 정제 기준
141 정제 지침
정제 내용
수집된 인력 정보를 등록하기 위한 데이터 분류 및 분석
여러 기관에 중복 입력된 인력정보에 대한 중복제거 및 데이터 취합
중복제거 후 취합 된 데이터는 확인 정정
- 학력사항 경력사항 등의 정보 이중 등록
- 기관별 인력정보 중 소속기관 상이
각 기관별 코드 및 항목에 대해 통합 인력DB의 코드 및 항목에 맞게 매핑
- 각 기관 고유의 코드 및 항목을 표준 코드 및 항목과 매핑 작업 필요
- 소속기관 전공 등 코드가 필요한 항목에 코드를 활용하지 않는 기관의 데이터는 표준 코드에
맞게 데이터 변환 필요
기본정보 경력정보 실적정보 등 인력정보에 대한 오류데이터 정정
- 각 항목의 데이터 내용을 검토하여 오류 정정
예) 학력사항의 데이터 내용 중 입학일이 졸업일 보다 나중일 경우 등
인력정보의 누락항목에 대한 보완
- 수집 가능한 범위 내에서 6개 주요항목기준(인력구분 우편번호 주소 소속기관명 전공 학위
등) 보완
- 27 -
구분 항목 세부항목
참여인력정보(41개)
기본정보(7개)주민등록번호 성명 자택주소 자택우편번호 자택전화번호
핸드폰번호 E-mail
소속기관사항(7개)소속기관명 부서명 직위명 사무실전화번호 기관주소 인
력구분 최초임용일
학력사항(10개)전공 취득대학 학위 입학일 졸업일 학과 취득국가 지도
교수명 학위논문명 학위취득일
경력사항(3개) 근무처명 직위명 근무기간
자격사항(3개) 자격발행처 자격증명 자격취득일
논문실적(8개)논문발표일 국문논문명 영문논문명 저자역할구분 발행처
학술지구분 학술지명 SCI여부
지식재산권(3개) 지식재산권명 출원_등록번호 특허구분
평가위원(11개)
소속학협회현황(3개) 담당업무 직위 학협회사항
훈포장사항(3개) 수상년월 수여기관명 훈포장명
저역서실적(5개) 국문저서명 영문저서명 발행년 발행처 저역서구분
정제 대상 정의
정제 대상 범위
- 연계시스템을 통해 등록변경되는 참여인력정보의 정제
정제 대상 항목
정제 수준 설정
lsquo속성값 전체 존재rsquo 데이터
- 공통사항 오류 데이터 정정 및 코드 매핑
- ① 중복 자료 중 데이터 신뢰성에 근거하여 통합 항목 누락 확인 및 보충 선별(성명 주민등록
번호) 형식 확인 (주소 전화번호 및 E-Mail)
- ② 중복 자료 중 최신 자료 선정 및 확인 형식 확인 (주소 전화번호)
- ③ ⑤~⑪ 중복 자료 중 데이터 신뢰성에 근거하여 통합
lsquo일부 또는 6개 미만rsquo 데이터
- lsquo속성값 전체 존재rsquo 데이터와 같은 방식으로 정제
오류 유형 정의 및 정제 형태
- 발생 가능한 오류 유형
- 28 -
오류 유형 세부 정제 지침 비고
데이터 내용 데이터 Type 오류
- 적합한 Type으로 수정 가능한 정도(의미상으
로는 유효한 경우)의 오류는 수정하고 그렇
지 않은 데이터는 삭제
데이터 형식 오류
- 데이터들 중 가장 많은 유형을 정규 형식으
로 보고 형식에 위배되는 데이터들은 정규
형식으로 변환
부점(구분자) 오류
- 실제 서비스 되는 데이터값과 비교하여 변환
과정에서 발생한 오류면 실제 데이터값으로
변환하고 원시 데이터 자체가 오류인 경우
에는 삭제 처리
데이터 코드 코드값 오류
- 일치 유사한 코드값으로 변환
- 유사 가장 적합한 코드값으로 변환
- 상이 lsquo기타rsquo코드값으로 분류 또는 삭제
데이터(not null)가 존재하지 않는 경우
데이터의 Type(문자형 숫자형)에 위배되는 값이 들어있는 경우
날짜의 경우 날짜로서 유효한 형태를 갖고 있지 않은 경우
정해진 법칙에 따른 번호가 아닌 경우
실제로 존재하지 않는 부점(구분자) 등이 입력되어 있는 경우
코드의 값이 정해진 범위를 벗어나는 경우
ex) 기관 코드와 인력시스템 사용 코드와의 매핑 오류
기관 데이터의 코드 항목 값이 잘못 입력되어 있는 경우
국문과 영문으로 구분되는 동일 데이터 항목에 잘못된 위치에 항목 값이 입력되어 있는 경우
ex) 논문실적정보의 국문제목에 영문제목이 입력되어 있는 경우
데이터가 복수로 존재하며 서로 상충되는 경우
ex) 유효하지 않은 주민등록번호의 중복
- 조치 가능한 데이터 정제 형태
수정 데이터 내용은 수정하지 않고 데이터 형태 및 특수문자 수정 정도 정제
삭제 데이터 값 삭제(Garbage 처리) 또는 레코드 삭제
위의 경우 원시 데이터 값은 관리를 위해 따로 보관
정제 제외 데이터 값이 누락이거나 오류로 판단되지만 정확한 데이터 내용을 알 수 없는 경
우 기준 데이터가 없으므로 정제 대상에서 제외 또한 별다른 오류로 보이지 않는
경우도 정제 대상에서 제외
오류 유형별 세부 정제 지침
- 29 -
논문제목 오류 - 논문제목1은 반드시 필수 입력으로 처리
중복 데이터들의 데이
터 값 상충 오류
- 변경될 수 없는 기본정보(이름 주민번호)의
경우는 기존 데이터 우선
- 변경 가능한 정보(기관명 논문 등)의 경우
최신 업데이트된 정보를 우선
구분 명(누락) 비고
기본정보 이메일 22719 기존 수집 데이터를 통해 보완
소속기관사항 있으나필드가 null인것
인력구분 15217 기관명이형전거DB 생성 완료 후 적용함
소속기관 우편번호
15977주소가 있는 경우 우편번호 찾기를 통해 보완주소가 없는 경우 기존 수집 데이터를 통해 보완
소속기관 주소
13512 기존 수집 데이터를 통해 보완
소속기관명 428기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
학력사항 있으나 필드가null인것
전공 38915기존 수집 데이터를 통해 보완하고 기관명이형전거DB로 매핑함
학위 34373기존 수집 데이터를 통해 보완하고 NTIS 표준코드로매핑함
소속기관사항 없는것 22502 기존 수집 데이터를 통해 보완
학력사항 없는것 31952 기존 수집 데이터를 통해 보완
~은 lsquo발생 가능한 오류 유형rsquo 내용 참조
~은 lsquo조치 가능한 데이터 정제 형태rsquo 내용 참조
인력정보의 누락항목에 대한 보완
기타 (정보 식별자 부여)
- 데이터 정제 최종 단계에서 식별자 부여 체계에 따라 정보식별자(번호) 삽입
- 정보식별자(번호)는 식별체계 API에 의해 자동으로 부여 되며 식별 부여 체계는 사업단 내 식별
체계 담당자가 마련하여 제공
정제 작업 방식
중복 확인 기계작업
- SQL Query를 활용하여 중복 확인하며 중복된 데이터 중 1건을 제외하고 나머지를 표시함(기계
작업)
- 30 -
구분 항목 세부항목 정제항목 오류유형 정제지침
참여
인력
정보
(56개)
기본
정보
(12
개)
주민등록
번호
인물ID인물ID이 발급되지 않
는 경우
인물 중복확인이 가능한 기본 항목(주민등록
번호 성명)이 존재하지 않으면 정제대상에서
제외
식별체계로부터 정제 수행 후 일괄발급 입력
인물관리
번호
(KOI)
NA
정제이전 인물관리번호 일괄 생성하여 key로
활용
Null 여부만 확인하고 정제대상에서 제외
주민등록
번호
Null인 경우 정제대상에서 제외
중복되는 주민등록
번호의 경우
인물관리번호 성명이 상이하면 현행 데이터
를 유지
모두 정제대상에서 제외
유효하지 않은 주민등
록번호의 경우
자리수가 lsquo-rsquo포함한 14자리가 아닌 데이터는
정제대상에서 제외
이관 후 서비스대상에서 제외
데이터 통합 기계작업 + 수작업
- 중복으로 확인된 항목들의 리스트를 비교하여 통합
- 기계적으로 필드간의 충돌이 없음을 확인할 수 있는 항목은 자동 통합하고 기계적으로 충돌을 확
인할 수 없는 경우는 수작업으로 필드별 데이터 통합을 수행
- 최신 또는 최종 여부를 확인하여 통합해야 하는 경우 해당 데이터에 포함된 일자 데이터를 감안
하여 선별 통합(일자 및 기간의 충돌이 없는 경우 기계작업 충돌이 있는 데이터는 리스트 업 후
수작업)
형식 확인 기계작업 + 수작업
- E-Mail 주소 전화번호와 같은 형식이 어느 정도 정의된 데이터의 경우 기본 형식을 템플릿으로
지정
- 정형화되지 않은 데이터의 리스트를 추출하여 이 중 기계적으로 형식을 일치시키고(기계작업)
일치되지 않은 데이터를 수작업으로 확인하여 수정하거나 형식 불량 데이터 리스트로 따로 추출
(수작업)
142 오류 유형별 정제 지침
오류 유형별 정제 지침은 lsquo131 세부 항목별 오류 패턴유형 분석rsquo 을 대상으로 정제지침을 정의
인력데이터
항목별 정해진 규칙에 위배되는 값이 들어있는 경우
- 31 -
구분 항목 세부항목 정제항목 오류유형 정제지침
외국인 및 임시주민번호의 경우 lsquo-rsquo포함한 14
자리가 아닌 데이터는 정제대상에서 제외
표준 포맷으로 구성되
어 있지 않은 경우
lsquo년(2)월(2)일(2)-성별(1)고유번호(6)lsquo 14자 숫자
로 구성되도록 변경
공란 및 특수문자를 제거
성명
성명-한글
Null의 경우
성명-영문 성명-한자가 존재하면 해당 필드
로 이동성명-한글 영문 한자 모두 Null이면 정제대
상에서 제외
이관 후 서비스대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
공란 및 특수문자 숫자 이름이 아닌 경우 제거
예) 이름이 아닌 경우 oo - --
예) 공란의 경우 홍 길동 홍길 동
예) 숫자의 경우 홍길동2 -gt 숫자만 제거
성명-영문
Null의 경우 정제대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
특수문자 숫자 이름이 아닌 경우 제거
예) Lee HS =gt Lee HS영문성명의 범위를 벗어난 경우
예) Lee KHS영문성명이 아닌 경우 해당 필드로 이동하거
나 제거
성명-한자
Null의 경우 정제대상에서 제외
공란 및 특수문자 숫
자가 있는 경우
공란 및 특수문자 숫자 이름이 아닌 경우 제거
예) 金鉉- 洙 =gt 金鉉洙
한문이 아닌 경우 해당 필드로 이동하거나 제거
자택주소기본주소
(주소1)
Null의 경우
우편번호가 존재하면 우편번호로 검색된 주
소 입력 단 우편번호 유효검사를 거친 우편번호만
대상으로 함
우편번호가 존재하지 않으면 정제대상에서 제외
우편번호의 주소와 상
이한 경우
가베지 데이터가 아닌 경우에는 정제대상에서 제외
예) 외국 주소는 유지
가베지 데이터인 경우
기존 데이터는 삭제하고 우편번호가 존재하
면 우편번호로 검색된 주소 입력
우편번호가 존재하지 않으면 기존 데이터 삭
제만 수행
- 32 -
구분 항목 세부항목 정제항목 오류유형 정제지침
상세주소
(주소2)
Null인 경우 정제대상에서 제외
주소정보가 아닌 경우주소정보가 아닌 가베지 데이터는 삭제
예) test 042-123-1234 등
자택우편
번호우편번호
Null인 경우
기본 주소지로 검색하여 입력
기본 주소가 오류데이터이거나 없는 경우는
정제대상에서 제외
우편번호 표준 형식이
아닌 경우
표준 포맷 시도군 구분(3자리)+lsquo-rsquo+지역구분(3
자리)
표준 포맷이 아닌 경우는 표준 포맷으로 변경
예) 300100=gt300-100
300 100=gt300-100
300100 =gt300-100
자리 수가 6자 이하이거나 가베지 데이터인
경우는 제거
우편번호가 old data
인 경우
현재 우편번호가 아닌 경우는 이전 우편번호
주소지를 기준으로 검색하여 입력하고 매핑되
지 않는 데이터의 경우는 삭제
자택전화
번호전화번호
Null인 경우
핸드폰번호가 존재할 경우 복제하여 입력 단 핸드폰 번호의 오류를 정제한 이후 처
리
전화번호가 표준 형식
이 아닌 경우
표준 포맷 국번(2~3자리)-지역전화번호(34자
리)-전화번호(4자리)포준 포맷으로 변경
예) 02-6746-1234 or 041-567-6789
국번은 지역별 국번 참조
내선번호는 유지
지역번호 없는 경우
국번 Null인 경우 자택 주소지의 시도 지역
번호를 입력
예) 6746-1234 이면서 서울 지역의 예
-gt 02-6746-1234
국가번호가포함된경우
(+)국가번호-국번-지역전화번호-전화번호의
형식으로 변경
예) +82-02-6746-1234
가베지 데이터의 경우
자리수가 작거나 크면 제거
예) 02-64-123 or 02-6746-123
숫자(특수문자 포함)가 아닌 문자이면 제거
전화번호 데이터가 아닌 경우 제거
핸드폰번호인 경우 전화번호핸드폰번호 표준포맷으로 변경
- 33 -
구분 항목 세부항목 정제항목 오류유형 정제지침
핸드폰번호 핸드폰번호
Null인 경우 정제 대상에서 제외
핸드폰번호가 표준 형
식이 아닌 경우
이동통신구분번호(3자리)-지역구분번호(34자
리)-전화번호(4자리)로 변경
예) 011-6746-1234 or 019-789-1234
이동통신구분번호는 이동통신사별 구분번호
참조 SK(011 017) KTF(016 018) KG(109)
010(공통)
국가번호가 포함된
경우
(+)국가번호-이동통신구분번호-지역구분번호-
전화번호의 형식으로 변경
예) +82-010-6746-1234
이동통신구분번호가
없는 경우
이동통신구분번호가 없는 경우는 가베지 데이
터으로 판단하여 제거
예) 672-1234의 경우
전화번호인 경우 전화번호핸드폰번호 표준포맷으로 변경
E-mail E-mail
Null인 경우 정제 대상에서 제외
표준 이메일 형식이
아닌 경우
표준 포맷 ID메일서버URI로 구성
예)admin1234daumnet kisti4530kistirekr
구분자 lsquorsquo lsquorsquo으로 변경 및 공란 제거
예) admindaumnet =gt admindaumnet
두 개이상의 이메일이 존재할 경우 앞에 것을
우선으로 유지함
예)admin1234daumnet kisti4530kistirekr
=gt admin1234daumnet
E-mail 데이터가 아닌
경우
E-mail 주소 데이터가 아닌 경우와 가베지 데
이터는 삭제
예) wwwkistirekr -- adminkisti 1 lsquorsquo
공란 등
소속
기관
사항
(11
개)
소속
기관명
소속기관
코드NA 코드 오류 유형 참조
소속
기관명
Null인 경우
소속기관코드가 존재하는 경우에는 해당 소속
기관코드의 명을 검색하여 입력하고 소속기관
코드가 존재하지 않으면 정제대상에서 제외
소속기관명이 NTIS
코드 내 명칭이 아
닌 경우
기관명이형전거DB의 대표기관명으로 변경
예) 서울대 -gt 서울대학교
- 34 -
구분 항목 세부항목 정제항목 오류유형 정제지침
단 기관명이형전거DB에 존재하지 않는 소속
기관명은 신규발급 요청하여 소속기관명을 유
지함
소속기관명이 아닌
경우
소속기관코드가 존재하는 경우에는 해당 소속
기관코드의 명을 검색하여 입력하고 소속기관
코드가 존재하지 않으면 정제대상에서 제외
부서명근무
부서명
Null인 경우 정제대상에서 제외
근무부서명이 아닌
경우
가베지 데이터인 경우만 삭제하고 이외의 경
우는 정제대상에서 제외
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
직위명
직위코드 NA 코드 오류 유형 참조
직위명
Null인 경우
직위코드가 존재하는 경우에는 해당 직위코드
의 명을 검색하여 입력하고 직위코드가 존재
하지 않으면 정제대상에서 제외
직위명이 직위코드 내
명칭이 아닌 경우
직위명이 직위코드내 존재하지 않으면 직위명
은 그대로 유지하고 직위코드는 기타(lsquo999rsquo)로
매핑함
직위명이 아닌 경우
직위코드가 존재하는 경우에는 해당 직위코드
의 명을 검색하여 입력하고 직위코드가 존재
하지 않으면 삭제
사무실
전화번호
사무실
전화
Null인 경우 정제대상에서 제외
전화번호가 표준 형식
이 아닌 경우
표준 포맷 국번(2~3자리)-지역전화번호(34자
리)-전화번호(4자리)포준 포맷으로 변경
예) 02-6746-1234 or 041-567-6789
국번은 지역별 국번 참조
내선번호는 유지
지역번호 없는 경우
국번 Null인 경우 소속기관 주소지의 시도
지역번호를 입력
예) 6746-1234 이면서 서울 지역의 예
-gt 02-6746-1234
국가번호가 포함된
경우
(+)국가번호-국번-지역전화번호-전화번호의
형식으로 변경
예) +82-02-6746-1234
- 35 -
구분 항목 세부항목 정제항목 오류유형 정제지침
가베지 데이터의 경우
자리수가 적거나 크면 제거
예) 02-64-123 or 02-6746-123
숫자(특수문자 포함)가 아닌 문자이면 제거
전화번호 데이터가 아닌 경우 제거
핸드폰번호인 경우 기본정보의 핸드폰번호로 이동
기관주소
기본주소
(주소1)
Null의 경우
우편번호가 존재하면 우편번호로 검색된 주
소 입력
단 우편번호 유효검사를 거친 우편번호만
대상으로 함
우편번호의 주소와 상
이한 경우
가베지 데이터가 아닌 경우에는 정제대상에서
제외
가베지 데이터인 경우기존 데이터는 삭제하고 우편번호가 존재하
면 우편번호로 검색된 주소 입력
상세주소
(주소2)
Null인 경우 정제대상에서 제외
주소정보가 아닌 경우주소정보가 아닌 가베지 데이터는 삭제
예) test 042-123-1234 등
우편번호
Null인 경우
기본 주소지로 검색하여 입력
기본 주소가 오류데이터이거나 없는 경우는
정제대상에서 제외
우편번호 표준 형식이
아닌 경우
표준 포맷 시도군 구분(3자리)+lsquo-rsquo+지역구분(3
자리)
표준 포맷이 아닌 경우는 표준 포맷으로 변경
예) 300100=gt300-100
300 100=gt300-100
300100 =gt300-100
자리 수가 6자 이하 이거나 가베지 데이터인
경우는 제거
우편번호가 old data
인 경우
현재 우편번호가 아닌 경우는 이전 우편번호
주소지를 기준으로 검색하여 입력하고 매핑되
지 않는 데이터의 경우는 삭제
인력
구분
인력
구분NA 기관명이형전거DB에 의해 매핑
최초
임용일
최초
임용일NA 날짜 오류 유형 참조
학력
사항전공
전공분야 NA 코드 오류 유형 참조
전공명 Null인 경우 정제대상에서 제외
- 36 -
구분 항목 세부항목 정제항목 오류유형 정제지침
(14
개)
전공명이 아닌 경우
가베지 데이터인 경우만 삭제하고 이외의 경
우는 정제대상에서 제외
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
취득대학
학위취득
대학코드NA 코드 오류 유형 참조
학위취득
대학명
Null인 경우
학위취득대학코드가 존재하는 경우에는 해당
학위취득대학코드의 명을 검색하여 입력하고
학위취득대학코드가 존재하지 않으면 정제대
상에서 제외
학위취득대학명이 학
위취득대학코드 내 명
칭이 아닌 경우
기관명이형전거DB의 대표기관명으로 매핑하
고 존재하지 않는 경우 신규 발급 요청하여
학위취득대학명을 유지함
학위취득대학명이 아
닌 경우
학위취득대학코드가 존재하는 경우에는 해당
학위취득대학코드의 명을 검색하여 입력하고
학위취득대학코드가 존재하지 않으면 삭제
학위 학위코드 NA 코드 오류 유형 참조입학일 입학년월 NA 날짜 오류 유형 참조졸업일 졸업년월 NA 날짜 오류 유형 참조
학과
학과코드 NA 코드 오류 유형 참조
학과명
Null인 경우 정제대상에서 제외
학과명이 학과코드내
명칭이 아닌 경우학과코드의 명으로 변경
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등
취득국가취득국가
코드NA 코드 오류 유형 참조
지도
교수명
지도
교수명
Null인 경우 정제대상에서 제외
이름이 아닌 경우 삭제하고 정제대상에서 제외
학위
논문명
최종학위
논문명1
Null인 경우 정제대상에서 제외
논문명1이 Null인경우논문제목1이 Null인 경우 논문제목2에서 이동
함
- 37 -
구분 항목 세부항목 정제항목 오류유형 정제지침
가베지 데이터인 경우
삭제
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터
최종학위
논문명2
Null인 경우 정제대상에서 제외
논문명1이 Null인경우 논문제목1이 Null인 경우 논문제목1로 이동함
가베지 데이터인 경우
삭제
예) -- 1 문자가 아닌 특수문자 또는 숫자로
만 구성된 데이터 문자열이지만 특정 문자가
반복된 데이터
학위
취득일
최종학위
취득일NA 날짜 오류 유형 정제지침 참조
경력
사항
(5개)
근무처명 근무처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
직위명
직위코드 NA 코드 오류 유형 정제지침 참조
직위명
Null인 경우 정제대상에서 제외
직위명이 직위코드내
명칭이 아닌 경우
직위명이 직위코드내 존재하지 않으면 직위명
은 그대로 유지하고 직위코드는 기타(lsquo999rsquo)로
매핑함
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
근무기간
근무
시작일NA 날짜 오류 유형 정제지침 참조
근무
종료일NA 날짜 오류 유형 정제지침 참조
자격
사항
(3개)
자격
발행처
자격
발행처
Null인 경우 정제대상에서 제외
가베지 데이터인 경우특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
- 38 -
구분 항목 세부항목 정제항목 오류유형 정제지침
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
자격증명 자격증명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
자격
취득일
자격
취득일NA 날짜 오류 유형 정제지침 참조
논문
실적
(8개)
논문
발표일
논문
발표일NA 날짜 오류 유형 정제지침 참조
국문
논문명
논문제목
국문
Null인 경우 정제대상에서 제외
필수
논문제목국문이 Null이고 논문제목영문이 Null
이 아닐 경우 논문제목영문을 논문제목국문으
로 이동시키고 논문제목영문은 Null로 갱신
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
영문
논문명
논문제목
영문
Null인 경우 정제대상에서 제외
필수
논문제목국문이 Null이고 논문제목영문이 Null
이 아닐 경우 논문제목영문을 논문제목국문으
로 이동시키고 논문제목영문은 Null로 갱신
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지만
특정 문자가 반복된 데이터
저자역할
구분
저자역할
구분NA 코드 오류 유형 정제지침 참조
발행처 발행처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
- 39 -
구분 항목 세부항목 정제항목 오류유형 정제지침
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터학술지
구분
학술지구
분NA 코드 오류 유형 정제지침 참조
학술지명 학술지명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
SCI여부 SCI여부 NA 코드 오류 유형 정제지침 참조
지식
재산
권
(3개)
지식
재산권명
지식
재산권명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
출원_등
록번호
출원등록
번호
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
특허구분 특허구분 NA 코드 오류 유형 정제지침 참조
평가
위원
(13개)
소속
학협
회
현황
(5개)
담당업무 담당업무
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
직위 직위
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
- 40 -
구분 항목 세부항목 정제항목 오류유형 정제지침
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
학협회
사항
학협회명
Null인 경우 정제대상에서 제외
직위명이 포함되어 있
는 경우
직위명이 존재하지 않으면 직위명 항목에 복
사하고 직위명칭에 관련된 부분은 삭제 존재
한다면 관련 부분을 삭제
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
활동시작
일NA 날짜 오류 유형 정제지침 참조
활동종료
일NA 날짜 오류 유형 정제지침 참조
훈포
장
사항
(3개)
수상년월 수상년도 NA 날짜 오류 유형 정제지침 참조
수여
기관명
수여기관
명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
훈포장명 수상명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저역
서
실적
(5개)
저서명1 저서명1
Null인 경우 정제대상에서 제외
저서명1이 Null인 경
우저서명2를 저서명1로 저장
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저서명2 저서명2
Null인 경우 정제대상에서 제외
저서명1이 Null인 경
우저서명2를 저서명1로 저장
가베지 데이터인 경우 특수문자 숫자로만 구성되거나 그 외의 가베
- 41 -
구분 항목 세부항목 정제항목 오류유형 정제지침
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
발행년 발행년도 NA 날짜 오류 유형 정제지침 참조
발행처 발행처명
Null인 경우 정제대상에서 제외
가베지 데이터인 경우
특수문자 숫자로만 구성되거나 그 외의 가베
지 데이터는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 문자가 아닌 특수문자
또는 숫자로만 구성된 데이터 문자열이지
만 특정 문자가 반복된 데이터
저역서
구분
저역서
구분NA 코드 오류 유형 정제지침 참조
- 42 -
구분 항목 세부항목 정제항목 오류내역 정제지침
참여인력정보(11개)
소속기관사항(1개)
최초임용일최초임용일
YYYYMMDD
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
DD가 없는 경우 01일로 갱신
YYYYMMDD가 유
효하지 않은 경우
년도가 유효하면 월-gt01월 일-gt01
일로 갱신하고 년도 자체가 유효하
지 않으면 삭제
학력사항(3개)
입학일입학년월
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 03월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt03월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
졸업일졸업년월
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 02월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt02월로 갱신
하고 년도 자체가 유효하지 않으면
삭제입학년월보다 같
거나 작은 경우데이터 삭제
학위취득일
최종학위
취득일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효
하지 않은 경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
경력사항(2개)
근무기간근무시작일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
날짜로서 유효한 형태를 갖고 있지 않은 경우
- 43 -
구분 항목 세부항목 정제항목 오류내역 정제지침
제
근무종료일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
근무시작일보다
같거나 작은 경우
근무시작일에서 YYYYMM이 동일하
면 삭제하고 근무시작일에서 YYYY
은 동일하나 MM이 작을 경우에만
삭제
자격사항(1개)
자격취득일자격취득일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭
제
논문실적(1개)
논문발표일논문발표일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효
하지 않은 경우
년도가 유효하면 월-gt01월로 갱신하고
년도자체가유효하지않으면삭제
소속학협회현황(2개)
학협회사항
활동시작일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경
우데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하
고 년도 자체가 유효하지 않으면 삭제
활동종료일
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이 유효하지
않은경우
년도가 유효하면 월-gt01월로 갱신하고
년도자체가 유효하지않으면 삭제
- 44 -
구분 항목 세부항목 정제항목 오류내역 정제지침
활동시작일보다
같거나 작은 경우
활동시작일에서 YYYYMM이 동일하
면 삭제하고 활동시작일에서 YYYY
은 동일하나 MM이 작을 경우에만
삭제
훈포장사항(1개)
수상년월수상년도
YYYYMM
Null인 경우 정제대상에서 제외
YYYY가 없는 경우 데이터 삭제
MM이 없는 경우 01월로 갱신
YYYYMM이유효하지
않은경우
년도가 유효하면 월-gt01월로 변경하고
년도자체가 유효하지않으면 삭제
평가위원(1개)
저역서실적(1개)
발행년발행년도
YYYY
Null인 경우 정제대상에서 제외
YYYY이 유효하지
않은 경우유효하지 않으면 삭제
구분 항목세부항목
정제항목 오류유형 정제지침
참여
인력
정보
(15개)
기본정보
(1개)
자택
우편번호
우편번호
기본주소
Null의 경우주소가 존재하면 주소지로 우편번호 검색
하여 우편번로를 입력(정제작업자)
우편번호와주소
정보가불일치
middot 기본 주소가 가베지 데이터가 아니고 상
세주소가 존재한다면 그대로 유지하고
가베지 데이터이면 우편번호 상 주소를
기본주소에 입력
상세주소가 존재하면서 오류 데이터가 아
닌 경우에는 기본주소의 변경은 하지 않으
며 기존의 우편번호를 주소지에 맞게 주소
검색하여 변경
소속기관
사항(4개)소속기관명
소속기관코드
소속기관명
Null인 경우 정제대상에서 제외
소속기관명만
존재하는 경우
기관명이형전거DB에서 검색하여 이형기관
코드 대표기관명으로 매핑하고 존재하지
않는 경우 신규 발급 요청하여 그대로 유
지함
시작일보다 종료일이 같거나 작은 경우 종료일을 삭제
날짜의 경우 본인의 생년월일보다 작을 수 없음
코드의 값이 정해진 범위를 벗어난 경우
- 45 -
구분 항목세부항목
정제항목 오류유형 정제지침
소속기관코드만
존재하는 경우
해당 소속기관코드를 기관명이형전거DB에
서 검색하여 소속기관명을 갱신하며 매핑
되지 않는 소속기관코드는 삭제
직위명직위코드
직위명
Null인 경우 정제대상에서 제외
직위명만 존재
하는 경우
직위명으로 동일 또는 유사한 직위코드를
검색하여 입력하고 직위코드 내 존재하지
않는 직위명칭이면 lsquo기타rsquo로 매핑
[직위코드] NTIS 직위코드 참조
직위코드만 존
재하는 경우
해당 직위코드를 NTIS 직위코드의 직위명
으로 검색하여 갱신하며 매핑되지 않는 직
위코드는 삭제
[직위코드] NTIS 직위코드 참조
기관주소 우편번호
Null의 경우
주소가 존재하면 주소지로 우편번호 검색
하여 입력
단 우편번호 내 기본주소만 가능
우편번호와 기
본주소가 불일
치
기본 주소가 가베지 데이터가 아니고 상세
주소가 존재한다면 그대로 유지하고 가베
지 데이터이면 우편번호 상 주소를 기본주
소에 입력상세주소가 존재하면서 오류 데이터가 아
닌 경우에는 기본주소의 변경은 하지 않으
며 기존의 우편번호를 주소지에 맞게 주소
검색하여 변경
인력(직업)
구분인력유형구분
Null인 경우 정제대상에서 제외인력유형구분
코드 범위를
벗어나는 경우
[인력구분코드] 대학교 연구소 산업계 기
타 등 구분코드 범위를 벗어나는 데이터는
Null로 갱신
학력사항
(5개)
전공전공코드
전공명
Null인 경우 정제대상에서 제외전공명만 존재
하는 경우
전공명으로 NTIS 전공코드를 검색하여 입
력
[전공코드] NTIS 전공코드 참조
전공코드만 존
재하는 경우
해당 전공분야코드를 NTIS 전공코드에서
전공명을 검색하여 갱신하며 매핑되지 않
는 전공코드는 삭제
[전공코드] NTIS 전공코드 참조
취득대학
학위취득대학
코드
학위취득대학명
Null인 경우 정제대상에서 제외
학위취득대학
명만 존재하는
경우
기관명이형전거DB에서 검색하여 이형기관
코드 대표기관명으로 매핑하고 존재하지
않는 경우 신규 발급 요청하여 그대로 유
지함
- 46 -
구분 항목세부항목
정제항목 오류유형 정제지침
학위취득대학
코드가 존재하
는 경우
해당 학위취득대학코드를 기관명이형전거
DB에서 검색하여 학위취득대학명을 갱신하
며 매핑되지 않는 학위취득대학코드는 삭
제
학위 학위코드
Null인 경우 정제대상에서 제외
학위코드 범위
를 벗어나는
경우
존재하는 학위코드가 NTIS 학위코드와 매
핑되는지 확인하고 멥핑되지 않는 학위코
드는 삭제
[학위코드] NTIS 학위코드 참조
학과학과코드
학과명
Null인 경우 정제대상에서 제외
학과명만 존재
하는 경우
학과명으로 동일 또는 유사한 NTIS 학과코
드를 검색하여 입력하고 NTIS 학과코드 내
존재하지 않는 학과명이면 기타 코드로 매
핑함
[학과코드] NTIS 학과코드 참조
학과코드만 존
재하는 경우
해당 학과코드를 NTIS 학과코드의 학과명
을 검색하여 갱신하며 매핑되지 않는 학과
코드는 삭제
[학과코드] NTIS 학과코드 참조
취득국가 취득국가코드
Null인 경우 정제대상에서 제외
취득국가코드
의 범위를 벗
어나는 경우
존재하는 국가코드가 NTIS 국가코드와 매
핑되는지 확인하고 멥핑되지 않는 국가코
드는 삭제
[국가코드] NTIS 국가코드 참조
경력사항
(2개)직위명
직위코드
직위명
Null인 경우 정제대상에서 제외
직위명만 존재
하는 경우
직위명으로 동일 또는 유사한 직위코드를
검색하여 입력하고 직위코드 내 존재하지
않는 직위명칭이면 lsquo기타rsquo로 매핑
[직위코드] NTIS 직위코드 참조
직위코드만 존
재하는 경우
해당 직위코드를 NTIS 직위코드의 직위명
으로 검색하여 갱신하며 매핑되지 않는 직
위코드는 삭제
[직위코드] NTIS 직위코드 참조
논문실적
(3개)
저자역할
구분저자역할구분
Null인 경우 정재 대상에서 제외
저자역할구분존재하는저자역할구분가 NTIS 저자역할구
- 47 -
구분 항목세부항목
정제항목 오류유형 정제지침
코드의 범위를
벗어나는 경우
분코드와 매핑되는지 확인하고 멥핑되지
않는 국가코드는 삭제
[역할구분코드] NTIS 저자역할구분코드 참
조
학술지
구분학술지구분
Null인 경우 정재 대상에서 제외
학술지구분코
드의 범위를
벗어나는 경우
존재하는 학술지구분코드가 NTIS 학술지
구분코드와 매핑되는지 확인하고 멥핑되지
않는 학술지구분코드는 삭제
[학술지구분코드] NTIS 저자역할구분코드
참조
SCI여부 SCI여부
Null인 경우 정재 대상에서 제외
SCI여부구분코
드의 범위를
벗어나는 경우
존재하는 SCI여부구분코드가 lsquo01 또는
02가 아닌 데이터는 Null로 갱신
[SCI여부구분코드] NTIS SCI여부구분코드
참조
지식
재산권
(1개)
특허구분 특허구분
Null인 경우 정제대상에서 제외
특허구분코드
의 범위를 벗
어나는 경우
존재하는 특허구분코드가 NTIS 특허구분
코드와 매핑되는지 확인하고 멥핑되지 않
는 특허구분코드는 삭제
[특허구분코드] NTIS 특허구분코드 참조
평가위원(1개)
저역서실적(1개)
저역서구분 저역서구분
Null인 경우 정제대상에서 제외
저역서구분코
드의 범위를
벗어나는 경우
존재하는 저역서구분코드가 NTIS 저역서
구분코드와 매핑되는지 확인하고 멥핑되지
않는 저역서구분코드는 삭제
[저역서구분코드] 1저서 2역서 中 택일
공통사항
- 매핑하고자 하는 기존 코드명(공란 및 특수문자 제거)으로 NTIS 표준 코드 內 한글코드명을 대
상으로 검색하여 동일한 코드명(11의 경우)은 시스템(SQL App 등)을 통해 미리 매핑하고 유사
한 코드명(1N의 경우)은 정제작업자가 선택한 코드로 입력하여 매핑 처리
- 코드 종류가 소수(3개 미만)인 경우 Source 데이터 내 등록되어 있는 코드 또는 코드명칭을 대
상으로 동일한 패턴별로 일괄 변환(SQL Query Excel)처리한 후 변환되지 않은 데이터는 삭제
- 코드가 가베지 데이터인 경우는 삭제
예) lsquo1rsquo lsquorsquo lsquo-rsquo oo 등 영숫자가 아닌 특수문자로만 구성된 데이터 특정 문자가 반복된 코드와
관련되지 않은 데이터
- 48 -
구분 항목 이중등록검사항목 정제지침 비 고
참여
인력
정보
기본
정보주민등록번호()
주민등록번호가 동일한 인력데이
터가 2개 이상이면 시스템으로
추출하여 이중등록검사를 수행함
시스템 정제
소속기
관사항소속기관명()
인력별 동일한 소속기관사항 데이
터가 2개 이상이면 시스템으로
추출하여 1개만 남겨 놓고 나머지
는 오류 체크 필드에 표시함
시스템 정제
학력
사항
1 취득대학() 학위() 입학일
2 취득대학() 학위() 졸업일
3 취득대학() 학위() 전공
4 취득대학() 학위() 학과
5 취득대학() 학위() 학위취득일
인력별 동일한 학력사항 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
경력
사항
1 근무처명() 직위명 근무시작일
1 근무처명() 직위명 근무종료일
인력별 동일한 경력사항 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
논문
실적
1 논문명() 논문발표일 학술지명
2 논문명() 논문발표일 ISSN
3 논문명() ISSN 게재권집 게재
호
4 논문명() 학술지명 게재권집
게재호
인력별 동일한 논문실적 데이터가
2개 이상이면 시스템으로 추출하
여 1개만 남겨 놓고 나머지는 오
류 체크 필드에 표시함
시스템 정제
지식
재산권
1 출원_등록번호()
2 지식재산권명() 출원등록구분
특허구분() 출원국가
인력별 동일한 지식재산권 데이터
가 2개 이상이면 시스템으로 추
출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
시스템 정제
저역서
실적
1 ISBN
2 저역서명() 저역서구분() 발행
인력별 동일한 저역서실적 데이터
가 2개 이상이면 시스템으로 추시스템 정제
143 이중등록 유형별 정제지침
이중등록 정제 지침
- 이중등록에 대한 정제는 오류 유형 정제 및 코드 매핑 처리 후 수행함
- 이중등록에 대한 데이터는 최신 데이터를 우선으로 유지함
- 이중등록검사항목의 문자Type의 데이터는 공란제거 제거 후 이중등록검사를 수행함
- 대상데이터의 이중등록검사항목 중 1개 이상 항목이 Null인 경우 이외의 항목이 동일하
여도 이중등록 정제 대상에서 제외함
- 49 -
구분 항목 이중등록검사항목 정제지침 비 고
년 발행처출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
평가
위원
소속학
협회
현황
1 학협회명() 직위 시작일
2 학협회명() 직위 종료일
인력별 동일한 소속학협회현황
데이터가 2개 이상이면 시스템으
로 추출하여 1개만 남겨 놓고 나
머지는 오류 체크 필드에 표시함
시스템 정제
훈포장
사항훈포장명() 수상년월 수여기관명
인력별 동일한 훈포장사항 데이터
가 2개 이상이면 시스템으로 추
출하여 1개만 남겨 놓고 나머지는
오류 체크 필드에 표시함
시스템 정제
자격
사항
자격증명() 자격발행처 자격취득
일
인력별 동일한 데이터가 2개 이상
이면 시스템으로 추출하여 1개만
남겨 놓고 나머지는 오류 체크 필
드에 표시함
시스템 정제
15 데이터 정제 절차 및 작업지침
151 데이터 정제 절차
- 50 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
데이터
정제
준비
초기
데이터
구축
연계기관기반 정보취합
연계기관 인력데이터 구조(스키마 엔터티 정의)코드정보 등 통합 인력DB로의 이관을 위한 연계기관 제공 정보 취합
기관 협의 정보 제공 기반정보 분석
연계대상기관데이터 취합
통합하고자 하는 연계기관 인력데이터를 제공받아 Temp DB(연계기관데이터 구조와 동일)에등록
기관 협의 데이터제공 데이터 생성
연계기관
데이터 이관
준비
NTIS 표준 코드정보를KISTI로부터 제공받음 표준 코드 제공 코드 분석
기존 코드별 NTIS 표준코드 매핑 정의 표준코드매핑 작성
플래그성 매핑기준작성
기존 데이터에 표준 코드 반영 표준코드 매핑처리
표준 코드 적용결과 검토 데이터 확인
연계기관
데이터 분석
및 매핑계획
수립
연계기관 데이터 분석 데이터 분석 데이터 분석
연계기관 코드매핑 정의 기관 코드매핑 작성플래그성 매핑 기준 작성
테이블매핑 정의테이블 매핑정보확정
테이블 매핑(안) 작성
데이터
정제 기준
및
계획 수립
과학기술 인력정보 데이터 분석
정제 대상 RampD참여인력데이터 분석
정제 대상 항목 및 기준에 대한 정의
데이터 정제 내역검토
데이터 분석
데이터정제 내역작성
데이터 정제기준 및 절차협의
정제 대상 데이터 건수및 연계 기관 인력데이터 포함 범위 정제 항목 선정 정제 공정(정제 1차 검증 최종 확인) 확정
정제 범위 대상 확정 협의 진행
데이터 정제매뉴얼 작성
데이터정제매뉴얼구성내용
데이터정제개요및절차정의
정제대상정의및정제범위
정제항목별기준및예시
정제검증도구사용법
전환코드표
표준양식
정제매뉴얼 검토및 확정
정제매뉴얼 초안작성
상세일정계획수립
정제 량을 분석하여 투입인력대비 주월별 데이터 정제 계획대비 실적 산정
일정 검토 및 확정 일정계획 작성
152 정제 단계별 작업 지침
- 51 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
데이터 정제 작업 환경 구축
작업 환경 및작업자 구성 데이터 정제 환경 구성
작업자 모집
작업장 환경 구축(월평동)
데이터정제 작업교육실시
정제작업자 및 정제관리자를 대상으로 교육 실시 및교육결과서작성
작업자 정제작업교육 실시
데이터정제진행
정제 작업수행
데이터 정제및 검증 데이터 정제 추진결과
데이터 정제
정제결과 검증(작업자별 검증)
정제추진현황보고 실적 보고
실적 확인 및 이슈사항 협의
주별진척보고
이슈사항 및 문제점 보고
데이터정제완료
데이터 이관 및 검수
데이터 이관정제된 데이터를 작업DB에서 서비스DB 로이관
이관 확인 데이터 이관
데이터 검수(최종 확인)
RampD 참여인력 데이터(정제 결과물) 검사 (샘플링 검수)
검수(샘플링)검수 데이터 추출제공
153 항목별 정제작업 세부지침
공통사항 및 시스템정제
공통사항
1 정보유형별로 주요항목이 존재하지 않는 경우라도 기본 학력 소속기관사항은 삭제하지
않고 실적정보는 삭제 처리함
가 정보유형별로 경력정보 실적정보의 주요항목이 Null인 데이터는 삭제
나 기존데이터의 경우 학력 소속기관사항은 주요항목이 Null이지만 현황정보 제공 필드가
존재하면 유지함
학력사항 학위 전공 등 존재하면 유지
소속기관사항 우편번호 직위 등 존재하면 유지
2 코드 항목 값을 NTIS 코드정보 내 명칭으로 갱신함
가 소속기관명 학위취득대학명 학과명 전공명 직위명 등을 NTIS 표준코드로 매핑하여
코드값을 넣고 각 항목에 NTIS 코드정보 내 코드명으로 변환하여 갱신함
- 52 -
No원본데이터 정제 후
정제요령 비고코드 명 코드 명
1 한국타이어(주) AAB6793 (주)한국타이어
기관명이형전거DB에서
대표기관명과
이형기관코드로 매핑
2 연구원 B06 연구원 직위코드 매핑
3 가베지 데이터의 값을 삭제 처리함
가 정보유형별 각 항목에서 가베지 데이터에 대해 삭제 처리함
No원본데이터 정제 후
정제요령 비고데이터 데이터
1 test 가베지 처리
2 가베지 처리
3 - 가베지 처리
4 가베지 처리
5 blank 가베지 처리
6 가베지 처리
7 서울대학교 서울대학교 정제 처리
시스템정제
1 비교대상이 존재하지 않는 항목에 대해서는 시스템정제(Null처리) 한다
가 시스템정제 항목
항목 세부항목 비고소속기관 인력구분
학력사항취득국가학위
지식재산권 특허구분
저역서실적 저역서구분
논문실적저자역할구분학술지구분SCI여부
비 고
shy 날짜 데이터의 경우 생성일이 완료일보다 후에 있는 경우 생성일을 남
겨놓고 완료일 삭제
shy 년도 포맷의 경우 1900년도~현재(정제시점)을 기준으로 이전이나 이후는
Null 로 갱신
shy 날자 데이터의 경우 생년월일보다 빠른 경우는 삭제
기본정보
기본정보_주민등록번호 정제지침
1 주민등록번호가 null인 경우 정제대상에서 제외
- 53 -
2 주민등록번호가 유효하지 않은 lsquo-rsquo포함한 14자가 아닌경우 정제대상에서 제외
No원본데이터 정제 후
정제요령 비고주민번호 이름 주민번호 이름
1 090166-471ORHAN
NALCIOGLU090166-471
ORHAN
NALCIOGLU정제대상에서 제외
2 000000-1111111 홍길동 000000-1111111 홍길동 lsquo-rsquo포함 14자리는 유지
3 194912-100001F 요이치로스즈키 194912-100001F 요이치로스즈키주민번호에 영문자
포함(F) 데이터 유지
4 1234561234567 홍길동 123456-1234567 홍길동 lsquo-rsquo 추가
3 기타사항
가 주민번호에 특수문자 포함시 가베지 데이터 처리(삭제)
기본정보_성명 정제지침
1 각 항목(한글영문한자)에 맞는 데이터 값 확인
2 성명 이외의 가베지 데이터는 삭제
3 한글한자영문이름이 모두 null인 경우 데이터 유지(서비스 제외)
4 한글한자영문이름이 가베지 데이터인 경우 가베지 값 삭제 데이터 유지(서비스 제외)
5 한글한자영문 이름을 각 항목에 맞게 값을 이동(한글성명은 한글 영문성명은 영문 한
자성명은 한자)
6 한글한자영문 이름이 기업명 또는 법인명인 경우 데이터 삭제
No원본데이터 정제 후
정제요령 비고한글이름 영문이름 한글이름 영문이름
1 SK LEE SK LEE 맞는 항목으로 값을 이동
2 test -- 삭제
3홍길동
(영구참여제한자)HONG GD 홍길동 HONG GD
이름 외 가베지 데이터
삭제
영문성명이 성+이니셜은
유지
4 성진기계 기업 법인명 삭제
5 홍 길 동 HGD 홍길동 영문성명 삭제
공란 제거
기본정보_주소 우편번호 정제지침
1 우편번호와 주소 모두 null인 경우 정제대상에서 제외
2 우편번호가 표준 형식이 나닌 경우 표준 포맷으로 변경(lsquo-rsquo포함한 7자리)
- 54 -
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302230 302-230 표준 포맷으로 변경
3 우편번호는 null 이지만 주소는 존재하는 경우 주소를 검색하여 우편번호 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 대전 서구 정림동 302-230 대전 서구 정림동우편번호에서 검색하여
매핑한다
4 우편번호는 존재하나 주소가 null인 경우 우편번호에 해당하는 주소 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302-230 302-230 대전 서구 정림동우편번호에서 검색하여
기본주소까지 입력한다
5 우편번호와 주소 값이 가베지 데이터인 경우 가베지 처리
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 111-1 대구 수성구 가베지 처리
2 111 대전 서구 정림동 302-230 대전 서구 정림동
기존 가베지 우편번호
대신에 주소를 가지고
새로운 우편번호를
검색하여 매핑한다
6 우편번호 체계가 OLD 데이터인 경우 현 주소로(NTIS 우편번호체계) 검색하여 매핑
No원본데이터 정제 후
정제요령 비고우편번호 주소1 우편번호 주소
1 449-981경기도 용인시 수지읍 성복리
LG2차아파트201~208동448-981
경기 용인시 수지구 성복동
LG2차빌리지
우편번호에서 검색하여
현재 우편번호로 매핑함
7 기타사항
가 외국주소 데이터 유지 원칙
(1) 우편번호가 국내우편번호인 경우는 우편번호만 가베지 처리
(2) 기본주소에 국가명만 존재해도 데이터 유지
나 주소가 2개 이상인 경우 세부주소를 포함한 주소로 정제
다 기본주소와 상세주소 구분(우편번호 기준 원칙)
(1) 기본주소 우편번호를 검색하여 나온 해당 주소
(2) 상세주소 우편번호를 검색하여 나온 해당 주소 이외의 주소
- 55 -
No원본데이터 정제 후
정제요령 비고우편번호 주소1 주소2 우편번호 주소1 주소2
1
11 schlundt
annex columbia
mo 65211 usa
11 schlundt annex
columbia mo
65211 usa
외국주소는 유지
2 USA USA기본주소에 국가명만
존재해도 데이터 유지
3 137-764
서울 서초구
반포2동
반포주공아파트
0동 0호
137-764
서울 서초구
반포2동
반포주공아파트
0동 0호 기본주소와 상세주소 구분
기본정보_전화번호 핸드폰번호 정제지침
1 전화번호가 null인 경우 정제대상에서 제외
2 전화번호 기본포멧 유지
가 지역번호-국번-전화번호
나 +국가번호-지역번호-국번-전화번호
다 이동통신구분번호(3자리)-지역구분번호(34자리)-전화번호(4자리)
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 042)123-4567 010-1234567 042-123-4567 010-123-4567 기본포맷으로 변경
2 015-123-1234
SK(011 017) KTF(016
018) KG(109) 010(공통)
만 유지
3 +1-125-123-1234 +1-111-123-1215 +1-125-123-1234 +1-111-123-1215 외국전화번호는 유지
3 지역번호 없는 경우 주소지의 시도 지역번호를 입력
No원본데이터 정제 후
정제요령 비고자택 전화번호 주소 자택 전화번호 주소
1 6746-1234 서울 강남구 서초동 02-6746-1234 서울 강남구
서초동
주소지의 시도 지역번호를
입력
2 6746-1234 주소정보 없으므로 삭제
4 국가번호가 포함된 경우 ldquo(+)국가번호-국번-지역전화번호-전화번호ldquo 형태로 변경
No원본데이터 정제 후
정제요령 비고자택 전화번호 자택 전화번호
1 +82)02-6746-1234 +82-02-6746-1234
ldquo(+)국가번호-국번-지역전
화번호-전화번호ldquo 형태로
변경
5 전화번호 외 가베지 데이터는 삭제
- 56 -
가 텍스트 최소자릿수 미달(3자리 미만)등
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 02-64-123 010-111-111 자리수가 작으면 제거
6 데이터를 각 항목에 맞도록 이동 정제
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 010-2353-0416 042-123-0416 042-123-0416 010-2353-0416전화번호와 핸드폰 번호를
각 항목에 맞게 이동
7 기타사항
가 내선번호 및 과거지역번호 데이터 유지
나 전화번호가 2개 이상인 경우 앞의 전화번호를 우선으로 유지함
No원본데이터 정제 후
정제요령 비고자택 전화번호 핸드폰 번호 자택 전화번호 핸드폰 번호
1 0431-123-1234 0431-123-1234 예전 지역번호는 유지
2 042-123-1234(100) 042-123-1234(100) 내선번호 유지
3 0431-123-1234 1235 0431-123-1234 앞의 전화번호를 우선으로
유지
기본정보_e-mail 정제지침
1 이메일 기본포멧 오류 및 내용상 무의미한 값 가베지 처리
No원본데이터 정제후
정제요령 비고e-mail e-mail
1 123123com 가베지 처리
2 1111111com 가베지 처리
3 123 가베지 처리
4 wwwkistirekr 가베지 처리
5 --- 가베지 처리
2 E-mail 2개 이상 존재 가베지 삭제 후 이상없는 값은 모두 유지
No원본데이터 정제후
정제요령 비고e-mail e-mail
1chhyangmdhanmailnet
chhyangdumcorkrrchhyangmdhanmailnet
앞의 이메일을 우선으로
유지함
2 abcdaumnet abcdaumnet이메일의 구분자가 누락된
경우 구분자 추가함
- 57 -
소속기관사항
소속기관_주소 우편번호 정제지침 ( 기본정보_주소 우편번호 정제지침 참조)
1 우편번호와 주소 모두 null인 경우 - 정제대상에서 제외
2 우편번호는 null 이지만 주소는 존재하는 경우 주소를 검색하여 우편번호 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 대전 서구 정림동 302-230 대전 서구 정림동우편번호에서 검색하여
매핑한다
3 우편번호는 존재하나 주소가 null인 경우 우편번호에 해당하는 주소 입력
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 302-230 302-230 대전 서구 정림동우편번호에서 검색하여
기본주소까지 입력한다
4 우편번호와 주소 값이 가베지 데이터인 경우 가베지 처리
No원본데이터 정제 후
정제요령 비고우편번호 주소 우편번호 주소
1 111-1 가정교육학 가베지 처리
2 111 대전 서구 정림동 302-230 대전 서구 정림동기존 가베지 우편번호 대신에 주소를 가지고
새로운 우편번호를 검색하여 매핑한다
5 우편번호 체계가 OLD 데이터인 경우 현 주소로 검색하여 매핑
6 기타사항
가 외국주소 데이터 유지 원칙
(1)우편번호가 국내우편번호인 경우는 우편번호만 가베지 처리
(2)기본주소에 국가명만 존재해도 데이터 유지
나 주소가 2개 이상인 경우 소속기관명을 기준으로 정제(소속 기관이 소재한 주소만 유
지하고 그 외 주소는 가베지 처리)
다 기관 주소로 적합하지 않은 주소(자택주소)인 경우 유효한 주소로 정제(주소가 둘 이
상일 경우)
소속기관_사무실전화번호 팩스번호 정제지침 ( 기본정보_전화번호 핸드폰번호 정제지침 참조)
1 전화번호가 null인 경우 정제대상에서 제외
2 전화번호 기본포멧 유지
가 지역번호-국번-전화번호
- 58 -
나 +국가번호-지역번호-국번-전화번호
3 전화번호 외 가베지 데이터는 삭제
가 텍스트 최소자릿수 미달(3자리 미만)등
4 데이터를 각 항목에 맞도록 이동 정제
No원본데이터 정제 후
정제요령 비고사무실 전화번호 기본정보핸드폰 번호
1 010-2353-0416 010-2353-0416
사무실전화번호에
핸드폰번호 형태의
데이터가 있을 경우
삭제하고 기본정보의
핸드폰번호가 널일
경우에만 이동함
5 기타사항
가 내선번호 및 과거지역번호 데이터 유지
나 지역번호 누락시 주소항목에서 유추 기입(유추 불가시 널처리)
다 전화번호가 2개 이상인 경우 기존 데이터 유지
라 기준에 명시되지 않은 사항은 추후 사업주관기관과 협의하여 진행
소속기관_기관 부서명 직위 정제지침
1 기관 부서명 직위 모두 null인 경우 정제대상에서 제외
2 기관 직위는 NTIS 코드값에서 검색하여 매핑
3 인력구분은 기관명이형전거DB에 의해 자동 매핑함
No원본데이터 정제 후
정제요령 비고기관코드 기관명 기관코드 기관명
1 한국타이어(주) AAB6793 (주)한국타이어
기관명이형전거DB에서
대표기관명과
이형기관코드로 매핑
No원본데이터 정제 후
정제요령 비고직위코드 직위명 직위코드 직위명
1 교수 A01 교수NTIS 직위코드에서
검색하여 매핑한다
2 항해사 999 항해사
직위코드에 매핑되지
않으면 직위코드는 lsquo999rsquo로
매핑하고 직위명은 유지함
4 필드내 중복데이터가 존재할 경우 가베지 처리하고 각 필드와 부합하지 않는 데이터는
해당 필드로 이동
5 해당 필드내 부합되지 않는 데이터는 해당필드로 옮기고 가베지 처리
- 59 -
No원본데이터 정제 후
정제요령 비고직위코드 직위명 직위코드 직위명
1 비정규직 가베지 처리
6 기타사항
가 소속기관이 2개 이상인 경우
(1)주소 데이터를 참고하여 해당 기관명만 유지하고 이외의 데이터는 가베지 처리
(2)주소 데이터가 없는 경우에는 대학교 연구소 산업계 기타 기관 순으로 정제
나 항목별 값이 2개 이상인 경우 해당 필드에 기 입력된 값을 우선하여 유지하고 이외
의 데이터는 가베지 처리
다 기관명이형전거DB에 존재하지 않는 기관은 신규발급 요청 후 매핑
라 기준에 명시되지 않은 사항은 사업주관기관과 협의하여 진행
소속기관_최초임용일 정제지침
1 날짜 오류 유형 정제
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMMDD
No원본데이터 정제 후
정제요령 비고생년월일 최초임용일 생년월일 최초임용일
1 19500310 19451011 19500310날짜는 생년월일 보다
작을수 없으므로 삭제
2 19500310 20101010 19500310날짜는 현재보다 클수
없으므로 삭제
3 19500310 19000101 19500310 1900년 이전은 삭제
학력사항
학력사항_전공 정제지침
1 전공분야코드와 전공명 모두 null인 경우 정제대상에서 제외
2 전공명은 있으나 전공분야코드가 null인 경우 전공명을 검색하여 전공분야코드 입력
가 전공명과 정확히 일치하는 전공분야코드가 존재하는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 정보통신 D130700 정보통신 정보통신전공명과 일치하는
코드값을 매핑한다
나 전공명에 공백이 있는 경우
- 60 -
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 무기 화학 C060300 무기화학 무기화학공백제거후 일치하는
값을 찾아 매핑한다
다 정확히 일치하는 전공명이 검색되지 않는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 농생물학 F010300 농생물학 농생물근사치의코드값으로매
핑한다
2 생물 C070000 생물 생물학
3 화학전공 C060000 화학전공 화학
4 컴퓨터학과 D130000 컴퓨터학과 컴퓨터학
5 물리전공 C040000 물리전공 물리학
라 전공명이 영문일 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 Medicinal Chemistry C060519Medicinal
Chemistry의약화학
영문을 번역하여
코드값을 찾아
매핑한다
마 전공명칭의 중간에 구분기호 ( - () amp
및 등) 가 포함되어 있는 경우
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 미생물계통분류 C070901 미생물계통분류 미생물분류계통
구분기호와 낱말의
순서를 무시하고
매핑한다
2 동물학유전학 C071000 동물학유전학 동물학
구분기호를 기준으로
앞부분 부터 일치하는
순으로 매핑한다
3 병리학 폐암병리 E050000 병리학 폐암병리 병리학
4 환경생태생리 D110800 환경생태생리 환경생태
5 의약화학-약리 C060519 의약화학-약리 의약화학
6 전기공학(컴퓨터공학) D090000전기공학(컴퓨터공학
)전기공학
7 원격탐사amp지구물리 D140900 원격탐사amp지구물리 원격탐사
8 물리화학및 무기화학 C060300물리화학및
무기화학무기화학
바 상기 방법으로 매핑이 불가능한 경우
- 61 -
No
원본데이터 정제 후
코드매핑 결과 정제요령 비고학위취득대학코드
(코드값 없을경우)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 서울대학교 7006431 서울대학교 서울대학교 기관명이형전거DB를
이용하여
학위취득대학코드에는
이형기관코드
학위취득대학명에는
대표기관명을 매핑함
2 서울대학교
공과대학ZD13063 서울대학교 서울대학교
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 발사체 공력 해석 D049900 발사체 공력 해석 기타항공우주공학
전공명을 포괄하는
상위 코드값으로
매핑한다
2 SOLID
MECHANICSD020299
SOLID
MECHANICS기타고체및구조역학
사 원본데이터의 코드값이 오류인 경우(전공분야코드가 아닌 경우)
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고전공분야코드 전공명 전공분야코드 전공명
1 0160 건축공학 D150000 건축공학 건축공학
원문의 코드값을
가베지 처리 후
재매핑한다
3 전공명이 오류인 경우(전공명이 아닌 경우)
No원본데이터 정제 후
코드명 검색 결과 정제요령 비고직위코드 직위명 직위코드 직위명
1 訣廢点뼈膀갹쳬窩 가베지 처리
2 석사학위 없음 가베지 처리
학력사항_취득대학 정제지침
기관명이형전거DB를 이용하여 학위취득대학코드 및 학위취득대학명 정제
1 학위취득대학코드와 학위취득대학명 모두 null인 경우 정제대상에서 제외
2 학위취득대학명은 존재하나 학위취득대학코드가 null인 경우 기관명이형전거DB에서 검
색하여 학위취득대학코드 입력
3 학위취득대학명 풀네임이 아닐때 학위취득대학코드가 null인 경우 - 기관명이형전거DB에
- 62 -
No
정제전 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(()내용이 모두
없을경우)
학위취득대학명학위취득대학코드
(검색코드입력)코드학위취득대학명
1 연세대학교(원주) ZD13266 연세대학교 연세대학교
기관명이형전거DB를
이용하여
학위취득대학코드에는
이형기관코드
학위취득대학명에는
대표기관명을 매핑함
No
정제전 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(기존 코드값)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 114800 서울대학교 7006431 서울대학교 서울대학교
학위취득대학명 검색
기존데이터 가베지
처리 후 검색된 코드
입력
No
정제전(표준대학명 설정) 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(표준대학명
기준설정)
학위취득대학명학위취득대학코드
(검색코드입력)학위취득대학명
1 가톨릭대학교가톨릭대학교(본
부)7001337 가톨릭대학교 가톨릭대학교
신규 발급 요청 후
코드 입력
No
정제전(개칭 외국취득대학명) 정제후
코드매핑 결과 정제요령 비고학위취득대학코드
(검색된값)학위취득대학명
학위취득대학코드
(검색코드입력)학위취득대학명
1 부경대학교 부산수산대학교 7003010 부경대학교 부경대학교
인터넷
학위취득대학명
검색하여 검색된 코드
입력
2 東京大學 도쿄대학 JA0122 도쿄대학 東京大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
3 東京工業大學Tokyo Institute
of TechnologyJA0114
Tokyo Institute
of Technology東京工業大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
서 검색하여 학위취득대학코드 입력
4 기존 학위취득대학코드가 있는 경우 NTIS 코드값으로 변경
5 취득대학명 검색 후 취득대학코드가 없을 경우 학위취득대학명 신규 발급 요청 후 코드
기입
6 취득대학명이 개칭 혹은 외국취득대학명일 경우 검색해서 학위취득대학코드 기입함
- 63 -
4 早稻田大學(일본)와세다
대학JA0319 (일본)와세다 대학 早稻田大學
인터넷
학위취득대학명
검색하여 검색된 코드
입력
5 서울산업대학교 경기공업전문대학 7002623 경기공업전문대학 서울산업대학교
인터넷
학위취득대학명
검색하여 검색된 코드
입력
오탈자 정제요령
서울대하교 서울대학교 (오탈자 수정)
7 가베지값
가베지 정제요령
111ㄴㄴㄴ amp 김정구 없슴 등등 가베지 처리
8 오탈자
학력사항_학과 정제지침
1 학과코드와 학과명 모두 null인 경우 정제대상에서 제외
2 학과코드는 존재하나 학과명이 null인 경우 학과코드를 검색하여 학과명 입력
No원본데이터 정제 후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 0015 0015 가정 가정코드표에서 학과코드로
검색하여 매핑한다
3 학과명은 존재하나 학과코드가 null인 경우 학과명을 검색하여 학과코드 입력
가 학과코드표에 학과명과 정확히 일치하는 값을 찾아 매핑
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가정 0015 가정 가정코드표에서 학과명으로
검색하여 매핑한다
나 정확히 일치하는 학과명이 검색되지 않는 경우 근사값으로 매핑
- 64 -
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가축번식학번식공
학 전공명칭
전공필드가 Null인 경우
전공필드로 이동한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 건설공학대학원
박사후기9475
건설공학대학원박사
후기대학원
대학원의 경우 일치하는
값이 없으면 상위 개념으로
검색하여 매핑한다
2 이과대학
단과대학의 경우 일치값이
없으면 가베지 처리한다 -
학과명 삭제
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 가정교육학 0040 가정교육학 가정교육 근사 값으로 매핑한다 유사
2 기계설계학전공 1260 기계설계학전공기계설계
기계설계학
검색값이 여러 개인 경우
일치도가 높은 값으로
매핑한다
유사
3 건축공학계열 0160 건축공학계열
건축공학
건축공학과
건축공학부
건축공학교육
일치도가 같은 여러 개의
값이 검색된 경우 글자수가
가장 적은 값으로
매핑한다
유사
일치도 높은 값을 매핑 한다하여 ldquo건축공학rdquo을 ldquo건축rdquo의 형태와 같이 학과 자체가 바뀔
수 있는 매핑을하지 않도록 주의한다
다 학과명칭의 중간에 구분기호(쉼표() 마침표() slash() and(amp) 등)가 있으면서 정확히
일치하는 학과명이 검색되지 않는 경우
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 전기 및
컴퓨터공학과0073
전기 및
컴퓨터공학과전기컴퓨터공학과
구분기호를 무시하고
매핑한다
2 생화학세포학 및
분자생물학과3240
생화학세포학 및
분자생물학과생화학
No 1의 결과가 없는 경우
구분기호를 기준으로
각각의 데이터를 검색하여
매핑한다
3 곡류과학식품공학 3715 곡류과학식품공학 식품공학구분기호를 기준으로
두번째의 값이 검색된 경우
라 학과코드가 Null 이고 학과명 필드에 전공명칭이 입력된 경우
(1) 전공필드가 Null인 경우 전공필드로 데이터를 이동하여 매핑하고 학과명 필드의 데이
터는 삭제한다
마 상기 방법으로 매핑이 불가능한 경우
- 65 -
3 요업공업 9999 요업공업 기타유사코드를 찾지 못한
경우 기타로 분류한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 명예박사 가베지 처리한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 공교 공업교육
공예교육
추정된 값이 하나일 때는
그 값으로 매핑 둘
이상이면 가베지 처리한다
2 IHE(Delft)
영문 약어의 경우 추정이
어려운 값은 가베지
처리한다
No정제전 정제후
코드매핑 결과 정제요령 비고학과코드 학과명 학과코드 학과명
1 工學系硏究 가베지 처리한다
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1 추후입력 test 가베지 가베지 처리
2 미정 PH D 가베지 가베지 처리
3 기억안남 NA 가베지 가베지 처리
4 졸업시험으로 대체 null 가베지 가베지 처리
5 국문없음 no data 가베지 가베지 처리
6
공학박사(지능형
소프트웨어 전공)
or 공학사
(자동차기술사)
학위 및 기타정보 가베지 처리
7 박사 학위 가베지 처리
4 가베지 처리
가 학과명이 아닌 경우
나 약어인 경우
다 학과명인지 판단하기 난해한 한문 명칭의 경우
학력사항_학위논문명 정제지침
1 최종학위국문논문명과 최종학위영문논문명이 모두 null인 경우 정제대상에서 제외
2 논문명 필드에 기타 정보나 가베지 데이터가 존재하는 경우
- 66 -
8 영문참조 none 가베지 가베지 처리
9 aa 0 가베지 가베지 처리
10 가 x 가베지 가베지 처리
11 디지털경제학 Chemistry 학과 또는 전공정보 가베지 처리
12
학사학위시설계PR
OJECT날개2001-
gt청소년수련원테마
로 설계함
졸업 작품에 대한
정보가베지 처리
13
교회 건축물의
계획 및
설계(설계작품)
졸업 작품에 대한
정보가베지 처리
14압축기 관련
기술연수 연수 정보 가베지 처리
15
광통신 부품용
소재 연구관련
논문을 준비중임
준비중인 논문 가베지 처리
16 KISTI 영문 약어 가베지 처리
17 CFD 영문 약어 가베지 처리
18
H Atoms in
Photodissociations
and Chemical
Reactions(수소원자
의 광화학반응)
H atoms in
Phtodissociation
and Chemical
Reactions
H Atoms in
Photodissociation
s and Chemical
Reactions(수소원
자의 광화학반응)
H atoms in
Phtodissociation
and Chemical
Reactions
()안에기타정보가표
기됨
-유효데이터의표기
언어는동일하나내용
상다소의차이를보이
는경우
데이터 유지
19
김휘택김승욱김정
일서근택서정탁유
총일대퇴골
근위부의
방사선학적 형태-
정상 고관절과
대퇴골두 무혈성
괴사가 있는
고관절에서의 비교
대한정형외과학회
지
33(1)177-1851998
김휘택김승욱김
정일서근택서정
탁유총일대퇴골
근위부의
방사선학적 형태-
정상 고관절과
대퇴골두 무혈성
괴사가 있는
고관절에서의
비교
대한정형외과학회
지
33(1)177-185199
8
유효 데이터 전후에
기타 정보가 표기된
경우
데이터 유지
20
친환경
도시건축계획에
관한 연구
Oekologisch
orientierte
Stadtplanung in
Seoul
Suedkorea(독문
명)
친환경
도시건축계획에
관한 연구
Oekologisch
orientierte
Stadtplanung in
Seoul Suedkorea
국문영문논문명
필드에 모두
데이터가 있고
영문논문명 필드에
한글로 (언어)
표기가 되어 있는
경우
(언어) 부분만 가베지
처리
21
ZFS symmetry
and parameters
in MR(임시등록)
임시등록데이터의
경우가베지 처리
3 논문명의 후반부가 잘린 경우
- 67 -
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1 합성과 논문명의 남은 부분이
극히 짧음가베지 처리
2 경영통계에 관련 논문명의 남은 부분이
극히 짧음가베지 처리
3
계층구조를
이용한 문서
클러스터 제목의
자동생성 기법
cluster
계층구조를
이용한 문서
클러스터 제목의
자동생성 기법
논문명의 남은 부분이
극히 짧음(영문논문명)
영문논문명
가베지 처리
4암호화된 위상
마스크를 이용한
New visual
cryptography
method based on
optical
interference
암호화된 위상
마스크를 이용한
New visual
cryptography
method based on
optical interference
논문명이
어느정도(2단어 이상)
남아 있음(국문논문명)
데이터 유지
5
metathesis
polymerization of
~
metathesis
polymerization of
~
논문명이
어느정도(2단어 이상)
남아 있음
데이터 유지
6 보편형식On universal
forms보편형식
On universal
forms
가베지 여부를
판단하기 난해함데이터 유지
7
점성유동장내에서
의 최대양력 익형
설계
The Optimal
Design
점성유동장내에서
의 최대양력
익형 설계
The Optimal
Design
영문 논문명에
데이터의 일부 -
두단어 이상 남아 있음
데이터 유지
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문명
최종학위영문논
문명최종학위국문논문명 최종학위영문논문명
1
석사순니켈의수소
취성에미치는Fe및B
의영향에관한연구
박사기계적합금화
에의해제조된ABA
B2형금속수소화물
의전극특성에관한연
구
기계적 합금화에
의해 제조된 AB
AB2 형
금속수소화물의
전극 특성에 관한
연구
석사논문 박사논문이
동시에 입력
최종(박사)
논문명만
유지한다
2
초임계이산화탄소를
이용한 마늘로부터
지방산 추출에 관한
연구(석사)
식품저장기간을연장
할수있는기능성필름
개발을위한항균성물
질추출및흡착에관한
연구
식품저장 기간을
연장 할수있는
기능성 필름 개발을
위한 항균성 물질
추출및 흡착에 관한
연구
석사논문 추정불가
논문이 동시에 입력
후반부의
논문명만
유지한다
3
GIS를 이용한
대학캠퍼스
공간분석(석사논문)
현재 인터넷 GIS를
이용한 경관평가
논문 준비중
GIS를 이용한
대학캠퍼스
공간분석
후반부가 준비중인
논문인 경우
준비중인 논문
가베지 처리
4 논문명이 두개 이상인 경우
- 68 -
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문명
최종학위영문논
문명최종학위국문논문명 최종학위영문논문명
1
(영)A Shift-first
Strategy for
Generalized LR
Parsing
A Shift-first
Strategy for
Generalized LR
Parsing
A Shift-first
Strategy for
Generalized LR
Parsing
()안의 언어표기만
제외하고 동일한
데이터
국문논문명만
유지하고
영문논문제
삭제 처리
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1
3d 전자계에 대한
NMR 이동
계산(Theoretical
calculations of
NMR shifts for
3dⁿsystems)
3d 전자계에
대한 NMR 이동
계산
Theoretical
calculations of
NMR shifts for
3dⁿsystems
한쪽의 필드에
데이터가 모두
입력된 경우
해당 필드로 이동
3
AStudyonLandslid
eofCuttingandBank
ingSlopeKFRI
Road 林道
盛土面의
崩괴에關한硏究
AStudyonLandsli
deofCuttingandBa
nkingSlopeKFRI
Road 林道
盛土面의
崩괴에關한硏究
국문 영문 구분없이
유지함데이터 유지
9
家庭用電氣製品
の親環境設計過
程への畵像流體
計測の適用に關
する硏究(A
Study on the
Design of Home
Appliances for
Energy Saving
Using PIV)
家庭用電氣製品の
親環境設計過程へ
の畵像流體計測の
適用に關する硏究
(A Study on
the Design of
Home Appliances
for Energy
Saving Using
PIV)
한쪽의 필드에
영문과 기타외국어
논문명이 모두
입력된 경우
데이터를 구분할
기준이 없으므로
데이터를 유지하고
국문논문명 필드로
이동
No
원본데이터 정제 후
데이터 유형 정제요령 비고최종학위국문논문
명
최종학위영문논
문명
최종학위국문논문
명최종학위영문논문명
1中韓兩國外銷美國
主要商品之比較硏
중한양국
대미수출
中韓兩國外銷美國主
要商品之比較硏究
논문명 필드 내
논문의 언어를해당 필드로 이동
5 국문영문논문명이 동일하나 (언어)가 표기 되어 있는 경우
6 국문영문 필드에 데이터가 뒤섞여 있는 경우
가 국문 영문을 구분하지 않고 국문논문명은 널이 아니어야 함
나 국문논문명(필수)이 널이고 영문논문명이 널이 아닐 경우 국문논문명으로 영문논문명
을 이동
다 중국어 논문명은 명확히 구분이 되는 경우만 정제하여 영문논문명 필드로 이동 - 일문
논문명 국문 논문명과의 구분 난해
- 69 -
究(중한양국
대미수출
주요상품의
비교연구) [1991년
경영학석사 논문
중국어]
주요상품의
비교연구
표기하여 명확한
구분 가능
No원본데이터 정제 후
데이터 유형 정제요령 비고취득국가코드 취득국가코드
1 KZ NTIS 국가코드와 불일치 널처리
2 오류 데이터 널처리
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 Takashi Tsuruo PhD Takashi Tsuruo PhD
2 유영면(자동차 부품연구원) 유영면(자동차 부품연구원) (기타정보)가 표기된 경우 데이터 유지
3 신현경 김정회 (공동) 신현경 김정회 (공동) 2명 이상인 경우 데이터 유지
4高橋照男(TAKAHASHI
TERUO)
高橋照男(TAKAHASHI
TERUO)(병음)이 표기된 경우 데이터 유지
5 송지복 박사 송지복 박사
교수명 앞뒤에 호칭이 붙은 경우 데이터 유지
6 이와바교수 이와바교수
7 Dr HT Hahn Dr HT Hahn
8 ProfDr NWiberg ProfDr NWiberg
9 C S George Lee aaaaa C S George Lee지도교수명 뒤에 의미없이
알파벳이 반복 나열된 경우
반복 나열된 알파벳 가베지
처리
10J Desmaism aaaaa
DBernacheJ Desmaism DBernache
2인의 지도교수명 사이에
의미없는 알파벳의 반복이 온 경우aaaaa 를 로 치환한다
11 김해구 김해구지도교수명 전후에 의미없는
특수문자나 파자가 존재하는 경우
의미없는 문자 가베지 처리
- 단 성명이 완전하지 않은
학력사항_취득국가 정제지침
1 취득국가코드가 NTIS 코드가 아닐 경우
가 취득국가코드가 NTIS코드가 아니면 널처리함
학력사항_지도교수명 정제지침
1 Null인 경우 정제대상에서 제외
2 필드내 지도교수명 외 기타 정보가 표기된 경우
가 필드내 유효 데이터의 존재 유무만을 중요시 함 유효 데이터가 존재하는 경우 데이
터의 형식 등에 큰 의미를 두지 않음
- 70 -
상황에서 성명이 들어갈
부분에 나 특수문자가
표기된 경우 데이터 유지
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 주강 주강
이름이 정확한지 불확실한 경우올바른 데이터인지 판단이
불가능 하므로 데이터 유지
2 김양 김양
7 공란 공란
3 홍길동 홍길동
4 Hiroyuki KIDO Hiroyuki KIDO
5 DH Youn DH Youn
한국 사람인데
영어(미국식)_이니셜로 표기된
경우
데이터 유지
6 Liu Hung Wen Liu Hung Wen한국 사람인데 영어(한국식)로
표기된 경우데이터 유지
7 이인원이상수 이인원이상수 지도교수가 2인 이상인 경우의
구분기호데이터 유지
8 오정무김상돈 오정무김상돈
9 庄子哲雄 庄子哲雄
일본식 이름의 표기법 데이터 유지
10 가네꼬 준이찌 가네꼬 준이찌
11 Kajiuchi Toshio Kajiuchi Toshio
12 대림성행 대림성행
일본 한자를 한글로 표기 데이터 유지
13 장욕천선대삼 장욕천선대삼
14 목도정부 목도정부
15 불상 불상 유효 데이터 여부 판단 난해 데이터 유지
16 지반 자바 지반 자바 외국어 이름을 한글로 표기 데이터 유지
17 Luo Luo
한국 교수의 성만을 표기한
것인지 외국인 교수의 이름인지
판단 난해
데이터 유지
No원본데이터 정제 후
데이터 유형 정제요령 비고지도교수명 지도교수명
1 N 가베지 데이터 데이터 가베지 처리
2 NA
3 필드내 데이터가 유효 값인지 판단하기 난해한 경우
가 유효 값인가 유효하지 않은 값인가 판단 자체가 불가능한 경우가 대부분 이므로 데이
터 유지를 기본으로 함
4 필드내에 기타 정보나 가베지 데이터가 존재하는 경우
- 71 -
3 none
4 해당없음
5 알수없음
6 모름
8 김교수 호칭하는 대상이 포괄적인 경우 데이터 가베지 처리
9 농과대학 근무처 또는 전공 정보 데이터 가베지 처리
10 대학원 학위 또는 학과 정보 데이터 가베지 처리
11 교수님 직위 정보 데이터 가베지 처리
12 지도교수명 가베지 데이터 데이터 가베지 처리
11 Kajiuchi Toshio Kajiuchi Toshio
12 대림성행 대림성행 일본 한자를 한글로 표기 데이터 유지
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 19871801 198702 월(MM)이 유효하지 않은
경우 - 졸업년월02월로 갱신
2 19871301 198703 월(MM)이 유효하지 않은
경우 - 입학년월03월로 갱신
3 19871301 198701월(MM)이 유효하지 않은
경우 - 최종학위취득일01월로 갱신
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 10780301 년도(YYYY)가 유효하지
않은 경우 - 공통
데이터 가베지
처리
No 원본데이터 정제 후 오류사항 정제요령 비고
학력사항_날짜유형(입학일졸업일학위취득일)
1 기본 지침
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMM
다 날짜 데이터가 유효하지 않은 경우
(1) 년도(YYYY)가 유효하며 월(MM)이 유효하지 않는 경우 졸업월(MM)은 02로 입학월
(MM)은 03으로 그리고 최종학위취득일(MM)은 01로 갱신
(2) 년도(YYYY)가 유효하지 않은 경우 데이터 가베지 처리
(3) 년도(YYYY)의 유효 범위
rarr 졸업일 입학일 최종학위취득일 1900 lt 졸업일 입학일 최종학위취득일 lt 현재
라 MM(월)이 없는 경우 졸업년월은 02월로 입학년월은 03월로 갱신
- 72 -
졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 1987 198702 월(MM)이 없는 경우 -
졸업년월02월로 갱신
2 1987 198703 월(MM)이 없는 경우 -
입학년월03월로 갱신
3 1987 198701월(MM)이 없는 경우 -
최종학위취득일01월로 갱신
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 19820301 19820301 19820301 입학년월과 졸업년월이
동일입학년월 유지
No원본데이터 정제 후
오류사항 정제요령 비고졸업년월 입학년월 최종학위취득일 졸업년월 입학년월 최종학위취득일
1 0201
년도가 없음 년도로
간주하더라도 유효하지
않은 데이터
데이터 가베지
처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
1한성대학교
산업시스템공학부한성대학교 정제 정제 처리
2(주)한정화학
총무과부장(주)한정화학 부장 정제 정제 처리
3연세대학교 공과대학
화학공학전공
연세대학교
공과대학정제 정제 처리
4연합철강공업(주) 입사
(국제그룹공채)연합철강공업 정제 정제 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
마 [입학년월 gt= 졸업년월]인 경우 입학년월 유지 졸업년월 가베지 처리
바 YYYY(년도)가 없는 경우 데이터 가베지 처리 정제대상에서 제외
경력사항
경력사항_근무처명 정제지침
1 근무처명이 null인 경우 정제대상에서 제외
2 근무처명에 직위 전공값이 있는 경우
3 가베지 데이터
- 73 -
1 중학교 총무처 군복무 현역 등
가베지 데이터 가베지 처리
2 가 나 다 몰라 가베지 처리 등
3 00 제2청사 (주)ㅇㅇ건설 000공무원 등
4 111163년10년1년106866 등
5 WHO COO aaa dkff saa 등
6 미국 일본 등
NO원본데이터 정제 후
데이터 유형 정제요령 비고근무처명 근무처명
1 日本産業技術合究所 日本産業技術合究所
오류
가베지 처리
2 고려대학교 보건대학원 역학 I 보건정보학과 고려대학교 보건대학원 정제 처리
3 환경공학 국가기술개발 선도사업 (G-7 연구환경공학 국가기술개발
선도사업 (G-7 연구가베지 처리
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 교수 A01 교수 교수직위명과 일치하는 코드값을
찾아 매핑
2 위촉연구원 B07 위촉연구원 위촉연구원
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 조교수부교수교
수A01
조교수부교수
교수교수
완전일치gt 일치도가 높은
직위명 순으로 매핑
2 시간강사연구조
교A05
시간강사연구조
교시간강사
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
4 기타
경력사항_직위명 정제지침
1 직위코드와 직위명 모두 null인 경우 정제대상에서 제외
2 직위명은 있으나 직위코드가 null인 경우 직위명 검색하여 직위코드 입력
가 직위명과 정확히 일치하는 직위코드값이 존재하는 경우
나 직위명에 직위가 복수인 경우
다 정확히 일치하는 직위명이 검색되지 않는 경우
- 74 -
1 주임교수 A01 주임교수 교수 근사치의 코드값으로 매핑
2 시간강의 A05 시간강의 시간강사
이형정의
표 첨부
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 Professor A01 Professor 교수영문을 번역하여 이형정의표에
의거 코드값을 찾아 매핑
이형정의
표 첨부
2 Research Fellow B20 Research Fellow 전문위원
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 간호사 999 간호사 기타직위명과 일치하는 코드명이
없을경우 기타코드값으로 매핑
2 계장 999 계장 기타
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 36 연구원 B06 연구원 연구원기존의 직위코드를 NTIS
직위코드로 대체
2 13 조교수 A03 조교수 조교수
No원본데이터 정제 후 코드명
검색결과정제요령 비고
직위코드 직위명 직위코드 직위명
1 등재 직위명은 가베지 처리
2 ㅁㅁㅁ
라 직위명이 영문일 경우
마 상기 방법으로 매핑이 불가능한 경우
3 직위명과 코드가 모두 존재하는 경우
4 직위명이 오류인 경우(직위명 가베지)
- 75 -
No NTIS코드 코드명(생성) 이형정의(원본데이터) 비고
1 A01 교수
Professor
Prof
Faculty
(대학의)Teacher
Teaching
TeachingFellowship
학장 학장보
부학장 학과주임
학과장 학부장
학생처장
대학원장대학원장보
(대학의)교직원(대학의)교원
총장부총장
2 A02 부교수
AssociateProfessor
AssociateResearchProfessor
AssociateVisitingProfessor
3 A03 조교수AssistantProf
AssistantProfessor
4 A04 전임강사FullTimeLecturer
Instructor
전문강사 전담강사
강의전임 강의전담
전임대우
5 A05 시간강사
시간강의
PartTimeLecturer
PartTimeInstructor
6 A06 강사(기타) 강의 출강
7 A10 명예교수Honorary[Emeritus]Professor
HonoraryVisitingProfessor
8 A11 석좌교수 Chair Professor
9 A12 강의교수
10 A13 겸임교수
겸직교수
adjunctprofessor
adjunctprof
AdjunctFaculty
11 A14 계약교수
12 A15 기금교수
13 A16 대우교수
14 A17 연구교수
ResearchProfessor
ResearchFaculty
FacultyResearch
teachingresearcher
15 A18 초빙교수
초청교수
InvitedProfessor
ProfessorInvite
16 A19 객원교수
Visitingfaculty
visitingprofessor
aprofessorextraordinary
17 A20 조교
조수
Tutor
Assistant
UniversityAssistant
GraduateAssistant
GraduateAssociate
Teachingfellow
TeachingAssistant
TeachingAssociate
FacultyAssociate
TA RA GRA GSRA
18 A21 대학원생박사과정
석사과정
별첨 이형정의표
- 76 -
postgraduate
19 A22 POST-DOC
연수과학자
연수연구원
포스트닥터
포닥
박사후연수
박사후과정
박사후연구원
Post-Dr
Postdoctor
postdoctoral
visitingscholar
visitingfellow
Researchassistant
ResearchAssociate
20 A23 POST_MAS
21 B01 수석연구원 Principal Research Engineer
22 B02 책임연구원
연구책임자
SeniorResearchEngineer
SeniorResearch
SeniorResearcher
SeniorResearchStaff
SeniorInvestigator
23 B03 주임연구원
연구주임
AssistantResearchEngineer
AssistantResearcher
assitantInvestigator
24 B04 전임연구원AssociateResearchEngineer
AssociateResearcher
25 B05 선임연구원 선임-연구소의
26 B06 연구원
연구소장 연구보조원
연구원보연구생
연구개발원연구조원
연구주임연구조수
연구부담당자연구자
연구실장연구보조
연구팀장연구요원
연구센터장연구부처장
연구부문장연구대리
연구단장연구연구진
연구회원연구활동
방문연구 연구수
(연구소연구원연구센터연구실의)-
실장팀장원장부원장소장부소장
선임단장그룹장본부장계장인턴
장장 등
GraduateFellow
(연구소의)-Fellow
Research
Researcher
ResearchStaff
ResearchEngineer
Investigator
27 B07 위촉연구원
VisitingResearcher
VisitingResearchEngineer
VisitingInvestigator
GuestResearcher
GuestInvestigator
28 B10 수석연구위원
29 B11 책임연구위원
30 B12 주임연구위원
31 B13 전임연구위원
32 B14 선임연구위원
33 B15 연구위원
34 B20 전문위원ResearchFellow
ReserchFellowship
35 B30 책임기술원책임기사
기술책임자
SeniorEngineer
ChiefEngineer
- 77 -
PrincipalEngineer
SeniorTechnical
36 B31 선임기술원 선임기사 선임엔지니어
37 B32 기술원
(주식회사의)-기사
엔지니어기술사
기술팀장기술센터장
기술직기술주임
기술담당기술처장
기술직사원
Engineer
Technician
TechnicalStaff
TechnologyStaff
38 C01 공무원
연구사연구관
주사주사보
보좌관기좌
기사보사무관
군무원서기관
이사관조사원
청장차관
자문관비서관
장관행정관
담당관기원
경찰분석관
서서서기보조무원
보건지소장보건소장
보건소영양사보건진료원
보건진료소장지도관
지도사보
(행정기관의)-토목급
(행정기관의)-심사관
(행정기관의)-지도원
(행정기관의)-지도사
(공공기관)-기사
(공사의)-급
39 C02 법조인
심판관변리사
재판관검찰관
변호사법무조정위원
법제이사법의관
법의학감식관
40 C03 의사
전문의전임의
전담의담당의
인턴레지던트
객원의공중보건의
수련의임상의
전공의주치의
의사보일반의
상담의인정의
지도의병원장봉직의
(병원의)-과장부장처장등
Clinician
Intern
Resident
Doctor
Attending
41 C04 교사 (초~고교의)-교원
42 C05 군인
(군관련)-교관소대장
병장교소령
소위대위
군의관의무관
군하사중위
중대장보충역
제대소령
참모의무자문관
기무사기무사보
기무관
43 D01 대표이사
CEO대표
사장법인장
President
44 D02 이사
부사장이사보이사대우
Director
viceDirector
associateDirector
VicePresident
SeniorExecutiveVicePresident
45 D03 전무SeniorManagingDirector
CFO
- 78 -
46 D04 상무 상무보
47 D05 부장
부장대리
DepartmentManager
GeneralManager
48 D06 차장
DeputyGeneralManager
DeputyDirectorGeneral
AssistantDirector
AssistantDirectorvice-chiefManager
49 D07 과장
Manager
GeneralManager
DepartmentManager
DeputyManager
50 D08 대리 Assistant Manager
51 D09 사원 회사원직원
52 999 기타
53 회원(삭제)
No원본데이터 정제 후
오류사항 정제요령 비고근무시작일 근무종료일 근무시작일 근무종료일
1 2005 2007 20050101 20070101 월 없음 월에 01 입력
No원본데이터 정제 후
오류사항 정제요령 비고생년월일 근무시작일 근무종료일 근무시작일 근무종료일
1 19500101 19000101 19400101 유효 범위 오류 삭제처리함
경력사항_날짜유형(근무시작일 근무종료일) 정제지침
1 기본 지침
가 null인 경우 정제대상에서 제외
나 날짜 데이터 기본 포맷 YYYYMM
다 날짜 데이터가 유효하지 않은 경우
(1) 년도(YYYY)가 유효하며 월(MM)이 유효하지 않는 경우 01로 입력
(2) 년도(YYYY)가 유효하지 않은 경우 데이터 가베지 처리
(3) 년도(YYYY)의 유효 범위
rarr 근무시작일 근무종료일 1900 lt 근무시작일 근무종료일 lt 현재
rarr 근무시작일 근무종료일 생년월일lt근무시작일 근무종료일
라 [근무시작일 gt= 근무종료일]인 경우 근무시작일 유지 근무종료일 가베지 처리
- 79 -
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1한국산업인력
관리공단
건설기계기
사1급1994-12-01
건설기계기사
1급
한국산업인
력관리공단1994-12-01 오류 해당필드로 이동
2치과의사면허
증1993-01-01 보건복지부
치과의사면허
증보건복지부 1993-01-01 오류 해당필드로 이동
3중등 2급
정교사자격증 문교부
중등 2급
정교사자격증문교부 오류 해당필드로 이동
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1워드 프로세서
2급
워드
프로세서
2급
1999-06-01워드
프로세서 2급 1999-06-01 중복 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 발행처 2004-03-01 가베지 가베지 처리
NO원본데이터(가베지) 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 111 222 0000 가베지 가베지 처리
2 상동
No원본데이터 정제 후
오류사항 정제요령 비고근무시작일 근무종료일 근무시작일 근무종료일
1 20050501 20040601 20050501 [근무시작일 gt=
근무종료일]인 경우
근무종료일 가베지
처리
자격사항
자격사항 정제지침
1 자격증명 자격발행처 자격취득일이 모두 null인 경우 정제대상에서 제외
가 자격증명값이 NULL인 경우 나머지 데이터(자격발행처 자격취득일) 모두 가베지 처
리
2 자격증명 자격발행처 자격취득일 각 필드값이 뒤바뀐 경우 처리방법
3 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값이 나올 경우 처리방법
4 자격증명 필드값이 NULL인 경우 처리방법
5 가베지값 처리방법
- 80 -
3 일본
4 없음
NO원본데이터(오탈자) 정제 후
데이터 유형 정제요령 비고자격증명 자격발행처 자격취득일 자격증명 자격발행처 자격취득일
1 화공기사1급ssssssssssssss 화공기사1급
오탈자데이터 수정 및
가베지 처리
2 충북졍찰청
3 박물관amp8228미술관 정학예사 3급미술관
정학예사 3급
4초경U항공기조종사면허1111111111111
111111111111111111111증
초경량항공기
조종사면허증
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
1 1루프캐리어
이송장치
루프캐리어
이송장치1
루프캐리어
이송장치중복 가베지 처리
2 1 1019990060031101999006003
1 가베지 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
1 1특허등록 제
0290068호 가베지 가베지 처리
2 1 1313131 아자차카 가베지 가베지 처리
NO원본데이터 정제 후
데이터 유형 정제요령 비고특허구분 출원등록번호 지식재산권명 특허구분 출원등록번호 지식재산권명
6 기타 처리방법
지식재산권
지식재산권 정제지침
1 특허구분 출원등록번호 지식재산권명이 모두 null인 경우 정제대상에서 제외
가 지식재산권명이 NULL인 경우 나머지 데이터 모두 가베지 처리
2 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값 상이값이 나올 경우 처리방법
3 지식재산권명 필드값이 NULL 가베지값인 경우 처리방법
4 가베지값 처리방법가 출원등록번호 지식재산권명으로 볼 수 없는 데이터는 가베지 처리
- 81 -
1 3자리 이하의
숫자특허
가베지 가베지 처리
2 한국 드릴
3 완료 국제
4 미정 마바
5 이름 사아
6 출원중 파하
7 경상현 가나
8 미지정 다라
9 공개중 카타
10 미입수 혜천
NO원본데이터 정제 후
데이터 유형 정제요령 비고지식재산권명 지식재산권명
1 光微粒子の製造方法 光微粒子の製造方法 오탈자 가베지 처리
2 양자우물amp8228세선의 제작방법 양자우물amp8228세선의 제작방법 오탈자 가베지 처리
3 94-26592 94-26592 오탈자 가베지 처리
NO원본데이터 정제 후 데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 총무
아태물리학회(Associati
on of Asia-Pacific
Physical Societies)
아태물리학회(Associa
tion of Asia-Pacific
Physical Societies)
총무 오류 데이터 이동
2 ASG 없음 Member ASG Member 가베지 가베지 처리
NO원본데이터 정제 후 데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
5 기타 처리방법
소속학협회
소속학협회현황 정제지침
1 학협회명 직위 담당업무 모두 null인 경우 정제대상에서 제외
가 학협회명값이 NULL인 경우 나머지 데이터 모두 가베지 처리
2 학협회명 직위 담당업무 각 필드값이 뒤바뀐 경우
3 해당 필드에 이미 유효 값이 존재하는데 다른 필드값도 나올 경우
- 82 -
1대한병리학회
임상병리학회
대한병리학회
경남(부산)회장
대한병리학회
임상병리학회
대한병리학회
경남(부산)회장 중복 데이터 유지
명칭포함
유지
2한국자원공학회
이사 한국자원공학회 이사 오류 데이터 이동
3여성생명과학기
술포럼 회원운영위원 학술위원
여성생명과학기술
포럼운영위원 학술위원 중복 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 편집위원 가베지 가베지 처리
2 종신회원 명예회장 가베지 가베지 처리 학협회명 아님
3 회원 해당없음 가베지 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 ㄴㄴㄴ 111 eee 20 q 등
가베지 가베지 처리
2 없음 해당없슴 등재
3 화공기사 1 급 덕있으마
NO
원본데이터 정제 후데이터
유형정제요령 비고
학협회명 직위 담당업무 학협회명 직위 담당업무
1 일본 학회 기타 가베지 처리
NO 원본데이터 정제 후 데이터 정제요령 비고
4 학협회명 필드값이 NULL값인 경우
5 가베지값
6 기타
훈포장사항
훈포장사항 정제지침
1 수여기관명 훈포장명이 모두 null인 경우 - 정제대상에서 제외
가 훈포장명이 NULL인 경우 나머지 데이터 모두 가베지로 처리
2 수여기관명 훈포장명 각 필드값이 뒤바뀐 경우
- 83 -
수여기관명 훈포장명 수여기관명 훈포장명 유형
1 장영실상 과학기술부 과학기술부 장영실상 오류 해당필드로 이동
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 대통령 대통령 대통령 대통령 중복 데이터 유지 대통령 상
2우수논문발표상 -
포스터 부문
우수논문발표상 -
포스터 부문
우수논문발표상 -
포스터 부문중복
데이터 가베지
처리
3 국무총리 표창 국무총리 표창 국무총리 국무총리 표창 중복데이터 가베지
처리
4 광혜학술상 광혜학술상 광혜학술상 중복데이터 가베지
처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 대한민국 정부 오류데이터 가베지
처리
훈포장명 데이터
null값
2 한국물리학회 한국물리학회 오류데이터 가베지
처리
훈포장명 데이터가
가베지값
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 222 111데이터 가베지 처리
2 회원 등재등
NO
원본데이터 정제 후데이터
유형정제요령 비고
수여기관명 훈포장명 수여기관명 훈포장명
1 제어amp8228자동화amp8228시스템공학회 제어amp8228자동화amp8228시스템공학회오탈자
데이터 유지 수정
및 가베지 처리
파일생성 형식에
따른 오류
2 ㅈ조선대총장 조선대총장
3 해당 필드에 이미 유효 값이 존재하는데 다른 필드에서 동일값이 나올 경우
4 훈포장명 필드값이 NULL값인 경우
5 가베지값
6 기타
저역서실적
저역서실적 정제지침
- 84 -
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 3차원
인체해부도1 UBCare
3차원
인체해부도 1 UBCare 오류
해당필드로
이동
2신흥인터내
셔날
소아
청소년치과학1
소아
청소년치과학 1 신흥인터내셔날 오류
해당필드로
이동
3 動力學Engineering
Mechanics2 普文堂 動力學
Engine
ering
Mechan
ics
2 普文堂 한자명 그대로 유지
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1고분자
공학 II
고분자 공학
II1 희중당
고분자 공학
II 1 희중당 중복 가베지 처리
2 주조응고일본금속학회
[주조응고]2
반도출판
사
일본금속학회
[주조응고] 2 반도출판사 오류
해당필드로
이동
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 1
가베지전체 데이터
삭제
2물리강의(20
9쪽)일서 2 대웅
3 wjswktkdrjfo
qhdks rltnf1 생능출판사
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 Polymer Surface
Dynamics 공동저서
Polymer Surface
Dynamics 공동저서 이동 데이터 이동
2
The Handbook of
Groundwater
Engieering-지하수공학에
있어서 지리정보시스템
The Handbook of
Groundwater
Engieering-지하수공
학에 있어서
지하수공학에
있어서
지리정보시스템
The Handbook of
Groundwater Engieering중복 데이터 수정
1 국문저서명 영문저서명 저역서 구분 발행처명이 모두 null인 경우 - 정제대상에서 제외
가 국문저서명 영문저서명 둘 다 NULL인 경우 나머지 데이터 모두 가베지 처리
2 국문저서명 영문저서명 저역서구분 발행처명 각 필드값이 뒤바뀐 경우
3 해당 필드에 이미 유효 값이 있는데 다른 필드에서 동일값 상이값 나올 경우
4 국문저서명 영문저서명 필드값이 NULL값이거나 가베지값인 경우
5 국문저서명이 널이고 영문저서명이 널일 아닐 경우 국문저서명으로 이동함
- 85 -
지리정보시스템
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 ㅁ 기지이전사업 기획서 YRPMPKOREA 기지이전사업 기획서 YRPMPKOREA 오자 가베지 처리
2 최신 EDICALS 최신 EDI CALS 오자 데이터 유지
3 보호 야동식물 보호 야생 동식물 오자
가능한
범위에서
수정
4 ISBN 1-59033-891-XInequality Theory and
Applications (III)
Inequality Theory and
Applications (III)가베지
가베지 처리
ISBN 필드로
이동
5 NHealth Insurance
Reform In Korea
Health Insurance
Reform In Korea가베지 가베지 처리
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명저역서
구분발행처명 국문저서명
영문저
서명
저역서
구분발행처명
1 1111 2 골든벨
가베지 가베지 처리
2
곽수동
고필옥
김무강
범문사
3 ㄷㄷㅁㅁ 1
4 (주)지학사 1 (주)지학사
6 오탈자
7 가베지 데이터
논문실적
논문실적 정제지침
1 최종학위국문논문명과 최종학위영문논문명이 모두 null인 경우 정제대상에서 제외
2 논문명 필드에 기타 정보나 가베지 데이터가 존재하는 경우
NO
원본데이터 정제 후데이터
유형정제요령 비고
국문저서명 영문저서명 국문저서명 영문저서명
1 추후입력 가베지 가베지 처리
2 미정 가베지 가베지 처리
3 가베지 가베지 처리
- 86 -
구분 항목 세부항목 항목수단위별
가중치()
참여
인력
정보
기본정보
주민등록번호 성명 자택주소 자택
우편번호 자택전화번호 핸드폰번호
7 31
소속기관사항
소속기관명 부서명 직위명 사무실
전화번호 기관주소 최초임용일 인
력(직업)구분
7 185
학력사항
전공 취득대학 학위 입학일 졸업
일 학과 취득국가 지도교수명 학위
논문명 학위취득일
10 21
16 데이터 검수
161 데이터 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
162 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 87 -
구분 항목 세부항목 항목수단위별
가중치()
경력사항 근무처명 직위명 근무기간 3 45
자격사항 자격발행처 자격증명 자격취득일 3 25
논문실적
논문발표일 국문논문명 영문논문명
저자역할구분 발행처 학술지구분
학술지명 SCI여부
8 105
지식재산권 지식재산권명 출원_등록번호 특허구분 3 25
계 소계 41 905
평가
위원
소속학협회현황 담당업무 직위 학협회사항 3 3
훈포장사항 수상년월 수여기관명 훈포장명 3 25
저역서실적국문저서명 영문저서명 발행년 발
행처 저역서구분5 4
소계 11 95
계 52 100
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
150 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
성명 100자택주소 10자택우편번
호
20
자택전화번 10
항목별 오류율 산정 기준 정의
- 88 -
호
핸드폰번호 10E-mail 10소계 310
소속기
관사항
(7개)
소속기관명 100
부서명 05
직위명 20
사무실전화
번호
10
기관주소 30
인력(직업)구
분
10
최초임용일 10
소계 185
학력사
항
(10개)
전공 20
취득대학 100
학위 20
입학일 10
졸업일 10
학과 15
취득국가 15
지도교수명 05
학위논문명 05
학위취득일 10
소계 210
경력사
항
(3개)
근무처명 20
직위명 15
근무기간 10
소계 45
자격사
항
(3개)
자격발행처 05
자격증명 10
자격취득일 10
소계 25
논문실
적
(8개)
논문발표일 10논문명1 10
논문명2 05저자역할구
분
05
발행처 05학술지구분 05학술지명 10
SCI여부 05
소계 105
지식재
산권
지식재산권
명
10
- 89 -
(3개)
출원_등록번
호
05
특허구분 10소계 25
평가 소속학
협회현
황
(3개)
담당업무 05
위원 직위 05
(11개) 학협회사항 20
소계 30
훈포장
사항
(3개)
수상년월 10
수여기관명 05
훈포장명 10
소계 25
저역서
실적
(5개)
저역서명1 10
저역서명2 05
발행년 10
발행처 05
저역서구분 10
소계 40
계 1000
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 03
품질지표기준점수산정(데이터1
건기준)=오류유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 005
계 6개 오류유형 1
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
- 90 -
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
3000 3 055 150 000825
성명 10 2 035 100 000350자택주소 3 0 000 10 000000자택우편번
호
3 2 035 20 000233
자택전화번
호
4 0 000 10 000000
핸드폰번호 6 0 000 10 000000E-mail 9 0 000 10 000000소계 45 7 125 310 001408
소속기
관사항
(7개)
소속기관명 1000 20 100 000000부서명 80000 200 05 000000직위명 80000 200 20 000000사무실전화
번호
80000 200 10 000000
기관주소 80000 200 30 000000인력(직업)구
분
80000 200 10 000000
최초임용일 80000 200 10 000000소계 481000 1220 000 185 000000
계 1000 01
주민등록번호 한글성명 영문성명 한문성명자택우편번
호
630421-0000000 백중환Joong hwan
Baek
412220
(형식 015)
630421-0000000 백종석Baek Jong
Seok
6304210000000
(형식 015)백인열 Baek IN Youl 白寅烈 711-822
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
국가RampD참여인력 100000건 100000건 3000건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
검사물량 집계표 예시
오류율산정표 예시
검수데이터 예시
- 91 -
630421-0000000 백승호
(오기 02)백제훈
630421-0000000 백종완
630421-
(오기 02)백장선 Jangsun Baek
白壯선
(형식 015)
502-
(오기 02)
630421-0000000 백승호1213132
(오기 02)
630421-0000000 백석형
630421-0000000 백석형
품질지표별
기준점수의
합
055 035 035
데이터별 품질지표 기준 점수
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 03
품질지표기준점수산정(데이
터1건기준)=오류유형별점수
의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 005
계 6개 오류유형 1
- 92 -
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수
기관마다 다름
hurims에 각 기관별 인력관리번호와 NTIS 인력관리번호매핑표관리함
RNO 주민등록번호 필수
-포함한 14자리 일 경우만 연계함
주민등록번호는 기관마다 유일해야 하는데 특정기관은주민등록번호 1개 당 n개의 인력관리번호 존재하는 경우 있음
=gt 연계기관에 연락해서 주민번호 중복되지않게 요구해서 처리
=gt 현재는 맨 처음 해당 데이터의 인력관리번호만 유지
KOR_PSN_NM 한글성명 필수
한글성명은 처음 hurims에 insert될때만 반영하고 update될때는반영하지 않음
기관마다 실명인증을 안 하는 곳이 있기 때문에 같은주민번호인데 성명이 다른 경우가 있음
CHN_PSN_NM 한문성명(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
ENG_PSN_NM 영문이름(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
ZIP_CD 우편번호
(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
hurims에 우편번호||주소1||주소2가 널일 경우만 반영ADDR1 주소1ADDR2 주소2
HOME_TEL_NO 집전화(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
CP_NO 핸드폰번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
EMAIL E-mail(최종수정일이 최신이고 널이 아님) 또는 (hurims가 널일)때update에 반영
MSTR_CLS_CD1 부처(기관)코드1
123에 대중소의 코드를 넣는게 아니라 각각의 분류를 넣어야함
매핑정보가 없으면 반영 못함
1n으로 매핑되는 경우 처음 select 되는 최하위 분류로 매핑함
현재 ntis에는 분류명을 저장하는 필드가 없음=gt분류명은 반영안함
MSTR_CLS_NM1부처(기관)분류명1
MSTR_CLS_CD2부처(기관)분류코드2
MSTR_CLS_NM2부처(기관)분류명2
MSTR_CLS_CD3부처(기관)분류코드3
MSTR_CLS_NM3부처(기관)분류명3
17 데이터 이관
참여인력 기본정보 이관 방안
- 93 -
MP_TYPE 평가위원구분Y일 경우 평가위원 pool Db에 자동 등록함
=gt N 또는 Null일 경우 기존에 평가위원 이면 반영 안함
GENDER_DIV_CD 성별구분 없을 경우 주민번호로 판별
BDT 생년월일 없을 경우 주민번호로 판별INFO_OPEN_SLCT 정보공개구분 없을 경우 비공개로 저장
PINFO_OFR_USE_APR_YN
개인정보제공활용동의여부
N일 경우 최종수정일을 기준으로 기존 동의에서 비동의로변경함
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG 데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
HM_ID 인물ID 인물아이디는 기관에서 넣지 않아도 됨
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
ORG_NM 기관명 필수
hurims에 기관이형DB에 존재하면 대표기관명이형기관코드를 저장하고 없을 경우에는 기관명을그대로 hurims에 저장하고 정제 및 신규 발급을 통해매핑해야함
WORK_DEPT_NM 근무부서명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
POSITION_NM 직위명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
직위명으로 자동코드 매핑하고 직위코드가 없으면 기타999코드로 저장하고
직위명필드에는 연계기관의 직위명 그대로 저장함
ZIP_CD 우편번호
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
hurims에 우편번호||주소1||주소2가 널일 경우만 반영ADDR1 주소1ADDR2 주소2OFFICE_TEL_NO 사무실전화
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
중복체크 기준
- 주민등록번호(주민등록번호 성명이 없으면 반영하지 않음)
소속기관 사항 이관
- 94 -
FIRST_EMP_DT 최초임용일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MP_TYPE 인력구분기관에서 넣지 않아도 되고 기관이형DB에 의해 자동매핑됨
HOFF_DIV_CD 재직구분코드
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일경우에는 재직중으로 인정함
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장
ORD_NO 순번 필수 hurims의 순번으로 저장
DEGREE_ACQ_UNIV_NM 학위취득대학명 필수
hurims에 기관이형DB에 존재하면 대표기관명이형기관코드를 저장하고 없을 경우에는 기관명을그대로 hurims에 저장하고 정제 및 신규 발급을 통해매핑해야함
SDEPT_NM 학과명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
학과명으로 코드매핑하고 매핑안되면 학과명필드만반영함
매핑안된 학과명은 나중에 정제 작업에 의해 매핑함
MAJOR_NM 전공명 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
전공명으로 코드매핑하고 매핑안되면 전공명필드만반영함
매핑안된 전공명은 나중에 정제 작업에 의해 매핑함
GRAD_DT 졸업일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함ENT_DT 입학일 필수 날짜가 1900년 이전이거나 현재보다 크면 삭제함DEGREE_CD 학위구분 필수
ACQ_NAT_CD 취득국가코드(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
DEGREE_ACQ_DT 학위취득일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
소속기관명이 없을 경우 반영하지 않음
학력 사항 이관
- 95 -
ADVISOR_NM 지도교수명기관에서 넣지 않아도 되고 기관이형DB에 의해 자동매핑됨
KOR_THESIS_NM
학위논문제목국문
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일경우에는 재직중으로 인정함ENG_THESIS_NM
학위논문제목영문
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장
ORD_NO 순번 필수 hurims의 순번으로 저장
WORK_ORG_NM 근무처명 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
POSITION_NM 직위명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
WORK_START_DT 근무시작일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
WORK_END_DT 근무종료일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
학위취득대학명 학위가 없을 경우 반영하지 않음
경력 사항 이관
- 96 -
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
INSTIT_LST 학협회명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
POSITION_NM 직위 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용INSTIT_JOB_NM 담당업무
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
INSTIT_ACT_START_DT 학회활동시작일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
INSTIT_ACT_END_DT 학회활동종료일
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
CERT_NM 자격증명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
CERT_ISSUE_ORG_NM 자격증발행처 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
CERT_ACQ_D 자격취득일 필수 중복 체크하는 기준에만 쓰임
근무처명이 없을 경우 반영하지 않음
소속 학협회 사항 이관
학협회명이 없을 경우 반영하지 않음
자격 사항 이관
- 97 -
Tinsert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
KOR_PAPER_NM 논문제목국문 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
ENG_PAPER_NM 논문제목영문
중복 체크하는 기준에만 쓰임
insert 할때만 적용
PAPER_PUB_DT 논문발표일 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ROLE_SLCT 역할구분(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_ORG_NM 발행처명(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
JRNL_NM 학술지명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
JRNL_SLCT 학술지구분 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용SCI_TYPE_SLCT SCI여부
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
ISSN ISSN번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_BK 게재권집(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PUB_ISSUE 게재호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
START_PG 시작페이지(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
END_PG 종료페이지 (최종수정일이 최신이고 널이 아님) 또는 (hurims가
자격증명이 없을 경우 반영하지 않음
논문실적 이관
- 98 -
널일)때 update에 반영CO_AUTHOR_NM 공동저자명
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
PTAPP_SLCT 특허구분 필수(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
PTAPP_REGIST_NO 출원등록번호 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
IPR_NM 지식재산권명 필수(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
ACQ_DT 취득일 필수
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ACQ_SLCT 취득구분
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
공동활용항목에 없는데 널일경우 무엇으로 봐야하나(확인요)
PTAPP_REGIST_NAT_CD
출원등록국가코드
(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
널일 경우에는 대한민국으로 자동 반영함(확인요)MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
논문명이 없을 경우 반영하지 않음
지식재산권실적 이관
- 99 -
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
TRNSWRT_SLCT 저역서구분 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
KOR_TRNSWRT_NM 국문저역서명 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
PUB_ORG_NM 발행처명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
PUB_YR 발행년도 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함
ISBN ISBN번호(최종수정일이 최신이고 널이 아님) 또는 (hurims가널일)때 update에 반영
MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드
항목 항목명 필수 이관 방안
MP_MGNT_NO 인력관리번호 필수 NTIS 인력관리번호로 저장ORD_NO 순번 필수 hurims의 순번으로 저장
AWARD_NM 수상명 필수중복 체크하는 기준에만 쓰임
insert 할때만 적용
AWARD_ACQ_YM 수상년월 필수
중복 체크하는 기준에만 쓰임
insert 할때만 적용
AWARD_GRANT_ORG_NM 수여기관 필수 중복 체크하는 기준에만 쓰임
지식재산권명 출원등록구분 특허구분 출원등록번호가 없을 경우 반영하지 않음
저역서실적 이관
저역서명 저역서구분이 없을 경우 반영하지 않음
훈포장실적 이관
- 100 -
insert 할때만 적용
날짜가 1900년 이전이거나 현재보다 크면 삭제함MODIFIER_IP 갱신자아이피 데이터 있을 경우만 반영DATA_MODIFY_SLCT 데이터갱신여부 참조 필드
DATA_MODIFY_DT 데이터갱신시간
최종수정일을 비교하는 필드임
널일 경우 hurims에 해당 필드가 널일 경우만 반영함DATA_TRNSM_YN 데이터전송여부 연계 완료후 Y로 저장
DATA_TRNSM_DT 데이터전송시간 연계 완료시간 저장
DATA_TRNSM_MSG
데이터전송메시지 연계 미완료시 에러 메세지 저장
SRC_ORG_SHORT_NM 출처기관약어명 각기관의 약어명으로 hurims에서 최종 변경 출처 저장
ACQ_SRC_CD 입수출처코드 참조 필드 훈포장명이 없을 경우 반영하지 않음
- 101 -
2 인력정보 영문이력 입력 매뉴얼
21 개요
211 목표
연구자 이력정보 영문 번역을 통한 DB 구축(1000건)
- 영문이력 번역 대상 항목 선정
기본정보 재직기관 최종학위 경력사항 논문실적 연구실적 특허
- 영문이력정보 관리 기능 개발 및 영문이력DB 구축
- 영문이력DB에 대한 본인확인 안내메일 발송
인물정보에 대한 영문 검색서비스 제공
212 DB구축 공정
- 102 -
항 목 세 부 항 목 영문명 비고
기본(BasicInformation)
기본정보 영문성명 English Name - 한글이력정보와 공동 사용- 전문분야는lsquo08 개정 분류코드 영문명 활용
휴대전화(국가번호)
Cellular PhoneNumber
E-mail E-mail
개인홈페이지 Homepage
전문분야 전문(연구)분야 Research Field 1
Research Field 2
Research Field 3
검색키워드 전문분야명 입력
재직기관(organization)
기관명 Organization Name - 현재 재직기관사항 1개 입력
부서명 Department
직위 Job title(position)
우편번호 Postal Code
주소 Address
전화(국가번호) Telephone
팩스(국가번호) Fax
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) Degree Code
학위취득일 GraduationDate
학교명 School
전공명 Major
22 DB구축 목록 및 범위
221 DB구축대상 및 항목 정의
DB구축대상 수집된 영문 이력서 번역 및 희망자에 대한 이력정보 번역
- 수집된 이력서 번역
middot 수집된 한글이력서 반영하여 번역 수행
middot 수집된 영문이력서 입력
- 이력서 번역 대상자
middot 참여인력 또는 평가위원 서비스 대상자
middot 논문실적 경력사항 등의 데이터가 충실한 인력
DB구축 대상 항목 정의
- 103 -
경력(Career)
경력사항(CAREER)
시작년월 Start Date - 재직 경력으로 주요 경력입력 현 재직정보제외
종료년월 End Date
재직기관명 Organization Name
직위 Position(Job Title)
실적ResearchResult
논문실적(paper)
논문명 Title - 최근 5년 이내만 입력
저널명 Journal Name
게제(권)집 Volume
게제호 Number
시작페이지 Start Page
종료페이지 End Page
게제년월 Date of Publication
공동저자명 Co-Author
비고 Etc
연구실적ResearchProject
시작년월 Start Date
종료년월 End-Date
발주기관 Funding organization
참여구분(역할)-코드
Role
연구실적명 title
특허(patent)
출원등록구분-코
드
appliedregistered
출원등록번호 number
출원등록국가-코
드
National Code
특허출원명 Patent name
출원등록일자 Date
- 104 -
항 목 세 부 항 목 비고
기본(BasicInformation)
기 본정보
영문성명 - 각각 형태가 다른 영문성명을ldquoGilDong Hong 형태로 변경 필요
T
휴대전화(국가번호)
- 휴대전화를 표준형태로 변경 필요(외국 휴대전화만 국가번호 표시)middot 대한민국 010--middot 외국 +국가번호---
T
E-mail abctestcom 형태 T
개인홈페이지
입력 시 http을 제외하고 입력T
전 문분야
전문(연구)분야
- 전문분야는 lsquo08 개정 분류코드 영문명 활용
- 본인 확인에 의해 본인이 직접 선택하도록 함
- 검색키워드 필드에 전문분야명을 입력
재 직기관(organization)
기관명 - 대표기관명- 기관명이 주소정보에 포함되어 있는경우 존재
부서명 - 부서명이 주소정보에 포함되어 있는경우 존재
직위 - 여러개의 직위 존재우편번호 - 주소정보에 기관명 부서명 포함되어
있는 경우 존재- 영문우편번호DB를 이용 가능
주소
전화(국가번호)
- 전화번호를 표준형태로 변경 필요(외국 전화만 국가번호 표시)middot 대한민국 042--middot 외국 +국가번호---
T팩스(국가번호)
학력(Academiccarrer)
최 종학위(FinalDegree)
학위(코드) - 8 박사- 5 석사- 2 학사
C
학위취득일 - YYYY-MM-DD형태 D학교명 - 대표기관명전공명
경력(Career)
경 력사항(CAREER)
시작년월 - YYYY-MM형태 D종료년월 - YYYY-MM형태 D
재직기관명 - 부서명 포함직위 - 여러개의 직위 존재
실적ResearchResul
논 문실적(paper
논문명 - 영문제목 일부 존재저널명
23 데이터 분석 내역
231 세부 항목별 영문이력정보 분석
번역을 위한 영문이력정보 분석
∙ D 날짜형태변환 C 코드화 T 표준형태변환
- 105 -
t ) 게제(권)집
게제호시작페이지종료페이지게제년월 - YYYY-MM형태 D공동저자명 - 공동저자명이 구분자로 N명이상 존
재연 구실적ResearchProject
시작년월 - YYYY-MM형태 D
종료년월 - YYYY-MM형태 D발주기관참여구분(역할)-코드
A 연구책임자B 참여연구원
C
연구실적명 - 영문제목 일부 존재특허(patent)
출원등록구분
-코드C
출원등록번호출원등록국가
-코드C
특허출원명출원등록일자
- YYYY-MM-DD형태D
항 목 세 부 항 목
기본(BasicInformation)
기본정보 영문성명
휴대전화(국가번호)
개인홈페이지
전문분야 전문(연구)분야
재직기관(organization)
기관명
부서명
24 DB구축 절차 및 작업 지침
241 DB구축 지침
DB구축 내용
수집된 연구자 영문 이력서 입력을 통한 DB 구축
연구자 이력정보 영문 번역을 통한 DB 구축
DB구축 항목
DB구축 대상 항목
- 106 -
직위
우편번호
주소
전화(국가번호)
팩스(국가번호)
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드)
학위취득일
학교명
전공명
경력(Career)
경력사항(CAREER)
시작년월
종료년월
재직기관명
직위
실적ResearchResult
논문실적(paper)
논문명
저널명
게제(권)집
게제호
시작페이지
종료페이지
게제년월
공동저자명
비고
연구실적ResearchProject
시작년월
종료년월
발주기관
참여구분(역할)-코드
연구실적명
특허(patent)
출원등록구분-코드
출원등록번호
출원등록국가-코드
특허출원명
출원등록일자
- 107 -
단계 액티비티 태스크 상세내역역할구분
KISTI 투모로우
DB구축
준비
계획 수립
번역대상자분석 번역대상자 데이터 분석 대상자 선정 분석 내역 작성
절차 협의선처리 번역 번역확인전문가검수 본인확인KISTI검수
DB구축 대상 확정
매뉴얼 작성
입력 매뉴얼 구성내용
DB구축 개요 및 절차정의
DB구축 대상정의 및 범위
입력 항목별 기준 및 예시
입력프로그램 사용법
전환 코드표
표준 양식
입력 매뉴얼 검토및 확정
입력 매뉴얼 초안작성
상세일정계획수립
입력 량을 분석하여 투입인력대비 주월별 입력 계획대비 실적 산정
일정 검토 및 확정 일정계획 작성
작업 환경구축
작업 환경 및번역자 구성 입력 환경 구성
번역자 선정
영문이력정보 관리기능 개발
입력 교육 실시
번역자를 대상으로 교육실시 및 교육결과서 작성
입력작업 교육 실시
DB구축진행
선처리번역번역확인전문가검수
선처리번역번역확인전문가검수
DB구축 추진결과번역 및 품질활동수행
추진현황보고 실적 보고실적 확인 및 이슈사항 협의
주별진척보고
이슈사항 및 문제점 보고
DB구축완료
서비스DB이관 검수및 납품
서비스DB이관
완료된 영문이력DB의서비스화 이관 확인 데이터 이관
데이터 검수(최종 확인)
영문이력 DB 검사 (샘플링 검수) 검수(샘플링)
검수 데이터 추출제공
242 DB구축 단계별 작업 지침
243 DB구축 항목별 세부지침(선처리)
공통사항
Ⅰ 공통사항
1 기존에 존재하는 영문명은 입력된 그대로 유지하되 일부 정제 필요
- 108 -
원본데이터 입력데이터 입력요령
H20 A2 H20 A2
- 서식에 의한 특수문자는 텍
스트 형태 그대로 입력함
k- iexcl k - ε
- 수식도구에 의한 특수문자는
특수문자표를 참조하여 호환되
는 경우에만 입력하고 그렇지
않으면 수식만 제외하고 입력
참고3 특수문자표
원본데이터 번역데이터 입력요령
문장의 첫 단어
이름장소 등 고유명사
직함칭호의 축약형
1인칭 주어
도시이름월요일휴일시대 등
단어의 시작글자 대문자 표기
책글노래영화제목 등
a an and at by for in
of로 시작할경우
a an and at by for in of
를 제외한 시작문자 대문자로
표기
장소를 지칭하는 고유명사
internet 등Internet 시작문자 대문자 표기
국가언어등을 지칭하는 단어
(고유명사 일반명사의 개념)시작문자 대문자 표기
교과 과목명 시작문자 소문자로 표기
외국기관명 외국대학명 논문제목 연구제목 등
2 한글영문 이외의 표기된 외국어는 그대로 유지
(단 한글영문을 일부 포함한 외국어는 번역 시행)
3 모든 항목은 좌우의 공백을 제거하고 입력
가 줄바꿈 문자나 좌우의 공백문자를 제거하고 입력
나 데이터 사이에 공백문자가 두 개 이상인 경우에는 공백문자를 한 개로 입력
4 휴대전화 및 전화번호는 대한민국의 경우에는 국가번호를 표시하지 않고 외국의 경우에
만 국가번호(+국가번호)를 표시함
5 특수문자의 입력
6 대소문자 규칙
가 번역의 경우 대소문자 표준 준수
해당 기관홈페이지에 표기되어있는 공식영문명칭의 대소문자에 따라 선처리 및 번역
단 번역 시 단어 시작글자만 대문자료 표기
- 109 -
사이트명 url 비고
NAVER 백과사전 http100navercom 기관명 홈페이지 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr기관명 홈페이지 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 기관명 검색서비스
KIS-Report httpwwwkisreportcom한국신용평가정보 기업보고서
국내일반기업 영문명 기재
KJTRANS httpwwwkjtranscokr학교 및 연구기관 분야별 검
색가능
영문표기kr httpwww영문표기kr 기관학교연구기관 검색가능
학위논문 원문 공동이용협의회 httpthesisorkr협의회 대학기관 목록
(연구 발주기관)
NDSL 연구실적 검색 httpscholarndslkrindexdo연구실적 검색 가능
(연구 발주기관)
Paper Searchnet httpwwwpapersearchnet논문 및 저널명 검색서비스
(연구 발주기관)
기관명
Ⅰ 소속기관사항(기관명) 학력사항(학교명) 경력사항(재직기관명) 연구실적(발주기관
명)
1 선처리 작업 수행 시 고려 사항
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
선처리 작업 시 기관명이 Full name 과 약어 기재를 원칙으로 함
단 약어가 존재하지 않을 경우 기재하지 않음
부서직위명을 포함하고 있을 경우 포함하여 선처리
단 소요시간이 길어질 경우 부서직위명 한글 그대로 입력)
업무명이나 업무설명이 포함된 경우 한글 그대로 입력 (추후 번역시 정제)
웹 검색 시 해당기관 홈페이지에 기재되어있는 영문을 우선순위로 선처리
웹 검색 및 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
2 기관명 웹 검색 url 목록
- 110 -
원문 번역 비고
상호명 ldquo(주)rdquo의 번역
상호명 ldquo(사)rdquo의 번역
상호명 ldquo(유)rdquo의 번역
상호명 ldquo(일)rdquo의 번역
상호명 ldquo(재)rdquo의 번역
Co LTd
Association
INC
Foundation
영국식 주식회사 표기 번역
기관명 약어의 경우
기관명(약어)
기관명
약어로 번역
Full name(약어) 번역
Full name 번역
약어가 존재하지 않을 경우
Full name만으로 번역
원문 번역 비고
((주)한일합섬Hanil Synthetic Fiber Co
Ltd
- 오탈자 정제
웹검색
원문DB의(rarr정제
(system2010)산자부과기부
(system2010)Ministry of
Commerce Industry and
EnergyMinistry of Science
and Technology
- 기관명n 괄호명칭 ()
웹검색
n개의 기관명 모두 선처리
()괄호안의 표기내용 기재
(주)부일건화(주)아해BUIL KEON WHA Co
LtdAhae Co Ltd
- 기관명n
웹검색
n개의 기관명 모두 선처리
(주)비츠로테크 공장장VITZRO TECH Co Ltd
Plant Manager
- 직위명 포함
웹검색
직위명 번역 선처리 기재
(재)전북생물산업진흥원Jeonbuk Bioindustry
Development Institute
-상호명 (재)
웹검색
해당기관 홈페이지 영문명기
검색 가능한 url은 추후 추가 가능
3 번역 시 고려사항
상호명 번역 지침
번역 시 고려사항
4 선처리 예
- 111 -
재
(캐나다) 오타와 대학교 (Canada)University of Ottawa
-괄호()
웹검색
괄호()내용 번역 선처리 기재
강원대학교 의과대학Kangwon National University
College of Medicine
-학과명
웹검색
학과명 번역 선처리 기재
국립 지바대학교(일본) National Chiba University(Japan)
-괄호()
웹검색
국립 번역 선처리 기재
괄호()내용 번역 선처리 기재
미국 Cornell대학교 Section of
Molecular Biology
USA Cornell College Section
of molecular Biology
-한글영문명
웹검색
미국 번역 선처리 기재
영문명 그대로 기재
엔에스(Natural Science Co) 공
동설립
NS(Natural Science Co
Ltd)
-괄호() 업무설명
웹검색
괄호() 영문명 그대로 유지
업무설명 ldquo공동설립rdquo 제거
웅진출판(주) 편집국 생태전집
부 - lsquo한국의 자연탐험rsquo 제작 참
여
Woongin Publications Co Ltd
Editorial ecological Colledted
Works
-부서명 업무설명
웹검색
부서명 번역 선처리 기재
업무설명 ldquolsquo한국의 자연탐험rsquo
제작참여rdquo 제거
11 국제산학연 공동기술개발지
원사업
Korea Association of Industry
Academy and Research
Institute(KAIARI) Business
support for academic-industrial
common technology
development
-괄호()
웹검색
국립 번역 선처리 기재
괄호()내용 번역 선처리 기재
기관명 코드 참조 첨부7 기관명 코드
- 112 -
사이트명 url 비고
NAVER 백과사전 http100navercom 통합 검색 서비스
NAVER 사전 httpendicnavercom 표준 영문직위 검색가능
KJTRANS httpwwwkjtranscokr학교 및 연구기관 분야별 검
색가능
영문표기kr httpwww영문표기kr 직위명 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr통합 검색 서비스
원문 번역 비고
교수 (학부장) Professor(Dean)
-직위명n 괄호() 직위명
웹 검색 및 직위표 코드참조
모두 번역 및 선처리
교학부장 겸 학과장 Dean Chair
-직위명n
웹 검색 및 직위표 코드참조
모두 번역 및 선처리
사원(전장설계부)Employee(Department of Wiring
Harness Design)
-직위명 부서명포함
웹 검색 및 직위표 코드참조
부서명 포함 번역 및 선처리
선임연구원(고주파제어시스템)Senior Researcher(High-Frequency
Wave)
-직위명 업무명
웹 검색 및 직위표 코드 참조
직위명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
직위가 n개의 경우 n개로 선처리
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당기관 홈페이지에 기재되어있는 직위 영문을 우선순위로 선처리
웹 검색 불가시 영문 직위명을 참조하여 번역
번역 작업 시 영문 직위명은 표준 영문 직위 표기에 따라 번역
웹 검색 및 영문직위표 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
2 직위명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
3 영문직위 번역 코드 참조
4 선처리 예
- 113 -
사이트명 url 비고
NAVER 백과사전 http100navercom 통합 검색 서비스
KJTRANS httpwwwkjtranscokr학교 및 전공명 검색가능
(자료실영어표현 강좌실)
영문표기kr httpwww영문표기kr 전공명 검색가능
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr통합 검색 서비스
NAVER 사전 httpendicnavercom 표준 영문직위 검색가능
원문 번역 비고
전기전자전자통신공학Electrical Electronics Communications
Engineering
-전공명n
웹검색 및 코드표 참조
전공명n개 n갯수만큼 선처리
하수도 Sewerage-전공명
웹검색 및 코드표 참조
업무명 번역 및 선처리
연 구 원 ( R E S E A R C H
ASSORIATE)Research Associate
-직위명 영문명 포함 정제
웹 검색 및 직위표 코드참조
정제 AssocraterarrAssociate
괄호() 제거(동일한 영문명
전공명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
전공이 n개의 경우 n개로 선처리
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당학교 홈페이지에 기재되어있는 전공 영문을 우선순위로 선처리
웹 검색 및 공식적으로 사용하는 영문명이 존재하지 않을 경우 번역
ldquoOO학과rdquo 항목의 경우 동일한 ldquoOO학rdquo으로 선처리 번역으로 입력
동일한 한글명에 대한 학문 분야별 영문표기명이 다를 경우 표준명칭으로 선처리
2 전공명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
3 선처리 예
- 114 -
사이트명 url 비고
NDSL 논문실적 검색 httpscholarndslkrindexdo 논문검색시 저널명 발췌
과학기술학회마을httpsocietykistirekrmainht
ml학술지검색 메뉴 검색
KJTRANS httpwwwkjtranscokr 자료실
DBpiahttpwwwdbpiacokrpublicati
onview_resultasp저널명 및 논문 검색가능
구글httpwwwgooglecokr
httpscholargooglecokr저널명 및 논문 검색가능
국회도서관httpsu-libnanetgokrdlSear
chIndexphp논문 및 저널명 검색가능
휴리스틱알고리듬 Heuristuc Algorithm
-원문 정제
웹검색 및 코드표 참조
정제 ldquo알고리듬rdquorarrlsquo알고리즘ldquo
면역학(면역학) Immunology
-전공명n 괄호()명
웹검색 및 코드표 참조
괄호()명 제거(동일한용어)
19C영미시19C British and American
Poetry
-숫자영문명
웹검색 및 코드표 참조
19Crarr그대로 유지(19세기 표
현방식)
저널명
1 선처리 작업 수행
선처리 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
선처리 작업 시 출처기록은 필수 항목으로 기재를 원칙으로 함
웹 검색 시 해당 논문게재지 홈페이지의 영문 표기로 선처리
동일한 논문명으로 여러개의 저널명이 검색될 경우 게재권(게재호) 게재페이지 게재년
월 등을 확인후 선처리
웹 검색 시 영문명이 존재하지 않을 경우 번역
2 저널명 웹 검색 url 목록
- 115 -
NAVER 전문정보httpacademicnavercommain
nhn논문 및 저널명 검색서비스
Paper Searchnet httpwwwpapersearchnet 논문 및 저널명 검색서비스
SpringerLinkhttpwwwspringerlinkcomho
memainmpx논문 및 저널명 검색서비스
원문 번역 비고
Proc 대한조선학회 추계연구발
표회
Proc International Journal of
Naval Architecture and Ocean
Engineering(JNAOE) Fall
Conference
-원문 영문 포함 일부번역
웹검색
영문명 유지
일부번역 ldquo추계연구발표회rdquo
대한건축학회논문집제20권Journal of the Architectural
Institute of Korea
-부서명 업무설명
웹검색
부서명 번역 선처리 기재
업무설명 ldquolsquo한국의 자연탐험rsquo
제작참여rdquo 제거
대한두개안면성형외과학회Korean Cleft Palate-Craniofacial
Association
-공식 영문저널명 특수문자
웹검색
저널홈페이지에 기재된 특수
문자 포함 선처리
대한두개안면성형외과학회지
Journal of the Korean Cleft
Palate-Craniofacial Association(J
Korean Cleft Palate-Craniofac
Assoc)
-약어 저널명
웹검색
저널홈페이지에 기재된약어
선처리
대한토목학회 학술발표회 논문
집 CD-ROM
Proceedings of the Korean Society of
Civil Engineers(KSCE) Conference
Technical Journal CD-ROM
-약어 원문영문
웹검색
약어기재 영문명그대로 유지
표준
지침
Proceedings of
Journal of The 회차 Journal Name Conference 계절 년도(날짜) 개최지
예)Proceedings of
Journal of The 7th Journal Name Conference Fall 2009 09 12 Tokyo Japan
저널명
없음저널명이 없을 경우 원문 순서 그대로 번역
검색 가능한 url은 추후 추가 가능
3 선처리 예
4 저널명 번역시 표준 지침
5 저널명 번역시 유의 사항
- 116 -
원본데이터 번역데이터 입력요령
학술발표학술발표회
학술연구발표학술연구발표회
번역
Journal Name Conference 저널명 뒤에 기재
논문집요약집초록집논문
초록집 번역Proceedings of Journal Name 저널명 앞에 기재
OO학OO학회OO학회지 Journal of Journal name 저널명 앞에 기재
회차 계절 날짜 개최지OOth Journal Name Spring
2010 Seoul Korea
회차 저널명 앞에 기재
계절날짜개최지 저널명 다음
구신 저널명 선처리번역 웹으로 검색된 저널명을 기준 존재하지 않을 경우 신 저널명
6 저널명 대소문자 표기 지침
middot 단어의 첫글자 대문자 표기
244 DB구축 항목별 세부지침(번역)
기본정보
Ⅰ 영문성명
1 영문성명의 입력포맷 홍길동 =gt GilDong Hong
원본데이터 입력데이터 입력요령
HONGGILDONG
Gil-Dong Hong
Hong Gil-Dong
GilDong Hong - 영문성명 입력표준으로 변경
2 영문성명 번역시 고려사항
기존에 존재하는 영문명은 유지
논문실적의 영문명이 존재할 경우 영문명 입력
- 단 논문실적 항목의 공동저자명에 약어 축약어의 경우 영문성명은 Full name기재
번역시 로마자 표기법에 준수하여 번역
참고 로마자 표기법
- 117 -
원본데이터 입력데이터 입력요령
017)- 017-- - ldquo-rdquo구분자로 변경
+82-10-2497- 010-2497-
- 대한민국은 국가번호 제외하
고 입력
- 휴대폰구분번호 앞에 ldquo0rdquo표
시
1-11-- +1-11--- 외국의 휴대전화는 +국가번
호 붙여서 입력
011-123 입력하지 않음- 휴대전화번호가 완전하지 않
은 형태는 입력하지 않음
Ⅱ 휴대전화
1 휴대전화의 입력포맷
대한민국 휴대폰구분번호-국번-전화번호 (대한민국은 국가번호 제외하고 입력)
외국 +국가번호-휴대폰구분번호-국번-전화번호
Ⅲ E-mail
1 E-mail의 입력포맷 abctestcom
Ⅳ 개인홈페이지
1 개인홈페이지의 입력포맷 wwwhomepageurlcom (http 제외하고 입력)
2 한글 도메인의 경우 영문 도메인을 찾아 입력
Ⅴ 전문(연구)분야
1 전문(연구)분야의 코드 입력은 이력서 본인에 의해 과학기술표준분류별 전문분야를 선택
하도록 함
재직기관
Ⅰ 기관명(선처리 작업)
- 118 -
부서명 표현 항목 표현여부
Department of경력사항부서명 기재
전공명(학력사항) 삭제
College of경력사항부서명 기재
전공명(학력사항) 삭제
Ⅱ 부서명
1 번역 수행
번역 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
번역 작업 해당 기관홈페이지의 영문명을 우선순위로 번역
공식화된 영문명이 존재하지 않을 경우 부서명 참조
참조 부서명 코드
기관홈페이지 및 공식화된 영문명이 존재하지 않을 경우 번역수행
부서 영문명은 Department of 등으로 시작하며 약어 및 축약어 기재는 불가하며 모두
Full name 번역을 원칙으로 번역수행
Ⅲ 직위(선처리 작업)
Ⅳ 우편번호 주소
1 영문 우편번호DB 참조
2 주소의 기본주소와 상세주소를 합침
3 우편번호 및 영문 번역주소 검색
httpwwwkoreapostgokrservletkpppostPostInfo (우정사업본부)
4 검색된 번역 영문 주소 입력(단 기관명과 영문주소와 동일하지 않을 경우 기관명을기준)
5 존재하지 않는 상세주소의 경우 로마자 표기법에 준수하여 번역
참고 로마자 표기법
6 우편번호 입력시 웹검색과 원본이 다른 경우 원본그대로 우편번호 유지
(영문주소는 웹검색 그대로 번역 및 입력)
Ⅴ 전화 팩스
1 전화의 입력포맷
대한민국 지역번호-국번-전화번호(내선번호) lt= 대한민국은 국가번호 제외하고 입력
- 119 -
원본데이터 입력데이터 입력요령
042)- 042-- - ldquo-rdquo구분자로 변경
+82-31-2497- 031-2497-
- 대한민국은 국가번호 제외하
고 입력
- 지역번호 앞에 ldquo0rdquo 표시
1-11-- +1-11--- 외국의 전화번호는 +국가번
호 붙여서 입력
061-123 입력하지 않음- 전화번호가 완전하지 않은
형태는 입력하지 않음
02-123-1234(12) 02-123-1234(12) - 내선번호는 그대로 입력
외국 +국가번호-지역번호-국번-전화번호(내선번호)
학력사항
Ⅰ 학위취득일
1 학위취득일 입력포맷
ldquoYYYY-MM-DDrdquo 형태
Ⅱ 학교명(선처리 작업)
Ⅲ 전공명(선처리 작업)
경력사항
Ⅰ 시작년월 종료년월
1 시작년월 종료년월 입력포맷
ldquoYYYY-MMrdquo 형태
시작년월은 종료년월보다 작거나 같아야 함
- 120 -
사이트명 url 비고
NDSL 논문실적 검색 httpscholarndslkrindexdo 논문검색시 저널명 발췌
과학기술학회마을httpsocietykistirekrmainht
ml학술지검색 메뉴 검색
구글 구글학술httpwwwgooglecokr
httpscholargooglecokr저널명 및 논문 검색가능
Ⅱ 재직기관명 직위(선처리 작업)
Ⅲ 직위(선처리 작업)
논문실적
Ⅰ 논문실적 형태
보통 논문제목 저널명 게재권 (게재호) 게재페이지 게재년월 공동저자명으로 작성
volume (Vol) ( 정기 간행물 1년분의 ) 권
issue(ISS)또는 No또는 (숫자) 게제호 예) Vol9 ISS 4 또는 v9 no4 또는 9(4)- 9
권 4호
Ⅱ 공동저자명
웹 검색을 통한 원문 출처의 번역 방식에 따라 입력
저자명과 저자명은 ldquo rdquo으로 구분자(마지막 입력 후 ldquo rdquo 입력)
번역 시 Full name으로 입력하며 로마자 표기법을 준수함
Ⅲ 논문명
1 번역 작업 수행
번역 작업 시 기존 논문 영문명은 그대로 유지하되 일부 정제 필요
웹 검색 시 해당 논문게재지 홈페이지의 영문 표기로 선처리
동일한 논문명으로 여러개의 저널명이 검색될 경우 게재권(게재호) 게재페이지 게재년
월 등을 확인 후 선처리
웹 검색 시 영문명이 존재하지 않을 경우 번역
2 논문명 웹 검색 url 목록
- 121 -
국회도서관httpsu-libnanetgokrdlSear
chIndexphp논문 및 저널명 검색가능
NAVER 전문정보httpacademicnavercommain
nhn논문 및 저널명 검색서비스
Paper Searchnet httpwwwpapersearchnet 논문 및 저널명 검색서비스
DBpiahttpwwwdbpiacokrpublicati
onview_resultasp저널명 및 논문 검색가능
SpringerLinkhttpwwwspringerlinkcomho
memainmpx논문 및 저널명 검색가능
검색 가능한 url은 추후 추가 가능
Ⅳ 저널명(선처리 작업)
연구실적
Ⅰ 시작년월 종료년월
1 시작년월 종료년월 입력포맷
ldquoYYYY-MMrdquo 형태
시작년월은 종료년월보다 작거나 같아야 함
Ⅱ 발주기관(선처리 작업)
Ⅲ 참여구분
1 참여구분 입력지침
연구책임자 참여연구원 중에서 선택하여 입력함(구분 불가능시 선택 안함)
Ⅳ 연구실적명
1 번역 작업수행
번역 작업 시 기존 영문명은 그대로 유지하되 일부 정제 필요
번역 작업 시 웹검색을 통하여 정확한 연구실적명을 검색
웹 검색 시 공식화되어있는 영문을 우선순위로 번역
웹 검색 및 공식적으로 사용하는 연구실적명이 존재하지 않을 경우 번역
- 122 -
사이트명 url 비고
한국특허정보원httpwwwkiprisorkrkormai
nmainjsp국내특허실적 분야별 검색
구글 특허정보 검색서비스 httpwwwgooglecompatents해외 특허정보 검색서비스
(7백만개 이상 검색가능)
PCT 특허정보 검색서비스 httpwwwwipointpctdben PCT 특허 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 특허정보 검색서비스
사이트명 url 비고
NDSL 연구실적 검색 httpreportndslkrindexdo 연구실적 검색 가능
KJTRANS httpwwwkjtranscokr학교 및 연구기관 검색가능
(자료실영어표현 강좌실)
구글 httpwwwgooglecokr
NAVER 전문정보httpacademicnavercommain
nhn네이버 연구실적명 검색
Paper Searchnet httpwwwpapersearchnet 연구실적명 검색서비스
2 연구실적명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
특허실적
Ⅰ 출원등록구분
출원 등록 중에서 선택함
같은 특허에 대해 출원과 등록 모두 존재하면 등록정보만 입력함
출원 등록이 미구분시에는 선택하지 않음
Ⅱ 출원등록번호
특허 출원등록번호 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
Ⅲ 출원등록국가
- 123 -
사이트명 url 비고
한국특허정보원httpwwwkiprisorkrkormai
nmainjsp국내특허실적 분야별 검색
구글 특허정보 검색서비스 httpwwwgooglecompatents해외 특허정보 검색서비스
(7백만개 이상 검색가능)
PCT 특허정보 검색서비스 httpwwwwipointpctdben PCT 특허 검색가능
NAVER 전문정보httpacademicnavercommain
nhn네이버 특허정보 검색서비스
1 출원등록국가 입력지침
출원등록국가 코드를 찾아 입력
Ⅳ 특허출원명
1 특허출원명 번역지침
특허출원명 입력시 웹 검색을 우선으로 시행
웹 검색 후 영문명이 존재할 경우 그대로 입력
영문명이 존재하지 않을 경우 번역 시행
2 특허출원명 웹 검색 url 목록
검색 가능한 url은 추후 추가 가능
Ⅴ 출원등록일자
1 출원등록일자 입력포맷
ldquoYYYY-MM-DDrdquo 형태
25 DB구축 검수
251 DB구축 검수 지침
검수 기준
정제 결과 모니터링
- 이슈사항보고 이슈사항 발생시 수시 검토 및 협의 진행
- 자체적인 품질활동 점검표 작성등의 수행결과를 주기적으로 측정하여 품질목표를 달성
하도록 함
- 124 -
항 목 세 부 항 목 항목수 단위별가중치()
기본(BasicInformation)
기본정보 영문성명 5 15휴대전화(국가번호)E-mail개인홈페이지
전문(연구)분야-본인입력검색키워드
재직기관(organization)
기관명 7 20부서명직위우편번호
주소전화(국가번호)
검수 기준
- 에러율 전체 데이터(전체 항목 필드 기준)의 01 이하(품질목표 999)
- 에러 체크 방식 전체 데이터에서 본인확인 미완료 대상 중 무작위로 30 샘플링 하
여 검수
- lsquo10년도 10월 DB구축완료단계에 최종 검수 실시
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침
및 매뉴얼에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며
오류율 산정에서 제외함
검수방식 및 기준
- 수집된 영문이력서 원본 파일(hwp doc pdf 등)과 입력 완료된 영문이력DB를 육안검
사 함
- 오류 판단 기준은 KISTI가 작성한 DB구축 작업 지침서를 참조함
252 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 125 -
팩스(국가번호)
학력(Academiccarrer)
최종학위(FinalDegree)
학위(코드) 4 15학위취득일학교명전공명
경력(Career)
경력사항(CAREER)
시작년월 4 15종료년월
재직기관명직위
실적ResearchResult
논문실적(paper)
논문명 9 15저널명게제(권)집게제호
시작페이지종료페이지게제년월공동저자명비고
연구실적ResearchProject
시작년월 5 10
종료년월발주기관참여구분(역할)-코드연구실적명
특허(patent)
출원등록구분-코드 5 10
출원등록번호
출원등록국가-코드
특허출원명출원등록일자
계 38 100
항 목 세부항목 검수대상
데이터수
오류데이터건
수
품질지표별
기준점수의 합
항목가중치
()
오류율산정
기본(BasicInformation)
기본정보(5개)
영문성명 30 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
단위별 가중치는 KISTI와 협의하여 결정함
항목별 오류율 산정 기준 정의
- 126 -
휴대전화(국가번호)
30
E-mail 30개인홈페이지
30
검색키워드
30
소계 150재직기관(o r gan ization)(7개)
기관명 40부서명 30
직위 30우편번호 10주소 30전화 (국가번호)
30
팩스(국가번호)
30
소계 200
학력(Academiccarrer)
최종학위(FinalDegree)(4개)
학위 (코드)
10
학위취득일
15
학교명 80전공명 45소계 150
경력(Career)
경력사항( C AREER)(4개)
시작년월 15
종료년월 15재직기관명
80
직위 40소계 150
실적ResearchResult
논문실적(paper)(9개)
논문명 40저널명 20
게제(권)집
20
게제호 20시작페이지
10
종료페이지
10
게제년월 10공동저자명
10
비고 10소계 150
연구실적(Researc
시작년월 15종료년월 15발주기관 20
- 127 -
hProject)(5개)
참여구분(역할 ) -코드
10
연구실적명
40
소계 100특허(patent)(5개)
출원등록구 분 - 코
드
10
출원 등록번호
20
출원등록국 가 - 코
드
35
특허 출원명
20
출원 등록일자
15
소계 100계 100
- 128 -
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형구분
오류요형별점수 비고
완전성
누락 - 코드 누락 02
품질지표기준점수산정(데이터1건기준)=오류
유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 01
유효성형식 - 패턴의 오류 02
오기 - 가베지 여부 02
정확성 코드 - 코드 매핑 오류 02
계 6개 오류유형 1
기본정보
영문성명 휴대전화 E-mail 개인홈페이지 계
Hong Gil Dong
(형식 02)010-111- testcom
GilDong Hong+82-011-111-
(형식 02)
testcokr
(오기 02)
testcom
(오기 02)
(누락 02) 019-111_ testcokr testcokr
품질지표별
기준점수의 합04 02 02 02 1
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
국가RampD참여인력
영문이력DB
3000건 3000건 3000건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
검사물량 집계표 예시
검수데이터 예시
- 129 -
3 평가위원 데이터 최신성 유지 매뉴얼
31 최신성 유지 업무 개요
311 개요
평가위원 데이터 최신성 유지란 lsquo기 구축된 평가위원 DB 내의 각 데이터들이 가장 마지막
으로 업데이트된 시점을 기준으로 그 시점부터 현재까지의 기간 동안 누락된 대상 인력들
의 변경사항들을 해당데이터에 추가입력 및 수정해주는 것rsquo을 의미
또한 대상 인력의 변경사항 반영이외에도 기 입력된 데이터들의 내용을 검토하고 발견된
오류 및 누락정보에 대한 수정ㆍ보완 작업 역시 평가위원 데이터 최신성 유지의 일환
최신성 유지를 위해 먼저 대상 인력에 대한 정보 수집이 요구됨
- 130 -
312 최신성 유지 업무 절차
최신성 유지 업무 절차는 관리자와 담당자의 역할로 구분가능
관리자는 담당자의 업무할당 데이터 검수 업무보고 등을 수행하며 담당자는 할당된 대
상인력에 대한 데이터 수정 및 보완 작업 수행
최신성 유지 업무 절차를 순서별로 나열하면 다음과 같음
- 관리자는 대상인력에 대한 전체리스트를 작성하고 이를 각 담당자들에게 일정량씩 할당
- 담당자는 할당된 대상인력에 대한 정보를 수집하고 기 입력된 데이터와의 비교를 통해
변경사항에 대한 수정 및 추가입력
- 담당자는 대상인력에 대한 정보를 수집한 출처 및 기타 비고사항에 대한 의견 등을 작
성하여 할당량에 대한 작업 완료시 관리자에게 보고
- 관리자는 보고된 작업결과물을 취합하여 정리하고 대상인력에 대한 정보가 잘 수집되고
입력되었는지 검토하여 수정 및 보완
- 관리자는 일일별 완료된 작업 결과 및 비고사항을 작성된 양식에 따라 담당 책임자에게 보고
- 131 -
32 대상 인력(평가위원) 정보 수집 방법
대상 인력의 정보를 수집하기 위한 방법은 크게 3가지로 구분
- 대상 인력에게 이력파일 요청
- 웹검색(기관홈페이지 개인홈페이지 및 각종 포털사이트)
- 신문기사의 인사ㆍ동정 모니터링
321 대상 인력에게 이력파일 요청
E-Mail 등을 통해 대상 인력에게 본인의 데이터에 대한 직접 업데이트 또는 입력대행을
위한 이력파일의 전송 요청
정보의 수신 방법은 E-Mail 우편 등이며 가장 신뢰성 높은 정보
입력이 완료된 이력파일은 개인정보보호를 위해 별도로 보관되며 E-Mail 및 기타 인쇄
물 이외의 형태로 수신되었을 경우 반드시 출력하여 관리
입력 완료시 해당인력에게 연락하여 결과에 대한 확인 요청
322 웹검색(홈페이지 및 각종 포털사이트)
대상 인력의 가장 최신의 연락정보(전화번호 E-Mail FAX 등) 재직정보 등을 수집하기
위해 웹상에 공개되어 있는 정보를 수집하여 데이터에 반영
대상 인력의 데이터 내 소속기관사항 및 기본정보의 홈페이지 주소 등을 통하여 해당 기
관 홈페이지 및 개인 홈페이지에 접근하여 연락정보 경력정보 실적정보 등에 관한 정보
수집
이직(移職) 등으로 대상 인력의 현재 소재지 재직기관 등에 관한 정보가 누락되어 있을
시 각종 포털사이트를 활용하여 해당인력의 소재정보 수집 및 접근
인물정보제공사이트를 통해 대상 인력의 기본정보 경력정보 실적정보에 대한 수정ㆍ보
완
323 신문기사의 인사ㆍ동정 모니터링
대부분의 신문에서 주요 인물에 대한 인사ㆍ동정에 관한 정보를 매일 싣고 있음
주기적으로 인사ㆍ동정란의 모니터링을 통해 평가위원 데이터에 변경사항 반영
- 132 -
33 최신성 유지 업무 작업 지침
331 언론을 통해 발표 되는 인사동정 수정
평가위원만 해당
교육과학기술부
- 참여인력을 포함하여 인사동정 수정
- 직급은 장관 차관 국장 팀장 사무관 서기관 까지 수정
- 특히 교육과학기술부장관 제2차관 정책보좌관 국장은 꼼꼼하고 세심하게 수정할 것
332 현행화 작업 내용
수정은 기본정보 소속기관 학력사항 초중고학력 경력사항 소속학협회 논문 실적 연구
실적 저역서실적 훈포장사항 지식재산권 주요업적사항 자격사항 사진관리 등 전 항
목에 걸쳐 작업 함
해당 인물의 개인 홈페이지를 최우선으로 보고 그 다음으로 기관 홈페이지를 참고
해당 기관 홈페이지에서 정확히 알 수 없을 경우에는 코셉 조인스 로마켓 동아일보를
참고 할 것
경력사항은 경력의 년도와 날짜가 없더라도 신규 입력 함
기본정보
e-mail에서 (dot)가 아닌 (comma) 로 표기된 경우 변경
e-mail 주소가 2개일 때는 개인홈페이지에 적힌 메일주소가 우선 판단이 안 될 경우는
소속기관에서부여된 e-mail 주소로 기입
인적사항의 홈페이지정보에서 lsquohttprsquo 는 빼고 입력
소속기관
산학협력단
- 소속기관에서 제외(삭제)하고 경력사항에만 기입
- 산학협력단이 주소로 되어있는 기업은 소속기관에 그대로 두거나 기입해 줌
평가위원이 의과대학의 교수이자 병원의 교수(의사)인 경우는 소속기관을 의과 대학
의 교수로 기입하고 병원 근무사항은 경력사항에 기입
(ex 관동대학교 의과대학 정형외과학교실 교수 소속기관
관동대학교 명지병원 정형외과 전문의 경력사항)
소속기관이 대학과 병원 모두 입력되어 있는 경우 수정하지 않고 pass
소속기관은 의과대학이나 주소가 병원일 경우 수정하지 않고 pass
평가위원의 재직기관 홈페이지에서 해당 인물이 검색 되지 않을 경우
- 학교의 교수 명예교수 등은 pass
- 회사의 대표이사 회장 등은 직급은 공란으로 바꾸고 재직중으로 변경
( 대표이사 인사말 회장 인사말 등의 인물 이름이 다를 경우를 뜻함)
- 133 -
평가위원이 학sdot협회에 재직중인 경우
- 소속기관이 하나이고 학sdot협회라면 소속기관에 그대로 둠
- 소속기관이 2개 이상이고 그 중 한 곳이 학sdot협회일 때
학sdot협회를 제외한 소속기관에서 인물이 검색 되는 경우 학sdot협회 내역으로 옮김
학sdot협회를 제외한 소속기관에서 인물이 검색 되지 않고 학sdot협회에서만 검색 되는 경
우 학sdot협회를 제외한 소속기관 내역은 경력사항으로 옮김
학sdot협회를 제외한 소속기관과 학sdot협회 모두 인물이 검색 되지 않는 경우 수정하지
않고 pass
기타
- 직장주소에 집주소가 되어있으면 변경하고 집주소란에 직장주소가 되어있으면 그냥 둠
- 겸임교수직은 경력사항에 입력
소속기관에 기입된 경우 경력사항으로 이동
소속기관이 한 개이고 겸임교수일 경우 pass
- 인물의 직급이 모두 시간강사인 경우 담당자에게 인물key 전송
- 퇴직한 교수로 그 이후의 소속기관이 없는 사람은 재직여부를 lsquo퇴직rsquo으로 변경 후 저장
- 전화번호가 2개인 경우 (comma)로 구분
- 교수의 경우 학과부서 탭엔 단과대 아래의 레벨 모두 기입
(ex 생명과학부 생명공학전공 or 의학과 내과학교실)
학력사항
박사후과정(Post-Doc)은 생략 단 경력사항의 Post-Doc은 기입
논문실적
2006~2010년도 논문sdot연구실적만 입력
현재 HuRIMs에 저장된 가장 최근 년도부터 템플릿에 작업
(ex 개인홈페이지에는 2000년~2009년까지 논문사항이 입력되어있고 HuRIMs에는 2007
년 2월까지만 입력되어 있다면 2007년의 논문은 중복체크를 한 후 입력되지 않은 논문
들과 2008 2009년도 논문을 템플릿에 넣는다)
기타논문집은 학술논문으로 판단되는 것들만 기입
- 판단기준 대학 연구소 학회에서 발행한 논문들
동일한 제목으로 다른 발행처에 중복 기재된 경우
- 발행처 두 곳이 모두 학회일 때 중복하여 기입
- 발행처 두 곳이 학회amp연구소 학회amp대학 일 때 학회의 논문실적만 기입
출판중인 논문은 기재하지 않음
학회sdot협회sdot대학 등에서 발간된 저서 중 일부만 담당한 경우
- 일부 chap theme 만 담당했더라도 저역서실적에 기입
- 일부 작성한 부분의 제목이 논문의 형태를 띄고 있을 때(~에 관한 연구 고찰 등)는 논문
실적에 기입
- 134 -
훈포장사항
세계인명사전등재 내용 기입
감사장 감사패는 기입하지 않음
경력업적학협회 유형 정리
향우회 민방위 동창회 성직자협의회 등은 제외함
lsquoooo위원회rsquo가 들어가는 내용은 직급에 상관없이 업적사항으로 기입 단 기초기술 연구
회와 산업기술연구회는 정부조직이므로 경력사항에 기입
(ex 기록관리혁신전문위원회 회장 정보통신위원회 고문 rarr 업적)
위원회를 제외한 lsquo회rsquo는 직급에 상관없이 학sdot협회 활동사항으로 기입
(ex 한국원예치료협회 상임이사 한국화훼장식학회 편집위원 한국양액재배연구회 이사
한국화훼환경디자인교수연합회 이사 전국대학정보화협의회 이사 rarr 학sdot협회)
활동내역 중 자문 심의는 업적사항에 기입 단 협회 학회 연구회 등의 자문sdot심의는
학sdot협회 활동사항에 기입
활동내역 중 기업sdot학교의 고문은 경력사항에 기입
34 최신성 업무 대상
341 대상 및 범위
평가위원후보추천서비스에서 서비스 중인 평가위원 전체
평가위원 기본정보 경력정보 갱신 및 실적정보 추가입력 및 갱신
추가 입력 및 갱신을 위한 기초자료는 웹사이트에 공개된 정보 신문의 인물 동정기사
평가위원 본인이 제공하는 이력정보 임
342 검수 기준
검수 기준
- 오류율 전체 레코드의 1 이하
- 오류 체크 방식 전체 데이터 중에서 무작위로 샘플링(전체 건수 대비 3)하여 검수
- 최신성 유지 관리를 수행한 전체 데이터 중 3를 샘플링하여 출처별 내용이 최신성 유
지 관리 매뉴얼 기준으로 추가 입력 및 갱신되었는지 여부를 확인
(오류데이터 전체에 대한 품질지표별 기준 점수의 합오류 데이터 건 수전체대상 데
이터건수) 항목가중치의 합산 결과가 1 이하
오류율 산정 기준
- 인력데이터에 대한 오류산정 단위 및 각 산정단위별 가중치를 정의함
- 135 -
구분 항목 세부항목 항목수단위별
가중치()
참여
인력
정보
기본정보
주민등록번호 성명 자택주소 자택
우편번호 자택전화번호 핸드폰번호
7 31
소속기관사항
소속기관명 부서명 직위명 사무실
전화번호 기관주소 최초임용일 인
력(직업)구분
7 185
학력사항
전공 취득대학 학위 입학일 졸업
일 학과 취득국가 지도교수명 학위
논문명 학위취득일
10 21
경력사항 근무처명 직위명 근무기간 3 45
자격사항 자격발행처 자격증명 자격취득일 3 25
논문실적
논문발표일 국문논문명 영문논문명
저자역할구분 발행처 학술지구분
학술지명 SCI여부
8 105
지식재산권 지식재산권명 출원_등록번호 특허구분 3 25
계 소계 41 905
평가
위원
소속학협회현황 담당업무 직위 학협회사항 3 3
훈포장사항 수상년월 수여기관명 훈포장명 3 25
저역서실적국문저서명 영문저서명 발행년 발
행처 저역서구분5 4
소계 11 95
계 52 100
- 오류산정 단위별 주요 항목별로 가중치를 정의함
- 오류기준은 형태별 오류로 판정(데이터별 품질지표 기준 점수 참조)
- 형태별 오류는 오류유형에 정의된 정제기준에 의해 판정함 형태별 오류는 정제지침 및 매뉴얼
에 정의된 정제 기준에 의하여 오류를 판정
- 누락 데이터의 경우 오류유형에 정의된 이외의 유형에 대한 정제는 수행하지 않으며 오류율 산
정에서 제외함
343 오류율 산정 기준
오류산정 단위 및 가중치 정의
- 136 -
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
150 (오류데이
터 전체에
대한 품질
지표별 기
준 점수의
합검수대
상 데이터
건수) 항
목가중치
100()
성명 100자택주소 10자택우편번
호
20
자택전화번
호
10
핸드폰번호 10E-mail 10소계 310
소속기
관사항
(7개)
소속기관명 100
부서명 05
직위명 20
사무실전화
번호
10
기관주소 30
인력(직업)구
분
10
최초임용일 10
소계 185
학력사
항
(10개)
전공 20
취득대학 100
학위 20
입학일 10
졸업일 10
학과 15
취득국가 15
지도교수명 05
학위논문명 05
학위취득일 10
소계 210
항목별 오류율 산정 기준 정의
- 137 -
경력사
항
(3개)
근무처명 20
직위명 15
근무기간 10
소계 45
자격사
항
(3개)
자격발행처 05
자격증명 10
자격취득일 10
소계 25
논문실
적
(8개)
논문발표일 10논문명1 10
논문명2 05저자역할구
분
05
발행처 05학술지구분 05학술지명 10
SCI여부 05
소계 105
지식재
산권
(3개)
지식재산권
명
10
출원_등록번
호
05
특허구분 10소계 25
평가 소속학
협회현
황
(3개)
담당업무 05
위원 직위 05(11개) 학협회사항 20
소계 30
훈포장
사항
(3개)
수상년월 10
수여기관명 05
훈포장명 10
소계 25
저역서
실적
(5개)
저역서명1 10
저역서명2 05
발행년 10
발행처 05
저역서구분 10
소계 40
계 1000
- 138 -
항목 유형 가중치 비고
세부항목별 가
중치
구분코드항목 05~10
중요도에 따라 항목별 가중
치를 차등하여 부여
분류코드항목 15~20
주요 항목 80~150
기본 항목 10~30
일반 텍스트 항목 05
날짜 항목 10~15
선택 항목 05
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 및
출처 비교 오류03
품질지표기준점수산정(데이터1
건기준)=오류유형별점수의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 맵핑 오류 005
계 6개 오류유형 1
구분 항목 세부항목검수대상
데이터수
오류데이터
건수
품질지표별기준점수의
합
항목가중치
()
오류율산정
참여
인력
정보
(42개)
기본정
보
(7개)
주민등록번
호
3000 3 055 150 000825
성명 10 2 035 100 000350자택주소 3 0 000 10 000000
자택우편번
호
3 2 035 20 000233
자택전화번
호
4 0 000 10 000000
DB 구축목표 구축실적 검사물량 샘플링율 검사율 비고
평가위원 Pool DB 23000건 23000건 690건 3 3
샘플링율() = (구축실적) divide (검사물량) times 100
검사율() = (구축목표) divide (검사물량) times 100
세부항목별 가중치 산정 기준
데이터별 품질지표 기준 점수
출처 비교는 작업대상별 출처 리스트 참조
검사물량 집계표 예시
오류율산정표 예시
- 139 -
핸드폰번호 6 0 000 10 000000
E-mail 9 0 000 10 000000소계 45 7 125 310 001408
소속기
관사항
(7개)
소속기관명 1000 20 100 000000부서명 80000 200 05 000000직위명 80000 200 20 000000사무실전화
번호
80000 200 10 000000
기관주소 80000 200 30 000000인력(직업)구
분
80000 200 10 000000
최초임용일 80000 200 10 000000소계 481000 1220 000 185 000000
계 1000 01
주민등록번호 한글성명 영문성명 한문성명자택우편번
호
630421-0000000 백중환Joong hwan
Baek
412220
(형식 015)
630421-0000000 백종석Baek Jong
Seok
6304210000000
(형식 015)백인열 Baek IN Youl 白寅烈 711-822
630421-0000000 백승호
(오기 02)백제훈
630421-0000000 백종완
630421-
(오기 02)백장선 Jangsun Baek
白壯선
(형식 015)
502-
(오기 02)
630421-0000000 백승호1213132
(오기 02)
630421-0000000 백석형
630421-0000000 백석형
품질지표별
기준점수의
합
055 035 035
검수데이터 예시
- 140 -
구분오류유형
구분오류요형별
점수비고
완전성
누락 - 코드 누락 및
출처 비교 오류03
품질지표기준점수산정(데이
터1건기준)=오류유형별점수
의합계
연결 - 항목 간 참조
오류01
유일성 중복 - 항목 내 중복 02
유효성형식 - 패턴의 오류 015
오기 - 가베지 여부 02
정확성 코드 - 코드 맵핑 오류 005
계 6개 오류유형 1
데이터별 품질지표 기준 점수
35 입력 항목별 QampA (처리 방법 및 사례)
기본정보
- 정보공개여부
구 분 내 용
상황 및 질문ㆍ데이터 신규입력 시 정보공개여부 설정(공개 기본인적사항만 공
개 비공개)을 어떻게 해야 하는지
처리 방법
및 사례
- 대상인력의 입력대행요청에 의한 정보입력 시 정보공개여부는 해당인
력이 요청한 대로 설정
- 최신성 유지팀 자체 내에서 수집한 정보를 바탕으로 대상인력 데
이터를 신규생성 할 경우에는 lsquo기본인적사항만 공개rsquo로 설정
- 과학기술표준분류
구 분 내 용
상황 및 질문ㆍ데이터 입력 시 과학기술표준분류에 대한 처리는 어떻게 해야 하
는지
처리 방법
및 사례
- 과학기술표준분류는 정보관리자가 임의로 선택하거나 수정하지 않
음
- 141 -
소속기관사항
- 재직여부
번호 구 분 내 용
1
상황 및 질문
ㆍ대상인력이 이직(移職)하여 재직기관이 변경된 경우 전 재직기
관 정보의 재직여부를 퇴직으로 변경하고 현 재직기관 정보를
추가입력해야 하는지
처리 방법
및 사례
- 대상인력의 재직기관이 변경되었을 경우 전 재직기관 항목은 삭제
후 경력사항에 반영함
- 현 재직기관 정보 신규입력 후 이를 경력사항에 반영
2
상황 및 질문ㆍOO연구원에 재직중인 홍길동씨가 현재 과학기술부에서 파견근
무 중일 경우 이를 어떻게 처리해야 하는지
처리 방법
및 사례
- 먼저 원 소속인 OO연구원 소속기관사항의 재직여부에 lsquo재직중rsquo
에서 lsquo파견중rsquo으로 변경
- 또한 소속기관사항 항목을 추가시켜 파견기관인 lsquo과학기술부rsquo 직위
등의 정보 입력 후 재직여부를 lsquo재직중rsquo으로 선택
3
상황 및 질문ㆍ대상인력이 정년 등의 이유로 퇴직한 상태인 경우 소속기관사
항을 삭제해야 하는지
처리 방법
및 사례
- 대상인력이 퇴직한 상태이고 현재 다른 직업이 없는 경우 소속
기관사항은 삭제 시키지 않고 재직여부를 lsquo퇴직rsquo으로 변경
- 경력사항 항목에 퇴직일자 포함된 정보 추가
- 142 -
학력사항
- 전공명
구 분 내 용
상황 및 질문ㆍ대상인력의 학력정보를 수집하였으나 학과명만 표기 있는 경우 전
공명은 공란으로 두는지
처리 방법
및 사례
- 대상인력의 학과정보만 발견된 경우 일반적으로 전공명은 우선 학
과명과 동일하게 입력
ex) 학과명 경영학과 rarr 전공명 경영학
경력사항주요업적사항
- 경력사항주요업적사항 일반
구 분 내 용
상황 및 질문 ㆍ경력사항과 주요업적사항은 어떤 기준으로 구분하는지
처리 방법
및 사례
- 일반적으로 웹상 및 타기관 인력정보데이터를 통해 수집된 정보에
는 경력사항과 주요업적사항을 따로 구분하지 않은 경우가 대다수
- 본 시스템에서는 경력사항과 주요업적사항을 구분하여 입력
- 경력사항은 대상인력의 직업과 관련된 사항으로 구분
- 주요업적사항은 대상인력의 직업 이외의 대외적인 활동 즉 평가
자문위원 등 각종 위원활동 설계 시공 기술지도 등의 사항으로
구분
예외적으로 학위 이외의 교육과 관련된 사항은 경력사항에 입력
ex) OO대학 OO교육과정 수료이수
- 143 -
소속학협회
- 직위담당업무
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 소속학협회정보에 학회명 이외에 다른 사항이
기재되지 않은 경우 직위 및 담당업무 항목은 어떻게 처리하는지
처리 방법
및 사례
- 활동시작년월 및 학회종료년월에 관한 정보가 없을 시 이는 공란처
리하며 직위의 경우 다른 정보가 없는 경우 lsquo회원rsquo으로 입력
논문실적
- 학술지구분
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 논문실적 정보만으로 학술지구분(국내 및 국외
전문학술지 국내 및 국외 학술대회발표논문집 기타논문집)에 대
한 구분은 어떻게 하는지
처리 방법
및 사례
- 수집된 대상인력의 논문실적 정보의 상당수가 국내 및 국외 전문학
술지 및 학술대회발표논문집에 관한 구분이 되어 있지 않기 때문
에 학술지구분에 어려움을 겪을 수 있음
- 이에 대한 구분기준은 명확하게 한정짓기 어려운 부분이 있어 이
러한 경우 최신성 유지 업무 담당 책임자가 판단하여 처리하고 있
음
- 이에 대한 몇 가지 팁을 제시하자면 먼저 lsquoOO학회지rsquo lsquoJournal
ofrsquo 등의 용어가 해당정보에 삽입되어 있는 경우 대부분 전문학
술지로 구분할 수 있으며 lsquo학술대회rsquo lsquo발표대회rsquo lsquoProceeding
Conference Seminar Workshop등의 용어가 해당정보에 삽입되
어 있는 경우 이는 대부분 rsquo학술대회발표논문집으로 구분할 수 있
음
- 또한 학술대회발표논문집 중 국내와 국외의 구분은 해당 학술대회
가 열린 장소를 기준으로 함
ex) lsquoThe Internation Conference in Seoulrsquo의 경우 학술대회가 열린
장소가 대한민국의 서울이므로 국내 학술대회발표논문집으로
구분함
- 144 -
- 역할
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 논문실적 정보에 역할(단독 공동(제1) 공동(참
여) 공동(책임))이 구분되어 있지 않은 경우 이를 어떻게 처리해야
하는지
처리 방법
및 사례
- 현재 대상 인력의 연구실적과 관련하여 역할구분이 되어 있지 않은 정
보를 입력할 시 해당 연구의 특성을 고려하여 역할을 lsquo단독rsquo 혹은 lsquo공
동(제1)rsquo으로 임시 구분해 줌
- 공동저자명
구 분 내 용
상황 및 질문ㆍ수집된 대상 인력의 논문실적 정보 중 공동저자명 입력 시 10명 이
상이 넘어가는 공동저자명을 모두 넣어주어야 하는지
처리 방법
및 사례
- 공동저자명의 경우 한 연구실적에서 무수히 발생될 수 있는 공동저
자명을 일일이 입력을 해주고 있지는 않음
- 예를 들어 공동저자명이 15명일 경우 공동저자명에는 lsquo홍길동 김순희
이명수 박영희 등rsquo으로 한정시키고 전체저자수 항목에 저자를 포
함한 16명을 입력해 줌
- 논문실적 일반
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 논문실적 정보가 논문명만 있는 경우 이를 입
력해야 하는지
처리 방법
및 사례
- 대상인력의 논문실적 정보에 대한 추가 입력 기준은 아직 명확하
게 정해지지는 않은 상태
- 현재(2007년 7월 18일 기준)는 개재년월 및 논문명의 두 가지 정보 이
상이 존재할 시에만 추가입력을 해주고 있음
- 145 -
연구실적
- 연구기간
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 연구실적 정보에서 연구기간 항목이 종료년월
만 나와 있는 경우는 어떻게 처리하는지
처리 방법
및 사례
- 연구기간에 관한 정보가 종료년월만 나와 있는 경우 임시로 1년의
기간을 책정하여 시작년월을 입력
ex) lsquo2005년 8월 OO에 관한 연구rsquo라는 연구실적의 입력 시 연구기간
에서 시작년월은 2004년 9월 종료년월은 2005년 8월로 입력
- 참여구분
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 연구실적 정보에서 참여구분(연구책임자 공동연
구자)의 경우 이를 어떻게 구분하는지
처리 방법
및 사례
- 연구실적에 관한 정보에서 참여구분이 되어 있지 않은 경우에는 해
당인력의 다른 연구실적 등을 감안하여 참여구분을 하여야 하나
대상이 평가위원인 경우 lsquo연구책임자rsquo로 임시 구분하여 줌
지식재산권
- 취득구분
구 분 내 용
상황 및 질문ㆍ수집된 대상인력의 지식재산권 정보에서 취득구분(출원 등록)이
구분되어 있지 않은 경우 어떻게 처리하는지
처리 방법
및 사례
- 수집된 지식재산권 정보에서 취득구분이 되어 있지 않은 경우 임
시로 lsquo등록rsquo으로 선택하여 입력
- 특허구분
구 분 내 용
상황 및 질문
ㆍ수집된 대상인력의 지식재산권 정보에서 특허구분(특허 실용신안
의장 상표 소프트웨어)이 구분되어 있지 않은 경우 어떻게 처리
하는지처리 방법
및 사례
- 수집된 지식재산권 정보에서 특허구분이 되어 있지 않은 경우 임
시로 lsquo특허rsquo로 선택하여 입력
- 146 -
첨부1 NTIS 코드 표준
NTIS 표준코드
정보공개구분
코드값 코드값 의미
1 공개
2 기본인적사항만공개3 비공개
인력(직업)구분
코드값 코드값 의미
1 대학교2 연구소
3 산업계9 기타
소속구분코드
코드값 코드값 의미
1 재직중2 퇴직
3 해외연수6 파견중
학위코드
코드값 코드값 의미
2 학사이하5 석사
7 박사수료8 박사
- 147 -
학술지구분
코드값 코드값 의미 비고
01 국외전문학술지 발표 학술지가 국외전문학술지에 게재
02 국외학술대회발표논문집 발표 학술지가 국외학술대회발표논문집에 게재
03 국내전문학술지 발표 학술지가 국내전문학술지에 게재
04 국내학술대회발표논문집 발표 학술지가 국내학술대회발표논문집에 게재
05 기타논문집 발표 학술지가 기타논문집에 게재
역할구분
코드값 코드값 의미
1 단독2 공동제1 주저자3 공저자4 교신(책임)저자
참여구분
코드값 코드값 의미
A 연구책임자B 참여연구원
저역서구분
코드값 코드값 의미
1 저서2 역서
발행지구분
코드값 코드값 의미
1 국내2 국외
취득구분
코드값 코드값 의미
01 특허출원02 특허등록
- 148 -
코드값 코드값 의미
9511 조경middot지역시스템공학부
특허구분
코드값 코드값 의미 비고
01 특허 산업재산권이 특허에 해당하는 경우
02 실용신안 산업재산권이 실용신안에 해당하는 경우
03 디자인 산업재산권이 디자인에 해당하는 경우
04 상표 산업재산권이 상표에 해당하는 경우
05 기타 산업재산권이 기타에 해당하는 경우06 프로그램(SW) 산업재산권이 프로그램에에 해당하는 경우07 저작권 산업재산권이 저작권에 해당하는 경우08 신기술 인증 산업재산권이 신기술 인증에 해당하는 경우09 신제품 인증 산업재산권이 신제품 인증에 해당하는 경우10 국제출원(PCT) 산업재산권이 국제출원(PCT)에 해당하는 경우11 서비스 산업재산권이 서비스에 해당하는 경우
업적구분
코드값 코드값 의미
1 평가위원
2 위원회활동3 자문4 설계5 시공6 기술지도9 기타
기관코드(기관명이형전거DB)
코드값 코드값 의미
ZE02400 엘에스엠트론(주)ZE02378 (주)지앤시바이오ZE02376 (주)하나아이엔씨ZE02374 센게이지러닝코리아(주)ZE02373 (주)루켄테크놀러지스ZE02372 (주)디투알컨설팅
ZE02367 (주)대흥이엔지ZE02366 (사)한국벤처산업연구원ZE02365 CSG(주)ZE02364 국제상사(주)전자기술연구소
학과코드
- 149 -
9510 생물정보학과
9509 나노과학기술학부9508 지능기계공학과9507 생명과학기술학부9506 의과학과9505 부동산정보9495 보건정보관리
9999 기타9475 대학원
코드값 코드값 의미 코드값 코드값 의미
A01 교수 B32 기술원A02 부교수 C01 공무원A03 조교수 C02 법조인A04 전임강사 C03 의사
A05 시간강사 C04 교사A06 강사(기타) C05 군인A10 명예교수 D01 대표이사A11 석좌교수 D02 이사A12 강의교수 D03 전무A13 겸임교수 D04 상무
A14 계약교수 D05 부장A15 기금교수 D06 차장A16 대우교수 D07 과장A17 연구교수 D08 대리A18 초빙교수 D09 사원A19 객원교수 D10 부사장
A20 조교 D11 상임이사A21 대학원생 Z01 위원A22 POST-DOC Z02 의원A23 POST_MAS Z03 실장A24 초청교수 Z04 학과장A25 외래교수 Z05 주임
B01 수석연구원 Z06 단장B02 책임연구원 Z07 팀장B03 주임연구원 Z08 회장B04 전임연구원 Z09 본부장B05 선임연구원 Z10 처장B06 연구원 Z11 학장
B07 위촉연구원 Z12 센터장B10 수석연구위원 Z13 소장B11 책임연구위원 Z14 부처장B12 주임연구위원 Z15 국장B13 전임연구위원 Z16 연구주임
직위코드
- 150 -
B14 선임연구위원 Z17 연구소장
B15 연구위원 Z18 원장B20 전문위원 Z19 부원장B30 책임기술원 999 기타B31 선임기술원
코드값 코드값 의미 비고
AD 안도라 ANDORRA
AE 아랍에미리트 UNITED ARAB EMIRATESAF 아프가니스탄 AFGHANISTANAG 앤티가 바부다 ANTIGUA AND BARBUDAAI 안길라 ANGUILLAAL 알바니아 ALBANIAAM 아르메니아 ARMENIA
전공분야코드
코드값 코드값 의미
E340600 구강해부학E340601 육안일반해부학E340602 신경해부학E340603 육안두경부일반해부학
E340604 두경부신경해부학E340605 두경부응용해부학E340700 치아형태학E340701 영구치치아형태학E340702 유치치아형태학E340703 치아교합학
국가코드
개인정보활용동의구분
코드값 코드값 의미
Y 동의N 비동의