33

발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta
Page 2: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

발 표 순 서

개인정보노출점검업무란?

개인정보노출발생원인

개인정보노출의문제점

개인정보노출대응방법

Page 3: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

1. 개인정보노출점검 업무란?

Page 4: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

1.1 개인정보 개요

개개인을 증명하고 식별할 수 있는 주민번호, 이름, 전화번호, 주소,

전자메일, 직장명 등 개인의 고유한 신상정보가 담긴 데이터개인정보란

주민번호가 노출된 경우 명백한 개인정보 노출로 판단

개인을 식별할 수 있는 항목이 2가지 이상 결합되었을 경우

개인정보

노출판단조건

R&D MU행안부

• 전자정부본부 . 행정안전부- 공공기관 30,000 개 대상 상시 모니터링 체계 구축

• 방송통신위원회 . 한국인터넷진흥원- 민간. 비영리. 단체 개인홈페이지 대상으로 p2p, 인터넷상시모니터링 체계구축

• 금융감독원- 보험, 금융기관 대상 07년 하반기 부터 상시 모니터링 추진

• 교육인적자원부- 각급학교 및 교육관련 기관 대상 개인정보노출 점검계획

• 청와대- 대통령 직속 기관 대상으로 모니터링 추진계획

개인정보 노출 방지를 위한 정책 수립

노출 방지를 위한 가이드라인 배포

개인정보 개요

Page 5: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

1.2 개인정보 노출점검 필요성

개인정보 침해로 인한 피해 발생

☞개인정보 피해 경험률이 증가 함에 따라 침해 유형도 다양해 지고 있음

사업자의 고객정보 관리 소흘로 개인정보 유출 피해를 경험했다고 응답한 이용자가 72.5%로

가장 많았음(ex:옥션해킹사고, gs칼텍스 개인정보 유출 사고)

출처 : 2008년 정보보호실태조사(한국인터넷진흥원)

18.916.4

29.6

0

5

10

15

20

25

30

35

2006년 2007년 2008년

피해경험률

(단위:%)

51.7

58.472.5

22.9

26.3

텔레마케팅 목적의 이용

및무단회원가입

동의 없이 이용하거나 제

3자에게 제공

사업자 관리소흘로 유출

주민번호 도용으로 인한

회원 가입 불가 및

경제적 피해ID/비밀번호 도용으로

게임 아이템 등을 도난

개인정보 침해 유형

※다중항목복수응답

Page 6: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

1.3 개인정보 관련법안

제28조 (개인정보의 보호조치)

① 정보통신서비스 제공자 등이 개인정보를 취급할 때에는 개인정보의 분실․도난․누출․

변조 또는 훼손을 방지하기 위하여 대통령령의 정하는 기준에 따라 다음 각 호의 기술적 ․ 관리적 조치를 하여야 한다.

1. 개인정보를 안전하게 취급하기 위한 내부 관리계획의 수립 ․ 시행2. 개인정보에 대한 불법적인 접근을 차단하기 위한 침입차단시스템 등 접근 통제장치의 설치 ․운영3. 접속기록의 위조 ․변조 방지를 위한 조치4. 개인정보를 안전하게 저장 ․전송할 수 있는 암호화 기술 등을 이용한 보안조치5. 백신 소프트웨어의 설치 ․운영 등 컴퓨터바이러스에 의한 침해 방지조치6. 그 밖에 개인정보의 안정성 확보를 위하여 필요한 보호조치

② 정보통신서비스 제공자 등은 이용자의 개인정보를 취급하는 자를 최소한으로 제한하여야 한다.

정통망법 개인정보 보호조치

Page 7: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

구글검색 DB 개인정보

노출점검 S/W 적용 점검

노출웹 사이트취합

구글노출 DB 삭제요청

삭제여부확인

콜센터

상시 점검

개인정보노출점검사무국

사후관리

1.4 개인정보 노출 점검 업무

노출웹 사이트삭제요청

메일발송(노출정보및 삭제방법포함)

YES

NO

6자리 숫자 질의를 통한 점검검색어(단어)를 통한 점검

업무 절차

Page 8: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

추가제안 범위

1.5 구글 검색 DB 삭제 업무

상시 점검

데이터

대량노출 건상시점검을 통해

노출리스트를

구글에 전달

개인정보노출점검사무국

대량노출 및 시급한

사항은

핫라인을 통하여

삭제요청

구글 DB 삭제 업무

Page 9: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

1.6 노출 홈페이지 삭제 업무

삭제조치회신

노출사이트

삭제조치미 회신

개인정보노출점검사무국

노출 웹 사이트삭제요청

행정 처분

콜센터

삭제거부업체리스트전달 및대책방법제시

삭제거부업체리스트전달

홈페이지 삭제 업무

Page 10: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

2. 개인정보노출발생원인

Page 11: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

2.1 개인정보노출원인

휴면사이트이거나 관리자연락처가 미존재 하거나 오류인 경우

게시판관리미흡

홈페이지관리

부재

개인정보가 마스킹처리 되어있으나 소스보기에 노출

URL 에 노출되는 경우

웹페이지소스

취약점

웹방화벽, 필터링 시스템의 부재로 내용이 유출되는 경우

보안솔루션

부재

원본은 삭제되었으나 구글캐쉬페이지에서 계속 노출되는 경우구글 캐쉬

페이지노출

이용자

인식부족 개인정보보호에 대한 의식이 부족하여 민원을 게시하며 노출

개인정보 노출 원인

Page 12: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

2.2 개인정보노출유형

관리자부재 소스코드노출

관리자 부재와 웹소스 취약점

Page 13: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

3. 개인정보노출의문제점

Page 14: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

사이트가입을 목적으로 하여 자신이 원하는 사이트에 가입을 못하는 경우발생

신분증 위조에 사용되어 신용불량자 혹은 범죄자가 되는 경우 발생

개인정보도용

원치 않는 안내 메시지나 정보를 받는 경우 발생

금융사기 등의 표적이 되는 경우 발생

스팸 및 보이스피싱

홈페이지 운영 및 개인정보보호에 관리적,기술적 책임이 있음

미흡한 개인정보관리로 인하여 회원가입자들에게 집단 소송의 대상이 됨소 송

기업의 이윤만을 추구한다는 이미지를 주며 이미지가 실추됨

기업에 대한 믿음이 감소하여 제품구매등에도 영향을 주는 경우 발생

신뢰도 감소

이용자들의 믿음을 잃으며 탈퇴하는 이용자가 발생

신규가입자가 발생하지 않거나 요구사항이 많아짐

이용자 탈퇴

3.1 개인정보 노출 피해

이용자 측면

기업 측면

Page 15: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

3.2 개인정보노출사례

옥션 개인정보 추가피해

Page 16: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

3.2 개인정보노출사례

스마트폰 개인정보

Page 17: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

3.2 개인정보노출사례

개인정보 소송

Page 18: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

3.2 개인정보노출사례

개인정보 불법 거래

Page 19: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

4. 개인정보노출대응방법

Page 20: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

4.1 로봇배제표준 적용(1)

검색로봇 배제 방법

로봇배제 표준은 검색로봇이 웹 서버에 접근했을 때 검색 여부 및조건을 정해놓은 규약으로 robots.txt와 meta tag가 있음

robots.txt : 검색엔진이 웹 서버에 방문했을 때 가장 먼저 확인하는 사항(파일)으로 홈페이지의 디렉터리와 파일에 대한 검색 조건을 지정meta tag : 검색엔진이 특정 페이지에 접근했을 때 해당 페이지와 그 페이지에링크된 페이지의 검색 조건을 지정하는 규약

[Check Point] 로봇배제 표준은 검색엔진에 대한 정보수집 차단기술이 아닌 자율적인 규약이므로 악의적인 로봇은 검색 배제 표준을 준수하지 않을수 있음. 따라서, 접근 통제 등 인증을 정확히 실시한 후 만일을 위한보조 수준으로 활용하는 것이 바람직함

Page 21: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

• robots.txt 파일을 사이트의 최상위주소(서버루트디렉토리 ex: www.naver.com/robots.txt)에 저장

• robots.txt 파일 수정을 통해 적용 범위 선정 가능

적용 범위 적용방법

모든 로봇을 배제하고 싶을 경우 User-agent: *Disallow:/

모든 로봇에게 서버의 일부분만을배제하고 싶을 경우

User-agent:Disallow: /my photo/Disallow: /my daily/(로봇은 my photo와 my daily 폴더에 속한 웹문서 접근 안됨)

특정 로봇만 배제하고 싶은 경우 User-agent: evilrobotDisallow:/

특정 로봇만 접근을 허용하고 싶은경우

User-agent: CowbotDisallow:User-agent:*Disallow:/(Cowbot만이 웹문서를 수집해 갈 수 있음)

4.1 로봇배제표준 적용(2)

로봇 배제 표준 제시

Page 22: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

4.1 로봇배제표준 적용(3)

로봇 배제 설정 예시

Page 23: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

[메타태그 적용 방법]

HTML 문서의 <HEAD>와 </HEAD> 태그사이에 <META NAME=“ROBOTS” CONTENT=“NOINDEX, NOFOLLOW”> 라는 메타태그를 추가

※ 소스상에 수정을 해야 하지만 robots.txt 적용보다 확실한 방법

-http://www.robotstxt.org (로봇배제에 관한 자세한 내용 설명)

- http://www.mcanerin.com/EN/search-engine/robots-txt.asp (외국사이트지만 robots.txt 를 제작하여 줌, 고르기만 하면 자동으로 파일을 생성해 주며 가져와서 메모

장에 붙여넣고 저장 후 FTP로 올리면 됨

- http://tool.motoricerca.info/robots-checker.phtml (만들어진 robots.txt 파일이 잘 작성되었는지 검사해주는 사이트)

4.1 로봇배제표준 적용(4)

메타 태그 사용 예시

로봇 배제 관련 사이트 정보

Page 24: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

4.1 로봇배제표준 적용(5)

메타 태그 화면 예시

Page 25: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

4.2 구글캐시삭제 방법

구글 웹 페이지 삭제 필연성

민원인이 원치 않는 정보가 담긴 구글의 저장페이지가 노출되는 경우 해당정보가 노출된 페이지를 삭제하였음에도 불구하고 구글검색로봇이 재검색하여 저장하기 때문에 계속하여 노출이 됨

그러므로 더 이상 민원인이 정보가 노출되기를 원치 않는 경우 구글(Google)에 요청하여 구글캐시 삭제요청을 해야 함

원 노출 사이트의 관리자와 연락이 닿지 않아 원본 삭제가 힘든 경우에는 구글측에서 캐시 페이지를 삭제하더라도 6개월 후 재 수집되어 노출 될 수 있음

※ 구글측에서 삭제요청을 모두 수용한다는 보장은 없으며. 원본이 삭제되었을 경우 가장 확실하게 구글 삭제페이지가 삭제 됨

Page 26: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

- Google 검색결과에서 표시되는 정보 또는 이미지 : 제 3자 웹화면에 있는 경우 이용(민원들의 주 이용대상)- Google 검색결과에서 시한이 지났거나 “사용하지않는” 링크로 ,404(찾을수 없음) 또는 401(사라짐) 오류를 표시 ::정상적인 구글캐쉬가 보이지 않는 것으로 수정된 화면이 보이기를 원하는 경우에 신청합니다.

- SafeSearch 필터링 결과에 표시된 부적절한 웹페이지 또는 이미지 : 성인용화면이나 검색시 노출되는 부적절한 이미지(얼굴사진등의 이미지제거에 적절함)의 삭제를 원하는 경우에 신청합니다.

1. 구글(www.google.co.kr)로 접속

2. 구글에 로그인

3. https://www.google.com/webmasters/tools/removals?hl=ko(주소창에 입력)

4. 3 가지 항목중 선택

4.2 구글캐시삭제 방법(1)

구글 캐시 삭제 요청 방법

Page 27: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

4.2 구글캐시삭제 방법(2)

1. Google 검색결과에서 표시되는 정보 또는 이미지- 사이트 소유자가 이 페이지/이미지를 삭제했거나 robots.txt 또는 메타태그를 사용해 색인이 생성되지 않도록 차단했습니다. : 사이트 관리자가 민원인의 요청에 의해 해당 페이지를 삭제하거나 로봇배제표준을 이용하여 더 이상 검색이되지 않도록 조치한 경우에 신청합니다.- 사이트 소유자가 해당 페이지를 수정하여 해당 페이지에 더 이상 문제가 되는 정보 또는 이미지가 없습니다. : 해당 페이지에서 민원인이 요청한 정보만 삭제하고 페이지 정보가 살아있고 구글캐쉬에서만 노출되는 경우 구글측에서 새로운정보(구글캐쉬)를 수집하기를 요청할 때 신청합니다.- 사이트 소유자와 연락이 닿지 않아 조치를 취하지 못하였습니다. : 노출된 웹사이트의 관리자가 없거나 연락이 닿지 않아 원본삭제가 원활하지 않은 경우에 신청합니다.

구글 캐시 삭제 요청 방법

Page 28: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

4.2 구글캐시삭제 방법(3)

1-1 사이트 소유자가 이 페이지/이미지를 삭제했거나 robots.txt 또는 메타태그를 사용해 색인이 생성되지 않도록…

- ‘Google 웹 검색결과 혹은 Google 이미지 검색결과’ 로 수집되었는지를 체크 후 웹페이지 또는 이미지 URL을 입력.- 구글캐쉬 URL이 아닌 해당정보가 처음에 노출된 원본페이지의 URL을 입력.- 요청제출을 클릭

구글 캐시 삭제 요청 방법

Page 29: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

4.2 구글캐시삭제 방법(4)

1-2 사이트 소유자가 해당페이지를 수정하여 해당 페이지에 더 이상 문제되는 정보 또는 이미지가 없습니다.

- 구글캐쉬 URL이 아닌 해당정보가 처음에 노출된 원본페이지의 URL을 입력.- 페이지에서 제거된 용어를 입력 -> 의견을 적은 후 요청제출을 클릭- 페이지에서 제거된 용어를 입력하면 이 용어에 대한 결과값으로 원본페이지가 검색되지만 해당 페이지나 구글캐쉬 페이지를 열었을 경우에 정보가 노출되지 않음

구글 캐시 삭제 요청 방법

Page 30: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

4.2 구글캐시삭제 방법(5)

1-3 사이트 소유자와 연락이 닿지 않아 조치를 취하지 못했습니다.

- 노출 사이트의 웹마스터 이메일 주소를 입력 후 개인정보 유형을 선택.(whois 나 홈페이지에 노출된 관리자 이메일주소)- 주민번호의 경우 미국사회보장번호를 선택- 웹페이지의 URL을 입력 후 해당 정보를 찾은 검색어를 입력- 어떤 정보가 노출되어 삭제를 희망하는지 등의 사유를 상세히 ㅇ입력.(영어사용)- 이 후 요청을 제출

구글 캐시 삭제 요청 방법

Page 31: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

2. Google 검색결과에서 시한이 지났거나 “사용하지 않는” 링크로 404(찾을수 없음) 또는 401(사라짐) 오류를 표시.

- 검색 시 선택하였던 옵션을 선택 후 정보가 있는 원본페이지의 URL을 입력 후 요청제출.

4.2 구글캐시삭제 방법(6)

구글 캐시 삭제 요청 방법

Page 32: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

4.2 구글캐시삭제 방법(7)

3. SafeSearch 필터링 결과에 표시된 부적절한 웹페이지 또는 이미지

- 검색 시 선택하였던 옵션을 선택 후 정보가 있는 원본페이지의 URL을 입력 후 입력한 검색어를 입력, 요청제출

구글 캐시 삭제 요청 방법

Page 33: 발표순서 - kisa.or.kr · 검색로봇배제방법. 로봇배제표준은검색로봇이웹서버에접근했을때검색여부및 조건을정해놓은규약으로robots.txt와meta

감사합니다