태그기반 파일관리시스템을 적용한 스토리지 시스템

Preview:

Citation preview

A조 : 쿠우쿠우

EZStorage태그기반파일관리시스템을 적용한스토리지서비스

장윤경신아름

조성수(조장)

김태경

목차

1 프로젝트소개

시연

설계및구현

한계점

결론및활용분야

2

3

4

5

11 프로젝트 소개프로젝트 소개

1프로젝트 소개

태그 기반 파일 관리 시스템을 이용한

스토리지 서비스

1프로젝트 소개

쉽게 말해 이것과 비슷한 서비스를 만들었습니다

1프로젝트 소개

독창적인 아이디어는?

1프로젝트 소개

정리는 귀찮다

근데 원하는 파일은 빠르게 찾고 싶다!

1프로젝트 소개

[파일처리]lab06.doc+

과제, 2015, 학교

태그

파일에 부가적인 정보를 더 추가하자

1프로젝트 소개

그래서 뭘 어떻게 하자는건데?

1프로젝트 소개

2015년에 작성한데이터베이스

중간 발표자료를 찾아줘!!

1프로젝트 소개

파일이 아무리 많아도

[파일처리]lab06.doc 운영체제과제.doc 데이터베이스중간발표.ppt 인가탐1.doc 데이터베이스보고서.doc

+실습, 2015, 학교파일처리

+과제, 2014, 학교운영체제

+발표, 2015, 학교데이터베이스,중간

+보고서, 2013, 학교

+보고서, 2015, 학교데이터베이스,중간

1프로젝트 소개

파일이 아무리 많아도

[파일처리]lab06.doc 운영체제과제.doc 데이터베이스중간발표.ppt 인가탐1.doc 데이터베이스보고서.doc

+실습, 2015, 학교파일처리

+과제, 2014, 학교운영체제

+발표, 2015, 학교데이터베이스,중간

+보고서, 2013, 학교

+보고서, 2015, 학교데이터베이스,중간

연관 단어들로만 검색하면 찾을 수 있다.

1프로젝트 소개

연관된 태그를 묶으면 카테고리

1학년 포트폴리오

2011년 과제 보고서 발표자료

1프로젝트 소개

그러니까

1프로젝트 소개

이런 복잡한 폴더구조 만들려고 하지 말고

1프로젝트 소개

그냥 파일만 저장하면 됩니다.태그와 함께..

[파일처리]lab06.doc+

과제, 2015, 학교

태그

1프로젝트 소개

파일을 찾고 싶으면 태그만 입력하세요

과제, 2015, 학교

[파일처리]lab06.doc

22 시연시연

2시연

설계/구현에 대해 알아보기 전 사용해 보세요

http://ezstorage.khuhacker.com

http://goo.gl/4GMTwE

33 설계 및구현설계 및구현

3전체 ERD

3파일 및 태그 관련 테이블

파일정보

관계정보

태그정보

사용자

파일타입

3

왜 N:M 을 직접 연결하지 않았나?

id name

1 a.txt

2 b.txt

3 c.txt

Storage_file

id File_id name1 1 학교

2 1 과제

3 2 2015

4 2 학교

5 3 파일처리

tags

파일 및 태그 관련 테이블

3

왜 N:M 을 직접 연결하지 않았나?

id name

1 a.txt

2 b.txt

3 c.txt

Storage_file

id File_id name1 1 학교

2 1 과제

3 2 2015

4 2 학교

5 3 파일처리

tags

같은태그명이중복!

파일 및 태그 관련 테이블

3참조 테이블을 통한 중복 제거

id name

1 a.txt

2 b.txt

3 c.txt

Storage_file

id name1 학교

2 과제

3 2015

4 파일처리

tags

File_id Tag_id1 1

1 2

1 3

2 1

2 4

파일 및 태그 관련 테이블

3참조 테이블을 통한 중복 제거

id name

1 a.txt

2 b.txt

3 c.txt

Storage_file

id name1 학교

2 과제

3 2015

4 파일처리

tags

File_id Tag_id1 1

1 2

1 3

2 1

2 4

파일 및 태그 관련 테이블

3태그 수정은 삭제/추가 연산으로

id name

1 a.txt

2 b.txt

3 c.txt

Storage_file

id name1 학교

2 과제

3 2015

4 파일처리

tags

File_id Tag_id1 1

1 2

1 3

2 1

2 4

a.txt 의 학교태그를파일처리로수정하고싶다.

파일 및 태그 관련 테이블

3태그 수정은 삭제/추가 연산으로

id name

1 a.txt

2 b.txt

3 c.txt

Storage_file

id name1 학교

2 과제

3 2015

4 파일처리

tags

File_id Tag_id1 1

1 2

1 3

2 1

2 4

1 4

File_id : 1 – Tag_id : 1 인 row를 지우고,File_id : 1 – Tag_id : 4 row 를추가

파일 및 태그 관련 테이블

3파일 업로드

파일을 업로드 하는 작업은 2개 작업이 복합되어있다.

과제, 2015, 학교[파일처리]lab06.doc

3파일 업로드

두 작업 중 하나라도 실패시 전체작업이 실패

과제, 2015, 학교[파일처리]lab06.doc

3파일 업로드

하나의 Transaction 으로 작업을 처리

실패 시 Rollback 후 에러반환

3파일 업로드

3파일 업로드

3파일 업로드

insert into eztags (name) values (?) on duplicate key update reference_count=reference_count+1

reference_count : 태그의 참조 횟수

3파일 삭제

파일삭제는 3개의 테이블이 연관되어서 작용

id name

1 a.txt

2 b.txt

3 c.txt

Storage_file

id name count1 학교 2

2 과제 1

3 2015 1

4 파일처리 1

tags

File_id Tag_id1 1

1 2

2 3

2 1

3 4

3파일 삭제

cascade on delete 이용?

id name

1 a.txt

2 b.txt

3 c.txt

Storage_file

id name count1 학교 2

2 과제 1

3 2015 1

4 파일처리 1

tags

File_id Tag_id1 1

1 2

2 3

2 1

3 4

3파일 삭제

파일이 지워지면관계 테이블의 내용은지워진다

하지만 관계 테이블의 cascade 는 감감무소식

id name

1 a.txt

2 b.txt

3 c.txt

Storage_file

id name count1 학교 2

2 과제 1

3 2015 1

4 파일처리 1

tags

File_id Tag_id1 1

1 2

2 3

2 1

3 4

3파일 삭제

Before Delete Trigger를 사용

id name

1 a.txt

2 b.txt

3 c.txt

Storage_file

id name count1 학교 2

2 과제 1

3 2015 1

4 파일처리 1

tags

File_id Tag_id1 1

1 2

2 3

2 1

3 4

3파일 삭제

3파일 삭제

3태그를 이용한 검색

2015년에 작성한데이터베이스

중간 발표자료를 찾아줘!!

3태그를 이용한 검색

사용자가입력한 태그가 실제 시스템에없을 수 있다.

tag

2015

DB

발표자료

id name

1 2015

2 과제

3 DB

사용자가 입력한 태그 실제 시스템의 태그 테이블

3태그를 이용한 검색

검색 절차

1. 사용자가입력한 태그에 해당하는 태그 ID 목록 조회

2. 검색을 요청한사용자 소유의 파일이면서,(1)에서 조회한 태그들을 1개 이상 가진 파일 조회

3. 사용자가입력한 태그 수 대비 (2)의 파일 각각이 가진 태그들의매칭률계산

4. 매칭률로결과를 내림차순 정렬

3태그를 이용한 검색

검색 구현 중점 사항

1. 각 단계 별 결과를 어플리케이션까지가져오지 않는다.-> 연결 세션에 한정적인메모리엔진기반임시 테이블 생성

2. 최소의 쿼리를이용하여 검색을 수행하자

3. 결과는 정확해야한다

3태그를 이용한 검색 - SQL

절차 1. 사용자가입력한 태그에 해당하는 태그 ID 목록 조회

create TEMPORARY table ttags ENGINE=MEMORY

as (select id from eztags where name in (tags))

3태그를 이용한 검색 - SQL

절차 2. 검색을 요청한 사용자소유의 파일이면서, (1)에서 조회한 태그들을1개 이상 가진 파일 조회

create TEMPORARY table files ENGINE=MEMORY

as (select distinct storage_file_id from eztags_has_storage_file

where tags_id in (select id from ttags) and user_id= ?)

3태그를 이용한 검색 - SQL

절차 3. 사용자가입력한 태그 수 대비 (2)의 파일 각각이 가진 태그들의매칭률 계산

tag

2015

DB

발표자료

name

2015

과제

DB

사용자가 입력한 태그파일이 가진 태그

차집합name

2015

DB

매칭되는 태그

3태그를 이용한 검색 - SQL

절차 3. 사용자가입력한 태그 수 대비 (2)의 파일 각각이 가진 태그들의매칭률 계산

매칭되는 태그 갯수

X 100 = 매칭률전체입력태그갯수

3태그를 이용한 검색 - SQL

절차 3. 사용자가입력한 태그 수 대비 (2)의 파일 각각이 가진 태그들의매칭률 계산

select tmp.storage_file_id, ef.name, ft.value from

(select storage_file_id from ttags left join eztags_has_storage_file f on id = f.tags_id where f.storage_file_id=?) as tmp join ezstorage_file as ef

on tmp.storage_file_id = ef.id join ezfile_type as ft on ef.type_id = ft.id

3태그를 이용한 검색 - SQL

절차 3. 사용자가입력한 태그 수 대비 (2)의 파일 각각이 가진 태그들의매칭률 계산

select tmp.storage_file_id, ef.name, ft.value from

(select storage_file_id from ttags left join eztags_has_storage_file f on id = f.tags_id where f.storage_file_id=?) as tmp join ezstorage_file as ef

on tmp.storage_file_id = ef.id join ezfile_type as ft on ef.type_id = ft.id

3중 조인....

3카테고리를 이용한 검색

1학년 포트폴리오

2011년 과제 보고서 발표자료

카테고리의태그가 실제 시스템에없을 수 있다.

하지만 실제 존재하는태그에 대해서는파일이 모두 가지고 있어야한다.

3카테고리를 이용한 검색

검색 절차

1. 카테고리가가진 태그 중, 실제 존재하는 태그이면서사용자가보유한파일들에 포함되는 태그 ID 목록 조회

2. (1)에서 조회한 태그들을 1개 이상 가진 파일 조회

3. 사용자가입력한 태그 수 대비 (2)의 파일 각각이 가진 태그들의매칭률계산

4. 매칭률이 100%인 파일을 필터링

3카테고리를 이용한 검색

절차 1. 카테고리가가진 태그 중, 실제 존재하는태그이면서 사용자가보유한 파일들에포함되는 태그 ID 목록 조회

create TEMPORARY table ttags ENGINE=MEMORY

as (select distinct ec.tags_id as id from eztags_has_categories ec join eztags_has_storage_file ef on (ec.tags_id = ef.tags_id)

where ec.categories_id = ? and ef.user_id = ?)

4 API 명세

44 한계점

4한계점

(1)쿼리 성능 평가 미진행-> 생각보다 join이많이 발생하였다.-> (시간상)대량의 데이터에대한 성능 평가를진행하지 못함

(2) 검색의 결과에대한 Paging 을 고려하지 않음-> 매칭률을 계산하기위해서는전체를 상대로 검색해야한다-> 전체를 검색하되 Paging 을 어떻게 지원할까?

55 결론및활용분야

5결론

스토리지시스템을 직접 손으로 구축해보았다

복잡한 조건이 걸린 검색 기능을 구현해보았다

곰곰히 생각해보니엄청난 기능이다

5활용분야

5활용분야

출처 : http://m.post.naver.com/viewer/postView.nhn?volumeNo=1669760&memberNo=11575417&vType=VERTICAL

5활용분야

출처 : http://m.post.naver.com/viewer/postView.nhn?volumeNo=1669760&memberNo=11575417&vType=VERTICAL

5활용분야

사용자가태그를 입력하는 것을 기계가대신한다면?

스토리지에나의 자료를 저장하는것이 일기가 되고삶의 기록이 될 수 있겠다.

66 Reference

6특허

감사합니다감사합니다

Recommended