23
출장 보고 ․ 163 출장 보고 소멸 위기 언어 보존을 위한 언어 기록 이보라미(국립국어원 학예연구사)위진 (국립국어원 학예연구사) 지난 2월에 도쿄 외국어대학 아시아 아프리카 언어 화 연구소 (ILCAA) 주최로 ‘제5회 기록 언어학 워크숍(Documentary Linguistic Workshop)’ 1) 이 개최되었다. 본고는 이 워크숍에서 다룬, 소멸 위기의 언어를 보존하기 위한 언어 조사 계획 수립 시 주의할 점, 현지답사에 서 언어를 채록하고 그것을 여러 사람이 사용할 수 있도록 자료를 전 산화(archive)하는 방법 등 기록 언어학의 이론과 조사 방법을 소개하 는 것을 목적으로 한다. 1) 현장 언어 조사자를 위한 워크숍으로 소멸 위기 언어를 기록하는 데에 필 요한 기본적인 훈련을 제공한다. 이번 제5회 워크숍에서는 인도네시아 소 수 언어를 모어로 하는 제보자를 초청하여 이들을 대상으로 소멸 위기 언 어 보존을 위한 언어 기록 실습을 실시하였다. 총 13명이 참석한 이번 워 크숍에는 언어학 박사 과정 이상의 전공자들이 주로 참가하였고, 그 중 대 다수는 일본 방언을 전공하였다. 강의를 담당한 강사는 영국 동양․아프리 카 대학(SOAS)의 데이비드 네이선(David Nathan), 라트로브(La Trobe) 대학의 앤서니 주크스(Anthony Jukes), 그리고 기록 언어학의 초기 학문 발전에 큰 기여를 한 쾰른(Köln) 대학의 니콜라우스 히멜만(Nikolaus P. Himmelmann)이다. 또한 도쿄 외국어 대학 ILCAA의 히데오 사와다(Hideo Sawada), 호노레 와타나베(Honoré Watanabe)가 일부 강의를 담당하였다.

소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

출장 보고 ․ 163

•••출장 보고

소멸 위기 언어 보존을 위한 언어 기록

이보라미(국립국어원 학 연구사)․위진 (국립국어원 학 연구사)

지난 2월에 도쿄 외국어 학 아시아․아 리카 언어문화 연구소

(ILCAA) 주최로 ‘제5회 기록 언어학 워크 (Documentary Linguistic

Workshop)’1)이 개최되었다. 본고는 이 워크 에서 다룬, 소멸 기의

언어를 보존하기 한 언어 조사 계획 수립 시 주의할 , 지답사에

서 언어를 채록하고 그것을 여러 사람이 사용할 수 있도록 자료를

산화(archive)하는 방법 등 기록 언어학의 이론과 조사 방법을 소개하

는 것을 목 으로 한다.

1) 장 언어 조사자를 한 워크 으로 소멸 기 언어를 기록하는 데에 필

요한 기본 인 훈련을 제공한다. 이번 제5회 워크 에서는 인도네시아 소

수 언어를 모어로 하는 제보자를 청하여 이들을 상으로 소멸 기 언

어 보존을 한 언어 기록 실습을 실시하 다. 총 13명이 참석한 이번 워

크 에는 언어학 박사 과정 이상의 공자들이 주로 참가하 고, 그

다수는 일본 방언을 공하 다. 강의를 담당한 강사는 국 동양․아 리

카 학(SOAS)의 데이비드 네이선(David Nathan), 라트로 (La Trobe)

학의 앤서니 주크스(Anthony Jukes), 그리고 기록 언어학의 기 학문

발 에 큰 기여를 한 쾰른(Köln) 학의 니콜라우스 히멜만(Nikolaus P.

Himmelmann)이다. 한 도쿄 외국어 학 ILCAA의 히데오 사와다(Hideo

Sawada), 호노 와타나베(Honoré Watanabe)가 일부 강의를 담당하 다.

Page 2: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

164 ․ 새국어생활 제22권 제2호(2012년 여름)

1. 언어 기록의 정의 및 주요 특징

언어 기록(Language documentation)의 발달은 언어 소멸 기에

한 문제 인식으로부터 출발하 다. 세계에 약 6,000개의 언어가 있

다면 그 반이 21세기에 소멸될 것으로 측된다. 특히 도 권역

(equatorial belt)의 언어가 소멸될 험이 가장 높다. 주지하다시피 언

어는 수백 년간의 언어 사용자와 공동체 간의 의사소통 결과이다. 그리

고 생물의 다양성이 환경의 안정성을 변하듯 언어의 다양성 한 문

화의 다양성을 의미하며, 이는 문화 발 의 가능성이 크다는 것을 암시

한다.

한 로 이 워크 에서 만난 쿠팡-말 이어(Kupang-Malay語)를 사

용하는 한 제보자는 자신의 문화에 있었던 옛 주거 형태를 가리키는

어휘를 하나 알려주었다. 그것은 가축이 집안에서 사람들과 같이 살 수

있는 구조를 가진 양식이었다. 그러나 제보자가 그림을 그려가면서

어로 그 집의 구조를 설명해 주어도, 소 등의 가축이 1층에 살고 사람

이 2층에 함께 사는 집을 이해하기란 쉽지 않았다. 게다가 이런 설명

없이 그 어휘를 이해하기란 불가능하다.

의 에서 볼 수 있듯 각자의 고유한 문화는 그것을 드러내는 어휘

를 가지기 마련이며, 따라서 언어는 다양한 문화를 반 한다. 그러나 이

처럼 문화 배경을 유추할 수 있는 언어가 사라져가고 있는 것이다.

이러한 소멸 언어에 한 기의식에서 출발한 ‘기록 언어학’은 사회

맥락에서 자연스러운 언어 사용을 강조하는, 표 이며 다목 의

언어 기록이다. 여기에는 ‘기록(creation), 설명/주석(annotation), 보존

(preservation), 보 (dissemination)’이 포함된다. 자연스러운 언어의

표 인 자료로서 다양한 목 으로 활용될 수 있는 언어 기록을 한

이론, 연구 방법, 도구에 해 연구한다.

Page 3: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

출장 보고 ․ 165

언어 기록은 오디오 비디오 자료와 같은 말뭉치(코퍼스)2)를 구

축하며, 언어 자료 기술, 기술 통합, 번역 등에 한 정보를 주고, 자료

의 사용 맥락에 한 메타 자료가 포함되는 특징을 가진다.

지난 15년간 발달한 이 학문은 컴퓨터 등의 기계 장치의 격한 발

달 덕분에 학문 조사와 자료 리가 용이해졌다. 한 이 학문은 세

계 소멸 기 언어를 기록하고 소멸 기 언어 사용자를 지원하기

한 긴 한 요구에 한 응답이라고 볼 수 있다.

기록 언어학의 주요 특징은 다음과 같다. 첫째, 기 자료에 주목한

다. 기 자료에 한 근은 언어학 주장과 분석에 한 평가를 가

능하게 해 다. 한 기존 문법 연구에서는 한 두 개의 문을 가지고

분석하는데, 언어 기록은 다양하고 풍부한 실제 자료를 바탕으로 하기

때문에 신뢰성이 높다.3) 둘째, 장기 보존이 가능하다. 재의 사용자뿐

만 아니라 미래의 이용자가 사용할 수 있도록 보 이 가능한 것이다.

즉, 기록 언어학은 언어학 자체만을 한 것이 아니라 미래를 한 것

이기도 하다. 셋째, 다른 이용자가 사용할 수 있게 가공하여 자료를 제

공한다. 넷째, 학제 간의 교류가 활발하다. 다양한 학문 범 의 문

2) 기록 언어로서 좋은 말뭉치의 특징

ㅇ 다양성: 상황, 참가자, 채 (말하기, 쓰기, 자 우편 등), 장르, 방언 혹은

변이어 등 다양한 내용을 포함해야 함.

ㅇ 지속성, 보 , 기회: 지속 으로 성장 가능, 많은 사람들에게 기여하고,

기여할 수 있어야 함. 기록자는 언어 사용의 순간 인 기록을 해 많은

기회를 이용해야 함(최근에는 자료 수집 시 스카이 (Skype)를 이용하기

도 함). 쉽게 사용할 수 있어야 함.

ㅇ 투명성: 앞으로 500년 이후에도 많은 학자들에 의해 이용될 수 있도록

모든 자료는 정확히 설명되고 이해될 수 있어야 함.

ㅇ 윤리 문제: 자료 수집 단계부터 요하게 고려하여야 함.

3) <표 1> 언어 기록과 언어 기술의 차이

언어 기록 언어 기술

사회 ․문화 맥락에서 발생한 언어

사용에 한 체계 인 녹음, 맥락화,

기록, 통합, 번역

( 형 으로 언어학자들을 한) 문법,

사 , 텍스트 수집, 이론

Page 4: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

166 ․ 새국어생활 제22권 제2호(2012년 여름)

인 지식을 필요로 하고 언어학의 한 가지 주류에만 국한되지 않는다.

다섯째, 사회 공동체의 참여가 가능하다. 사회 구성원이 참여하고 함께

작업해서 언어 자료를 생산하기도 하고, 공동으로 연구할 수 있다. 그

리고 공동체의 문화유산에 심 있는 구성원을 포함한 모든 사람이 사

용할 수 있다. 그 기 때문에 기록된 언어 자료를 사용하는 사용자(이

용자) 한 <표 2>와 같이 이용 목 에 따라 매우 다양하다.

<표 2> 기록 언어 이용자별 주요 심 사항

이용자 주요 심 사항

연구자 연구 자료

응용하는 사람 언어 자원

기자 이야기, 음상이 귀여운 소리들

후손 정체성, 문화 ․사회 자원

기존에는 자료 수집자가 자료를 직 수집해서 연구한 반면, 지 은

자료 수집과 연구가 분리되고 있다. 그리고 다양한 수용자의 요구에 맞

게 자료를 어떤 방법으로 가공해서 제공하는가의 문제가 두되며, 동

일 자료를 다양한 형식으로 제공하여 이해 계자가 목 에 맞게 내용

을 보고 이해할 수 있게 구축하는 요성도 강조된다.

2. 음성 및 비디오 자료 기록 방법4)

2.1. 음성 자료 기록 방법

오디오 녹음은 인간의 청취 경험에 따라 달라진다. 녹음은 우리가

특정 치에서 청취한 경험을 달하는 것으로 언어 기록의 목표는 녹

4) 여기에서 소개하는 그림 자료는 워크 에서 제공된 자료임을 밝힌다.

Page 5: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

출장 보고 ․ 167

음 방법에 따라 정의될 수 있으며, 녹음은 공간 정보를 포함해야 한다.

그리고 녹음 녹화 설정에 한 메타 자료는 해석에 필요한 모든 정

보를 담고 있어야 한다.

녹음을 할 때 기록자는 모든 것을 비 ․윤리 책임을 가지고 녹

음할 필요는 없지만, 양질의 자료로 녹음해야 한다. 이때의 녹음 자료

는 술 이며 동시에 과학 으로 만들어져야 할 것이다. 한 양질의

자료를 구축하기 해 사회 공동체와 긴 한 계를 형성하는 것도

요하다.5) <표 3>에서 제시하는 방법을 통해 양질의 오디오 자료를 평

가할 수 있을 것이다.

<표 3> 오디오 자료 평가 방법

평가 상 평가 내용

정확도 신호가 잘 잡히며, 왜곡 없이 진실한 자료인지 평가

명료성/정보 근성 이용자가 원하는 내용을 찾을 수 있는지 평가

신호와 소음허용 가능한지, 주요 음성 내용을 소음으로부터

분리할 수 있는지 평가

듣기 가능성/편안함 귀에 무리를 주지 않고 들을 수 있는지 평가

공간 정보 제공 충분한 공간 정보가 포함되었는지 평가

소음 분리 소음의 모든 소스를 분리할 수 있는지 평가

제보자의 정성제보자가 녹음하기에 정한 사람인지, 정한 이야기를

해 수 있는 사람인지 평가

수정 변환 가능성 녹음 자료가 다른 일로 변환하기에 정한지 평가

5) 국 동양․아 리카 학(SOAS)의 데이비드 네이선(David Nathan)은 강의

오디오의 질과 가치를 평가하는 것은 인간이기 때문에, 자신의 귀를 믿고,

귀를 존 하라고 하 다. 기계가 아무리 발달하여도 말하는 환경(주변의 물리

환경) 변화에 따른 소리의 변화를 사람의 귀가 가장 민감하게 알아들을 수

있기 때문이다. 장에서 언어 자료를 기록할 때 기계에만 무 의존하지 말고

기록자 스스로 집 해야 한다는 을 강조한 것이다.

Page 6: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

168 ․ 새국어생활 제22권 제2호(2012년 여름)

그 다면 양질의 오디오 자료를 구축하기 해 어떻게 해야 할까?

녹음 시 주의할 사항과 녹음에서 요한 도구인 마이크를 선택하는 방법

에 해 소개하겠다. 먼 본격 인 녹음을 하기 에 시범 녹음을 해서

소리를 확인하는 모니터링 과정이 선행되어야 한다. 입술, 를 움직이는

소리처럼 가장 작은 크기의 소리(minimal voice)가 들리지 않도록 음량

을 조정해야 하며, 무엇보다 소음을 제거하기 해 노력해야 한다. 도로

에서 차가 지나가는 소리가 발생할 수 있는데, 이 경우에는 녹음 치를

바꿈으로써 소음을 없앨 수도 있다. 즉, 소음을 최소화하기 한 치를

선정하는 게 가장 요하다. 소음은 벽과 같은 장애물에 반사되어 발생

하기 때문에 유리, 화이트보드 등이 있는 곳은 피하는 것이 좋다. 만약

야외에서 녹음을 해야 하는데 당한 장소를 찾지 못했다면 자동차 안에

서 하는 것도 하나의 안이 될 수 있다.

제보자 이외의 사람들로부터 발생하는 소음도 있는데, 한 로 아이

들의 떠드는 소리가 장애가 된다. 이때 아이들을 녹음 장에서 쫓아내

면 아이들을 통제하는 데 시간이 소요될 뿐만 아니라 아이들이 호기심

에 녹음 장으로 다시 돌아오는 경우가 많다. 이 경우 마이크를 들게

하거나 아이들을 상으로 인터뷰를 하면, 아이들이 방 흥미를 잃고

다른 곳으로 가기도 한다.

기록자(인터뷰하는 사람)가 만드는 소음에도 주의를 기울여야 한다.

옷이나 종이를 만지는 소리, 테이블을 조정하는 소리, 마이크나 이블

등 장비를 조정할 때 발생하는 소음이 있다. 그리고 제보자의 이야기를

듣고 인터뷰하는 사람이 반응(음성 백채 )을 하면 목소리가 겹쳐서 좋

은 녹음 자료가 되지 못한다. 그러므로 최 한 양질의 녹음을 하기

해 여러모로 주의를 기울여야 하며, 소음을 방지하는 기구의 도움을 받

아야 한다. 마이크를 만질 때 나는 소리(handling noise)를 방지하기

해 <그림 1>과 같이 마이크를 보조하는 장치를 사용할 수 있고, 이러

한 장치가 없다면 수건 등을 활용할 수 있다.

Page 7: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

출장 보고 ․ 169

<그림 1> 소음 방지 보조 장치6)

그러나 언어 기록 자료에 소음에 한 정보를 포함시키면 자료를 분

석할 때 소음이 문제가 되지 않는다. 제보자에게 질문을 해서 녹음되는

소음에 한 정보를 자료로 제공할 수 있으며, 사진을 어서 정보를

제공하거나 주석․각주를 통해 소음에 한 정보를 수 있다.

다음으로는 음성 자료 기록 시 가장 요한, 마이크를 선택하는 방

법에 해 소개한다. 마이크는 녹음 품질을 결정하는 데 가장 요한

요소로, 작업에 합한 마이크를 선택하고, 마이크의 설치 치를 선정

하는 것이 매우 요하다.

모든 마이크는 아날로그로 그 가격은 녹음기 가격의 약 80% 정도

되는 것을 선택하는 것이 좋다. 렴한 마이크를 선택할 경우 녹음 자

료의 질이 떨어질 수 있기 때문이다. 그리고 마이크마다 수용 가능한

소리의 범 가 다르므로, 마이크 종류, 녹음 환경 등을 미리 계산해서

최 한 소음을 이고 제보자의 이야기를 녹음할 수 있도록 해야 한다.

마이크의 기본 종류는 콘덴서(condenser)와 다이내믹(dynamic)이며,

녹음 범 에 따라 모노 마이크와 스테 오 마이크로 구분된다.

6) 왼쪽에서 첫 번째와 두 번째는 마이크를 고정하는 보조 장치이며, 세 번째는

마이크에 끼워 사용하는 데드캣(dead cat)으로 바람 소리를 방지하는 기구

이다.

Page 8: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

170 ․ 새국어생활 제22권 제2호(2012년 여름)

<표 4> 콘텐서 마이크와 다이내믹 마이크의 구분

콘덴서 마이크 다이내믹 마이크

․ 기 소자인 콘덴서의 원리를 이용

한 마이크로폰

․ 소리의 크기에 따라 진동 과 속

(metal back plate)에는 하가

충 되고 이에 상응하는 압이 발생

․ 문 녹음에 많이 쓰임

․ 마이크의 진동 뒤에 부착된 코일

이 외부 진동에 따라 움직이면서

압을 발생시키는 마이크로폰

․ 일반 으로 사용하는 마이크의 유형

녹음 범 에 따른 마이크의 구별은 방향에 따른 것으로, 모노 마이

크는 하나의 신호가 하나의 채 에서 재생되는 시스템을 일컫는다. 스

테 오 마이크는 두 개의 분리된 채 로 녹음되는 것으로, 언어 기록에

서는 스테 오 마이크를 주로 사용한다. 스테 오로 녹음한 것은 모노

로 변환이 가능하고 여러 정보를 담을 수 있기 때문이다.

한 스테 오 마이크는 녹음 자료의 필수 인 정보인 공간 정보를 담

을 수 있다는 이 을 가진다. 그러나 스테 오 마이크를 사용할 때에는

왼쪽과 오른쪽 구분이 필요하므로 이 을 주의하여 기록해야 한다. 그리

고 녹음 시 제보자의 입과 마이크는 약 20cm의 거리를 두는 게 좋다. 기

본 으로는 마이크의 거리를 조정할 때 1/r2의 공식이 용되는 것을 유

념해야 한다.

<그림 2> 제보자와 마이크의 거리에 따른 녹음 가능 범

Page 9: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

출장 보고 ․ 171

<표 5> 녹음 방향에 따른 마이크의 종류와 그 특징

구 분 특징

옴니

(omni)

․ 음원의 달 방향에 계없

이 항상 일정한 감도를 나

타내는 무지향성 마이크로

․ 혼자 말하는 것을 녹음하기

좋음

카디오이드

(cardioid)

․ 정면의 음원에 한 감도는

가장 높고 측면으로 갈수록

약해져 배면에서 감도가

제일 낮은 지향성 마이크로

샷건

(shotgun)

․ 지향 폭이 매우 좁은 마이크

로폰

․ 기다란 외형에서 붙여진

이름

․ 데드캣(dead cat)을 사용하

여 소음을 방지함

2.2. 비디오 자료 기록 방법

비디오 자료는 오디오 자료와 달리 참여자를 직 확인할 수 있어

제보자를 구별하기가 용이하며, 몸짓언어(gesture)를 인식할 수 있어

담화 분석에 유용하다. 한 시각 자료 없이 청각 자료에만 의존할 경

Page 10: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

172 ․ 새국어생활 제22권 제2호(2012년 여름)

우, 어떤 내용인지 구분하기 어려운 경우도 있는데, 비디오 자료에서는

이를 쉽게 이해할 수 있다는 장 을 가진다. 그리고 명문화의 기본 인

토 로 비디오는 선구 인 방법론에 속하며, 해당 공동체에 제공하기가

합하다.

그러나 비디오 기기를 사용하기 때문에 가격이 비싸다는 과 무게가

많이 나간다는 은 기록 언어 장에서 단 이 된다. 그리고 촬 과 동시

에 양질의 녹음을 진행해야 하며, 진행한 다음에도 편집, 코딩 변환 등 비

디오와 녹음 자료를 동시에 반 해야 하는 후속 작업이 많다.

그리고 ‘진실’인 것처럼 보일 수 있지만 실제로는 오디오 자료에 비

해 진정성이 약하다. 카메라 안에 잡힌 것만 보고 그 외의 것을 놓칠

수 있기 때문이다. 그러므로 무엇을 을지, 가 보게 될 것인지, 어디

서, 어떻게 보게 될 것인지를 고려해야 하고, 오디오를 잘 조정해야 하

며 편집 방법도 잘 선택해야 한다. 장 조사(fieldwork)를 할 때에는

비디오 가격이 어떻게 되는지, 이동이 용이한지 등 실 인 사항도 고

려할 필요가 있다.

비디오 자료의 유형은 ‘sit and talk’, ‘point and show’로 구분되는데

자는 아래의 그림처럼 인물들이 변동 없이 정 으로 앉아서 이야기

하는 것을 기록한 것이다. 일반 사람들은 이러한 상을 보면 방 지

루함을 느껴 선호하지 않는데, 연구자에게는 좋은 자료가 된다. 그러나

일상 으로 화를 나 때의 구도가 아니기 때문에 자연스러운 화

방식이 아닐 수 있다는 을 유념할 필요가 있다. 후자는 문화를 담고

있는 주변 환경을 보여 수 있는 이 을 가진다.

Page 11: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

출장 보고 ․ 173

<그림 3> sit and talk 비디오 자료의

앞 에서 마이크의 종류에 따라 녹음할 수 있는 소리의 범 가 다

르다는 것을 확인하 다. 카메라를 선택할 때에는 무엇을 요하게 고

려해야 할까? 라트로 (La Trobe) 학의 앤서니 주크스(Anthony

Jukes)는 카메라 선택의 요 요소로 ‘ 즈’와 ‘센서’를 언 하 다. 큰

즈가 많은 빛을 흡수해 더 자세하게 보여 수 있고, 센서가 클수록

정 하게 기록할 수 있게 해 다. 결국 카메라 간의 요한 차이 은

즈와 센서에 의해 생기며, 문가 카메라와 일반 소비자용 카메라 간

의 가격 차이는 바로 즈와 센서에 의한 것이다.

즈는 마이크처럼 아날로그이며, 좋은 즈는 비싸다. 호환 즈 카

메라(DSLR, 35mm 비디오)에서도 즈 가격이 체 카메라 가격의

부분을 차지한다. 센서는 즈에서 이미지를 받아서 자 신호로 변

환하는 장치로, 최근에는 큰 센서가 렴해지고 있다. 큰 센서는 즈

를 통해 볼 수 있는 피사계 심도7)를 더 많이 조정할 수 있으며, 이미

7) 피사계 심도(Depth of field)는 화면에서 어떻게 잡느냐에 따라 시청자의

(focus), 주의(attention)가 이동하는 것을 나타낸다. 그러므로 화면에

잡힌 인물․사물 뒤의 배경 정보에도 주목해야 한다.

Page 12: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

174 ․ 새국어생활 제22권 제2호(2012년 여름)

지의 질을 높이는 역할을 한다.

카메라의 종류는 문가용 카메라, 캠코더, DSLR, 포인트앤드샷카메라

(Point and shot camera), 녹음기에 장착된 카메라가 있으며 각각의 특징

은 <표 6>과 같다.

<표 6> 카메라의 종류와 특징

구 분 특 징

문가용

카메라

• Sony PMW-F3

* 장 : 비디오 질이 좋음

․좋은 즈와 큰 센서, 좋은

오디오(내장 마이크 질이 좋음)

․외부 마이크와 연결 가능함

* 단 : 비싸고 무거움, 작동이

어려움, 제보자에게 부담

을 수 있음

캠코더

• Panasonic HDC-TM750

* 다양한 모델이 있기 때문에 필

요한 사항과 산에 따라 선택

해야 함

․HD, 카드 혹은 내부 장

방식, 비디오와 오디오 압축

(compression)

․녹음(오디오)이 요한 입장에

서는 압축을 선호하지 않음:

녹음 내용을 별도로 분리해 내

기 어렵기 때문에 외부 마이크

사용이 가능한 모델을 선호함

* 캠코더 선택 시 고려 : 외부

마이크 연결 가능 여부, 약한

조명, 사용 용이성

Page 13: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

출장 보고 ․ 175

구 분 특 징

DSLR

(Digital

Single Lens

Reflex)

• Canon EOS KISS X5

* 장

․ 형 센서가 피사체를 에 띄

게 하는 기법으로 촬 할 수

있음

․큰 즈로 교체하여 사용 가능

* 단

․ 조정 이동이 불편 →

같은 공간에서 이동 없이 사용

한다면 문제없음

․음질이 좋지 않고, 일 크기가

커서 녹음 길이가 제한됨

포인트앤드샷

카메라

(Point and

shot camera)

• Sony Cybershot

DSC-W570

* 일반 으로 사용하는 카메라

* 크기가 작고 사용하기 편해서

사람들이 쉽게 이용함

․비디오 상의 질과 형식은

카메라 모델에 따라 다름

․ 즈가 작아서 화질이 좋지

않고, 음질이 좋지 않음

녹음기에

장착된

카메라

• Olympus LS-20M* Video enable audio로 녹음기에

카메라를 부착한 것

* 밝은 상태에서는 간단한 상을

어도 괜찮음

3. 자료 수집 및 관리 방법

제보자로부터 언어 자료를 수집할 때에는 설문지를 통한 수집(유도

질문), 녹음 후 분석하는 방법이 있는데, 이 두 방법을 동시에 사용할

필요가 있다. 기본 으로는 인터뷰를 하면서 질문을 통해 답을 이끌

Page 14: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

176 ․ 새국어생활 제22권 제2호(2012년 여름)

어 내는데 장 조사에서 제보자로부터 화를 이끌기가 쉽지 않다. 이

때 화를 이끌기 해 이용하는 사진, 그림 등의 소도구(props)를 이

용할 수 있다. 그러나 문화권에 따라 화를 이끌기 한 도구 사용이

달라질 수 있다는 에 주의해야 한다. 화를 보는 것이 익숙하지 않

은 제보자의 경우 의도한 로 자료를 얻기 어려울 수 있기 때문이다.

제보자와 이야기할 때는 컴퓨터(노트북)보다는 메모장을 가지고 하

는 게 좋다. 컴퓨터 기기를 설치하는 데 시간이 많이 걸릴 뿐더러 기기

가 작동하지 않는 경우도 있기 때문이다. 한 때로는 컴퓨터 등의 기

기를 신기하게 본 제보자가 화에 집 하는 데 장애가 되기도 한다.

메모를 할 때에도 모든 것을 필기하려고 하면 제보자가 지루해 할 수

있으므로, 약어 등을 활용해 기록 시간을 이고 추가로 정보를 담을

수 있는 공간을 많이 남겨 두어야 한다. 무엇보다도 제보자의 주의력을

잃지 않도록 해야 할 것이다.

이 게 수집된 자료를 리하는 것이 무엇보다 요할 텐데, 명료함

과 일 성을 가질 수 있도록 자료의 흐름에 한 철 한 계획을 세워

야 한다. 그리고 다른 사람과의 공유 작업에서 서로 다른 시스템과의

호환 여부도 미리 확인해 두어야 한다. 한 한 데이터 구조 방법

과 편리한 데이터 코딩 방식에 해서도 고려해야 한다.

폴더 구조와 일의 이름 만들기도 자료 구축에서 사소하게 지나칠

수 없는 부분인데, 사용 목 , 내용, 작업 양식에 부합하는 논리 계층

구조로 폴더 구조를 만들어야 한다. 백업 등을 해 자료방(디 터리)

안에 반 인 자료를 모으는 것이 편리하며 연결된 범주(카테고리) 안

에서 자료방을 만드는 것이 좋다.

한 새로운 이름으로 일을 만들 때 컴퓨터 응용 로그램에서 자

동으로 제안하는 이름이나 치 로 장하지 않아야 하며, 자신이 구

축한 일명 부여 체계에 따라 장해야 한다. 이때 정체성을 드러낼

수 있도록 작명해야 한다. 주요 방법으로는 ‘경로8)+ 일명’을 통해 디

Page 15: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

출장 보고 ․ 177

지털 자료의 치를 표 하고, 기호나 련 정보 등의 식별 정보9)를

포함하는 것이 의미 식별보다 효율 10)이다. 일명 부여 규칙과 부

여 체계를 간단하게 소개하면 아래와 같다.

<표 7> 일명 부여 규칙과 체계

구 분 내 용

일명

부여

규칙

- 모든 일에는 정확한 확장명이 있어야 함

- 확장명 이외에는 마침표(.)를 사용하지 말고 구분할 때에는 가운뎃 (-)이나 (_) 사용

- ‘문자, 숫자, 붙임표(-, 하이 ), (_)’만 사용

․ 'a-z, A-Z, 0-9, -, _'만 사용하기

․ 문자, 소문자를 같이 쓸 수 있으나 컴퓨터에 따라 구별하지 못할 수 있음

․ 빈칸, 한 등은 사용하지 말기

- ASCII(아스키 코드) 사용: 미국 정보 교환용 표 부호

- 꼭 필요한 식별자 내용만 담고 최 한 짧게 만들기

․ 일의 정보를 나타내는 것으로 일명을 길게 만들지 말고 메타 정보를 별도로 리

일명

부여

체계

- 신 하게 설계하고, 다른 군가가 그것을 이해할 수 있도록 문서화할 필요 있음

- 일명 부여 체계 : aaa_bb_cc_yyyy-mm-dd_nnn.wav

․aaa: 마을 코드

․bb: (주요) 제보자 코드

․cc: 장르/사건 코드

․yyyy-mm-dd: 날짜

․nnn: 순서( : 001, 002, 103)

․wav: 일 유형에 따른 정확한 확장자명

8) ‘경로’는 순번과 디 토리의 구조를 표 하는 것.

9) 일명은 크게 세 가지의 구별 유형을 가진다. 첫 번째, 의미 식별(semantic

identifiers)은 제보자의 이름( : Nelson Mandela) 등의 문자 체계를 의미

한다. 두 번째, 기호(key)는 1137204(학생 번호), 화 번호 등 주로 숫자가

사용되며, 세 번째, ‘ 련 정보 식별(relative identifiers)’은 metadata.xls처

럼 일 속성을 드러낸다. 이들 각 유형의 차이와 한계를 인식하고, 혼합하

여 이름을 짓는 것이 좋다.

10) 의미 식별로 일명을 만드는 것은 단어를 더 추가하여 일명을 바꿀

경우 작동되지 않을 수 있기 때문에 잠재 으로 험하다.

Page 16: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

178 ․ 새국어생활 제22권 제2호(2012년 여름)

일이 많을 때에는 목록을 만들어 메타 정보를 리하는 것이 유용

하다. 메타 자료(Metadata)는 ‘자료들의 자료’로 자료의 식별, 리, 검

색을 한 정보이다. 이는 자료 생산자보다 이용자를 한 것으로서 자

료의 맥락과 이해에 한 정보를 최 한 자세하고 보기 쉽게 제공해야

한다. 일반 인 메타 자료의 표 으로 OLAC(Open Language Archives

Community categories)와 IMDI(ISLE Metadata Initiative)가 있다. 이

OLAC는 ‘Title(제목), Identifier(구분), Creator(제작자), Contributor(기여

자), Language(조사 언어), Subject language(조사 상 언어), Date(날짜),

Description(설명), Format(형식), Type(유형), Rights(권리), Coverage(

용 범 ), Relation( 계)’등의 내용을 기본으로 한다.

4. 언어 기록 관련 프로그램

4.1. 텍스트 로그램

텍스트 로그램은 문자 텍스트만 기록할 수 있는 것으로, MS 등의

로그램은 다양한 버 이 있어 업그 이드를 해야 하는 반면 텍스트

로그램은 버 업그 이드가 필요 없어 독립 으로 사용할 수 있다.

그리고 응용 로그램에 의존 인 로그램은 복구가 어렵지만 텍스트

일은 복구가 쉬워 기록 자료로서 리하기가 편리하다. 한 호환성

이 좋아 다양한 로그램에서 사용할 수 있다. 그러나 자꼴(폰트),

자 크기 등을 조정하기가 어렵고, 종이 크기, 여백 조정 등 이아웃을

바로 조정할 수 없다는 단 을 가진다.

텍스트 일이 가진 수정의 어려움은 텍스트 일을 편집하기 한

문 소 트웨어인 ‘텍스트 수정 로그램(text editor)’11)을 이용하여

해결할 수 있다. 텍스트 편집기는 원래 로그래머를 해 개발되었지

Page 17: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

출장 보고 ․ 179

만, 지 은 텍스트 일을 편집하기 해 일반 으로 사용된다. 이

로그램의 장 은 텍스트 일의 편집 기능이 강하며, 큰 용량의 일도

빠르게 처리하는 것이다.

<그림 5> 텍스트 로그램 Notepad++의

4.2. 언어 기록을 한 로그램

언어 기록을 해 문 으로 사용되는 로그램이 있다. 표 으

로 ELAN, Transcriber, Toolbox, FLEx(Fieldworks Language Explorer),

11) 추천 텍스트 수정 로그램

- 도우 사용자: Notepad++, EmEditor(무료 사용이 제한됨)

- Mac 이용자: Text Wrangler, Fraise

- 도우/Mac 이용자: jEdit, vi/vim

Page 18: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

180 ․ 새국어생활 제22권 제2호(2012년 여름)

We Say가 가장 많이 사용되는데 각 로그램의 주요 특징을 소개하면

아래와 같다.

<표 8> 언어 기록을 한 로그램의 종류와 특징

구 분 ELAN Transcriber Toolbox FLEx We Say

오디오 시간 정렬 o o x x x

비디오 시간 정렬 o x x x x

다층 계층 주석 o x o o x

행간 지원 x x o o x

사 편집 x x o o o/x

낱말 수집 x x o o o

로그램 이용 용이성 x o x x o

특수 문자 입력 o x o o o

XML 자료 o o x o o

4.2.1. ELAN

ELAN은 EUDICO Linguistic Annotator(EUDICO 언어 주석 로그

램)의 약어로, 비디오 오디오 자료에 한 주석을 생성․수정․검색

할 수 있는 로그램이다. 이 로그램은 오디오 자료와 비디오 자료를

연결하여 한 번에 보여 수 있다는 장 을 가진다. 오디오 자료 한 개

에 최 4개의 비디오 자료를 연결할 수 있으며, 다양한 형식의 일

(MS word 등)로 내보낼 수도 있다. 한 사와 번역에도 유용하며,

공동체 구성원을 해 텍스트, 비디오 자막 등을 생산하는 데 용이하

다. 그리고 ELAN의 주석으로 IPA 사, 폭넓은 언어로 번역, 형태소,

몸짓 언어, 문법 노트, 기타 정보 등을 포함할 수 있다.

Page 19: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

출장 보고 ․ 181

<그림 6> ELAN 로그램 기본 화면

<표 9> ELAN의 장․단

장 단

∙ 부분의 오디오와 비디오 형식을

다룰 수 있음

∙ 자료 통합, 검색 용이

∙ Toolbox와 호환하여 사용하기 좋음

∙ 웹비디오, 유튜 (You Tube) 등으

로 자료를 출력할 수 있음

∙ 공개 자료(open source)

∙ 로그램 사용이 어려움

: 별도의 학습이 필요

∙ 행간에 써 넣거나 어휘 목록을 만들

수 있는 별도의 내장 도구가 없음

∙ 주석 제한이 없기 때문에 무

많은 내용을 담아 혼란스러울 수

있음

4.2.2. Transcriber

이 로그램은 음성 자료의 주석을 지원하기 한 도구로 긴 음성

자료를 부분(segment)으로 나 어, 사, 발화 교 의 표시, 화제 변화,

음향 조건 등을 기록할 수 있다. 공개 자료이기 때문에 설치하기가 쉬

우며, 사용하기도 용이하다. 한 XML 형식으로 간단하게 일을 교

Page 20: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

182 ․ 새국어생활 제22권 제2호(2012년 여름)

환할 수 있다.

그러나 ELAN과 달리 동 상 지원이 부족하며, Toolbox로 내보낼

때 화가 복되는 부분을 처리하기가 어렵다. 그리고 이 로그램은

본래 언어학을 해 설계된 것이 아니기 때문에 다른 언어학 분석 도

구와의 통합이 어렵다는 단 을 가진다.

<그림 7> Transcriber 기본 화면

4.2.3. Toolbox

장 언어학자들을 해 개발된 Toolbox는 자료 리와 분석을 한

도구이다. 어휘 자료를 유지하는데 유용하며, 문장을 분석(parsing)하고

텍스트의 행간을 분석하기가 쉽다. 이 로그램은 오랜 기간 여러 사람

에 의해 시험이 되었기 때문에 비교 안정 이다. 그리고 사용법을 간

단하게 배울 수 있으며, 상 으로 다른 로그램에 비해 사용하기가

Page 21: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

출장 보고 ․ 183

쉽다. 한 ELAN과 상호운용성이 좋고, MDF 는 Lexique Pro와 함

께 인쇄하거나 온라인 사 을 생성할 수 있다는 장 을 가진다. 그러나

기본으로 제공하는 형식(양식)의 구조가 부족하며, 업그 이드가 되지

않고 있다. 그리고 미디어 일과 제한 으로 상호 교환되며, Mac 운

용 체계에서는 사용이 제한되는 단 을 가진다.

<그림 8> Toolbox 기본 화면

4.2.4. FLEx(Fieldworks Language Explorer)

이 로그램은 출 을 목 으로 기 수합된 문화 ․언어학 자료

를 리할 수 있도록 도와주는 소 트웨어 도구의 집합이다. 어휘 정보

를 기록하고 사 을 개발하는 데 사용할 수 있으며, 텍스트의 행간 분

석이 가능하다. 그리고 형태학 서(parser, 문장의 구조 분석․오류

검 로그램)를 제공하여 이용자들이 문법 규칙들을 확인할 수 있게

해 다.

FLEx의 장 은 첫째, Toolbox-XML보다 더 나은 자료 구조(data

Page 22: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

184 ․ 새국어생활 제22권 제2호(2012년 여름)

structure)를 가진다. 둘째, 구문 분석 문법 분석 도구가 좋다. 셋째,

모든 언어학 ․문화 자료와 메모를 유지할 수 있도록 설계되었다.

그러나 미디어 자료 처리가 나쁘며, 응용 로그램 용량이 크고, 메모리

를 많이 차지한다. Toolbox와 통합하는 것이 불편하며, 도우 응용 체

계에서만 작동한다는 단 을 가진다.

<그림 9> FLEx 기본 구성

4.2.5. We Say(사전 도구)

We say는 비언어학자도 그들 자신의 언어로 사 을 구축할 수 있게

해주는 로그램으로 사용하기가 매우 쉽다. 모어 화자가 자신의 언어

로 어휘를 생각하는 것을 도와주며, 모어 화자에 한 몇 가지 기본 데

이터(no backslash codes 등)를 입력하는 다양한 방법이 있다. 한 고

단계 사용자가 복잡한 설정 작업을 수행할 수 있고, 다른 사용자를

해 매우 간단한 인터페이스를 만들 수 있어 동 작업(teamwork)이

Page 23: 소멸 위기 언어 보존을 위한 언어 기록 · 2.2. 비디오 자료 기록 방법 비디오 자료는 오디오 자료와 달리 참여자를 직접 확인할 수 있어

출장 보고 ․ 185

가능하도록 설계되었다.

We say는 기본 데이터 양식의 구조가 좋으며, 노트북 등 사양이 낮

은 기기에서도 작동 가능하다. 그리고 Lexique Pro12)를 통해 린트를

하거나 웹으로 자료를 내보내기 쉽다. 그러나 언어 기록과 분석을 한

문 로그램이 아니기 때문에 행간을 나 거나 분석할 수 있는 도구

가 없으며, 미디어 지원을 받는 데 한계가 있고, 도우 응용 체계에서

만 작동된다.

<그림 10> We say 기본 구성

12) Lexique Pro는 상호작용 인 사 뷰어 편집기로 하이퍼링크, 범주 보기,

사 환, 찾기, 내보내기가 가능한 도구이다.