29
국어 정보화 교육 자료 개발과 활용 방안 연구 * 15) 민현식 * ․김기훈 ** ․윤경욱 *** <次 例> Ⅰ. 국어 정보화와 국어교육 Ⅱ. 텍스트 자료의 처리 및 활용 방안 Ⅲ. 맺음말 . 국어 정보화와 국어교육 국어 정보화와 관련된 교육 내용은 2009 개정 국어과 교육과정에 이르 러서야 교육과정 내용 속에 본격적으로 포함되었다 . 이는 매체 언어가 교 육 내용으로 본격적으로 다루어지기 시작한 때와 비교하면 약간 늦은 감 이 있지만 이는 당연한 것으로 볼 수 있다 . 매체에 비해 정보화 문제는 그 리 오래지 않은 연원 ( 淵源)을 가지는 것이기 때문이다 . 본고는 국어 정보 화를 국어교육에서 구체적으로 어떻게 실천할지의 문제를 다루고자 한다 . 국어 정보화와 관련된 교육 내용은 2009 개정 국어과 교육과정 내의 일 * 이 연구는 서울대학교 국어교육연구소의 지원으로 이루어진 2010년도 연구공모사업 의 일환으로, 20101210일 서울대학교 국어교육연구소 연구보고대회에서 발표 국어정보화 교육 자료 개발과 활용 방안 연구를 수정보완한 것임. ** 서울대학교 국어교육과 교수(1저자) *** 덕성여자고등학교 교사(2저자) **** 서울대학교 대학원생(국어교육)(3저자)

국어 정보화 교육 자료 개발과 활용 방안 연구s-space.snu.ac.kr/bitstream/10371/87205/1/7. 연구공모...국어 정보화 교육 자료 개발과 활용 방안 연구*

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

  • 국어 정보화 교육 자료 개발과 활용 방안 연구*

    15)

    민 현 식*․김 기 훈

    **․윤 경 욱

    ***

    < 次 例 >

    Ⅰ. 국어 정보화와 국어교육

    Ⅱ. 텍스트 자료의 처리 및 활용 방안

    Ⅲ. 맺음말

    Ⅰ. 국어 정보화와 국어교육

    국어 정보화와 관련된 교육 내용은 2009 개정 국어과 교육과정에 이르

    러서야 교육과정 내용 속에 본격적으로 포함되었다. 이는 매체 언어가 교

    육 내용으로 본격적으로 다루어지기 시작한 때와 비교하면 약간 늦은 감

    이 있지만 이는 당연한 것으로 볼 수 있다. 매체에 비해 정보화 문제는 그

    리 오래지 않은 연원(淵源)을 가지는 것이기 때문이다. 본고는 국어 정보

    화를 국어교육에서 구체적으로 어떻게 실천할지의 문제를 다루고자 한다.

    국어 정보화와 관련된 교육 내용은 2009 개정 국어과 교육과정 내의 일

    * 이 연구는 서울대학교 국어교육연구소의 지원으로 이루어진 2010년도 연구공모사업

    의 일환으로, 2010년 12월 10일 서울대학교 국어교육연구소 연구보고대회에서 발표

    한 ‘국어정보화 교육 자료 개발과 활용 방안 연구’를 수정․보완한 것임.

    ** 서울대학교 국어교육과 교수(제1저자)

    *** 덕성여자고등학교 교사(제2저자)

    **** 서울대학교 대학원생(국어교육)(제3저자)

  • 186 국어교육연구 제27집

    부 해설에서 처음 보인다. 2009 개정 국어과 교육과정 해설서에서는 국어

    정보화와 관련된 교육 내용의 성취 기준으로 ‘정보화 시대의 국어 정보화

    상황을 이해하고 국어의 발전 방안을 탐구한다.’라는 항목을 설정한 다음,

    세부적으로 해설을 덧붙이고 있다. 그 취지는 정보화 시대에 맞추어 국어

    의 정보화 상태를 이해하고 국어 정보화 능력을 신장하기 위함이라고 하

    였다. 그 배경으로는 국어 말뭉치(corpus)가 여러 곳에서 구축되어 국어사

    전을 제작하게 되었고 말뭉치를 통해 어휘 빈도, 문형 빈도 등의 조사도

    가능해져 교육용 기본 어휘를 선정하거나 등급별 어휘를 선정할 수 있게

    되었으며 이러한 빈도 조사나 말뭉치 활용을 통해 국어의 다양한 특성을

    드러내고 과학적인 국어 기술(記述)이 가능하게 되었기 때문으로 밝히고

    있다.

    이를 국어교육에서도 실천하려면 ‘깜짝새, 형태소 분석기’와 같은 분석

    프로그램이나 분류법(sorting)을 이용하여 시나 연설문과 같은 자료의 음

    소, 형태소, 어휘 빈도를 조사하여 자료의 특징을 판단할 수도 있고, 담화

    자료를 조사하면 문체의 특징을 비교하여 효과를 판단할 수 있다고 하였

    다. 이상과 같은 해설 내용을 보면 교육과정 해설서의 기술은 국어 정보

    화와 관련된 교육 내용이 무엇인지 암시해 준다.

    일반인과 국어 정보학 관련 연구자 및 국어교육학 관련 연구자의 입장

    에서는 크게 두 가지 측면에서 국어 정보화 및 국어교육과 관련된 의미

    있는 작업을 행할 수 있다. 그 하나는 국어의 특성을 좀 더 과학적인 관점

    에서 규명하거나 국어교육에 활용하는 데 도움을 주는 국어 정보화에 따

    른 자료를 구축하는 것이고, 다른 하나는 이러한 국어 정보화 자료를 적

    절하게 활용하여 국어의 특성을 밝히거나 국어교육에 활용하는 방안을

    모색하는 것이다. 양자는 다음과 같은 도식으로 상관관계를 밝힐 수 있다.

  • 국어 정보화 교육 자료 개발과 활용 방안 연구 187

    (a) 국어 정보화 자료(b) 국어의 특성 규명

    국어교육에의 활용

    [ㄱ]

    [ㄴ]

    (a→b에서 a: 수단, b: 목적을 의미. 즉 [ㄱ]은 국어 정보화 자료를 활용하여 국어의 특성

    을 규명하거나 국어교육에 활용하는 것을 의미하고, [ㄴ]은 국어의 특성을 규명하거나

    국어교육에 활용하기 위해 국어 정보화 자료를 구축하는 것을 의미한다.)

    위와 같은 논의에서 ‘국어의 특성을 규명하는 일’과 ‘국어교육에 활용하

    는 일’이 엄밀히 구분되지 않는 경우도 존재한다. 예컨대 국어 정보화를

    활용하여 교육용 등급별 어휘를 선정한 연구의 경우에는 그 자체가 한국

    어 어휘의 특성을 등급별로 나누어 규명하게 되는 효과가 있을 뿐 아니라

    교육용 등급 어휘 자료를 국어교육에 활용할 수 있는 효과를 갖는다.

    국어 정보화 교육은 학교 현장에서 정보화 기기를 다루는 기술을 숙달

    하게 하는 것을 목표로 하는 이른바 ‘학교 정보화 교육’과는 구별되며, ‘국

    어교육 정보화’와도 성격을 달리한다. ‘국어 정보화 관련 교육’에서 정보

    화의 대상은 ‘국어’인 데 반해, ‘국어교육 정보화’에서 정보화의 대상은 ‘국

    어교육’ 현장 자체이다.1)

    1) ‘국어교육 정보화’와 관련하여 서혁(1999)에서는 정보기술을 교육에 활용할 수 있는

    환경을 구축하고 운영하는 것에 초점을 두어 논의를 진행하고 있다. 이 논의에서는

    국어교육 정보화 연구의 내용을 ‘국어교육 관련 소프트웨어’, ‘인터넷 등의 PC통신이

    나 가상교육 공간을 통한 국어교육 현상’, ‘초·중등 학교 현장에서의 국어교육 정보

    화 매체의 활용도’ 등으로 세분화하고 있다.

  • 188 국어교육연구 제27집

    Ⅱ. 텍스트 자료의 처리 및 활용 방안

    우리는 국어 정보화 교육을 현장에 적용하기 위한 사례 연구로 교사가

    구축, 생성하여 만들 수 있는 교수·학습 자료 구축을 위한 말뭉치 처리 과

    정을 살핀 다음, 현장에서 교사가 국어교육 정보화 자료를 구축할 수 있

    는 방편으로 산문과 운문 텍스트의 활용 방안을 예시하려고 한다.

    1. 교수․학습 자료 구축을 위한 한국어의 말뭉치 처리

    일반적으로 말뭉치에서 필요한 정보를 추출하기까지의 과정은 ‘말뭉치

    구축을 위한 1차 자료 수집 - 말뭉치의 검토 - 말뭉치의 가공 - 정렬

    (sorting) - 정보 추출(용례 및 통계정보)’과 같은 다섯 단계로 이루어진다.

    ‘말뭉치 구축을 위한 1차 자료 수집 - 말뭉치의 검토 - 말뭉치의 가공’

    의 단계가 말뭉치 자체를 ‘준비’하는 작업이라면, ‘정렬 - 정보 추출’의 단

    계는 말뭉치를 목적에 맞게 결과물을 내어 ‘활용’하는 작업으로 볼 수 있

    다. ‘준비’와 ‘활용’에 필요한 정보화 도구는 특성상 구분된다.

    말뭉치를 준비하는 단계에서는 효율적인 텍스트 처리를 위해서 ‘텍스

    트에디터(text editor)’가 필요하다. 일반적인 문서 편집기로서 한글이나 메

    모장 등도 활용할 수 있으나 대용량 자료 처리를 위해서는 텍스트 처리

    기능에 초점을 두고 고안된 ‘EmEditor’나 ‘Editplus’ 등의 프로그램에 있는

    매크로(macro)나 정규 표현식(Regular Expression)과 같은 세부 기능들을

    활용할 수 있다.

    말뭉치를 활용하는 단계에서는 일반적으로 용례추출기(Concordancer)

    를 활용한다. 한국어 말뭉치를 기초자료로 하여 용례를 추출하기 위해 국

    내에서 개발된 프로그램으로는 글잡이Ⅱ, 한마루, 깜짝새, Uniconc 등이

  • 국어 정보화 교육 자료 개발과 활용 방안 연구 189

    있다.2) 글잡이Ⅱ와 한마루는 국가 차원의 개발물로서 ‘21세기 세종계획’

    의 성과물이고, 깜짝새와 Uniconc는 국어학 연구 차원에서 각각 소강춘,

    박진호 교수가 개발하였다. 원시 말뭉치의 형태소를 분석하고 품사를 부

    착하는 프로그램도 있는데, 국립국어원을 통해 공개된 ‘지능형 형태소 분

    석기’는 형태소 분석과 품사 부착 기능을 갖추고 있어 연구에 활발히 활

    용되고 있다.

    한편, ‘21세기 세종계획’을 통해 구축된 대규모 국가 말뭉치를 활용하기

    위해 개발된 웹 기반 말뭉치 검색 프로그램도 정보화 교육의 저변 확대에

    기여하는 성과이다. ‘21세기 세종계획 2007년 배포판’의 현대 문어 및 구어

    말뭉치를 검색할 수 있는 ‘꼬꼬마’, 한일 병렬 말뭉치를 검색할 수 있도록

    구성된 ‘나라 시스템’을 통해 인터넷을 통해서도 말뭉치의 용례를 추출하

    여 활용할 수 있다.

    때로는 말뭉치 분류법(sorting)의 활용만으로도 수업에 응용이 가능한

    유의미한 정보를 얻을 수 있다. 일례로 1985년에 발간된 ‘우리말 역순사전’

    은 일반 사전과는 달리 표제항이 거꾸로 정렬된 점이 특징인데, ‘종성’의

    ‘ㅎ’부터 ‘초성’의 ‘ㄱ’ 까지 ‘ㅎ, ㅍ, ㅌ’의 순으로 단어를 배치하여 국어의

    형태 구조를 일목요연하게 파악할 수 있게 되어 있다. ‘하양, 까망, 노랑,

    파랑’ 등과 같은 색채어 단어들을 예로 들자면, 이들은 일반 사전에 각각

    ‘ㅎ, ㄱ, ㄴ, ㅍ’의 표제항으로 분산되어 배치돼 있지만 ‘우리말 역순사전’

    에는 이들의 어말 종성이 ‘-ㅇ’로 공통되는 특성으로 인해 나란히 제시된

    다. 이와 같이 특수한 정렬 방식을 따른 사전을 활용하면 형태상으로 의

    미군(意味群)을 이루고 있는 단어들을 한 눈에 확인할 수 있으므로 학생

    들의 창작 활동 또는 형태소 분석 탐구 활동 등 작문이나 문법 수업 현장

    2) 글잡이Ⅱ·한마루는 세종계획 홈페이지를 통해 무료로 배포 신청할 수 있는 ‘21세기

    세종계획 최종 성과물(2010.12. 수정판)’에 탑재되어 있고, 깜짝새와 Uniconc는 구결학

    회의 ‘국어정보학 연구 강의 자료실’ (http://www.kugyol.or.kr/han)에 공개되어 있다.

  • 190 국어교육연구 제27집

    에 직접 응용이 가능하다. 요즘은 공개 자료인 깜짝새 등의 세부 기능을

    통해 예전보다 손쉽게 문어 자료를 ‘빈도순, 가나다순, 하파타순’ 등으로

    정렬할 수 있으므로 교사의 재량에 따라 교수․학습 자료로서 한국어 말

    뭉치를 다각도로 활용할 수 있는 가능성도 높다.

    2. 산문 텍스트에 대한 계량적 분석

    이제 구체적으로 교사가 스스로 또는 학생들과 공동으로 구축 생성할

    수 있는 텍스트 자료의 분석 방법과 그 결과를 살펴보도록 한다. 우리는

    작문 영역과 문학 영역에서 이를 다루고자 한다. 두 영역을 선택한 이유

    는 우선 글쓰기가 국어교육 학습자들의 시급한 목표 능력이므로 글쓰기

    자료를 분석하는 방법은 국어 정보화를 잘 활용할 수 있는 사례라 할 수

    있기 때문이다. 우리의 방법을 통하여 학생들은 자기 글도 분석, 진단, 개

    선할 수 있기 때문이다.

    다음으로 문학 연구도 단순히 감상 차원의 영역으로 남길 것이 아니라

    그 감상의 근거가 과학적 언어 분석과 일치함을 보여야 한다는 점에서 문

    학 영역에서 국어정보화의 방법론을 적용하여 다루고자 한다. 구체적 분

    석 대상과 조사 내용을 표로 정리하면 다음과 같다.

    분석 대상 말뭉치와 조사 내용

    텍스트 종류 분석 대상 조사 내용

    산문 학생 및 일반인 논술문 36편어휘 지표(어절수, 어형수,

    TTR)

    운문 김영랑 시 86편연, 행, 어절, 음절 계량 /

    유성음 비율

    우리는 생각하기를 “고등학생은 중학생보다 많은 어휘를 다양하게 구

  • 국어 정보화 교육 자료 개발과 활용 방안 연구 191

    사할 것이다.”라는 평서형 진술이 위계화된 교육의 결과로서 누구에게나

    자연스럽게 받아들여진다고 생각한다. 또한 “잘 쓴 글일수록 많은 어휘를

    구사한 것일까?”, “어휘를 다양하게 구사한 글과 ‘잘 쓴 글’은 정확히 일치

    하는 것일까?”와 같은 의문들은 글의 수준에 따른 어휘력과 관련하여 해

    결해야 할 의문이라고 본다. 교육 현장에 국어 정보화를 활용할 목적으로

    산문 텍스트에 관한 교육 내용과 방법을 제시하려면 위와 같은 직관적 추

    론이나 미해결된 의문을 넘어 실제 자료를 바탕으로 검토하는 세밀한 고

    찰이 필요하다. 이를 위해서는 국어 교육 현장에서도 구체적인 학습자의

    결과물을 놓고 일정한 분석틀로 계량화해보는 시도가 필수적이다.

    어휘 지표(語彙指標)에는 어절수(Token), 어형수(Type), 어휘 다양도

    (TTR Type-Token Ratio) 등이 있다. 여기서는 동일 주제로 작성된 논술

    자료3)를 대상으로 학습 단계 및 글의 수준에 따른 어휘지표를 계량 · 조

    사해 보았다. 분석 대상은 한국언론진흥재단 주관으로 시행된 제1회 ‘신

    문논술대회’의 수상 작품 및 예선입선작 총 36편이다. 논술문은 ‘신문 읽

    기에 대한 관심을 높일 수 있는 내용(자유 주제)’으로 작성되었다. 자료

    분석의 분석 도구로는 깜짝새를 활용하였다. 분석된 산문 텍스트의 목록

    은 다음과 같다.

    3) 2010년 4월부터 7월까지 4개월에 걸쳐 열린 이 대회에는 중등/고등/대학 및 일반부

    1,000여명이 참가하였다. 말뭉치는 한국언론진흥재단(2010), 신문 읽기의 즐거움:

    2010 신문논술대회 수상작 모음집 에 수록된 36편(대상 1편, 금상 3편, 은상 9편, 동

    상 15편, 예선 입선작 8편)을 대상으로 구축하였다. 본 연구의 분석 대상이 된 원문

    의 PDF는 홈페이지(http://www.kpf.or.kr)의 ‘정보마당-사업결과-간행물’에 공개되어

    있다.

  • 192 국어교육연구 제27집

    번제목 어절수

    학습

    단계글의 수준

    1 미디어 삼형제 생존의 필요충분조건 463

    대학/

    일반

    (10)

    대상작(1)

    2 글로벌 인재, 신문에 물어봐! 524

    금·은·동상

    수상작

    (9)

    3 좋지 아니한가 379

    4 희망사항: 나는 이런 신문이 좋더라 562

    5 최대다수의 최대공감을 사는 ‘꿈의 신문’ 471

    6 우물쭈물하다 이럴 줄 알았지 486

    7 메신저의 메신저 638

    8 말벌떼 같은 신문과 영화 같은 신문 573

    9 희망의 단서, 신문: 세상에서 가장 행복한 거래 480

    10 나를 깨우는 즐거운 힘 471

    11 나는 오늘을 열며 어제를 읽는다 371

    고등

    (17)

    입선작

    (5)

    12 신문과 나의 인연은 ‘~ing’ 385

    13 종이 신문의 미래 439

    14 신문으로 교육의 길을 메우다 433

    15 신문, 헐값에 모든 걸 내놓다 360

    16 오프라인에서 찾은 세상 484

    금,은,동상

    수상작

    (9)

    17 꿈꾸던 신문을 만들고 있는 미래에 서서 362

    18 나의 훌륭한 멘토, 신문 614

    19 그 여름날의 작은 기적 619

    20 정보의 홍수 속에서 돋보이는 신문의 우수성 480

    21 매체가 주는 뒤틀린 정보, 그 해결책 신문 563

    22 신문이 선사하는 ‘배우는 즐거움’ 422

    23 나에게 신문이란 437

    24 신문 읽기의 구수한 맛 528

    25 쿨한 친구, 신문 316입선작

    (3)26 나를 키운 신문, 내 삶의 소소한 행복 404

    27 신문은 우리 가족 행복 전도사 323

    작문자료 말뭉치의 정보

  • 국어 정보화 교육 자료 개발과 활용 방안 연구 193

    28 아빠를 웃게 할 수는 없니? 326

    중등

    (9)

    금,은,동상

    수상작

    (9)

    29 진정 소중한 매체는 407

    30 신문의 변신은 무죄! 392

    31 컴퓨터 마우스 대신 신문 290

    32 신문을 읽으면 얻는 즐거움, 아직도 모르십니까? 495

    33 신문과 나 391

    34 나의 소리 없는 선생님 489

    35 과거, 현재, 미래 그리고 나 299

    36 21세기의 주도자 364

    총 36편, 3단계(대학/일반10, 고등17, 중등9), 3수준(대상1, 수상27, 입선8), 1만6천40어

    1) 학습 단계별 어휘지표(語彙指標) 계량조사

    학습 단계와 학습자의 어휘력 사이에 어떤 관계가 있는지 측정하기 위

    해서는 학년별 어휘를 분석해볼 수 있는 검증된 자료가 필요하다. 분석을

    위해 동일한 주제로 작성된 중학생과 고등학생, 대학생 및 일반인 논술문

    총 27편(12,546어절)의 작문자료 말뭉치를 구축하여 계량화하였다. 어휘력

    측정에 관한 분석 지표로는 어절수와 어형수, 그리고 이들 간의 비율인

    어휘다양도를 기준으로 알아보았다.

    자료의 단계별 분포는 중학교 1학년부터 일반인(일반 직장인, 교사 등)

    까지 다양하다. 한국언론진흥재단에 공개된 제1회 신문논술대회의 주요

    수상작 27편(중등부·고등부·대학 및 일반부 각 9편)을 작문 말뭉치로 구축

    하였는데 자료의 급별 구성은 편수 면에서 균등하다.4) 다음의 표는 분석

    4) 세부 현황은 아래와 같다.

    - 중등부 9편(1학년 1명, 2학년 1명, 3학년 7명)

    - 고등부 9편(1학년 5명, 2학년 2명, 3학년 2명)

    - 대학 및 일반부 9편(학부 4명, 대학원 1명, 일반 4명)

  • 194 국어교육연구 제27집

    결과를 정리한 것이다.

    작문 자료 말뭉치의 분석 결과 - 학습 단계별

    중등(9편) 고등(9편) 대학 및 일반(9편)

    분석

    기준

    어절

    (Token)

    어형

    (Type)

    다양도

    (TTR)

    어절

    (Token)

    어형

    (Type)

    다양도

    (TTR)

    어절

    (Token)

    어형

    (Type)

    다양도

    (TTR)

    합계 3,453 2,656 0.7692 4,509 3,557 0.7889 4,584 3,669 0.8004

    위 결과를 어절 및 어형, 어휘 다양도로 나누어 각각의 단계별 추이를

    도표로 제시하면 아래와 같다. 어휘 측정의 3 요소 모두 학습 단계가 올

    라갈수록 상승선을 그리는 형태이다.

    어절 수(Token)는 중등(3453어절), 고등(4509어절), 대학 및 일반(4584어

    절)으로 그 단계가 올라갈수록 높아짐을 확인할 수 있다. 어형 수(Type)

    또한 중등(2,656어휘), 고등(3,557어휘), 대학 및 일반(3,669어휘)으로 급별

    단계와의 양적(量的) 상관관계가 나타난다. 어절 수는 글의 분량과 직결

    된 것이므로 중학생보다는 고등학생 또는 대학 및 일반인의 글 분량이 월

    등히 많다는 뜻으로 해석된다. 27편의 글 중 가장 짧은 글은 중학교 3학년

    생의 작문(290어절)이었으며, 가장 긴 글은 대학 2학년생의 글(638어절)이

  • 국어 정보화 교육 자료 개발과 활용 방안 연구 195

    었다. 한편, 어형 수는 어휘력을 나타내는 지표 중 구사하는 어휘 량에 관

    계된 것으로, 학습 단계별로 어절 수와 비슷한 추이를 보인다. 어절 및 어

    휘의 편차는 중등과 고등 사이의 편차가 고등과 대학 및 일반 사이의 편

    차보다 큰 것이 특징이다.

    어휘 다양도(TTR) 역시 중등(76.92%), 고등(78.89%), 대학 및 일반

    (80.04%)으로 그 단계가 올라갈수록 높아짐을 확인할 수 있다. 또한 중등

    과 고등 사이의 편차는 1.97%로 고등과 대학 및 일반 사이의 편차 1.15%

    보다 더 높다. 중학생이 고등학생이나 일반인보다 어휘 다양도가 낮고,

    이 어휘 다양도 편차는 중등에서 고등으로의 이행기에서 나타나는 것이

    고등에서 대학 및 일반으로의 이행기에서 나타나는 것보다 더 크다는 것

    을 보여 준다. 즉, 중학생이 고등학교에 진학하고 그 이상으로 학력이 올

    라갈수록 양적으로 많은 어휘를 구사하게 되며, 중등교육과정 내의 진학

    이 그 이상의 학력으로의 진학보다 어휘 다양도 면에서 더 급격한 차이를

    보인다는 뜻으로 해석할 수 있다.

    편당 평균 어절 수를 기준으로 보면, 중학생(383.7어절)의 작문이 고등

    학생(501.0어절)이나 대학 및 일반인(509.3어절)에 비해 글의 길이가 75~

    76% 수준이었는데도 어휘 다양도 면에서는 낮게 나타났다. TTR은 일반

    적으로 구어(口語, spoken language)보다는 문어(文語, written language)에

    높게 나타나고, 같은 장르의 글이라도 텍스트의 길이가 짧을수록 높게 나

    타나는 것으로 알려져 있음(Douglas Biber․Susan Conrad, 2002: 53 참조)

    을 감안하면 그 경향은 더욱 뚜렷함을 확인할 수 있다.

  • 196 국어교육연구 제27집

    2) 글의 수준별 어휘지표(語彙指標) 계량조사

    글의 수준과 어휘지표와의 관계를 알아보기 위해 여기서는 수준별 어

    휘력을 측정할 수 있는 자료로서 동일한 주제로 작성된, 고등학생과 대학

    및 일반인의 논술문 총 27편(12,587어절)의 작문 자료 말뭉치를 구축하여

    계량화하였다. 분석 대상의 수효는 27편으로 앞 절의 숫자와 동일하나, 중

    등 9편이 대상작 1편과 입선작 8편(일반부 5편, 고등부 3편)으로 대치되어

    말뭉치 구성 면에서는 앞 절과 차이가 있다. 여기서 글의 수준은 수상 실

    적과 동일 개념으로 간주되는데, 중등·고등·대학 및 일반 부문별로 금·은·

    동의 입상 구분이 있으나 급간의 구분을 선명하게 하기 위해서 상대적으

    로 급간 차이가 적은 ‘금·은·동’을 ‘수상작’으로 묶고, 대상작·수상작·입선

    작의 범주로 삼분하여 분석하였다. 중등부 입선작은 없으므로 분석 대상

    에서 제외하였다. 어휘력 측정에 관한 분석 지표로 앞 절과 동일한 어휘

    지표들을 조사하였다.

    그 결과 에 보이는 것과 같이 글의 수준은 어절, 어형, 다양도

    등과 모종의 상관관계를 갖고 있다고 보기 어렵다.5)

    5) 이는 각각의 요소를 수상작(금·은·동) 내에서 살펴보아도 마찬가지이다. 다음은 학습

    단계별로 금상 작문의 분량(Token)을 기준으로 비슷한 은상 및 동상 수상작을 선별

    하여 어절 수, 어형 수, 어휘 다양도를 제시한 결과이다. 중등·고등·대학/일반 모두

    어휘 수(Type)나 어휘 다양도(TTR) 면에서 선형적인 관계가 없고 수준에 따른 모종

    의 경향성도 드러나지 않으므로 글의 수상 실적과 이들 요소 사이에 상관관계를 갖

    는다고 보기 어렵다.

    중등 고등 대학/일반

    Token / Type / TTR

    금 326 / 245 / 0.7515

    은 290 / 239 / 0.8241

    동 299 / 244 / 0.8161

    Token / Type / TTR

    금 484 / 385 / 0.7955

    은 362 / 291 / 0.8039

    동 480 / 380 / 0.7917

    Token / Type / TTR

    금 524 / 425 / 0.8111

    은 471 / 378 / 0.8025

    동 480 / 390 / 0.8125

  • 국어 정보화 교육 자료 개발과 활용 방안 연구 197

    작문자료 말뭉치의 분석 결과 - 수준별

    대상작

    (1편)

    수상작

    (16편: 대학/일반 8편,

    고등 8편)

    입선작

    (8편: 대학/일반 5편,

    고등 3편)

    분석

    기준

    어절

    (Token)

    어형

    (Type)

    다양

    (TTR)

    어절

    (Token)

    어형

    (Type)

    다양

    (TTR)

    어절

    (Token)

    어형

    (Type)

    다양

    (TTR)

    대학/

    일반463 390 0.8423 4584 3669 0.8004 1988 1649 0.8295

    고등 - - - 4509 3557 0.7889 1043 812 0.7785

    위 결과 중 대학/일반인 작문자료를 어절 및 어형, 어휘 다양도의 측면

    으로 구분하여 단계별 추이를 도표로 제시하면 아래와 같다. 도표에 표시

    된 숫자는 항목별 합산 결과를 해당 편수로 나누어 계산한 평균값이다.

    도표를 보면 어절 수(Token)와 어휘 수(Type)는 공히 역 ‘v’자 모양을

    띠고 있어서 글의 수준별 경향성을 찾기 어렵다. 즉, 수상 실적이 높은,

    ‘잘 쓴 글’이라고 해서 글의 분량이 많다든지, 많은 어휘를 구사했다는 근

    거를 찾기가 어렵다는 뜻이다.

    어휘다양도(TTR) 면에서도 도표는 입선작이 수상작보다 높은 ‘v’자 형

  • 198 국어교육연구 제27집

    태를 보이므로 수상권에 들지 못한 작문이라고 해서 대상작이나 수상작

    보다 글에서 다양한 어휘를 구사하지 못하지는 않았음을 알 수 있다. 실

    제 개별 사례를 봐도 5편의 입선작 중 대상작(84.23%)보다 높은 어휘다양

    도를 보이는 작문이 2편(86.75%, 84.51%)이나 된다. 이는 환언하자면, 다양

    한 어휘를 구사한 ‘현란한 글’이 반드시 ‘좋은 글’이 되는 것은 아니라는

    사실의 방증도 된다.

    결국 ‘좋은 글’은 어휘의 양과 다양도와 같은 양적(量的) 측면의 문제라

    기보다는 구사한 어휘 집합 사이의 응집성(凝集性, coherence)이나 의미

    관계 등과 같은 질적(質的) 측면의 문제로 볼 수 있다.

    3) 운문 텍스트에 대한 계량적 분석

    텍스트 자료를 대상으로 문체적 특성을 계량적 방법으로 분석하는 논

    의는 꾸준히 행해져6) 특히 문학 작품의 경우에 그 논의가 활발히 이루어

    져 왔다. 이는 최근에 현대문학 자료에 대한 말뭉치가 대대적으로 구축되

    었을 뿐 아니라 텍스트 처리 프로그램이 개발되면서 음소별, 음절별, 혹

    은 어절별로 그 빈도를 정확하게 산출하게 된 데 힘입은 바 크다. 또한 이

    러한 분석으로 특정 작가가 어떤 음소, 어떤 형태소, 혹은 어떤 어휘를 많

    이 사용하는지를 분석할 수 있어 문체상의 특징을 파악하기가 용이해졌

    다. 텍스트 처리 프로그램으로 하나의 작품은 물론 작가의 작품 전체를

    한꺼번에 분석할 수도 있게 되었고, 시대별 혹은 경향별로 작품을 계량적

    6) 서상규(2008)에 따르면, 외솔 최현배는 1930년에 이미 ‘낱낱의 글자의 쓰이는 번수로

    써의 차례잡기’라는 논문을 발표하여 계량적 연구의 시초를 마련하였다. 이 논문에

    서 사용한 이른바 한글의 번수(현재의 ‘빈도’에 해당하는 개념) 조사는 비록 현재 우

    리가 사용하고 있는 것과 같은 텍스트 처리 프로그램을 사용한 것은 아니나 현재 검

    증해 보아도 그 정확성과 합리성을 인정할 수 있을 정도로 타당성을 지닌 것임이 밝

    혀졌다.

  • 국어 정보화 교육 자료 개발과 활용 방안 연구 199

    방법으로 해석하고 연구하는 경향이 나타나게 되었다.

    이러한 연구는 다양한 작가를 대상으로 진행되어 왔는데, 예를 들어 김

    영랑의 시에 대해 행해진 연구로는 김영랑 시 작품에 사용된 시어 음소별

    빈도를 조사하여 음운론적 특성을 밝혀 문체 분석을 꾀한 조성문(2010)의

    연구나 김영랑의 시 작품에 사용된 시어의 품사별 분포, 음절 중복 비율

    양상, 김소월의 작품에 사용된 시어와 비교하여 드러난 양상 등을 분석한

    조창규·한유석(2001)의 연구, 김소월과 김영랑의 작품에 나타난 시어를 비

    교․분석하여 두 작가의 작품에 나타난 음조, 어휘 반복의 정도, 품사 구

    성, 색채어, 의성의태어, 어휘의 향토성 등의 측면에서 특성을 비교하여

    고찰한 조창규(2002)의 연구 등이 있다.7)

    여기서는 특히 김영랑의 시 작품에 대한 분석이 활발하다는 점, 해방

    이후 현재 교육과정까지 중등 국어 교과서에 김영랑의 시가 지속적으로

    수록되고 있다는 점에 주목하여 그의 시 작품에 사용된 시어에 대해 자료

    구축과 그 활용을 시도해 보았다.

    (1) 영랑 시 86편의 말뭉치 구축

    우리는 운문 텍스트의 말뭉치로 한국학 데이터베이스8)에 공개된 영

    랑시집 의 ‘txt’ 형식의 파일 자료를 1차로 수집한 후 현대어 정본과 대조

    하여 수정하였다.9) 현대어 정본과의 대조가 필요한 이유는 김영랑 시의

    7) 물론 한 작품을 대상으로 계량적 분석이 행해지기도 한다. 이태영(2000)은 ‘산유화’

    한 작품을 국어 정보학적 관점에서 분석하였다.

    8) 한국학 데이터베이스(http://www.krpia.co.kr)에는 과학, 문학, 사전류, 역사 등 세부

    항목별로 방대한 자료가 구축되어 있고 국어 정보화 관점에서도 유의미한 자료들을

    구할 수 있다. 그중 ‘한국 근대 시집 총서’에는 「영랑시집」등 16편 시집의 원문 이미

    지, 원문 텍스트, 현대문 텍스트가 수록되어 있다.

    9) 영랑시집 의 영인본이 수록되어 있는 최근 저작으로는 ‘한국시인협회·한국시학회

    편(2008)으로 나온 남도의 황홀한 달빛 이 있다. 우리는 김영랑 시 전편(86편)을 해

  • 200 국어교육연구 제27집

    발표 연도가 1930년대∼1950년대로 고어 표기가 다수 등장하기 때문이며,

    현장에 활용되는 국어 교육의 자료로 활용되는 영랑 시도 현대어 표기이

    기 때문이다. 한국학 데이터베이스에는 영랑시집 영인본 원문보기 기

    능과 함께 고어와 현대어를 ‘txt’ 형식으로 제공하고 있다. 나머지 시는 이

    숭원(2009)에 제시된 영랑시 전편(총 86편)의 ‘현대어 정본’으로 말뭉치를

    구축하였다. 말뭉치는 텍스트에디터를 활용하여 구축하였고 통계 처리에

    는 ‘엑셀’이 사용되었다.

    (2) 영랑 시의 계량 정보

    영랑시집 (1935)은 김영랑 시인이 등단한 1930년부터 약 6년간의 초기

    작품들을 본인이 엮은 시집이다. 창작 기간은 1930년 3월부터 1935년 11월

    이고, 이들 중 대부분은 동인지 시문학 또는 문학 을 통해 발표되었다.

    그의 초기작 총 53편의 서정시가 제목 없이 번호 순으로 나열되어 있는

    점이 이 시집의 특징이다.

    영랑시선 (1949)에는 영랑시집 에 수록된 시들 중 일부 개작된 43편

    을 포함하여, 1936년 이후부터 1949년 9월까지의 문장 , 문예 , 민성 ,

    여성 , 인문평론 , 조광 등을 통해 발표된 후기 작품 17편을 더해 총

    60편이 수록되어 있다.

    영랑시집 과 영랑시선 에 공통으로 등장한 작품은 43편이고 이 작품

    설한 최근 저작 이숭원(2009)의 ‘영랑을 만나다’에 제시된 현대어를 정본으로 삼았다.

    다음은 이숭원(2009)의 머리말에 밝히고 있는 영랑 시의 현대어 작성 원칙에 대한

    요약이다.

    (1) 띄어쓰기와 표기는 현행 한글 맞춤법의 규정을 따름.

    (2) 시어는 국립국어원 ≪표준국어대사전≫을 기준으로 함. 방언이 ≪표준국어대사

    전≫에 등재된 것이면 표제항대로 쓰고, 음성적 특징이 뚜렷한 말은 원본대로 적음.

    (3) 한자는 꼭 필요한 경우에만 병기하고 뜻을 알 수 있는 한자는 한글로 함.

  • 국어 정보화 교육 자료 개발과 활용 방안 연구 201

    계량 단위연

    (聯)

    (行)

    어절

    (語節)

    음절

    (音

    節)

    번 제목

    평균

    음절

    수효

    평균

    어절

    평균

    음절

    수효

    1끝없는 강물

    이 흐르네□ ■ 1 5.0 35.0 81.0 5 7.0 16.2 35 2.3 81

    2돌담에 소색

    이는 햇발□ ■ 2 4.0 18.5 49.5 8 4.6 12.4 37 2.7 99

    3어덕에 바로

    누어□ ■ 2 4.0 20.5 52.0 8 5.1 13.0 41 2.5 104

    4뉘 눈결에

    쏘이었오□ ■ 2 4.0 16.0 42.5 8 4.0 10.6 32 2.7 85

    5오-매 단풍

    들것네□ ■ 2 4.0 13.5 39.0 8 3.4 9.8 27 2.9 78

    6 한박눈 □ ■ 2 4.0 14.5 46.0 8 3.6 11.5 29 3.2 92

    들은 영랑의 시 세계를 대표한다고도 볼 수 있다. ‘끝없는 강물이 흐르네

    ( 시문학 1호; 1930.3.)’, ‘돌담에 속삭이는 햇발( 시문학 2호; 1930.5.)’, ‘오

    -매 단풍 들것네( 시문학 1호; 1930.3.)’, ‘모란이 피기까지는( 문학 3호;

    1934.4.)’ 등과 같은 작품들( 영랑시집 수록 번호 순)이 여기에 해당된다.

    영랑시집 과 영랑시선 어디에도 수록되지 않은 시는 16편인데, 이들

    중에는 문예지가 아닌 동아일보나 서울신문 등 신문을 통해 발표된 시가

    포함돼 있다. 이 후기 작품들은 형식상으로 대부분 장편인데다가 어휘 사

    용이나 어조 등 내용 면에서도 이전의 영랑시와는 뚜렷한 차이를 보인다.

    다음은 영랑의 시 86편 각각의 ‘연(연 당 평균 행·어절·음절 수)’, ‘행(행

    당 평균 어절·음절 수)’, ‘어절(어절 당 평균 음절 수)’, ‘음절’ 수를 계량한

    값이다.

    영랑시 전편(86편)의 계량 정보

  • 202 국어교육연구 제27집

    7눈물에 실려

    가면□ 2 4.0 20.5 51.0 8 5.1 12.8 41 2.5 102

    8 쓸쓸한 뫼앞에 □ ■ 1 6.0 25.0 70.0 6 4.2 11.7 25 2.8 70

    9 꿈밭에 봄마음 □ ■ 1 5.0 20.0 50.0 5 4.0 10.0 20 2.5 50

    10 무제(4행시) □ ■ 1 4.0 23.0 61.0 4 5.8 15.3 23 2.7 61

    11 무제(4행시) □ ■ 1 4.0 18.0 49.0 4 4.5 12.3 18 2.7 49

    12 무제(4행시) □ ■ 1 4.0 18.0 47.0 4 4.5 11.8 18 2.6 47

    13 무제(4행시) □ ■ 1 4.0 18.0 44.0 4 4.5 11.0 18 2.4 44

    14 무제(4행시) □ ■ 1 4.0 17.0 52.0 4 4.3 13.0 17 3.1 52

    15 무제(4행시) □ ■ 1 4.0 16.0 44.0 4 4.0 11.0 16 2.8 44

    16 무제(4행시) □ ■ 1 4.0 16.0 45.0 4 4.0 11.3 16 2.8 45

    17 무제(4행시) □ ■ 1 4.0 14.0 46.0 4 3.5 11.5 14 3.3 46

    18 무제(4행시) □ ■ 1 4.0 16.0 49.0 4 4.0 12.3 16 3.1 49

    19 무제(4행시) □ ■ 1 4.0 24.0 56.0 4 6.0 14.0 24 2.3 56

    20 무제(4행시) □ ■ 1 4.0 20.0 44.0 4 5.0 11.0 20 2.2 44

    21 무제(4행시) □ ■ 1 4.0 19.0 48.0 4 4.8 12.0 19 2.5 48

    22 무제(4행시) □ ■ 1 4.0 16.0 48.0 4 4.0 12.0 16 3.0 48

    23 무제(4행시) □ ■ 1 4.0 17.0 46.0 4 4.3 11.5 17 2.7 46

    24 무제(4행시) □ ■ 1 4.0 19.0 47.0 4 4.8 11.8 19 2.5 47

    25 무제(4행시) □ ■ 1 4.0 19.0 47.0 4 4.8 11.8 19 2.5 47

    26 무제(4행시) □ 1 4.0 21.0 47.0 4 5.3 11.8 21 2.2 47

    27 무제(4행시) □ ■ 1 4.0 22.0 49.0 4 5.5 12.3 22 2.2 49

    28 무제(4행시) □ ■ 1 4.0 28.0 62.0 4 7.0 15.5 28 2.2 62

    29 무제(4행시) □ ■ 1 4.0 22.0 48.0 4 5.5 12.0 22 2.2 48

    30 무제(4행시) □ ■ 1 4.0 26.0 60.0 4 6.5 15.0 26 2.3 60

    31 무제(4행시) □ ■ 1 4.0 25.0 54.0 4 6.3 13.5 25 2.2 54

    32 무제(4행시) □ ■ 1 4.0 17.0 44.0 4 4.3 11.0 17 2.6 44

    33 무제(4행시) □ ■ 1 4.0 18.0 43.0 4 4.5 10.8 18 2.4 43

    34 무제(4행시) □ ■ 1 4.0 20.0 49.0 4 5.0 12.3 20 2.5 49

    35 무제(4행시) □ 1 4.0 20.0 50.0 4 5.0 12.5 20 2.5 50

    36 무제(4행시) □ 1 4.0 17.0 52.0 4 4.3 13.0 17 3.1 52

    37 무제(4행시) □ ■ 1 4.0 23.0 45.0 4 5.8 11.3 23 2.0 45

    38 除夜 □ ■ 4 2.0 11.8 29.8 8 5.9 14.9 47 2.5 119

    39 내옛날 온꿈이 □ ■ 4 2.0 9.5 25.0 8 4.8 12.5 38 2.6 100

    40그대는 호령도

    하실만하다□ ■ 4 2.0 8.0 21.8 8 4.0 10.9 32 2.7 87

    41 아퍼 누어 □ 3 3.0 11.3 27.7 9 3.8 9.2 34 2.4 83

  • 국어 정보화 교육 자료 개발과 활용 방안 연구 203

    42 가늘한 내음 □ ■ 4 4.0 18.0 43.5 16 4.5 10.9 72 2.4 174

    43내마음을 아

    실 이□ ■ 4 3.5 16.3 38.0 14 4.6 10.9 65 2.3 152

    44 시냇물소리 □ 2 6.0 32.0 78.5 12 5.3 13.1 64 2.5 157

    45모란이 피기

    까지는□ ■ 1 12.0 66.0 168.0 12 5.5 14.0 66 2.5 168

    46 佛地菴 □ ■ 5 3.0 26.8 69.6 15 8.9 23.2 134 2.6 348

    47 물보면 흐르고 □ ■ 4 3.0 11.0 27.5 12 3.7 9.2 44 2.5 110

    48降仙臺 돌

    바늘 끝에□ 4 3.0 12.8 31.5 12 4.3 10.5 51 2.5 126

    49사개틀닌 古風

    의 퇴마루에□ 3 4.0 18.0 43.3 12 4.5 10.8 54 2.4 130

    50마당 앞 맑

    은새암을□ 5 2.8 9.2 20.2 14 3.3 7.2 46 2.2 101

    51 황홀한 달빛 □ 5 4.0 9.4 22.0 20 2.4 5.5 47 2.3 110

    52 杜鵑 □ ■ 4 8.0 54.3 128.8 32 6.8 16.1 217 2.4 515

    53 淸明 □ ■ 5 5.0 24.8 61.4 25 5.0 12.3 124 2.5 307

    54 五月 ■ 1 11.0 52.0 134.0 11 4.7 12.2 52 2.6 134

    55 五月 아침 ■ 5 4.0 20.0 52.0 20 5.0 13.0 100 2.6 260

    56낮의 소란소

    리■ 1 10.0 48.0 116.0 10 4.8 11.6 48 2.4 116

    57 빛갈 환히 ■ 1 8.0 25.0 64.0 8 3.1 8.0 25 2.6 64

    58 내홋진 노래 ■ 5 2.0 11.0 26.2 10 5.5 13.1 55 2.4 131

    59수풀아래 작

    은샘■ 1 12.0 79.0 185.0 12 6.6 15.4 79 2.3 185

    60 땅검이 ■ 3 3.0 13.0 32.0 9 4.3 10.7 39 2.5 96

    61 집 ■ 5 5.0 18.8 43.0 25 3.8 8.6 94 2.3 215

    62 연1 ■ 3 4.0 15.7 37.0 12 3.9 9.3 47 2.4 111

    63 연2 ■ 1 11.0 83.0 191.0 11 7.5 17.4 83 2.3 191

    64 언-땅 한길 ■ 2 4.0 19.0 40.0 8 4.8 10.0 38 2.1 80

    65 북 ■ 7 2.0 9.9 25.9 14 4.9 12.9 69 2.6 181

    66 바다로 가자 ■ 5 6.0 31.0 81.2 30 5.2 13.5 155 2.6 406

    67 한즘 흙 ■ 7 1.7 7.4 18.7 12 4.3 10.9 52 2.5 131

    68 毒을 차고 ■ 4 3.5 24.8 58.5 14 7.1 16.7 99 2.4 234

    69 春香 ■ 7 7.0 33.7 90.4 49 4.8 12.9 236 2.7 633

    70 忘却 ■ 5 4.0 34.4 90.8 20 8.6 22.7 172 2.6 454

    71 못 오실 임이 △ 1 4.0 18.0 52.0 4 4.5 13.0 18 2.9 52

  • 204 국어교육연구 제27집

    72 거문고 △ 4 3.0 18.0 39.8 12 6.0 13.3 72 2.2 159

    73 가야금 △ 4 2.5 5.3 13.5 10 2.1 5.4 21 2.6 54

    74 묘비명 △ 1 8.0 35.0 88.0 8 4.4 11.0 35 2.5 88

    75 강물 △ 6 2.0 8.7 23.5 12 4.3 11.8 52 2.7 141

    76 한길에 누워 △ 6 2.5 12.7 32.3 15 5.1 12.9 76 2.6 194

    77 偶感 △ 5 2.8 17.2 44.0 14 6.1 15.7 86 2.6 220

    78 새벽의 處刑場 △ 1 17.0 104.0 266.0 17 6.1 15.6 104 2.6 266

    79 絶望 △ 1 31.0 178.0 490.0 31 5.7 15.8 178 2.8 490

    80 겨레의 새해 △ 1 17.0 98.0 238.0 17 5.8 14.0 98 2.4 238

    81 感激 八·一五 △ 4 6.5 44.5 118.5 26 6.8 18.2 178 2.7 474

    82 行軍 △ 5 2.0 6.0 13.8 10 3.0 6.9 30 2.3 69

    83 池畔追憶 △ 1 17.0 138.0 360.0 17 8.1 21.2 138 2.6 360

    84어느 날 어

    느때고△ 6 3.0 8.0 19.2 18 2.7 6.4 48 2.4 115

    85千里를 올라

    온다△ 6 4.0 22.7 59.8 24 5.7 15.0 136 2.6 359

    86 五月 限 △ 3 5.0 18.7 51.0 15 3.7 10.2 56 2.7 153

    합계 및 평균

    ([숫자]는 86으로 나눈

    값)

    222

    [2.6

    ]

    4.2 21.4 54.0

    930

    [10.8

    ]

    5.1 12.9

    4,74

    0

    [55.

    1]

    2.5

    11,9

    78

    [139.

    3]

    □시집 53편 : 영랑시집(永郞詩集 1935) / ■시선 60편 : 영랑시선(永郞詩選 1949) /

    △미수록 16편 : 시집 미수록

    를 보면, 전체 영랑시는 총 222연, 930행, 4천 740어절, 1만 1천

    978음절로 이루어졌음을 확인할 수 있다. 한 편 당 평균 연 수는 2.6연, 평

    균 행 수는 10.8행, 평균 어절 수는 55.1어절, 평균 음절 수는 139.3음절이

    다. 계량 분석을 통해 우리는 영랑이 생애에 걸쳐 쓴 시를 통틀어 평균적

    으로 1개 연 하나가 4.2개의 행으로 구성되어 있으며, 하나의 연에는 평균

    54개의 음절이 21.4개의 어절로 조합되었고, 하나의 행에는 평균 5.1어절,

    12.9음절이 있는데, 그 한 어절의 평균 음절 수는 2.5음절이라는 수치를 구

    할 수 있었다.

    각 작품은 이들 평균값으로부터의 편차가 크지 않음도 읽을 수 있다.

  • 국어 정보화 교육 자료 개발과 활용 방안 연구 205

    한편, 10번부터 37번까지 영랑의 전체 시 편수의 30%에 해당하는 28편의

    시가 단연(單聯) 4행시인 점은 그의 시작(詩作) 상의 특징으로 확인된다.

    마치 연시조를 연상케 하는 이런 연작 방식은 비슷한 주제의 정서를 평탄

    한 어조로 표현하기 적합한 양식이다. 어절과 음절 수 면에도 각각 14~25

    어절, 44~62음절로 평균에서 편차가 크지 않다. 이처럼 영랑은 한두 개의

    짧은 연으로 된 단조로운 구성을 선호하였다.

    가. 영랑 시의 ‘연·행·어절·음절’ 계량 정보

    다음 표는 수록 정보별로 1) 영랑시집 과 영랑시선 에 모두 수록된

    시 2) 영랑시집 에만 수록된 시 3) 영랑시선 에만 수록된 시 4) 시집에

    수록되지 않은 시를 구분하여 합산한 결과이다.

    영랑 시의 구조적 측면: '연·행·어절·음절'의 계량 결과

    수록

    정보

    (聯)

    (行)

    어절

    (語節)

    음절

    (音節)

    수효편당

    평균수효

    편당

    평균수효

    편당

    평균수효

    편당

    평균

    1) □ ■ 43 전반기

    (평균 이하)

    78 1.8 314 7.3 1,617 37.6 4,078 94.8

    2) □ 10 26 2.6 91 9.1 354 35.4 846 84.6

    3) ■ 17 후반기

    (평균 이상)

    63 3.7 275 16.2 1,443 84.9 3,622 213.1

    4) △ 16 55 3.4 250 15.6 1,326 82.9 3,432 214.5

    합계 86 222 2.6 930 10.84,74

    055.1

    11,9

    78

    139.

    3

    □시집 53편 : 영랑시집(永郞詩集 1935) / ■시선 60편 : 영랑시선(永郞詩選 1949) /

    △미수록 16편 : 시집 미수록

    위의 표를 종합해 보면 시집의 수록 정보를 중심으로 구분된 네 범주

    가 합계의 평균값을 기준으로 ‘전반기’와 ‘후반기’가 명확히 양분됨을 확

  • 206 국어교육연구 제27집

    인할 수 있다. 즉, 1)과 2)의 경우 영랑시집 에 수록된 작품 53편으로 평

    균 연수인 2.6이하의 값(1.8, 2.6)을 보인다. 이 작품들은 영랑이 등단한

    1930년부터 영랑시집 이 출간된 1935년 사이의 작품들이다. 반면, 3)과 4)

    는 작품 한 편당 연의 수가 평균값보다 큰 값(3.7, 3.4)으로 나타난다. 이러

    한 양상은 행·어절·음절에도 동일한 양상으로 나타나며, 분석 단위가 낮

    아질수록 더욱 뚜렷한 편차를 보인다. 이것은 영랑의 시 세계를 순수 서

    정만을 추구한 ‘전반기’와 사회 참여 경향도 함께 보이는 ‘후반기’를 구분

    할 수 있는 계량적인 근거로 볼 수 있다.

    나. 영랑 시 발음의 공명음(ㄴ, ㄹ, ㅁ, ㅇ) 계량 정보

    다음 표는 영랑 시 86편을 한국어 표준 발음법에 따라 전사한 후 초성

    및 종성에 나타나는 공명음(共鳴音, sonorant) ‘ㄴ, ㄹ, ㅁ, ㅇ’의 비율을 조

    사한 결과이다.

    영랑 시 발음의 초성․종성 공명음 계량 결과

    자음 음소

    (초성·종성)

    공명음 음소

    ㄴ ㄹ ㅁ ㅇ

    효14,501

    2,993

    (20.6%)

    2,511

    (17.3%)

    1,355

    (9.33%)

    488

    (3.4%)

    성10,387

    1,300

    (12.5%)

    1,474

    (14.2%)936 (9.0%) -

    성4,114

    1,693

    (41.2%)

    1,037

    (25.2%)419 (10.2%) 488 (11.9%)

    합계

    7,347

    (50.7%)

    초성(3710, 35.7%) / 종성(3637, 88.4%)

    ※소수 둘째 자리에서 반올림

    음운론에서는 울림이 큰 비음(鼻音, nasal)과 유음(流音, liquid)을 묶어

  • 국어 정보화 교육 자료 개발과 활용 방안 연구 207

    서 공명음(울림소리)이라고 한다. 비음은 공기가 비강을 통과하면서 나는

    소리로, 한국어 비음에는 ‘ㄴ, ㅁ, ㅇ’이 있는데, 이들은 발음할 때 코를 막

    으면 코가 울리는 것을 느낄 수 있다. 유음은 공기가 구강에서 장애를 별

    로 받지 않고 흘러나옴으로써 조음되는 자음으로 한국어 유음에는 ‘ㄹ’이

    있다(이진호, 2005: 42-43). 초성 ‘ㅇ’은 아무런 음가를 지니지 않으므로 계

    량에서 제외되었다.

    영랑 시 전편에 나타나는 음소(音素)의 종류 수는 초성‧중성‧종성을

    모두 합해 46개인데, 그중 초성 음소의 종류는 19가지이고, 중성은 20가지,

    종성의 종류 수는 한국어의 발음 원칙에 따라 총 7가지이다. 초성의 종류

    는 ‘ㄱ, ㄲ, ㄴ, ㄷ, ㄸ, ㄹ, ㅁ, ㅂ, ㅃ, ㅅ, ㅆ, ㅇ, ㅈ, ㅉ, ㅊ, ㅋ, ㅌ, ㅍ, ㅎ’로

    이들 중 유성음의 종류 수(4가지)가 차지하는 비율은 약 21.1%이다. 그런

    데 계량을 통해 나타난 음소의 수효는 3,710개이므로 초성 음소 전체

    10,387개 중 비율이 35.7%나 된다.

    김영랑 시의 음소 계량 결과를 보면 공명음이 약 50.7%로 ‘ㄴ(20.6%)’,

    ‘ㅁ(17.6%)’, ‘ㅇ(9.34%)’, ‘ㄹ(3.37%)’순서로 많이 등장한다. 유성 자음 ‘ㄴ,

    ㅁ, ㅇ’은 비음으로서 소리 흐름이 비교적 자유롭고 상대적으로 약한 소

    리이며 부드럽고 여운이 있는 한편, ‘ㄹ’은 유음으로서 반모음적 성질을

    띤 자음으로 가볍고 약동하는 느낌을 준다(G. Borden et al., 1994).

    특히, 초성 중에 ‘ㄹ’의 비율이 14.2%로 가장 높은 점을 주목할 필요가

    있는데, 공명음 중에도 유음은 비음보다 울림도가 더 크므로(이진호, 2005:

    43) 유음인 ‘ㄹ’은 초성 자음 중에 울림도가 가장 큰 소리에 해당한다. 종

    성 중에도 공명음 출현 회수가 차지하는 비중(88.4%: 4,114개 중 3,637개)

    은 공명 자음의 종류 수가 차지하는 비중(57.1%: 7개 중 4개)에 비해 훨씬

    높은 비율로 31.3%포인트나 높은 차이를 보인다. 이처럼 김영랑 시인은

    자신의 시를 낭독할 때 울림소리가 많이 등장하도록 시를 썼음을 알 수

    있는데, 이것은 시어의 음악성을 고려한 장치로 볼 수 있다10).

  • 208 국어교육연구 제27집

    표기의 측면에서 시의 행 끝에 등장하는 음소 사용을 보면 영랑의 일

    부 시에서 초성과 종성의 유음 비중이 상대적으로 높게 나타난다는 사실

    은 기존 연구에 의해 밝혀진 것인데(조창규·한유석, 2001: 146-147), 영랑

    시는 실제 낭송할 때에도 울림소리가 높은 비율로 실현된다는 사실을 위

    의 계량 자료를 통해서 확인할 수 있다.

    Ⅲ. 맺음말

    본론의 논의를 요약하면 다음과 같다.

    1. 말뭉치를 준비하는 단계에서는 효율적인 텍스트 처리를 위해서 ‘텍스트

    에디터(text editor)’가 필요하며, 텍스트 에디터의 매크로(macro)나 정규

    표현식(Regular Expression)과 같은 세부 기능들을 익혀두는 것이 좋다.

    말뭉치를 활용하는 단계에서는 일반적으로 용례추출기(Concordancer)나

    분류법(sorting)을 활용한다. 한글 처리 프로그램으로는 글잡이Ⅱ, 한마

    루, 깜짝새, Uniconc 등이 있다.

    2. 교사가 스스로 혹은 학생들과 공동으로 구축할 사례로 산문 텍스트와

    문학 작품을 계량 분석하도록 하였다. 산문 텍스트 계량의 예시로서 일

    반인·학습자 논술문(제1회 신문논술대회) 36편(1만6천40어절)을 분석한

    결과 학습 단계별 어휘지표는 학습 단계가 중등(TTR: 0.7692), 고등

    (TTR: 0.7889), 대학 및 일반(TTR: 0.8004)으로 올라갈수록 상승선을 그

    10) 영랑 시의 음악성을 뒷받침하는 근거로 본 연구에서는 영랑 시의 자음 즉, 초성과

    중성의 음소만을 살폈지만 중성의 양성 모음을 계량해 봐도 마찬가지이다. 실제 계

    량 결과를 보면 모음 중에는 양성모음(ㅏ, ㅗ, ㅑ, ㅛ)이 중성 종류 수(총 20가지)에

    비해 비교적 많은 비중(36.4%)을 차지한다. 양성모음은 음성모음에 비해 밝고, 가볍

    고, 부드러우며, 작고, 탄력적인 느낌을 준다.

  • 국어 정보화 교육 자료 개발과 활용 방안 연구 209

    리는 형태이다. 그러나 글의 수준별 어휘지표는 입선작, 동상, 은상, 금

    상, 대상과 양적인 상관관계가 나타나지 않았다.

    3. 운문 텍스트 계량의 예시로서 김영랑 시 86편은 평균 2.6연, 10.8행, 55.1

    어절, 139.3음절로 계량되었다. 그 중 전반기 시 53편은 연·행·어절·음절

    이 평균값 이하이며, 후반기 33편은 연·행·어절·음절이 평균값 이상이다.

    또한 김영랑 시는 낭독할 때 공명음(울림소리)의 비율이 50.7%로 자음

    음소의 절반 이상이며, ‘ㄴ(20.6%)’, ‘ㅁ(17.6%)’, ‘ㅇ(9.34%)’, ‘ㄹ(3.37%)’순

    서로 많이 등장한다.

    우리는 본고의 논의를 통해 국어 정보화와 관련된 교육은 ‘매체 언어

    교육’이나 ‘국어교육 정보화’와는 그 지향점이 분명히 다르며, 교사들이

    학습자들과 같이 국어 정보화 자료를 활용함으로써 국어의 특성을 이해

    하는 것을 주된 목표로 삼는다는 것을 이해할 수 있다. 그리고 국어 정보

    화와 관련된 교육은 단순히 국어 정보화 관련 기술을 익히는 데 머무르지

    않음을 유념하게 된다.

    국어 정보학에서는 그간 국어의 특성을 규명하고 그 계량적 분석 결과

    를 국어교육에 활용하기 위한 수많은 연구가 진행되어 왔으며, 이는 국어

    정보화와 관련된 교육 내용을 마련하는 데 소중한 밑거름이 된다. 비록

    우리는 학생 혼자 하기에는 벅찬 글짓기 대회 수상작 다수와 저명 시인의

    작품 전체 분석이라는 방대한 분석 작업의 사례를 보였지만 이런 방식으

    로 교사가 한 편의 글이나 한 편의 문학 작품을 대상으로 분석 프로그램

    을 이용해 계량 분석하여 지도한다면 국어교육 현장에서 국어정보화의

    방법론을 활용할 가능성을 찾아볼 수 있다고 하겠다.

    앞으로 국어 정보화와 관련된 교육 활동의 사례로는 앞에서 다룬 작문

    자료 분석 방식을 학생 개개인의 글을 대상으로 적용하여 자기가 자주 쓰

    는 어휘나 조사의 특성을 파악하여 글버릇을 반성할 수 있다는 점을 들

  • 210 국어교육연구 제27집

    수 있다.

    또한 문학 작품을 감상할 때에도 영랑 시 분석처럼 분석 도구를 이용

    하면 단 한 편의 계량 분석을 통해 문학 작품에 대한 정서와 느낌의 근거

    를 계량적으로 파악할 수 있다. 이처럼 자기 글 분석, 작품 분석은 그리

    어렵지 않게 교실에서 국어정보화의 도구를 적용하여 다룰 수 있다.

    교수자의 측면에서는 우리 주변의 무수한 텍스트 자료를 대상으로 학

    습자들에게 유의미한 교육 내용을 제공하기 위한 치밀하고도 정확한 텍

    스트 처리 능력을 쌓아가는 것이 필요하고, 이와 함께 텍스트 처리 결과

    에 대한 적합한 해석 능력을 갖추도록 학습자에게 그러한 안목을 길러주

    기 위해 힘쓰려는 노력이 절실하다고 하겠다.

    이러한 노력이 국어교육의 교수․학습 장면에서 충분히 발휘되어 풍부

    한 텍스트 자료를 통해 국어의 숨은 특성을 발견해 나가는 과정이 구현되

    고 학생들은 각자 분석 프로그램을 자유자재로 활용하여 자기의 글을 반

    성하여 언어생활을 성찰하고, 저명 작가나 남의 작품을 과학적으로 분석

    하여 보는 안목을 갖춘다면 ‘국어 자료의 분석과 해석을 통해 미래를 지

    향하는’ 국어교육이 되도록 하는 데 국어정보화의 도구들은 의미 있는 기

    여를 할 것으로 기대된다.*11)

    참고 문헌

    교육과학기술부(2009), 2009 개정 교육과정에 따른 고등학교 국어과 교육과정

    해설 .

    서상규(2008), 「한글의 번수 조사와 외솔 최현배」, 한글 281, 한글학회,

    * 이 논문은 2011. 4. 27. 투고되었으며, 2011. 5. 20. 심사가 시작되어 2011. 6. 1. 심사가

    완료되었고, 2011. 6. 7. 편집위원회 심의를 거쳐 게재가 확정되었음.

  • 국어 정보화 교육 자료 개발과 활용 방안 연구 211

    pp.393-418.

    서혁(1999), 「국어교육 정보화의 실태와 문제점」, 국어교육학연구 9, 국어교

    육학회, pp.327-360.

    이숭원(2009), 영랑을 만나다 , 태학사.

    이진호(2005), 국어 음운론 강의 , 삼경문화사.

    이태영(2007), 「‘산유화’의 국어 정보학적 연구」, 국어문학 42, 국어문학회,

    pp.35-72.

    조성문(2010), 「김영랑 시의 음운론적 특성 분석」, 동아시아 문화 연구 47, 한

    양대학교 동아시아문화연구소, pp.197-214.

    조창규(2002), 「소월과 영랑 시어의 계량언어학적 고찰」, 배달말 30, 배달말

    학회, pp.153-176.

    조창규․한유석(2001), 「영랑 시어의 계량적 고찰」, 언어학 9, 대한언어학회,

    pp.139-158.

    한국언론진흥재단(2010), 신문 읽기의 즐거움: 2010 신문논술대회 수상작 모음집

    Douglas Biber, Susan Conrad, Geoffrey Leech(2002), Longman student grammar

    of spoken and written English, Harlow; Longman.

    G. Borden, K. Harris, L. Raphael(1994), Speech Science Primer, Baltimore;

    Lippincott Williams & Wilkins, 김기호·양병곤·고도홍·구희산 공역(2000),

    음성과학 , 한국문화사.

    구결학회 국어정보학 연구 강의 자료실 : http://www.kugyol.or.kr/han

    국립국어원 : http://www.korean.go.kr

    한국학 데이터베이스 : http://www.krpia.co.kr

    21세기 세종계획 : http://www.sejong.or.kr

  • 212 국어교육연구 제27집

    ■국문초록

    국어 정보화 교육 자료 개발과 활용 방안 연구

    민현식․김기훈․윤경욱

    본고는 정보화 시대에 맞추어 국어의 정보화 상태를 이해하고 국어 정보화

    능력을 신장시킴으로써 더 나아가국어의 특성을 파악하는 데 도움을 주는교육

    으로서 국어 정보화와 관련된 교육의 내용을 고찰하였다.

    본고에서는 국어 정보화 교육이 학교 정보화 교육이나 국어교육 정보화와 성

    격이 다르다는 점을 살펴보았고, 국어 정보화 자료를 활용하는 측면에 초점을

    맞추어 말뭉치를 구축하고 분석해 보았다. 그리하여 국어 정보화 교육에 유의미

    한 교육 내용을 제공하는 측면에서 운문·산문 말뭉치를 처리하여 교수·학습 자

    료를 구축하는 실례를 보였다.

    본고에서는 산문 자료로서 학습자 산문 텍스트 114편의 학습 단계별 · 글의

    수준별 어휘 지표를 계량적으로 조사하여 학습 단계별 어휘지표가 중등, 고등,

    대학 및 일반으로 올라갈수록 상승선을 그리고 있음을 알 수 있었고 글의 수준

    별 어휘지표는 입선작, 동상, 은상, 금상, 대상과 양적인 상관관계가 나타나지 않

    음을 알수 있었다. 운문 자료로는김영랑의 시 86편의 말뭉치를 구축하고 그계

    량 정보를 분석하여 김영랑은 한두 개의 짧은 연으로 된 단조로운 구성을 선호

    했다는 점, 그의 시 작품의 음소계량 결과를 보면공명음의 비중이 높은 편이며

    공명음이 ‘ㄴ, ㅁ, ㅇ, ㄹ’의 순으로 많이 등장한다는 점, 전반기에 비해 후반기에

    서 작품 한 편당 연·행·어절·음절의 수가 많다는 점 등을 파악할 수 있었다.

    [주제어] 국어 정보화 교육, 국어교육 정보화, 어휘지표, 김영랑시 계량정보

  • 국어 정보화 교육 자료 개발과 활용 방안 연구 213

    ■Abstract

    A Study on Developing and Applying the Materials of

    Computerized Linguistic Information of Korean

    Min, Hyun-sik․Kim, Ki-hoon․Yoon, Kyeong-wook

    This study investigated the educational contents that help learners identify

    the linguistic features of Korean. We called it the education related to the

    computerized linguistic information of Korean. In today’s information-oriented

    society, we need to realize the status of computerization linguistic information

    of Korean and enhance the related linguistic ability.

    Constructing and analysing a corpus enables us to provide the meaningful

    contents in the education related to the computerized linguistic information of

    Korean. Two types of corpus were examined. First, literary-written text

    was examined. The vocabulary indexes of the essays of learners were

    analyzed in terms of the learning steps of the writers and the levels of the

    writings. Second, poetry text was examined. We constructed a corpus of 86

    poems of Kim Young-rang, and the quantitative information about the

    phonological properties and the respective characteristics on the first half and

    the second half of Young-rang’s poems were analyzed. As a result,

    significant findings were reported.

    [Key words] the education related to the computerized linguistic information

    of Korean, the computerization of Korean language education,

    vocabulary index, the quantitative information of Kim

    Young-rang’s poems