50
1 総合研究の概要 1 1 研究の目的と方向性 この総合研究目的は,以下のようなものであった。 コーパス言語学(コーパスを利用した言語研究)は,近年盛んになりつつある研究分 である。各言語について多種多様なコーパスが提供されるようになって,それらをする研究われつつある状態である。 本研究では,研究対象言語なる研究者えて,情報処理専門とする研究者 参加して,それぞれが個別のテーマで研究めるとともに,3 共同研究会開催して,相互にコーパス言語学としての方法論中心討議い,それぞれの専門 分野研究他分野視点からえて,研究としてどのようにあるべきか,どうすれば より効果的研究として進展させうるのかを共同討議する。 我々は,平成 29 年度内3 わせ5 18 9 21 2 27 )をき,お いの研究進捗状況報告しあい,質疑応答ってきた。 個別研究成果は,それぞれの専門領域でないと妥当評価はむずかしいが,方法論専門分野えた議論可能である。共同討議では,このようにして,なる個別研究ない,相互知見交流われ,共同のノウハウなどのでコーパス言語学一層発展 期待できる。ここに本研究最大意義がある。 以下では,個別研究成果について簡略にまとめておく。 保阪はドイツdoch 機能 付加疑問文での応答詞心態詞接続詞)の実例して,英語やイタリアとの対訳して,様々表現されることをらかにした。た 257 研究代表者荻野 綱男 国文学科研究分担者保阪 靖人 (ドイツ文学科板倉  歌 (ドイツ文学科塚本  聡 英文学科田中ゆかり 国文学科韓  東力 情報科学科コーパス言語学の学際的研究 平成 29 年度 人文科学研究所総合研究 研究報告

コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

1 総合研究の概要

1- 1 研究の目的と方向性

この総合研究の目的は,以下のようなものであった。コーパス言語学(コーパスを利用した言語研究)は,近年盛んになりつつある研究分

野である。各言語について多種多様なコーパスが提供されるようになって,それらを利用する研究が行われつつある状態である。本研究では,研究対象の言語が異なる研究者に加えて,情報処理を専門とする研究者

も参加して,それぞれが個別のテーマで研究を進めるとともに,年3回の共同研究会を開催して,相互にコーパス言語学としての方法論を中心に討議を行い,それぞれの専門分野の研究を他分野の視点から考えて,研究としてどのようにあるべきか,どうすればより効果的な研究として進展させうるのかを共同討議する。我々は,平成29年度内に3回の打ち合わせ会(5月18日,9月21日,2月27日)を開き,お

互いの研究の進捗状況を報告しあい,質疑応答を行ってきた。個別の研究成果は,それぞれの専門領域でないと妥当な評価はむずかしいが,方法論は各

専門分野を超えた議論が可能である。共同討議では,このようにして,単なる個別の研究でない,相互の知見の交流が行われ,共同のノウハウなどの形でコーパス言語学の一層の発展が期待できる。ここに本研究の最大の意義がある。以下では,個別の研究成果について簡略にまとめておく。保阪はドイツ語のdochの機能(付加疑問文での応答詞,心態詞,接続詞)の実例を取り出して,英語やイタリア語との対訳を通して,様々な形で表現されることを明らかにした。た

257

研究代表者:荻野 綱男(国文学科)研究分担者:保阪 靖人(ドイツ文学科)

板倉  歌(ドイツ文学科)塚本  聡(英文学科)田中ゆかり(国文学科)韓  東力(情報科学科)

コーパス言語学の学際的研究

平成29年度 人文科学研究所総合研究 研究報告

Page 2: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

とえば文脈によってdochの意味は(英語で示せば)now,however,butなどのバリエーショ

ンが見られる。また,指示代名詞や関係代名詞として使用されるderenのコーパスでの分布を調べ,指示代名詞が特定の構文に使われやすいことを明らかにした。板倉は,形容詞süßと名詞の連語を調査対象とし,süßがどのような名詞と共起し,その際どのような意味機能を持つか,コーパスデータをもとにボトムアップ方式で探った。塚本は,古英語から近代英語にわたる史的コーパスを使用し,限定詞(determiner)の有

無が時系列としてどのように変化しているのか,その状況を調べた。その結果,次第に限定詞の付加率が高まり,中英語の終了の1500年ころには現代英語の用法と同様の使用率を示すことが明らかになった。田中は,携帯メイルコーパスの整備を進め,絵文字について研究を行った。全データに使

用される絵文字コード(ユニコード)と具体的絵文字の結びつけが完了した。その上で,絵文字の延べ・異なり数と,それぞれが年度や携帯電話会社によってどのように多用されるかをグラフ化した。荻野は,鉛筆・エンピツ・えんぴつの表記のゆれを調べ,漢字表記(鉛筆)は正式なもの,

伝統的なものに多く使われ,カタカナ表記(エンピツ)は固有名詞性が強いものに多く,ひらがな表記(えんぴつ)はこども向けの商品名などに多く使われることを示した。また,「激化」を「げきか」と読むか,促音化させて「げっか」と読むかを調べ,形態素の切れ目の直前の部分は促音化しにくいことなどを明らかにした。韓は,Twitter上の発言データを用いてオノマトペ用例コーパスを構築し,それぞれのオノマトペの利用パターンを調べ,それに当てはまらないものを自動的に除去する研究を行った。

それぞれの研究は,コーパス利用の方法論の研究であるとともに,コーパス言語学のあり方を考える上での実践例とも位置づけられる。言い換えれば,コーパス言語学をめぐるそれぞれの応用例でもある。それぞれの研究に関して,今後のさらなる発展に期待したい。

1- 2 本稿の構成

本稿は,共同研究会で発表されたものを中心に,その後の研究も一部加え,平成29年度の1年間の研究成果をとりまとめたものである。共同研究とはいえ,研究の具体的な進行までを共同して行ったわけではなく,それぞれの個々のテーマごとの研究については,ほぼ各個人が行った研究である。各章ごとに執筆したため,若干記述スタイルに違いが見られるが,それは,それぞれの学問的伝統などによるものであり,簡単に統一できるようなものではない。そのため,あえてそのままで原稿化している。ここでは,各章の担当者を明記しておきたい。目次に該当するものでもある。

258

Page 3: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

2章: 会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

並びに関係代名詞・指示代名詞derenの使用について 保阪靖人3章:形容詞süßと名詞の連語の意味関係について 板倉歌4章:限定詞(determiner)の有無の時系列変化 塚本聡5章:「携帯メイルコーパス」の公開を目指したデータ整備についての経過報告 田中ゆかり6章:WWWから探る日本語のゆれ 荻野綱男7章:Twitter上の発言データを用いたオノマトペ用例コーパスの構築 韓東力

2  会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch並

びに関係代名詞・指示代名詞derenの使用について

2- 1 はじめに

今回のプロジェクトにおいては,二つの作業を行った。一つは本研究者が収集した映画における会話データ(約40万語)に基づいたドイツ語のdochの主に応答詞 1)としての使用実態の調査である。もう一つは書き言葉の観点からの考察であり,関係代名詞・指示代名詞のderen(英語whose)の使用のパターンについての分析である。前者の研究では,dochの基本パターンからどのように用法が拡張されていったのかを実際のデータで具体的に示すことを目的としており,後者の分析ではderenがどのようなパターンで使われるのかを明らかにすることを目的としている。

2- 2 dochについて

2- 2- 1 dochの基本的用法

dochには次のような用法が挙げられる 2)。

(1)a. 前の部分で述べていることについて,逆接的に受ける。「それにもかかわらず」b. 否定の疑問文に対して,返事が肯定になる場合に使用される。c. 命令文で使用される。「是非」d. 並列接続詞としての「しかし」

いくつかの用法に分類はされているが,相手の意見,あるいは既に自分が述べたことについて反論する時に用いられるのがdochの基本と規定していいであろう。本稿では(1b)の

dochの用法を「応答詞doch」と呼ぶことにする。英語ではyes-no疑問文に対してyes/noを

受け答えとして使用するが,ドイツ語では ja/nein/dochを用いる。次節ではまずこの応答詞の基本パターンについて述べる。

259

Page 4: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

2- 2- 2 応答詞の基本パターン

英語学習において,日本語との違いが問題になるのは,否定の疑問文に対する答え方である。まず肯定の疑問文について見てみよう 3)。

(2)a. Ist er beschäftigt? - Ja, er ist beschäftigt./ Nein, er ist nicht beschäftigt.

b. Is he busy? - Yes, he is. / No, he isn’t.

上記の例で分かることは決定疑問文に対しては,ドイツ語は ja/nein,英語はyes/no,で

答えることである。次に否定疑問文に対する答え方を見てみよう 4)。

(3)a. Ist er nicht beschäftigt? - Doch, er ist beschäftigt./ Nein, er ist nicht beschäftigt.

b. Is he not busy? - Yes, he is. / No, he isn’t.

上記の例から分かることは,否定疑問文に対して英語は肯定の疑問文と同じように,yes/

noで答えるのに対して,ドイツ語はdoch/neinで答えることである 5)。日本語では「彼は忙しくないのですか? --いいえ,忙しいです/はい,忙しくありません」と答えるので,ドイツ語は日本語の「いいえ,忙しいです」に対応している点で分かりやすいと言える。英語の答え方は次のように否定辞があれば,必ずnoという応答詞が使われると考えればよい 6)。

(4)No, he isn’t.

他方,日本語の応答は,質問が正しいかどうかについて判断を下しているのであり,質問文が肯定文か,疑問文であるかには依存していない 7)。この否定疑問文に対する答え方は,英語の付加疑問文においても同じである。

(5)a. He is busy, isn’t he? - Yes, he is. / No, he isn’t.

b. He isn’t busy, is he? - Yes, he is. / No, he isn’t.

英語におけるyes/noの使い方は一貫しており,答えとなる文が肯定であればyes,否定であればnoである 8)。英語は次のように,定動詞に対応した付加疑問文が使用される。

(6)a. It’s good, isn’t it? 9)

b. You like spicy food, don’t you?

上記のように,英語は主文の動詞によって付加疑問の動詞が決まる。このような仕組みは

260

Page 5: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

ドイツ語には存在しない 10)。ただし,日本語で言えば「~ですよね」とか「だね?」などに該当するドイツ語の表現は存在する。コーパスから実例を挙げる。

(7)A: Das hier ist ein magisches Haus, nicht wahr? [WS: 00:26]11)

B: Ja, doch ...

(8) A: Ich danke dir. Wir müssen zurück, nicht wahr? [WS: 0:38]

B: Es ist seltsam ...

(9)A: Das war’s nicht wert, nicht wahr? [PIF: 00:51]

B: Nein.

(10)A: Früher haben wir so was oft gesehen, nicht wahr? [Ponpoko: 01:09]

A: Zum Beispiel die Laternen-Parade der Füchse, stimmt’s?

B: Ja, in der Tat, das hat man früher haüfiger gesehen

(11)A: Sie sind alle Individuen ... Und Sie sind gesund, nicht wahr? [Awakenings: 01:35]

B: Ja.

(12)A: Dein Papa fehlt dir, Haihappen, nicht wahr? [Finding Nemo: 00:46]

B: Ja.

(13)A: Die beiden lieben sich, nicht wahr? [SDH: 02:12]

B: Ja, aber sie leben in verschiedenen Welten.

以上の例において,nicht wahr?や,stimmt’sが使われている。実際にはこのほかにも付加疑問的な効果を引き起こす表現が存在する 12)。これらの表現は否定文,肯定文の違いなく使用される点でも日本語の「ね?」・「ですよね?」などの疑問表現と類似している。英語とは異なり,否定文においてもwahr?ではなく,nicht wahr?が使用される。

(14)A: Ich meine, das war doch nicht Veterinär-Psychologie, nicht wahr? [GD: 00:28]

B: Waren ... Waren Sie denn nicht in Vorlesungen, wo so was behandelt wurde?

また,(8)や(14)のように,nicht wahr?に対して必ずしも ja/neinが受け答えに使われているわけでない。また(11)~(13)の答えから,nicht wahr?が否定疑問文として解釈されて

261

Page 6: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

いないことも分かる。もし否定疑問文として解釈されるのであれば,dochで答えなければならない。この点からもnicht wahr?をはじめとする一連の付加疑問文形成表現は付け足し的な用法であることが分かる。なお,この付加疑問文の答え方については,データ収集をさらに広げてDWDS

13)を利用しても同じ結果が得られている。下記の例はその一部である。

(15) A: Und, Frau Löffler, wenn ich Sie noch ergänzen darf: Da ist ja das ganz wichtige Wort,

wir erleben ja den Versuch eines Exorzismus.

B: Er will ja aus den Kreaturen , die er im Keller gefangen hat, will er ja die Nazi-Bestie

her- ausbeschwören, nicht wahr?

A: Ja. (Das Literarische Quartett vom 18. Februar 1991)

(16)A: Aber diese ironische Huldigung an den Schmierenkomödianten hab’ ich noch vor mir.

B: Ihre Lebensmaxime lautet “Und’s ist alles nicht wahr”. Für einen Schauspieler ein

geradezu gefährlich naheliegender Satz, nicht wahr?

A: Ja, vielleicht. ( „Ich bin ja so gehemmt “, in: Der Spiegel 22.07.1996, S. 152-154)

以上の事を踏まえた上で,ドイツ語の否定疑問文に対して,「いや,いいえ」の意味合いで使用される応答詞dochの拡張された用法について検討する。

2- 2- 3 応答詞 dochの拡張用法

応答詞dochは疑問文の答えとして必ずしも用いられるわけではない。このことは英語においても観察出来る。

(17)A: Er kommt zurück!   [Spider-Man: 01:39]

B: Hör zu. Du musst da runterklettern.

A: Ich kann nicht.

B: Doch, kannst du!

(18) A: He’s coming back!

B: Listen. I need you to climb down.

A: I can’t.

B: Yes, you can!

英語の例(18)を見て分かるように,「私にはできないわ。」に対して,「いや,できるとも」と叫んでいる場面である 14)。応答詞よりも拡張して使われている 15)。

262

Page 7: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

(19)A: Machen Sie daraus eine amerikanische Durchschnittsnase! [Roxanne: 00:42]

B: C.D., Sie wissen, das geht nicht.

A: Doch, doch, Sie können das, Dave, Sie kriegen das hin. Holen Sie das Messer! Und

dann weg damit!

この例も同じであるが,この例では,「それはできないよ」というBの発言に対して,「いやいや,あなたにはできるよ。やってのけられるよ。メスを手に取って,(私の長い鼻を)取り除いてくれよ」と述べている。相手の(nichtやkeinを伴う)否定的な発言に対して,「いや,できるよ」と伝えている。つまり,辞書に書かれているような「否定の意味を質問に対する肯定の返事として」だけ使われるわけではない。このように応答詞dochは,その機能を会話の状況において広く使われていることが(18),(19)の例から分かる。(18)の例を見る限り,英語でも同じような拡張があると見えるかもしれないが,そうではない。(18)は

あくまで表現したい文の肯定・否定に関わるyes/noである。たとえば次の例を見てみよう。

(20)A: Conner, was ist mit dir? Du weißt es doch. [IAS: 00:19]

B: Nein, weiß ich nicht!

A: Doch du weißt es. - Das hast du aufgeschrieben! Weißt du’s noch?

(21)A: Conner. What are you doing? You know this stuff.

B: No. I don’t.

A: You do know it. - You wrote that part, remember?

この(20)と(21)の例を比べると,dochは強調を表すために使用されている。形式上は「しかし」あるいは「でも」になるが 16),一部の辞書で記述されているように,dochではaberの

意味がさらに強調されている 17)。次の例で見てみよう。

(22) Doch auf welcher Art wollen wir ihn zubereiten? Das ist hier die Frage ... [Ratatouille:

00:06]

(23)Now, exactly how we cook this is the real question.

この例では,dochがnowと対応していて,「でもどうしたら ...」というニュアンスが出ている。複言語のコーパスを利用すると,日本語の辞書では見られない使い方が発見できる。次のような等位接続としての表現も見られ,ドイツ語のdochは幅広い用法があることが分かる。

263

Page 8: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

(24)a. (D) Doch der Antichrist hatte wieder einmal gesiegt. [NR: 01:42]

b. (E) But the Antichrist was victorious once more...

前文,あるいは先行する発話に対して,対立・反対を表す意味合いを持つdochは,接続詞,副詞,あるいは心態詞 18)として幅広く使われ,その使い方を厳密に区別するのは難しい。このdochの機能を日本語にどのように訳出するか,あるいは他の言語でどのように表現するかは常に課題となっている。たとえばドイツ語・英語・イタリア語の次の例を比べてみよう。

(25)a. (D) Er ist ein guter Mensch, der Doktor. Das weiß doch jeder. [MR: 00:08]

b. (E) He is a kind man, the doctor. Anyone can see that.

c. (I) È buono, il dottore. Si vede subito.

「そのことは誰でも知っている(よね)」という意味合いで使われおり,英語では,Anyone

という形で「誰でも」が強調されており,イタリア語ではその表現がない代わりに,subito「た

だちに,すぐに」という表現が加えられている。ドイツ語以外のデータを収集することによって,ドイツ語のdochの訳出のヒントになるであろう。

2- 3 関係代名詞・指示代名詞 derenについて

関係代名詞deren(女性名詞属格ないし複数名詞属格形)は次のように使われる。

(26)a. Da  ist  die Frau,  deren  Mutter  ich gut  kenne.

There is the woman whose mother I well know.

(There is the woman whose mother I know well)

b. Da  ist  die Frau,   mit deren Mutter  ich einmal über dich gesprochen habe.

There is the woman with whose mother I once about you talked have.

(26a)はよく教科書にも掲載されている例であり,「そこにいらっしゃるのは,お母さんのことはよく存じ上げている女性です」という表現である。(26b)は,「そこにいらっしゃる

のは,あなたのことについてお母さんと話したことがある女性です」という表現であり,mit

der Mutter der Frauの下線の部分が関係詞化されている。関係節の先頭には,関係代名詞を含む名詞句(DP)ではなく,それを含む前置詞句PP (mit deren Mutter)が前置されている 19)。この属格の関係詞を日本語にそのまま移すのはその基本的な仕組みが異なるために難しいことが多い。たとえば,直接目的語(対格目的語)や,主語(主格)の場合には次のよう

264

Page 9: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

に比較的容易に日本語化することができる。Φは空所を表し,本来は先行詞(日本語では後に生じるが)と同じ要素が存在していたと考える。

(27) a. Der Fisch, den ich gegessen habe

b. (わたしが Φ 食べた)魚が

(28)a. Der Mann, der den Fisch gegessen hat

b. (Φ その魚を食べた)男が

ドイツ語では関係代名詞に相当する表現が文頭に移動するのに対して,日本語では削除されている 20)。日本語では関係詞化される要素が削除されるために,先行詞が修飾節(関係節)の中でどのような文法役割(主語,目的語,副詞表現など)を果たしているのかが明確にならないため,次のような削除されたと考えられる空所が見いだせない表現も存在する。

(29) [就職が大変な]物理学,[卒業がたいへんな]言語学-どの学問も容易ではない。(Kuno

(1973: 255))

属格の関係代名詞にはderen(女性名詞・単数,複数形),dessen(男性名詞・単数,中性名詞・単数)が存在するが,今回はderenを含む約1万例について調査を行った。なお,このderenは次のように指示代名詞としても使用される。

(30)Deren Mutter kenne ich gut.

Her/Their mother know I well.

(HER/THEIR mother, I know well.)

指示代名詞の働きは一般の代名詞とは大きく異なる。

(31)a. John talked to Bill about his mother.

b. Hans sprach mit Peter über seine Mutter.

c. Sabine sprach mit Maria über deren Mutter.

(31a)のhisは John/Billを指示するのと同じように,ドイツ語の(31b)においてもseineは

Hans/Peterを指示しうる。しかしながら,(31c)の指示代名詞はMariaのみと同一指示となる。このように,指示代名詞の場合には,線状の順序に依存する解釈が行われる。次の2-3-1では,derenを含む関係代名詞という複合文を形成する場合の特徴を明らかにし,

265

Page 10: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

2-3-2では指示代名詞としてのderenの特性について検討する。

2- 3- 1 前置詞付き関係代名詞 derenについて

検索に使用したコーパスは,マンハイム国立ドイツ語研究所のCOSMASIIの中のW-öffentlich

(書き言葉コーパスアーカイブ)である。derenでヒットした用例は1,056,943例,そのうち10,000

例を取り出し,関係代名詞の例を取り出した作業の結果が次になる 21)。

(33)a. 前置詞無しの例:4,888

  b. 前置詞付き関係代名詞の例:1,676

(26a)のようにDPが関係節の先頭を形成している場合が(33a)であり,(26b)のようにPP

が関係節の先頭を形成している場合の割合が,(33b)である。この結果からDPのみのシン

プルな形式が多いことが分かる。また,指示代名詞よりも関係代名詞として使用されることが多い。次にその一例を挙げる。下線が関係節の先頭を形成するDPであり,斜体字が先行詞となる 22)。

(34) 600 Franken pro Semester betragen die Studiengebühren für Studierende, deren Eltern

beim Erwerb der Matura des Studenten oder der Studentin in der Schweiz oder im

Fürstentum Liechtenstein wohnhaft waren. Ausländer zahlen eine Gebühr von 750

Franken pro Semester. (A97/APR.01129 St. Galler Tagblatt, 29.04.1997, Ressort: TB-SG

(Abk.); Dienstag, 29. April 1997) 「関係節の部分の訳:高校卒業資格を得るときに,その両親がスイスかリヒテンシュタインに居住地を持つような学生の学費は,一学期600

スイス・フランとなる。」

全体の二割弱と少しの用例しかないが,(33b)で挙げたように,前置詞付き関係代名詞の例が存在する。前置詞別に分類したのが次の表である。

(35)

前置詞との共起一覧(カッコ内は用例数。*は(36)を参照。)an (159) 9% anhand (1) anlässlich (1) anstelle (1)

auf (161) 10% aus (39) 2% bei (75) 4% bis (1)

dank (5) durch (15) für (168) 10% gegen (9)

gegenüber (3) hinter (5)*

in (465) 28% infolge (2)

innerhalb (4) mit (158) 9% mittels (2) nach (18)

ohne (45) 3% über (90) 5% *um (12) unter (48) 3%

von (54) 3% vor (7) zu (128) 8 %

266

Page 11: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

用例としては1万例の中の約2000例であるが,その中で目につくのは次の二点である。

(36)a. in との共起が多い。b. umは用いられることが少ないが,実は指示代名詞として使用されるum .... zu (英語

in order to ) の用例(72例)が圧倒的に多い 23)。

前置詞 inと共起しやすい名詞を次に挙げる。

(37) Verlauf, 57(12%) Rahmen, 35(8%) Mittelpunkt, 34(7%) Folge, 20(4%) Reihen,

20(4%) Zentrum, 16(3%) Besitz, 15(3%) Mitte, 13(3%) Namen, 11(2%) Nähe, 5(1%)

Verwaltungsrat, 5(1%) Auftrag, 4(1%) Leben, 4(1%) Outfit, 4(1%) Umkreis, 4(1%)

Erdgeschoss, 3(1%) Gefolge, 3(1%) Genuss, 3(1%) Händen, 3(1%) Schoss, 3(1%)

Umfeld, 3(1%) Zug, 3(1%) Zusammenhang, 3(1%)

慣用的に用いられる場合(Zusammenhangなど) もあるが,場所的意味合いで使用される表現(Rahmen, Mittelpunkt, Reihen, Zentrum, Mitte, Nähe, Umkreis)が多く,日本語で言えば,「その~において」という形で使われるのが P + deren + N のパターンであるという一つの傾向が見える。ここで次節で扱う指示代名詞との関連で,(36b)で指摘したum... zuについて触れる。

(36b)の基本パターンは(38)であり,実例は(39)である。

(38)Die Trauben werden früh gelesen, um deren Frische zu erhalten.

(39) «Es braucht Kompetenz, um in Führungspositionen zu kommen», sagt Ingrid Markart;

aber das gelte für beide Geschlechter. Es sei aber auch eine Frage des Systems, hat sie

bei ihrem Einstieg erfahren. Dieser erfolgte bei der Polizei, wo ein absolut hierarchisches

Führungsprinzip herrscht. «Bei meinen ersten Führungsschritten wurde ich sehr

stark beobachtet», erinnert sich Markart, damals frisch backene ausserordentliche

Untersuchungsrichterin. Mit ihrer offenen und spontanen Art hat sie die Polizisten aber

auch beeindruckt - beispielsweise, als sie an einem Open-Air-Wochenende Pikettdienst

hatte und statt zuhause auf ein allfälliges «Aufgebot» zu warten, gleich mit den Fahndern

ausrückte, um deren Arbeit vor Ort kennen zu lernen. Man erkenne mit der Zeit seine

Stärken und müsse sich nicht mit überdimensionierter Leistung behaupten. Ingrid

Markart gehört zur jüngeren Generation, die den langen Kampf um Gleichberechtigung

und Frauenstimmrecht nicht mehr selber mitgefochten hat. Allerdings ist er ihr nicht

267

Page 12: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

unbekannt - zu ihrer Unizeit gab es gerade mal zehn Prozent Frauen an der HSG. (A00/

JUL.49631 St. Galler Tagblatt, 24.07.2000, Ressort: TB-OST (Abk.); «Überzeugungskraft

statt Macht»)

(38)においても,主文に提示された要素(die Trauben)を受けてderenが使用されている。このように直前の要素を受けるのが指示代名詞のパターンであり,そのことは(39)でも明らかである。このように提示された直前の要素を指示するのが指示代名詞の機能であり,そのためにum ...zuとの共起頻度が高い。この指示代名詞の機能ゆえに指示代名詞derenの出現パターンはある程度限定される。このことについて次節で述べる。

2- 3- 2 指示代名詞 derenのパターンについて

指示代名詞derenは,(38)以降で述べたように,直前の要素を受けることから,その表現形式が限定される傾向がある。括弧はデータ数である。

(40)a. undの直後に共起。(93)

b. dassの後に共起。(111)

c. wenn(30),wie(57),aber(29),da(23)...などの接続詞の後に共起。d. 前文の発言内容を受ける場合に生じる。(sagen 65, erklären 22)

このパターンは直前の要素を受けるために形成されたと考えられる。たとえば,(40a)に

ついては,次のような基本パターンがある。

(41)a. die Frau und deren Mann「その婦人と,彼女の夫」b. Ich haben die Frau geshen, und deren Mann hat ....「私は婦人に会いました。そしてその婦人の夫は ...」

一つ目の(41a)は任意の要素の等位接続であるが,二つ目の(41b)は提示されている話題要素(ここではdie Frau)を受けて,さらに文を続けるための役割を果たしている。この既出の要素を受けて文を続ける機能は,(40b, c)の接続詞にも見られる。また(40d)は,......,

sagte deren Präsident ....「~と,その社長は述べた」などのパターンが多用されており,derenは直前の文において述べられた会社名を指し,「その会社の社長」という形で前文との緊密性を保つために ihr Präsidentではなくて,deren Präsidentが用いられている 24)。

2- 3- 3 derenと結びつく名詞について

本節では,derenと結びつく傾向の強い名詞について観察していくことにしたい。属格の

268

Page 13: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

用法にも様々な提案があるが,ここでは次の5つに絞る 25)。

(42)a. Der Sohn des Vaters「父の息子」(人間関係)b. Das Auto des Vaters「父の車」(所有)c. Die Rückkehr des Vaters「父の帰還」(主語)d. Die Realisierung des Plans「計画の実現(計画を実現すること)」(目的語)e. Der erste Teil des Buchs「その本の第1部」(部分)

deren+名詞のパターン約9000例の中で,1パーセント強の結びつきとなるのは次の4語である 26)。

(43)Eltern(130例,1.3%)Kind(124例,1.2%)

Name (121例,1.2%) Präsident (121例,1.2%)

既に(24)の例文で示したように,「両親,子ども」などの家族関係の語彙はこの結合パターンにはよく見られる。家族関係の語彙を数え上げると564例(5.8%)になる 27)。また,例文(37)の説明で挙げたPräsident「大統領,長官,社長」などの職名(Boss,Chefなど)をさら

に含めると,1180例(12.2%)となる。このように,属格+名詞の場合には組織(家族も含む)の中の一部を取り出して説明するのに主に使われることがこの頻度の調査から知ることができる。このことは(42a, b)に該当するであろう。「人間関係,所有」という,この属格の関係代名詞(並びに指示代名詞)用法が大きな比重を占めることは,他の要因からも明らかとなる。たとえば次のような「部分を表す語」が上位にランクされる。括弧内はデータ数である。

(44)Zahl(71) Ende(33) Teil(26) Anteil (23)

また特徴的なのは名詞とともに使用される形容詞である。名詞が数・順序・割合を表すと,共起する形容詞もある一定の傾向が見られる。たとえば,erst- 「最初の」が用いられている例は54例あり,次のような頻度が見られる 28)。総計で163例挙げられる。

(45)erst-(54) letzt-(17) neu-(17) einzig-(14) groß-(11) klein- (9)

best- (4) hoch (4)

また,次のようにNPのヘッドがなく,数のみと結合している例は238例もある。

(46) Johann Sebastian Bach war nicht nur ein Kantor an der Leipziger Thomaskirche, der

gelehrte Fugen schrieb. Er lieferte auch für weltliche Ereignisse seine Beiträge. Zum

269

Page 14: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

Beispiel Kantaten für (fürstliche) Hochzeiten, deren drei Christine Schäfer präsentiert.

Die deutsche Sopranistin ist eine der vielseitigsten in ihrem Fach - sie singt Mozart

(«Entführung aus dem Serail»), wie die Lulu in Alban Bergs Oper. Und barocke

Koloraturen bereiten ihr keine Mühe. Dass sie sich dabei dem Draufgänger Reinhard

Goebel und seiner Musica Antiqua Köln anvertraut, zeugt von selbstbewusstem Mut.

(A99/NOV.77751 St. Galler Tagblatt, 05.11.1999, Ressort: TB-KUL (Abk.); Weltlicher

Bach, expressives Requiem) イタリックの部分のみの訳「たとえば,王侯の結婚式でのカンタータのうち,三つはクリスティーネ・シェーファーが歌っている」

数字のみが使用される例並びに(44)のタイプの例を合わせて401例になることも,このタイプが好まれて使用されていることが分かる。また,形容詞に目を向けると,(45)のタ

イプが使われる事によって,それと結合する名詞の選択に影響が出る。たとえば,Teilと(45)

のタイプの形容詞の結合例は「形容詞+Teil」の全用例399のうち215(54%)にもなる。

以上のことから,新聞などの書き言葉におけるderenの使用では部分・数量・割合を表す表現と結びつくことが多く,deren+形容詞+名詞 の場合にもその形容詞の使い方はこの傾向と結びついていることが分かり,一つのスタイルを形成していることが明らかとなった。

2- 3- 4 会話文での derenの使用について

本研究で使用している映画の会話コーパスの中で,derenの使用回数は次の通りである。書き言葉コーパスでは,約400億語のコーパスの中で,1,056,943個のデータがあったことを斟酌すると,ほぼ同じ割合であると言えるが,会話のデータの中には関係代名詞としての用法が明らかに少ない。これは複合文が会話では使用されにくいことと関係しているのであろう。

(47)a. 関係代名詞(DP)  2例b. 関係代名詞(PP)  2例c. 指示代名詞  5例d. 目的語    1例

実例を以下に挙げる。

(48) a. Dieses Zelt ist für Champions und deren Freunde. [HP4: 00:53]

b. Um die Menschen gründlich zu studieren und sich über deren Alltag zu informieren,

ließ man im Hauptraum des Manpaku-Schreins einen Fernseher aufstellen. [Ponpoko:

00:08]

270

Page 15: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

c. Einer Abtei, deren Namen man heute noch besser verschweigen sollte.[NR:00:01]

上記のa,bは指示代名詞の用法であり,直近の要素を指示するために使われている。(48a)

では deren = Champions であり,(48b)では,deren = Menschen である。指示代名詞はその機能ゆえに会話においてもよく使用されている。話し言葉では明らかに使用頻度が高い。(48c)は関係代名詞の用法であるが,既に(43)で示したように,高頻度の名詞であるName

と共起していて,典型的な使用例であることが分かる。

2- 4 最後に

今回はドイツ語のdoch,並びにderenについてのその使われ方,機能についてコーパスを利用して明らかにしてきた。コーパスを使うことで,予想されることを数量的に確認することができる。また曖昧な表現を他言語と比較することによってその用法を正確に捉えることができる。今後はさらにコーパスを整備して意味や表現をさらに正確に把握する可能性を追求したい。

3 形容詞süßと名詞の連語の意味関係について

3- 1 はじめに

本章ではドイツ語味覚形容詞süßの意味に注目する。Dudenにはsüßについて下記の記載があるが,本章では特に,形容詞süßと名詞の連語を調査対象とし,süßがどのような名詞と共起し,その際どのような意味機能を持つか,コーパスデータをもとにボトムアップ方式で探る。

süß

1. a. in der Geschmacksrichtung von Zucker oder Honig liegend und meist angenehm

semeckend; nicht sauer, bitter

b. in seinem Geruch süßem Geschmack entsprechend

2. a. (gehoben) zart, lieblich klingend und eine angenehme Empfindung hervorrufend

b. (emotional) [hübsch und] Entzücken hervorrufend

c. (emotional, oft gehoben) eine angenehme Empfindung auslösend

3. [übertrieben] freundlich, liebenswürdig

Duden Online (https://www.duden.de/rechtschreibung/suesz)

3- 2 調査の方法

本稿調査では,Institut für Deutsche Sprache (IDS)のコーパスCOSMASⅡを使用した。COSMASⅡの書き言葉コーパスのうち,雑誌『FOCUS』のコーパスを調査対象とし,2012

271

Page 16: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

年1月1日から2016年12月31日までの5年間を対象期間とした。名詞を修飾する付加語的用法のsüßを検出し,名詞による分類を行い,süßと共起語の意味関連を分析した。

3- 3 名詞による分類と süßの意味用法

上記『FOCUS』5年分の資料から合計161例の「形容詞süß+名詞」が検出された。連語の中の名詞をボトムアップ方式で分類したところ,食物に関する名詞,人間や動物に関する名詞,人間の生活や活動に関する名詞という3つの大きなグループが浮かび上がった。それぞれについて下記に述べる。

<食物関連の名詞>まず,süßとの連語が最も検出されたのが,食物,料理を指す名詞で,35件検出された(全

体の22%)。(1)は白ソーセージにつける「甘いからし」の例である。このほかFrucht(果物),Paprika(パプリカ),Joghurt(ヨーグルト),Mousse(ムース),Chili-Sauce(チリソース),

Nachtisch(デザート)などの例があるが,これらを修飾するsüßはすべて「甘い」という味覚の意味で用いられていた。

(1) In der bayerischen Landesvertretung servierte er Weißwürste mit süßem Senf, aber

Journalisten aller Couleur kamen am liebsten wegen seiner scharfen Sprüche. [FOC13/

JUL.00021 FOCUS, 01.07.2013, S. 122; TAGEBUCH DES HERAUSGE-BERS]

味覚の意味でのsüßは,飲料に関する名詞とも共起していた(2)。Getränke(飲み物),Saft

(ジュース),Limonaden(レモネード),Weißwein(白ワイン)など,飲料に関する名詞は全体の16%を占めていた。

(2) Eine Enkelin bringt süßen Tee. [FOC12/MAR.00373 FOCUS, 26.03.2012, S. 52-54; Flucht

aus dem Massakerland]

このほか食品に関する名詞とはいえ,実際の食品を指すのではなく,比喩的に用いられている場合も検出された。(3)で表されている「甘い飴」は,文脈から,ギリシャの政治家の掲げる政策を意味している。

(3) Der Zahnarzt in dieser Geschichte ist die griechische Regierung. Vielleicht trif ft sie

die größte Schuld. [......] Jetzt ist plötzlich ein neuer, junger Zahnarzt aufgetaucht

(Alexis Tsipras, Syriza), der wieder süße Bonbons verspricht. Wiederholt sich also die

Geschichte? [FOC15/JAN.00272 FOCUS, 17.01.2015, S. 62; Immer wieder Bonbons]

272

Page 17: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

食料を指しているということが文脈からはじめてわかる名詞も,全体の15%に上った。これらの名詞はStoff(材料),Stückchen(かけら),Sachen(もの),Würfel(さいころ形),Meisterwerke(傑作)などで,付加語süßは味覚「甘い」の意味であった。なおこの中には,比喩的に用いられている例もあった。(4)では「甘い爆弾」が砂糖を指している。

(4) Doch die beiden Kattas stürzen sich nicht aufs Eis, weil es schön kühlt, sondern weil

es süß ist. Fast alle Tiere sind wahnsinnig scharf auf Zucker. [.....] Die süße Bombe

überfordert die Verdauung der Tiere und schädigt ihre Zähne. [FOC12/JUL.00425

FOCUS, 30.07.2012, S. 12-13; FOTOS DER WOCHE]

以上は形容詞süßが,食料・飲料などに関する名詞を修飾する場合であった。これらの総数は,本調査データ全体の半数に上った。この場合の形容詞süßは,味覚「甘い」を意味した。なお,(5)の「甘い匂い」や(6)の「甘く心地よい響き」のように,嗅覚や聴覚に関連する例も数件ずつ数えられた。

(5) Ein dicker, süßer, honighafter, fast erdrückender Duft. [FOC15/SEP.00327 FOCUS,

26.09.2015, S. 500x; DÜFTE]

(6) Wolfgang Schäuble[.] Der süße Klang der Euro-Länder [FOC14/DEZ.00310 FOCUS,

15.12.2014, S. 150; MENSCHEN]

<人間・動物関連の名詞>形容詞süßが,Baby(赤ん坊),Kinder(子供たち),Junge(若者)など人間を指す名詞を修飾する場合(7),あるいは名詞部分が人名の場合(8)が全体の7%を占めた。これらの場合,süßの意味は「かわいい」と解釈される。

(7) Die Kinder werden zu schnell groß? Oh ja, das stimmt. Unsere Prinzessin ist jetzt zehn und

auf der Skipiste die absolute Rock’n’-Roll-Queen, und genau deshalb, für die gemütlichen

Après-Ski-Stunden auf dem Sofa vor dem Kamin, möchte ich sie in mein süßes kleines

blondes Baby zurückverwandeln. [FOC15/DEZ.00029 FOCUS, 05.12.2015, S. 138-142;

Geschenkt!]

(8) Die Ladys im Ort nennen ihn ganz angetan “den süßen kleinen Chris” , wie Mark Seal

in seinem Bestseller “Der Mann, der Rockefeller war” (btb Verlag) schreibt. [FOC12/

JAN.00123 FOCUS, 16.01.2012, S. 58-60; Ein amerikanischer Albtraum]

273

Page 18: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

動物を表す名詞の場合は7件(全体の4%)検出された(9)。なお,その中には人間が動物に例えられた場合(10)も含まれる。

(9) Ein süßer Eisbär in Not vielleicht schon. [FOC14/OKT.00127 FOCUS, 13.10.2014, S. 118;

ENERGIE SPAREN SPEZIAL]

(10) “Wow, du bist ja eine süße Maus” , schreibt mir Marco, 34. “Wow, das ist ja ein

Scheißspruch” , gebe ich zurück. Er löscht mich. Gut so. [FOC14/MAR.00122 FOCUS,

10.03.2014, S. 115; TITEL]

一方,Roboter (ロボット)など,人間や動物に姿の似た非生物を指す名詞の場合も5例検出された(11)。このうち1件Puppie(お人形ちゃん)は,人間のあだ名・呼び名(かわいい子)として用いられている例であった(12)。

(11)Zowi Ernsthaftes Spielzeug

Auf den ersten Blick ist Zowi ein kleiner, süßer Roboter. [FOC16/FEB.00233 FOCUS,

20.02.2016, S. 121; MATTINGS WARENTEST]

(12) Kurz vor seinem Tod hatte Vater mir ein Gedicht geschrieben: ” . . . und süße Puppi,

dieses ist mein Wille: Bald bin ich fern, den ewigen Schatten nah - dann ruf’s noch einmal

in die große Stille: Bonsoir, Papa . . .” Das habe ich dann auch bei seinem Begräbnis

gerufen. [FOC13/JUN.00213 FOCUS, 17.06.2013, S. 127; MEIN VATER]

これら人間や動物,その形を模したロボットなどの例は全体の17%に上った。付加語süß

の意味はこの場合,「かわいい,愛らしい」であった。

<人間の生活や活動に関する名詞>ボトムアップ方式で共起名詞を分類することによって,形容詞süßが人間の生活や様々な活動を表す名詞を修飾することが確認された。その中で最も件数の多かった名詞(7件)は,Leben(生活)であった。(13)に見られるsüßes Lebenとは,社会的地位(権力)と財力を獲得した生活ということになる。

(13) In der Pekinger Halle des Volkes soll er im November zum neuen KP-Chef gekürt

werden. An seiner Seite: Ehefrau Peng Liyuan, ein Star der chinesischen Folkloreszene[.]

Das süße Leben[.] Viele Parteifunktionäre versorgen ihre Familien mit lukrativen Posten.

274

Page 19: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

Ihre Kinder vergnügen sich in exklusiven Clubs wie hier in Peking. Die Mächtigen und

die Reichen haben sich verbündet [FOC12/OKT.00444 FOCUS, 29.10.2012, S. 48-50; Der

rote Kaiser, der China retten soll]

(14)は,人気歌手がしばらく休業していたという内容の記事である。人間の行為に関する名詞Nichtstun,つまり何もしないという意味の名詞をsüßが修飾している。この(14)と(13)

のsüßを「甘い」と訳すと,「甘い無為(の生活)」と,(最高権力と財力のある)「甘い生活」となる。どちらも同じsüßという語で修飾されているが,süßとみなされる内容(生活)は異なっている。süßという語を選択する判断基準については,さらなる用例にあたる必要がある。

(14)Pop-Comeback Liebe, Trauer, Hoffnung

[.....] “Mein Großvater aber hat mir den besten Rat gegeben: Wenn du nicht weißt, was

du tun sollst, dann mach erst einmal gar nichts.” Mitten im süßen Nichtstun kam Kollege

Tim Bendzko und produzierte mit Cassandra Steen die neuen Songs. [FOC14/OKT.00035

FOCUS, 06.10.2014, S. 150; NACHRICHTEN]

人間の行為を表す名詞の例をもうひとつ挙げる。(15)は,ドイツのコンツェルンのカル

テルと罰金を報じたものである。文脈からDeal(商取引)にかかるsüßには,利益の転がり込むうまい話というニュアンスが読み取れる。

(15) Die Bonner Behörde geht demnach davon aus, dass das Kartellverfahren, das vor fünf

Jahren mit groß angelegten Razzien bei Händlern und Herstellern begonnen hatte,

spätestens Ende März abgeschlossen sein wird. Insgesamt rechnen die Wettbewerbshüter

mit Strafzahlungen in “dreistelliger Millionenhöhe” .

Süße Deals unter Verdacht[.] Die Kartellwächter gehen von Absprachen bei Süßwaren,

Kaffee, Bier und Tiernahrung aus[.]

[FOC15/FEB.00072 FOCUS, 07.02.2015, S. 71; Lebensmittelhandel]

人間だけではなく,ゲームのキャラクターの行為にsüßがかかる例も検出された(16)。「か

わいくて,はらはらさせるパズル‐冒険」ということだが,この場合のsüßは,(「冒険がかわいい」ではなく,)キャラクターの鳥がかわいいということが反映されていると解釈される。冒険の中身とは異なるレベルからの付加語ということになり,連語と意味の関係が(14)

や(15)とは異なった構造になっている。

275

Page 20: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

(16)Das nutzen iPad-Besitzer

TOP-SPIELE-APPSG1 Candy Crush Saga

Tauschen und kombinieren Sie sich in diesem süßen und spannenden Puzzle-Abenteuer

Ihren Weg durch mehr als 300 Level. 11,8 %*

2 Angry Birds HD

Das Überleben der Angry Birds steht auf dem Spiel - Geschicklichkeitsspiel, das auch auf

Logik setzt (2,69 Euro).

[FOC13/SEP.00215 FOCUS, 16.09.2013, S. 125; FOCUS APP-CHARTS]

süßはまた,夢,希望,思い出といった人間の心理的な活動を表す名詞とも共起する。(17)

は,故人との優しい思い出ということになる。

(17) Sean verliert nun eine zweite Vaterfigur. Das wird hart für ihn, ich weiß. Aber wir teilen

einige sehr süße Erinnerungen, die uns immer erhalten bleiben werden. [FOC16/

JAN.00230 FOCUS, 16.01.2016, S. 120-121; NACHRUFE]

最後に,語義自体が食料とも人間とも関係のない名詞にsüßが共起する例を挙げる。

(18)Gesamttitel: Schlank werden - geht doch! | Das süße Lexikon

Nicht alle Lebensmittel enthalten die gleichen Zuckerarten. Die wichtigsten auf einen

Blick

Agavendicksaft Der Sirup der Agavenpflanze kann bis zu 90 Prozent Fructose enthalten

und ist damit keine kalorienarme Variante zu anderen Süßungsmitteln - auch wenn er

häufig so vermarktet wird.

Fructose (Fruchtzucker)

[FOC15/DEZ.00292 FOCUS, 19.12.2015, S. 97; TITEL]

(18)では名詞Lexikon(辞典)をsüßが修飾しているが,辞典自体が甘いのでもかわいいのでもない。文脈によると,この辞典にはいろいろな食料の糖質情報が一目でわかるように記載されているという。つまりこの辞典は,「甘いものに関する辞典」ということになり,例えば「甘いりんご」(=りんご自体が甘い)のような場合とは語と意味の関係が異なり,共起の仕方が複雑になっている。

3- 4 まとめ

本章では,コーパスデータをボトムアップ方式で分類することによって,形容詞süßが食物に関する名詞,人間や動物に関する名詞,人間の生活や活動に関する名詞と共起しやすい

276

Page 21: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

ことを示した。食物に関する名詞は調査データ全体の半分を,また人間・動物,さらにロボットなどに関する名詞も全体の17%を占め,基本語義の頻度の高さが伺えた。他方,語選択の際の基準に曖昧性の残る場合や,süßと名詞との意味構造が複雑な場合があるということが明らかになったので,これらについては今後,データを拡大してさらなる検証を図りたい。

4 限定詞(determiner)の有無の時系列変化

4- 1 はじめに

古英語(Old English 以下OE)における限定詞の用法は,現代英語の限定詞の用法とは異なり,必ずしもその使用が必須ではない。以下(1)~(9)は聖書による同一箇所を異なる時代の言語で表した例であるが,現代英語で限定詞が使用されている文脈において,OEで

は限定詞が使用されていない。

(1) On frymðe wæs word & þæt word wæs mid Gode & God wæs þæt word. (OE: John 1.1)

‘on beginning was word and that word was with God and God was that word’

(2) In the bigynnyng was the word, and the word was at God, and God was the word. (ME:

John 1.1)

(3) In the beginning was the Word, and the Word was with God, and the Word was God.

(eModE: John 1.1)

(4) Þæt wæs on fruman mid Gode. (OE: John 1.2)

‘that was on beginning with God’

(5) This was in the bigynnyng at God. (ME: John 1.2)

(6) The same was in the beginning with God. (eModE: John 1.2)

(7) Mann wæs fram Gode asend þæs nama wæs Iohannes. (OE: John 1.6)

‘man was from God sent whose name was John’

(8) A man was sent fro God, to whom the name was Joon.(ME: John 1.6)

(9) There was a man sent from God, whose name was John.(eModE: John 1.6)

すなわち,現代英語において限定詞が必須となる可算名詞単数形(cf. Quirk et al. 1985:

253)に対し,以下Traugottが指摘するように,OEでは限定詞に相当する指示詞seの使用は必須ではない。

On the other hand, se is often not present where an article or demonstrative might be

expected in PDE. (Traugott 1992: 172)

277

Page 22: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

現代英語における冠詞などが含まれる限定詞 theはOEの指示詞 seにさかのぼるが,

Traugott (1992)やFischer (1992)では,deixisとしての用法の相違などに記述の中心があり,現代英語と同様な限定詞の必須化の時期についての明確な記述はなされていない。Rissanen

は以下のように,限定詞の発達は中英語(Middle English 以下ME)であったと述べている。

In Middle English the use of the articles becomes more systematic (see Fischer CHEL ii

4.2.2), and by the end of the period an article came to be used regularly even with singular

nouns with generic reference, the type ‘A/The cat loves comfort’, as against the older type ‘Cat

loves comfort’. (Rissanen 1999: 191)

ME期に限定詞が発達したことを述べているが,400年間にわたるMEのどの時期にどのような発達・定着がなされたのかについての明確な記述はなされていない。したがって,本研究では,コーパスを用い,定冠詞(the),不定冠詞(a/an),所有格代名詞(my/yourなど),

数量詞(some, any, one)を限定詞とし,その使用が必須化された時期を明らかにすることを目標とする。

4- 2 使用コーパスおよび調査方法

本研究では,以下の構文解析されたOEから近代英語(Modern English 以下ModE)にわ

たるコーパスを使用した。

A) The York-Toronto-Helsinki Parsed Corpus of Old English Prose (YCOE)

B) The Penn Historical Corpora, including the Penn-Helsinki Parsed Corpus of Middle

English, second edition (PPCME2)

C) The Penn-Helsinki Parsed Corpus of Early Modern English (PPCEME)

D) The Penn Parsed Corpus of Modern British English (PPCMBE)

これらのコーパスは,基本的に同一の基準に基づき,構文解析されている。前掲(3)は,

以下(10)のように記述されている。すなわち,限定詞Dは,名詞句NPに直接支配され,かつ名詞Nと姉妹関係にあると分析・表記されている。

(10) =(3)

( (IP-MAT (PP (P In)

(NP (D the) (N beginning)))

(BED was)

(NP-SBJ (D the) (N Word))

278

Page 23: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

(. ,))

(ID AUTHNEW-E2-H,1,1J.6))

したがって,限定詞の有無は以下の2通りの検索式を作成し,検索を行った。複数形名詞は必ずしも限定詞を必要としないため,今回の検索では単数名詞のみを検索対象としている。また,限定詞自体の属性を確立することが目的ではないため,Sommerer(2018)が行ったような限定詞と所有格代名詞の排他的使用などの条件は課さない。

(11) 検索式:限定詞有node: NP

print_indices: true

query: (NP*

idoms [1]N)

AND ([1]N hassister D*

|PRO$|Q|ONE)

(12) 検索式:限定詞無node: NP

print_indices: true

query: (NP*

idoms [1]N)

AND ([1]N hassister !D*

|PRO$|Q|ONE)

一方OEのYCOEでは,以下(13)のように格表示が付加されているため,検索式は(14)

(15)のように設定した。

(13) =(1)

( (CODE <T06440000100,1.1>)

(IP-MAT (PP (P On)

     (NP (N frymðe)))

(BEDI wæs)

(NP-NOM (N^N word))) (ID cowsgosp, Jn_[WSCp]:1.1.5733))

(14) 検索式:限定詞有node: NP

print_indices: true

query: (NP*

idoms [1]N^*

|[1]N)

AND ([1]N^*

|[1]N hassister D^*

|PRO$*|Q^*

|ONE^*

)

279

Page 24: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

(15) 検索式:限定詞無node: NP

print_indices: true

query: (NP*

idoms [1]N^*

|[1]N)

AND ([1]N^*

|[1]N hassister !D^*

|PRO$*|Q^*

|ONE^*

)

これらの検索の結果,限定詞付名詞の比率を観察することにより,その必須化の時期を判断する。発達時期を確定するため,個々のテキストの年代をそのまま用いず,テキストの年代を25年ごとにまとめ,各期間の生起数の平均値を用いた。YCOEではテキスト成立年代が不明であることがあるため,写本の作成時期を基準にテキスト年代として扱った。

4- 3 結果

検索式(11)および(12)による検索結果は以下表1および図1のとおりである。

表 1 限定詞付比率(25年ごと平均値)(コーパス:B~ D)

年 限定詞無 限定詞有 総計 限定詞有比率%1150 483 883 1,366 65%

1200 2,986 3,264 6,250 52%

1225 9,807 11,763 21,570 55%

1275 150 260 410 63%

1325 2,683 3,159 5,842 54%

1350 1,934 3,259 5,193 63%

1375 8,169 13,085 21,254 62%

1400 5,374 9,313 14,687 63%

1425 6,621 11,638 18,259 64%

1450 9,911 22,108 32,019 69%

1475 2,034 5,592 7,626 73%

1500 6,321 15,033 21,354 70%

1525 7,272 20,173 27,445 74%

1550 9,747 22,088 31,835 69%

1575 8,533 19,559 28,092 70%

1600 7,793 21,894 29,687 74%

1625 3,891 8,589 12,480 69%

1650 6,143 16,155 22,298 72%

1675 10,458 26,122 36,580 71%

1700 3,720 8,956 12,676 71%

1725 5,854 14,571 20,425 71%

1750 2,232 6,278 8,510 74%

1775 3,587 10,417 14,004 74%

1800 5,448 12,831 18,279 70%

1825 4,176 9,795 13,971 70%

1850 3,417 8,587 12,004 72%

1875 4,532 11,136 15,668 71%

1900 2,030 5,009 7,039 71%

280

Page 25: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

1100 1200 1300 1400 1500 1600 1700 1800 1900 2000

図 1 25年ごと限定詞付比率

検索式(14)および(15)による検索結果は以下表2および図2のとおりである。

表 2 OE限定詞付比率(コーパス:A)

年 限定詞無 限定詞有 総計 限定詞有比率800 269 174 443 39%

850 707 354 1,061 33%

900 20,001 18,056 38,057 47%

950 27,317 31,997 59,314 54%

1000 53,964 60,947 114,911 53%

1025 614 654 1,268 52%

1050 6,198 5,432 11,630 47%

1075 3,539 3,044 6,583 46%

1100 1,560 2,105 3,665 57%

1125 3,458 3,415 6,873 50%

1150 1,665 2,019 3,684 55%

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

700 800 900 1000 1100 1200

図 2 OE限定詞付比率

281

Page 26: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

OEとそれ以降では検索式が異なるが,両者のデータを合算した結果を以下図3に示す。

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

700 800 900 1000 1100 1200 1300 1400 1500 1600 1700 1800 1900 2000

図 3 限定詞付比率(コーパス:A~ D)

名詞が複数形の場合には,限定詞は義務的ではない。ME期のみの複数名詞に対する限定詞の付加率は以下表3および図4のとおりである。

表 3 複数形限定詞有率(25年ごと平均値)(コーパス:B)

年 限定詞無 限定詞有 総計 限定詞有率1150 138 229 367 62%

1200 470 404 874 46%

1225 2,328 3,053 5,381 57%

1275 21 70 91 77%

1325 690 1,078 1,768 61%

1350 669 1,475 2,144 69%

1375 3,124 2,863 5,987 48%

1400 2,531 1,838 4,369 42%

1425 2,605 2,702 5,307 51%

1450 3,088 3,619 6,707 54%

1475 806 920 1,726 53%

1500 808 812 1,620 50%

282

Page 27: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

1100 1150 1200 1250 1300 1350 1400 1450 1500

図 4 複数形限定詞有率

4- 4 考察

OE期には30%程度であった限定詞の使用率が,ME終了期の1500年頃には70%に達している。しかしながら100%にはなっていない。現代英語においても,単数形として生起する不可算名詞には限定詞は必須ではない。今回の使用したコーパスには統語構造に関わる情報は記述されているが,名詞にある可算・不可算という属性は含まれていない。そのため,限定詞が必須ではない不可算名詞も一定程度含まれている。(16)には reasonという不可算名詞が限定詞無しで使用されている一方,(17)(18)のように限定詞が付加される場合もある。

(16)he gave us reason to expect him soon; (AUSTEN-180X,181.477)

(17) However, it is evident from the Instances I have given, and from the Reason of the thing,

that Latin may be learn’d after this Method. (ANON-1711,15.151)

(18) It is well understood to be a reason for borrowing foreign words, that they do not suggest

any meaning but the one intended to be coupled with them. (BAIN-1878,376.254)

したがって限定詞の使用率が100%となることは期待できない。表1によると,MEが終了した16世紀初めに,限定詞の使用率が70%に達し,その後は使用率に大きな変化が見られない。16世紀以降の安定性から,近代・現代英語では単数名詞のうち30%程度が限定詞が先行しない不可算名詞であるとみなすことができるであろう。また,限定詞が義務的ではない複数名詞の限定詞使用率は50%程度であり(表3),使用率に差がみられる。単数名詞および複数名詞の1500年での限定詞使用率(70%:50%)には有意な差(p<0.001)がみられること

から,この時期には単数名詞と複数名詞には限定詞の用法に差が存在していたこと考えることが適当である。この前提に立てば,MEの終了となる16世紀までには限定詞の用法が定着し,現代英語の用法と同様の使用となったとみなすことが可能であろう。

283

Page 28: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

4- 5 おわりに

本研究では,現代英語にみられる限定詞の義務化について,構文解析史的コーパスを使用し数量的にその確立時期を検証した。その結果,OEからMEを通し,次第に限定詞の付加率が高まり,MEの終了の1500年ころには現代英語の用法と同様の使用率を示すことが明らかになった。この事実から,限定詞の確立は1500年頃であると推定される。

5 「携帯メイルコーパス」の公開を目指したデータ整備についての経過報告

5- 1 経緯と現状

本研究課題では,故加藤安彦氏が構築してきた「携帯メイルコーパス」の公開を目指したデータ整備を中心に行った。筆者は,生前の加藤氏から同コーパスの公開を目指した整備を依頼され,故人の家族の同意の下で本作業に取り組んでいる。本作業は,本研究課題と並行し,田中同様に生前の加藤氏から直接依頼を受けた三宅和子氏(東洋大学)と協議の上,加藤氏に縁の深い宮嵜由美氏(国立国語研究所)と,当該年度に文理学部若手特別研究員であった林直樹氏(日本大学)のふたりの研究者を加えたチームで遂行している。同コーパスは,加藤氏が専修大学文学部日本語日本文学学科在職中の2004年度から2010

年度の間に開講されたゼミナールにおいて,その履修者らの課題として,作成されたものである。同コーパスは,履修者自身の携帯電話に蓄積された送受信メイルのうち,同コーパスのために提供をしたテキストメッセージによる。その経緯や詳細ならびに個人情報の取り扱い等は,加藤安彦編(2005),同(2007)に詳しい。作業途上にある「携帯メイルコーパス」(暫定公開版)の概要のみ以下に示す。

【「携帯メイルコーパス(暫定公開版)」概要】・構築主体:専修大学文学部日本語日本文学科加藤安彦ゼミナール・構築時期:2004年度~2010年度(7年度)・ 格納データ:専修大学文学部日本語日本文学科加藤安彦ゼミナールに所属しているゼミ生が収集したメイル送受信データ・データ形式:送信者・受信者の情報は非公開で,各メイルを1文で1行とした形

表 1.「携帯メイルコーパス(暫定公開版)」データ数(行数)2004年度 2005年度 2006年度 2007年度 2008年度 2009年度 2010年度 合計

23,102 44,279 71,369 28,158 47,273 71,274 77,668 363,123

本研究課題期間における進捗状況は,以下の通りである。

284

Page 29: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

【進捗状況】・2004~2010年度データ(363,123件)の絵文字リンク付け・コード抽出作業が完了・確認作業・公開準備作業を今後行う予定

5- 2 「携帯メイルコーパス(暫定公開版)」に基づく 「絵文字 」の出現状況

今年度研究課題で整備した暫定公開版に基づき,「絵文字」の出現状況について報告する。同コーパスの整備は未だ途中であり,細かな数値の変動は今後あると考える。よって,報告は仮のものと位置づける。同コーパスの収集された2000年代中頃は,携帯メイルが若年層の主要な「打ちことば」コ

ミュニケーションの手段であった(文化庁国語課2003)。一方,2000年代後半には,「絵文字」に加えアニメーション機能をもつ動く絵文字である「デコメール」(以下,デコメ)29)が商品として導入されるといった新しい動向も反映していると予測される。2011年の東日本大震災を契機に,今日では若年層を中心に主要な「打ちことば」コミュニケーション手段はスマホによるSNSとりわけLINEに移行している 30)。「携帯メイルコーパス(暫定公開版)」は,その前段におけるフィーチャーフォン,いわゆるガラケーによる非言語情報としての「絵文字」を用いた「打ちことば」コミュニケーションの実態把握資料と位置づけることが可能である。

5-1で示した363,123行の携帯メイルテキストデータに出現する「絵文字」は,述べ出現度数は193,227で,異なりは910であった。1行あたり平均0.53個の「絵文字」が使用されていることになり,「絵文字」の出現頻度はかなり高いといえる。

910種類の「絵文字」の累積使用率の観点からまとめたものが図1である。

図 1.「携帯メイルコーパス(暫定公開版)」における「絵文字」の累積使用率分布

285

Page 30: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

上位100絵文字の累積使用率は87.9%,118位で90%,186位で95%を越える。通常の語彙調査結果(山崎誠2009)と比べると,上位の絵文字が占める割合が多く,通常の語彙以上に限られたタイプの「絵文字」が,同コーパス内では繰り返し使用される傾向にある。「携帯メイルコーパス」全体に出現する910種類の「絵文字」の出現度数上位10種について,年度ごとの出現度数を示したものが表2である。

上位10種に注目すると,以下のようなことがわかる。「絵文字」は「絵解き(ユニコード)」として示す。

(1)「笑い顔(E6F0)」が最も多い。(2)「!?(E703)」「?(E483)」「!!(E704)」が多い。これらは,一般的な記号としても表記可能だが,「絵文字」が選択されることが多い。

(3)「汗(E706・E5B1)」や「キラキラ(E6FA・EAAB)」が多い。これらは,一般的な記号では表記することができないため,「絵文字」に依存することになる。

(4)「絵解き」としては同じであるが異なる「絵文字」が現れる(見た目とユニコードが異なる)。例えば,「汗」は,E706は 2006年まで盛んに使われ,その後使用数が減少する。E5B1は 2007年まではあまり現れず,2008年以後に出現度数が増える。契約会社(docomo・au・vodafone)の影響も考えられるが,一種の 「 絵文字 」の流行のようなものがあると想像される。

表 2 「携帯メイルコーパス(暫定公開版)」年度別上位 10位の「絵文字」出現度数(降順)

表2で示した上位10種の「絵文字」の出現度数を年度別に見ると,2004年度(1,300),2005

年度(6,567),2006年度(16,062),2007年度(1,733),2008年度(12,614),2009年度(12,831),

2010年度(11,147)となり,全体としては上位10位までの「絵文字」の出現度数は増加傾向にあるものの,2007年度が著しく低く,2010年度では減少する。

910種すべての「絵文字」出現度数を年度ごとにみると,2004年度(3,786),2005年度(20,095),2006年度(43,547),2007年度(5,457),2008年度(35,319),2009年度(39,733),

286

Page 31: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

2010年度(45,290)となっている。

上位10種と910種全体の出現度数いずれにおいても,2007年度は前後の年度の10%前後の出現度数となっている。これは,「携帯メイルコーパス(暫定公開版)」に格納されたデータ数が2007年度のものが他の年度に比して少ないことに起因する(表1参照)。また,出現度数の他に年度による違いの認められるものには,契約会社と,高頻度で使用

される「絵文字」がある。高頻度で使用される「絵文字」の変化は,契約会社が異なることによるだけでなく,「絵文字」自体のトレンド変化も映すと想像される。契約会社は,図2の通りで,2007年度は前後の年度とは異なる傾向にあり,2009年度・

2010年度以降はそれまでのdocomo優位からau優位に状況が変化している。表3は,年度別の出現度数上位10位までの「絵文字」について示したものである。2004年度と2010年度の1位の「絵文字」の推移を見ると,2009年度あたりでトレンド変化が生じつつあったように見える。また,当該年度にのみ上位10位に出現する「絵文字」も,2010年度に6種,2004・2005年度それぞれに1種となっており,2010年度はそれ以前の年度とは,当該コーパスにおいては他の年度とはかなり様相が異なることがわかる。また,表3からは,00年代中頃は単色,単純な線描画の「絵文字」,00年代後半から10年代

にかけては多色,ボリューム感のある「絵文字」へという変化がうかがえる。以上から,「携帯メイルコーパス(暫定公開版)」は前半の00年代中頃と00年代後半から

10年代の2つの時代を映すコーパスとなっていること,2009年度あたりがその分水嶺となっているらしいことが読み取れる。フィーチャーフォン後期に登場する多色・ボリューム感のある「絵文字」は2009年度以降

に現れる動く絵文字としての「デコメ」,その後のLINEにおけるスタンプなどを用いた「打ちことば」コミュニケーションへの通過点とみることができるだろう。

287

Page 32: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

2010年度(n=96912)

2009年度(n=92026)

2008年度(n=61656)

2007年度(n=36444)

2006年度(n=90646)

2005年度(n=55725)

2004年度(n=29464)

docomo au vodafone その他

図 2 「携帯メイルコーパス(暫定公開版)」「データ数(行数)」の年度別契約会社比

表 3 「携帯メイルコーパス」年度別出現度数上位 10位までの「絵文字」の出現度数

288

Page 33: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

5- 3 今後の課題

今回は,「携帯メイルコーパス(暫定公開版)」に基づく「絵文字」の出現度数からみた当該コーパスの性質について仮報告を行った。引き続き,暫定版から正式版としての公開を目指し,「携帯メイルコーパス」の整備を進めながら,本コーパスのもつ資料的意味などを検証するための基本的な報告を積み重ねたい。

【付記】

 本稿は,本研究課題の他,科学研究費基盤研究(C)(課題番号 15K02577)の一環でもある。

6 WWWから探る日本語のゆれ

6- 1 鉛筆・エンピツ・えんぴつの表記のゆれ

6- 1- 1 はじめに

荻野綱男(2016.6)で,アサガオの表記のゆれについてまとめたことがあった。これと同様の手法で,他の語の表記のゆれについて検討してみよう。

6- 1- 2 具体的計算手順

[1]鉛筆 エンピツ えんぴつのそれぞれでどのような複合語を作ることが多いか,出現頻度をWWWを検索して求めた。例:硬質色*硬質色鉛筆 119,000 硬質色エンピツ 4 硬質色えんぴつ 18

[2]単独形でのWWW全体での出現頻度 【鉛筆】約4,690,000件,【エンピツ】約404,000件,【えんぴつ】約811,000件を基準として,鉛筆の場合を13.24で割り,えんぴつの場合を2.024

で割り,エンピツはそのままとして,調整済み頻度を計算した。例:硬質色鉛筆 8987.915408 硬質色エンピツ 4 硬質色えんぴつ 8.893280632

[3]たくさんの複合語について,調整済み頻度からそれぞれの表記の比率を求め,各表記が多いものを取り出した。例:硬質色* 鉛筆が0.999を占める。結果は以下の表1から表3の通りである。

289

Page 34: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

表 1 「鉛筆」の表記が多い複合語の表記のゆれと最多表記率鉛筆 鉛筆 エンピツ えんぴつ 最多表記率硬質色* 8987.9 4.0 8.9 0.999

色*画家 3753.8 4.0 16.3 0.995

名入れ* 3987.9 11.0 27.2 0.991

*ギフト 3731.1 7.0 39.5 0.988

*芯 28096.7 74.0 696.6 0.973

*彫刻 2228.1 48.0 26.7 0.968

*軸 561.9 4.0 16.8 0.964

消しゴム付き* 2137.5 51.0 44.5 0.957

黒鉛* 152.6 3.0 5.4 0.948

色*教室 703.9 13.0 27.2 0.946

*ビジネス 301.4 25.0 6.9 0.904

スコア* 170.7 21.0 9.4 0.849

水彩色* 31419.9 58.0 6126.5 0.836

*肖像画 209.2 34.0 7.9 0.833

電車* 162.4 7.0 25.7 0.832

くねくね* 161.6 9.0 40.5 0.765

学業成就* 105.7 13.0 22.2 0.750

*画 33459.2 3.0 21788.5 0.606

*書き 9441.1 3260.0 2929.8 0.604

*素材 78.5 18.0 44.0 0.559

*削り 45241.7 9970.0 37203.6 0.490

*タッチ 494.0 98.0 443.7 0.477

*工場 898.8 851.0 267.3 0.446

*立て 8685.8 3270.0 8399.2 0.427

表 2「エンピツ」の表記が多い複合語の表記のゆれと最多表記率エンピツ 鉛筆 エンピツ えんぴつ 最多表記率*らんど 0.2 3160.0 23.2 0.993

*サヨリ 133.7 2780.0 40.5 0.941

*賞 40.3 892.0 25.2 0.932

*記念日 4.8 89.0 42.0 0.655

鼻* 706.9 2870.0 825.1 0.652

*風ブラシ 5.3 13.0 4.9 0.560

*パズル 70.0 96.0 27.2 0.497

表 3 「えんぴつ」の表記が多い複合語の表記のゆれと最多表記率えんぴつ 鉛筆 エンピツ えんぴつ 最多表記率もちかた* 4.8 11.0 11808.3 0.999

こども* 34.7 12.0 10326.1 0.995

*びな 1.6 9.0 1576.1 0.993

つくし* 2.3 8.0 864.6 0.988

*写経 2.9 11.0 1141.3 0.988

さんかく* 3.2 17.0 1190.7 0.983

*公園 6.9 98.0 5484.2 0.981

おえかき* 70.1 3.0 2608.7 0.973

*野球 22.3 48.0 2080.0 0.967

290

Page 35: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

*物語 5.2 11.0 458.5 0.966

チョコ* 32.3 91.0 3310.3 0.964

グリッパー* 202.4 9.0 3690.7 0.946

キャラクター* 444.1 28.0 7065.2 0.937

*ファイル 34.3 13.0 607.7 0.928

*タワー 37.0 66.0 578.1 0.849

音* 104.2 19.0 652.2 0.841

*倶楽部 634.4 3.0 2317.2 0.784

はじめて* 99.7 22.0 434.3 0.781

*博士 5.2 1.0 21.7 0.778

*タイプ 1344.4 2990.0 14920.9 0.775

かきかた* 9365.6 82.0 30978.3 0.766

*ハウス 37.5 57.0 305.8 0.764

*シリーズ 379.9 37.0 1136.4 0.732

*キャップ 18806.6 4070.0 58794.5 0.720

*セット 10951.7 2400.0 32658.1 0.710

*茄子 2.9 21.0 37.1 0.608

*ポスター 247.0 16.0 355.7 0.575

赤* 19864.0 5910.0 32411.1 0.557

*練習 365.6 22.0 383.4 0.497

*屋さん 6.6 24.0 28.7 0.484

ロケット* 3595.2 6850.0 9535.6 0.477

色* 181268.9 28600.0 185276.7 0.469

6- 1- 3 複合語の表記のゆれを見る

表1から表3の各複合語の中から,60%以上の最多表記率のものを取り上げ,低頻度の語形を省略して示すと,以下のようになる。

[1]漢字表記(鉛筆)が多いもの・正式なもの,伝統的なものに多く使われる:結果的に全体が漢字で構成される硬質色*,色*画家,*芯,*彫刻,*軸,黒鉛*,色*教室,水彩色*,*肖像画,電車*,学業成就*,*画注:「色*」は,色*画家,色*教室,水彩色*などの用例を含む(はず)。・(この傾向の例外に該当する)名入れ*,*ギフト(実際は「セット」が後接する場合が多い),消しゴム付き*,*ビジネス(複合語になっていない例が多い),スコア*(ゴルフ鉛筆ペグシルのこと),くねくね*

[2]カタカナ表記(エンピツ)が多いもの・固有名詞性が強いもの*らんど:幼児教育施設の固有名詞*サヨリ:魚の品種名

291

Page 36: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

*賞:ビックリハウスの(冗談の)(文学)賞の名前*記念日:5月2日の鉛筆製造開始日・(この傾向の例外に該当する)鼻*:鼻に尖ったエンピツを突っ込むこと

[3]ひらがな表記(えんぴつ)が多いもの・こども向けの商品名:結果的に全体がひらがなで構成されるもちかた*:トンボ鉛筆の持ち方を矯正する鉛筆こども*:くもんの幼児用鉛筆*びな:絵本の題名さんかく*:『筆育もんちゃんの ちゃんともてる さんかくえんぴつ』

おえかき*:同人誌のタイトル,作家のペンネーム,……はじめて*:くもんの幼児用鉛筆(ただし,副詞用法も混在)かきかた*:トンボ鉛筆他数社が製作つくし*:東京・国立にある「つくし文具店」オリジナルの4Bえんぴつ

・こども向けの商品名チョコ*:不二家のお菓子グリッパー*:三菱鉛筆が発売した子供用のすべらない鉛筆*ファイル:アーテック製で鉛筆を挟めるファイル*タワー:遊園地よみうりランドのアトラクション*公園:各地の公園の名前*野球:ゲームの名前*物語:テレビ番組の名前*タイプ:電動鉛筆削り器の名前*ハウス:学習室の名前*キャップ

*セット

・(この傾向の例外に該当する)キャラクター*

*写経音*:ペン型の音声デバイス*倶楽部:絵を中心とした任意団体の名前*シリーズ

292

Page 37: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

6- 1- 4 表記のゆれの傾向

「鉛筆」を表す3種類の表記で,それぞれどんなものを表すことが多いか,傾向の違いが見て取れた。漢字表記(鉛筆)が多いものは正式なもの,伝統的なものに多く使われる傾向にある。カタカナ表記(エンピツ)が多いものは,固有名詞性が強いものに多い。ひらがな表記(えんぴつ)が多いものは,こども向けの商品名などが多い。ただし,鉛筆を巡る複合語の場合は,本来,より長い複合語の一部が抽出される場合が多

く,それを考慮すると,あまり単純にこのような結論を述べることに多少躊躇せざるを得ない。WWWから直接用例を抽出する方法の限界が感じ取れた。

6- 2 母音の無声化と促音化

6- 2- 1 はじめに

母音の無声化が進むと促音化する例が知られている。「三角形」は「さんかくけい」と発音するが,その場合「く」が無声化している。しばしば「さんかっけい」という発音を耳にする。では,WWWの中ではどのように読み方が書かれているのだろうか。WWWは文字で検索しているので,音声の調査ではないが,「三角形」という漢字表記が

普通であり,「さんかくけい」あるいは「さんかっけい」と表記する例は(子供向け,外国人向けを除いて)ほとんどないと考えられる。そこで「さんかくけい」あるいは「さんかっけい」を検索すれば,「三角形」のふりがなを検索していることになるが,書き手の仮名表記意識を通じて,近似的に音声の傾向を見ることができるように考えた。

6- 2- 2 検索方法

仮に,「三角形」を検索してみよう。「さんかくけい」と「さんかっけい」の両方を含む文章は,「三角形」の仮名表記に関する議論をしているような例(こういう類を参照例と呼ぶことにしている)が多いことが予想される。したがって,そういうのを除外して検索することで,「三角形」のふりがなが検索できる。具体的には,Yahoo!の検索エンジンを使って「"三角形 " "さんかくけい " -"さんかっけ

い "」と検索し,7,140件検索できた。また「"三角形 " "さんかっけい " -"さんかくけい "」

と検索し,3,300件検索できた。本来は,それぞれの用例を確認し,本当にふりがなとして使われているかどうかを確認す

るべきだが,今回は,個別の確認をスキップし,どんな語にゆれが見られるかを把握するため,さまざまな読み(のペア)で検索することを優先した。したがって,以下の「検索件数」は,かなり誤差を含むものである可能性があることに注意されたい。「三角形」については「さんかくけい」7,140件と「さんかっけい」3,300件があったので,促音化率は

293

Page 38: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

   3,300/(3,300+7,140)×100=31.6(%)

と計算される。このような計算を多くのペアについて行うと,以下の表4のような結果になる。

表4は促音化率の昇順に並べたものである。

表 4 母音の促音化の程度漢字表記 非促音化語形 促音化語形 非促音化頻度 促音化頻度 促音化率副交感神経 ふくこうかんしんけい ふっこうかんしんけい 27,900件 0件 0.0

赤鉄鉱 せきてっこう せってっこう 1,330件 0件 0.0

全国各地 ぜんこくかくち ぜんこくかっち 556件 0件 0.0

潜伏期 せんぷくき せんぷっき 327件 0件 0.0

増幅器 ぞうふくき ぞうふっき 67件 0件 0.0

三角コーナー さんかくコーナー さんかっコーナー 52件 0件 0.0

主力艦 しゅりょくかん しゅりょっかん 28件 0件 0.0

演劇界 えんげきかい えんげっかい 28件 0件 0.0

肉切り包丁 にくきりぼうちょう にっきりぼうちょう 27件 0件 0.0

三角コーナー さんかくこーなー さんかっこーなー 25件 0件 0.0

逆為替 ぎゃくかわせ ぎゃっかわせ 25件 0件 0.0

外食券 がいしょくけん がいしょっけん 20件 0件 0.0

観菊会 かんぎくかい かんぎっかい 18件 0件 0.0

喜劇界 きげきかい きげっかい 6件 0件 0.0

音楽家 おんがくか おんがっか 73,000件 33件 0.0

肉球 にくきゅう にっきゅう 91,000件 48件 0.1

駆逐艦 くちくかん くちっかん 13,300件 26件 0.2

悪感情 あくかんじょう あっかんじょう 4,550件 16件 0.4

敵国 てきこく てっこく 4,730件 17件 0.4

適格 てきかく てっかく 3,820件 16件 0.4

音楽会 おんがくかい おんがっかい 8,830件 48件 0.5

奨学金 しょうがくきん しょうがっきん 4,710件 27件 0.6

液化 えきか えっか 4,280件 27件 0.6

的確 てきかく てっかく 4,600件 31件 0.7

著作権 ちょさくけん ちょさっけん 10,100件 70件 0.7

三角巾 さんかくきん さんかっきん 2,700件 23件 0.8

腹くう ふくくう ふっくう 917件 9件 1.0

生殖器 せいしょくき せいしょっき 1,800件 19件 1.0

攻撃機 こうげきき こうげっき 93件 1件 1.1

不適格 ふてきかく ふてっかく 82件 1件 1.2

各県 かくけん かっけん 327件 5件 1.5

毒気 どくけ*語形対応せず どっき 22,900件 417件 1.8

観測機 かんそくき かんそっき 44件 1件 2.2

適格者 てきかくしゃ てっかくしゃ 42件 1件 2.3

熱気球 ねつききゅう ねっききゅう 1,550件 42件 2.6

三角関数 さんかくかんすう さんかっかんすう 72件 2件 2.7

くも膜下出血 くもまくかしゅっけつ くもまっかしゅっけつ 1,150件 40件 3.4

声楽家 せいがくか せいがっか 56件 2件 3.4

逆回転 ぎゃくかいてん ぎゃっかいてん 74件 3件 3.9

水族館 すいぞくかん すいぞっかん 103,000件 4,280件 4.0

畜犬 ちくけん ちっけん 415件 18件 4.2

逆効果 ぎゃくこうか ぎゃっこうか 713件 34件 4.6

副官 ふくかん ふっかん 816件 42件 4.9

294

Page 39: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

陸海空 りくかいくう りっくかいくう 67件 4件 5.6

四角形 しかくけい しかっけい 1,530件 97件 6.0

副校長 ふくこうちょう ふっこうちょう 47件 3件 6.0

撃剣 げきけん げっけん 866件 76件 8.1

刻々 こくこく こっこく 6,750件 594件 8.1

大織冠 たいしょくかん たいしょっかん 452件 44件 8.9

多角形 たかくけい たかっけい 822件 82件 9.1

赤褐色 せきかっしょく せっかっしょく 89件 9件 9.2

弾薬庫 だんやくこ だんやっこ 59件 6件 9.2

陸海 りくかい りっかい 83件 9件 9.8

腹くう鏡 ふくくうきょう ふっくうきょう 40件 5件 11.1

陸海軍 りくかいぐん りっかいぐん 46件 6件 11.5

火薬庫 かやくこ かやっこ 71件 12件 14.5

著作家 ちょさくか ちょさっか 34件 6件 15.0

三色旗 さんしょくき さんしょっき 45件 8件 15.1

著作権法 ちょさくけんほう ちょさっけんほう 76件 14件 15.6

劇化 げきか げっか 36件 7件 16.3

逆コース ぎゃくコース ぎゃっコース 38件 8件 17.4

各界 かくかい かっかい 238件 56件 19.0

腹こう ふくこう ふっこう 8件 2件 20.0

肉塊 にくかい にっかい 96件 31件 24.4

逆コース ぎゃくこーす ぎゃっこーす 14件 5件 26.3

一見識 いちけんしき いっけんしき 36件 13件 26.5

激化 げきか げっか 3,250件 1,280件 28.3

赫々 かくかく かっかく 2,630件 1,080件 29.1

三角形 さんかくけい さんかっけい 7,140件 3,300件 31.6

敵艦 てきかん てっかん 54件 26件 32.5

大食漢 たいしょくかん たいしょっかん 68件 37件 35.2

万国旗 ばんこくき ばんこっき 43件 25件 36.8

二等辺三角形 にとうへんさんかくけい にとうへんさんかっけい 40件 24件 37.5

直角三角形 ちょっかくさんかくけい ちょっかくさんかっけい 47件 29件 38.2

俗気 ぞくけ ぞっけ 29件 19件 39.6

旅客機 りょかくき りょかっき 68件 45件 39.8

五角形 ごかくけい ごかっけい 87件 61件 41.2

肉感的 にくかんてき にっかんてき 37件 31件 45.6

逆光線 ぎゃくこうせん ぎゃっこうせん 21件 19件 47.5

進学校 しんがくこう しんがっこう 42件 39件 48.1

活火山 かつかざん かっかざん 536件 501件 48.3

全国区 ぜんこくく ぜんこっく 38件 36件 48.6

洗濯機 せんたくき せんたっき 261,000件 251,000件 49.0

菊花 きくか きっか 34,700件 33,600件 49.2

緑化 りょくか りょっか 2,440件 2,740件 52.9

各局 かくきょく かっきょく 47件 53件 53.0

時々刻々 じじこくこく じじこっこく 33件 45件 57.7

菊花展 きくかてん きっかてん 34件 53件 60.9

俗化 ぞくか ぞっか 15件 24件 61.5

学界 がくかい がっかい 33件 60件 64.5

劇作家 げきさくか げきさっか 25件 50件 66.7

各校 かくこう かっこう 603件 1,370件 69.4

世界各国 せかいかくこく せかいかっこく 32件 87件 73.1

各国 かくこく かっこく 1,320件 5,050件 79.3

学会 がくかい がっかい 4,220件 20,600件 83.0

295

Page 40: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

激高 げきこう げっこう 96件 489件 83.6

神学校 しんがくこう しんがっこう 10件 52件 83.9

敵機 てきき てっき 90件 526件 85.4

一刹那 いちせつな いっせつな 55件 689件 92.6

各項 かくこう かっこう 87件 1,210件 93.3

食券 しょくけん しょっけん 50件 830件 94.3

築港 ちくこう ちっこう 480件 12,400件 96.3

新学校 しんがくこう しんがっこう 1件 26件 96.3

俗曲 ぞくきょく ぞっきょく 2件 53件 96.4

一個人 いちこじん いっこじん 627件 27,100件 97.7

北極海 ほくきょくかい ほっきょくかい 1件 71件 98.6

各戸 かくこ かっこ 54件 4,980件 98.9

各個 かくこ かっこ 49件 20,000件 99.8

赤血球 せきけっきゅう せっけっきゅう 2件 68,400件 100.0

刻一刻 こくいちこく こくいっこく 0件 79件 100.0

6- 2- 3 当面の結論

このリストをながめていると,いろいろなことがうかがえる。一部を以下にメモしておく。

[1]形態素の切れ目の直前の部分は促音化しにくい。促音化率0%のところには,これらの語が集まっている。副/交感神経,赤/鉄鉱,潜伏

/期,増幅/器,三角/コーナー,主力/艦,演劇/界,肉/切り/包丁,逆/為替,観菊/会,喜劇/界。促音化率が0%を越え,10%未満の語でも,形態素の切れ目の直前にあたるもの(漢字3字の語)が並んでいる。音楽/家,駆逐/艦,悪/感情,音楽/会,奨学/金,著作/権,三角/巾,生殖/器,攻撃/機,観測/機,熱/気球,三角/関数,くも膜/下/出血,声楽/家,逆/回転,水族/館,逆/効果,陸/海/空,四角/形,副/校長,赤/褐色,弾薬/庫,多角/形。しかし,ここには漢字2字の語もかなりあり,また漢字3字の語でも形態素の切れ目でない場合がある。肉球,敵国,適格,液化,的確,腹くう,不/適格,適格/者,各県,毒気,畜犬,副官,撃剣,刻々,大織冠,陸海。

[2]「各」は,性格が複雑である。表4から「各」を含むものを抜き出すと,表5のようになる。

ただし,「世界各国」は「各国」と同様なので,除いてある。

296

Page 41: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

表 5 「各」を含む語の母音の促音化の程度漢字表記 非促音化語形 促音化語形 非促音化頻度 促音化頻度 促音化率全国各地 ぜんこくかくち ぜんこくかっち 556件 0件 0.0

各県 かくけん かっけん 327件 5件 1.5

各界 かくかい かっかい 238件 56件 19.0

各局 かくきょく かっきょく 47件 53件 53.0

各校 かくこう かっこう 603件 1,370件 69.4

各国 かくこく かっこく 1,320件 5,050件 79.3

各項 かくこう かっこう 87件 1,210件 93.3

各戸 かくこ かっこ 54件 4,980件 98.9

各個 かくこ かっこ 49件 20,000件 99.8

「各」と,それに後続する形態素の結合の強さ(ないし後続形態素の独立性の弱さ)が影響しているのかと思える。「県」は独立用法があり,名詞性が強いので「各」は促音化していない。その他は音読みということもあって,「各」と密接に結合しているので促音化が進んでいる。「各地」だけは「かっち」にならない。これだけは「かく」の後がカ行音でなくタ行音になっていることが関係しているのかもしれない。(もう少し他の例を調べてみないと何とも言えない。)

[3]「逆」は,促音化があまり進んでいない。「逆」は名詞性が強く,接頭辞性が強くない。この点で接頭辞性が強い「各」とは性格が異なる。

表4から「逆」を含むものを抜き出すと,表6のようになる。

表 6 「逆」を含む語の母音の促音化の程度漢字表記 非促音化語形 促音化語形 非促音化頻度 促音化頻度 促音化率逆為替 ぎゃくかわせ ぎゃっかわせ 25件 0件 0.0

逆回転 ぎゃくかいてん ぎゃっかいてん 74件 3件 3.9

逆効果 ぎゃくこうか ぎゃっこうか 713件 34件 4.6

逆コース ぎゃくコース ぎゃっコース 38件 8件 17.4

逆コース ぎゃくこーす ぎゃっこーす 14件 5件 26.3

逆光線 ぎゃくこうせん ぎゃっこうせん 21件 19件 47.5

あまりたくさんの例が検索されたわけではないので,信頼性は高くないが,いずれも促音化率は低い。その中で,「逆光線」は促音化率が半分ほどあって,やや高い。勝手な推測だが,もしか

して「逆光」(ぎゃっこう)の影響があるかもしれない。

297

Page 42: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

6- 3 WWWから探る日本語のゆれ

今回は,二つのゆれについてWWWを検索して調べてみた。表記のゆれについては,WWWによる検討がかなり有効であった。また,母音の促音化についてもWWWである程度調べられることがわかった。いずれも試論の域ではあるが,WWWをコーパスとして利用する場合の一つの方法論を提示することができたと考えている。

7 Twitter上の発言データを用いたオノマトペ用例コーパスの構築

7- 1 はじめに

オノマトペとは,擬音語,擬態語,擬声語の総称のことである。オノマトペは物の動きや状態,感覚,人の心理状態等を一言で表すことが出来る便利な言葉であるため,日常生活で頻繁に利用されるが,日本語を習得しようとする外国人にとって,このような感覚的な語の習得は非常に困難である。知能情報処理の分野では,言い換えや学習支援などオノマトペに纏わる研究がたくさん展開されているが,オノマトペの構造やオノマトペ辞書を利用しているものが多く,オノマトペの使用例をもとに行われているものがほとんど存在しない。本研究では,Twitter上の発言データからオノマトペを含んでいる文を大量に収集し,各種フィルタを通過させたものをオノマトペ用例コーパスとして構築する。

7- 2 構築手法の概要

まずはAPIを利用してTwitterデータを収集する。次に収集されたTwitterデータからオノ

マトペを含むTweet文を抽出する。抽出されたツイート文に用例文の一部として適切でないものも含まれているため,複数のフィルタを適用することによりオノマトペ用例コーパスを構築する。

7- 3 用例文抽出のための Tweetデータのフィルタリング

Twitter上では絵文字や記号が必要以上に多用されていたり,元の表記から崩れ過ぎていたりして用例文として適切でないと思われる文が多く存在している。そのため,それらに応じてTweet文にフィルタを適用する必要がある。フィルタを過度に適用すると用例として適切な文が除外されてしまう可能性もあるが,Tweetデータがほぼ無限にあるという事実を考慮すれば,再現率よりも適合率を重視する方針を採用し,以下4つのフィルタを導入した。

7- 3- 1 末尾以外に記号を含む文を除く

これは記号が多すぎて文として成り立たないものや,括弧などで囲んである部分が文から独立しているものが多く存在していたためである。

298

Page 43: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

7- 3- 2 3回以上の反復を含む文を除く

この場合も文として成り立っていないものが多く存在したためである。3回以上と指定したのは,オノマトペの中に「キラキラ」や「ざーざー」など2回の反復を持つものが存在するためである。

7- 3- 3 ひらがなとカタカナしか含まない文を除く

これは,表記が砕けすぎて具体的な意味を持つ用例文として相応しくないものや,文になっていないものが多く存在したため一律に除外している。

7- 3- 4 各オノマトペの利用パターンに適さない文を除く

事前に統計的手法により獲得した「オノマトペパターンリスト」と「オノマトペパターン優先順位リスト」を利用し,それぞれのオノマトペが最も頻繁に使われるパターンに合致した文のみを残すフィルタを作成した。図1と図2は各リストの一部を示している。

299

Page 44: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

キリキリ 名詞+も+オノマトペ+名詞 :1 形容詞的用法キリキリ 動詞+オノマトペ+の+名詞 :1 形容詞的用法キリキリ 副詞+オノマトペ+名詞 :1 形容詞的用法キリキリ 名詞+が+オノマトペする :337 動詞的用法キリキリ 名詞+オノマトペする :45 動詞的用法キリキリ 名詞+を+オノマトペする :10 動詞的用法キリキリ 形容詞+オノマトペする :8 動詞的用法キリキリ 動詞+オノマトペする :8 動詞的用法キリキリ 名詞+も+オノマトペする :7 動詞的用法キリキリ 名詞+は+オノマトペする :7 動詞的用法

図 1 オノマトペパターンリスト(一部)

「オノマトペパターンリスト」は,Tweetデータを形態素解析し,オノマトペとその前後の品詞からオノマトペの品詞的利用パターン及びその頻度を抽出したものである。

おっとり

形容詞的用法 2201

動詞的用法 2157

副詞的用法 483

名詞的用法 0

からり

形容詞的用法 6777

副詞的用法 1575

動詞的用法 45

名詞的用法 10

図 2 オノマトペパターン優先順位リスト(一部)

そして,「オノマトペパターン優先順位リスト」は「オノマトペパターンリスト」を元に,各オノマトペが品詞ごとに利用された頻度を集計し,それらを降順に並べ替えたリストである。

フィルタを適用する際に,まず「オノマトペパターン優先順位リスト」の中から,各オノマトペが最も頻繁に使われている用法を得る。さらにその用法の中で,最も多く使われているパターンを「オノマトペパターンリスト」から探し,そのパターンに当てはまった文のみを用例文として残す。

7- 4 結果

APIにより自動収集された3ヶ月間のTweetデータに対して,上記4つのフィルタを適用した結果は次の通りである。・フィルタを通過する前: 12,061,385ツイート 616MB

・フィルタ1~フィルタ3を通過した後: 6,231,012ツイート 341MB

・すべてのフィルタを通過した後: 2,082,615ツイート 113MB

300

Page 45: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

また,図3から分かるように,全てのフィルタを通過し,オノマトペ用例コーパスに収集された用例文に,意味が通じやすく,日本語として形が整っているものが多数含まれていることが確認された。

屋敷は立ち上るとまだ何か軽部にせられるものと思ったのか恐わそうにじりじり後方の壁へ背中をつけて完全にリンク着れるまでのロスタイムがいつまで続くかって結構じりじりしそうその辺りの加減が難しくてじりじりする今日髪切りにいって,今公園で遅い昼飯兼夕飯を食べてるんだけど,鳩がじりじりと詰め寄ってきてる両手上げつつじりじりと逃走経路を確保しそしてじりじりと雷獣が近寄っているのも見えるじりじり近づいてきて微妙な距離を保ってる鳩共背中に直射日光くらってじりじりするしかもあの風の中おれの手の方にじりじりにじり寄って来るし後場からじりじり上に戻してきましたね鷹司の値段下がるのじりじり待つわ

図 3 オノマトペ用例コーパス(一部)

7- 5 まとめ

本研究では,事前に統計的手法により作成された「オノマトペパターン優先順位リスト」を用い,3ヶ月間のTweetデータに対してフィルタリング作業を行った結果,200万文以上の用例文を収集し,オノマトペ用例コーパスとして構築することができた。今後は,抽出する期間を拡大しながら,フィルタの追加や文法・意味の成立度合に基づく加重手法を導入することで,より大規模で信頼度の高いコーパスを構築することを目指したい。さらに,構築されたオノマトペ用例コーパスを利用し,オノマトペ学習支援システムを開発していきたい。

1) 「応答詞」は「はい」や「いいえ」だけでなく,「ふーん」,「ほんと」,「そう」なども含まれると思われるが,ここでは疑問文に対する答え方としての yes/no(英語),ja/nein/doch(ド

イツ語)を指すものとする。2) 『アポロン独和辞典』(2010) S. 295f.に基づいている。3) イタリア語では次のようになり,ドイツ語・英語と同じである。

Lui è impegnato? - Sì, è impegnato. / No, non è impegnato.

4) イタリア語では Lui non è impegnato? - Sì, è impegnato. / No, non è impegnato.となり,英語と同じパターンとなる。

5) 否定疑問文に対して肯定文の答え方がドイツ語と同じタイプの言語の一つにフランス語がある。フランス語のコーパスが揃えられていないので,本稿では論じない。

6) Holmberg(2012)などが扱っているように,極性(Polarität)についての理論的な提案はいくつかあるが,ここでは理論的検討は行わない。

301

Page 46: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

7) 英語でもそのような場合がある。注 8を参照されたい。8) 実例では(5)とは異なるパターン,つまり第三のパターンが存在する。[Titanic:02:12]に

以下の会話が見られる:A: You are a good liar.

B: Almost as good as you.

A: There’s no, uh.... There’s no arrangement, is there?

B: No, there is. Not that you’ll benefit much from it. 下線部は,No, there isn’tではなく,There is no arrangementと言う Aの発話に対して,「それは違う」と答え,「やりとりの余地 (arrangement)がある」と述べているところである。なお,映画の資料については,[Titanic:02:12]のように,資料名「Titanic」とタイムコード「02:12」

(2時間 12分のシーン)で表す。資料名については論文末の参考資料を参照されたい。9) Hosaka (2009: 460).

10) イタリア語にも存在しない。11) 映画の資料名とタイムコード。注 8を参照されたい。12) oder?や (oder) nicht?や,日常会話では was? ,ne?など様々な形がある。13) Berlin-Brandenburgische Akademie der Wissenschaften: BBAWではProjekt “Digitales Wörterbuch

der deutschen Sprache des 20. Jahrhunderts” : Projekt DWDSを進めており,その中の Spezialcorpora

の中の Corpus Gesprochene Sprache(話し言葉コーパス)を利用した。(2017-08-23時点)14) kannst duと言う定動詞の位置が第一にあるが,これは [das] kannst du の dasが省略された

形であると考えられる。15) イタリア語でも英語と同じく,Sìが用いられている。

A: Sta tornando!

B: Ascolta! Devi cercare di scendere.

A: Non posso!

B: Sì, puoi!

16) 定動詞の位置による解釈。17) 『独和大辞典[第二版]』(1999)の dochの記述より。18) 心態詞としての dochについてはWeydt(1983)などが参考になる。19) ドイツ語は英語のような前置詞残留(prepositional stranding)[例: the man whose book I’m

looking for]は許されない。そのため,必ず PP内の関係代名詞 derenは PPとともに前置される。前置詞残留については,ドイツ語には一般的に存在しないとされているが,実例がないわけではない。歴史的なことも含めた具体的な文例については Fleischer(2002)を参照されたい。

20) そのため日本語では関係節形ではなく,連体修飾節とも言われるが,ここではその名称,並びにどのように日本語を分析するかについての問題については立ち入らない。

21) さらに指示代名詞や目的語としての deren(たとえば bedürfenの目的語として)などの 3,436

例(全体の約 34%)は除外してある。そのため(33)の総計は 6,564例となる。22) DP,すなわちこの deren + N の Nの特徴については 2-3-3で述べる。23) このことについては後述する。24) 今回調査した derenの出現比率について,念のため別のコーパス(Mannheimer Korpus I [257

302

Page 47: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

万語,小説などのデータが入っている])で見直してみた。その結果は次の通りである。(i)a. DPのパターン 401(54%)

b. PPのパターン 105(14%)

c. 指示代名詞としての用法 213(29%)

d. それ以外 25(3%)

e. um...zuのパターン 2個関係代名詞,指示代名詞の比率とも今回の調査とほぼ同じであり,今回の調査の結果が偏っていないことが分かる。

25) 「その他の用法」は,たとえば,die Anzahl der Teilnehmer「参加者の総数」などの例である。26) 以下,Mitglied(93),Hilfe(86),Zahl(74),Ziel(72),Verlauf(70),Inhalt(60)となる。

27) たとえば,Onkel,Großvaterなど。

28) neuなどの比較変化可能な形容詞の場合には,neuer-,neuest-も算入してある。なお,hochは,

形容詞としては hoh-, höher-の形を取る。29) 「デコメール 別名:デコレーションメール,デコメ【英】decomail デコメールとは,NTT

ドコモが提供している FOMA向けの iモードメールサービスの名称である。デコメールは,iモード対応 HTMLに対応しているため,従来の iモードメールと異なり,文字や背景の色を変えたり画像を貼り付けたりして,視覚的効果のあるメッセージをやりとりすることができ る。」(https://www.weblio.jp/content/%E3%83%87%E3%82%B3%E3%83%A1  Weblio 辞 書,2018年 7月 28日最終閲覧)

30) 「総務省|平成 29年版 情報通信白書| SNSがスマホ利用の中心に」(http://www.soumu.

go.jp/johotsusintokei/whitepaper/ja/h29/html/nc111130.html,2018年 7月 28日最終閲覧)

参考文献

文化庁国語課(2003)「人とのやりとりに,どのような方法を用いているか<問 6>」『平成 13年度国語に関する世論調査』財務省印刷局 .

Fischer, Olga. (1992) Syntax. In Blake, Norman ed. The Cambridge History of the English Language II.

Cambridge: Cambridge University Press, pp. 207-108.

Fleischer, Jürg (2002) Die Syntax von Pronominaladverbien in den Dialekten des Deutschen : eine

Untersuchung zu Preposition Stranding und verwandten Phänomenen, Zeitschrift für Dialektologie

und Linguistik : Beihefte 123, Wiesbaden/Stuttgart.

Holmberg, Anders (2012) The Syntax of Negative Questions and Their Answers, Proceeding of GLOW

in Asia IX, 1-18.

Hosaka, Yasuhito (2009) Notes on Functional Categories in German, English Linguistics 26, 460-475.

加藤安彦編(2005)『加藤ゼミ研究報告集 1―携帯メイルによるコミュニケーション研究―2004年度』私家版 .

加藤安彦(2007)「ケータイメイルにおける顔文字と記号の出現頻度とその関係―ケータイメイルコーパスの紹介とともに―」『専修国文』81,専修大学日本語日本文学会 .

Kuno, Susumu (1973) The Structure of the Japanese Language, MIT Press, Cambridge, MA.

荻野綱男 (2016.6)「〈研究へのいざない〉表記のゆれと単語の意味・用法の違い――朝顔・アサガオ・

303

Page 48: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

あさがおを含む複合語を例に――」語文第 155輯,pp.左 1-8

Quirk, Randolf, Sidney Greenbaum, Geoffrey Leech and Jan Svartvik. (1985) A Comprehensive

Grammar of the English Language. London: Longman.

Rissanen, Matti. (1999) Syntax. In Lass, Roger ed. The Cambridge History of the English Language III.

Cambridge: Cambridge University Press, pp. 187-331.

Sommerer, Lotte. (2018) Article Emergence in Old English: A Constructionalist Perspective. Berlin: De

Gruyter.

Traugott, Elizabeth Closs. (1992) Syntax. In Hogg, Richard H. ed. The Cambridge History of the English

Language I. Cambridge: Cambridge University Press, pp. 168-289.

Weydt, Harald (1983) Kleine deutsche Par tikellehre: ein Lehr- und Übungsbuch für Deutsch als

Fremdsprache, Klett.

山崎誠(2009)「語彙 概説」『計量国語学事典』朝倉書店 .

コーパス

Corpus Gesprochene Sprache, in: “Wörterbuch der deutschen Sprache des 20. Jahrhunderts” : Projekt

DWDS (https://www.dwds.de/r)

COSMAS Ⅱ : W-Archiv der geschriebenen Sprache (https://cosmas2.ids-mannheim.de/cosmas2-web/)

Kroch, Anthony, Beatrice Santorini, and Lauren Delfs. (2004) The Penn-Helsinki Parsed Corpus of Early

Modern English (PPCEME). Department of Linguistics, University of Pennsylvania. CD-ROM,

(http://www.ling.upenn.edu/hist-corpora/PPCEME-RELEASE-2/index.html).

Kroch, Anthony, Beatrice Santorini, and Ariel Diertani. (2010) The Penn Parsed Corpus of Modern

British English (PPCMBE). Department of Linguistics, University of Pennsylvania. CD-ROM, (http://

www.ling.upenn.edu/hist-corpora/PPCMBE-RELEASE-1/index.html).

Kroch, Anthony, and Ann Taylor. (2000) The Penn-Helsinki Parsed Corpus of Middle English (PPCME2).

Department of Linguistics, University of Pennsylvania. CD-ROM, second edition (http://www.ling.

upenn.edu/hist-corpora/PPCME2-RELEASE-3/index.html).

Taylor, Ann, Anthony Warner, Susan Pintzuk, and Frank Beths (2003) The York-Toronto-Helsinki Parsed

Corpus of Old English Prose. University of York, York.

参考資料

([本文中の引用タイトル],映画タイトル,()内はドイツ語タイトル【】内は邦題)[Awakenings], Awakenings (1900), (Awakings), 【レナードの朝】[Finding Nemo], Finding Nemo (2003), (Findet Nemo), 【ファインディング・ニモ】

[GD], Groundhog Day (1993), (Groundhog Day),【恋はデジャ・ブ】[HP4], Harry Potter and the Goblet of Fire (2005), (Harry Potter und der Feuerkelch),【ハリーポッ

ターと炎のゴブレット】[IAS], I am Sam (2001), (Ich bin Sam),【アイ・アム・サム】

[MR], Mary Relly (1996) , (Mary Relly),【ジキル&ハイド】

[PIF], Pay It Forward (2000), (Glückspinzip), 【ペイ・フォワード可能の王国】

304

Page 49: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

コーパス言語学の学際的研究

[Ponpoko],『平成狸合戦ぽんぽこ』, (Pom Poko)

[Ratatouille], Ratatouille (2007), (Ratatouille), 【レミーのおいしいレストラン】

[Roxanne], Roxanne (1987), (Roxanne), 【愛しのロクサーヌ】[Spider-Man], Spider-Man(2002), (Spider-Man), 【スパイダーマン】

[SDH], 『耳をすませば』, (Stimme des Herzens)

[NR], The Name of Rose (1986), (der Name der Rose),【薔薇の名前】[WS].『ハウルの動く城』(2004), (Das wandelnde Schloss)

305

Page 50: コーパス言語学の学際的研究...コーパス言語学の学際的研究 2章:会話コーパス並びに散文コーパスを利用して現代ドイツ語の傾向を探る-応答詞doch

306