Lectures for Radio

consisting of talks and slides for the coming Radio Data System

This course is about Data Model for Language Documentation.

このコースでは,言語ドキュメンテーション(Language Documentation)と呼ばれている,言語学のいち分野として近年認め られてきている知識分野の中から,データモデルを学びます. 言語ドキュメンテーションは,その英語の名称もLinguistic Documentationなど,複数の用語が使われているように,その名称 ならびに定義は,研究者により異なっています.但し,この言語ドキュメ ンテーションという知識分野が独立・確立した背景には,言語情報 を記録し,それを言語資料として,自らの研究だけにとどまらず, 研究データとしての共有,言語コミュニティへの還元など,自らが 記録・整理・作成している言語資料が,自分だけのものではないこ とが強く自覚されるようになり,記録方法への関心が高まったこと が背景としてあるのでしょう.さらに,これらの作成・記録が全て デジタルの形式で作成されることが,一層,データ共有を容易にす る一方で,データの作成・保存・管理を一貫して計算機環境で実現 するための知識が,従来の計算機科学では整理されていないという 現実も背景としてあると思われます.つまり,言語学者は,自らの 手で,言語情報の記録・編集,言語資料の作成・保存の手法をまと め上げる必要性が生まれていたのです.

このような言語ドキュメンテーションの研究活動の中で,計算機科学の重要な 知識が残念ながら扱われていません.それは「データモデル」と呼ばれている ものです.データモデルとは,記録する情報そのものの姿です.実は,計算機 で情報を扱う際には,入力・処理されるデータは,単なる数値や文字だけでな く,必ずデータ構造と呼ばれているデータモデルの実現型を伴っています. 普段のアプリケーションで扱っている,入力したり検索したりするデータには, 既にプログラマーが設定してあるデータモデル(データ構造)が与えられてい ますが,わたしたちはそれを意識せずに,データそのものを情報として扱うこ とができています.ところが,言語学者が,言語情報を記録・整理・編集・ 利用・保存をしようとするとき,既存のアプリケーションでは不満であったり, また,作成した言語資料のデータ寿命を考慮してゆくと,どうしても,既存の アプリケーションに頼らずに,または,データ寿命を伸ばすために,アプリケー ションには強くは依存しない言語資料を作りたいと考え始めます.そのときに 必要となる知識がデータモデルとデータ構造の知識です.

データモデルは,プログラマにとっては必須の知識ですが,これまでは,言語 学者には不要の知識とされてきました.しかし,特定のアプリケーションには 依存ぜずに,アプリケーション間でデータの交換が容易な言語データを作成し たいと考える言語学者にとって,これは必須の知識となってきます.

言語資料は,それを作成した研究者だけのものではなく,言語研究の共有財産であり,さらには,言語コミュニティに還元されるものであること,そしてそれは,言語資料を作成した研究者の寿命を遥かに超えたものであることを知ったとき,その言語資料を作成する研究者は,自らの利便さのためにデータを作成することに負い目を感じることになるでしょう.そのときに必要となってくるのが,データモデルの知識になります.

なおこのオンラインラジオコースの一部は科研費「記述・フィールド言語学向け言語資料の理論的・実践的言語ドキュメンテーション研究」(課題番号:17K02749)の成果によるものです.