昨日(8日)、AAMT(アジア太平洋機械翻訳協会)のミーティングで椎茸プロジェクトのお話をしてきた。 質疑などを通して気づいた、これまでのまとめ方で弱かったところの簡単なメモ。 辞書・コーパス・アーカイヴの区別が、言語の実態的な区別でありまた言語認識の理論的な区別でありまた言語記録/メディアの社会的な編成を表したものであることは、OK。 アーカイヴという言葉は要検討。これで押し切ってもよい。 NLの最近の流れ(コーパスベース)から言うと、コーパスのところであらゆる言語単位を扱う。このうち、語彙は辞書へ、歴史的記憶を伴う表現はアーカイヴへと再編成する、というかたちで問題は定義できる。 これを、翻訳者のレファレンス行動から捉えると、単語や熟語などは辞書に排他的に結びつけられているかの感を与えてしまう。 NLの流れの中で、一回性・歴史・具体性・アーカイブ・ラングの実体を出力とするかたちで問題を言

