研究概要

本研究では,人間によるライティング・パフォーマンス評価と機械学習に基づくウェブシステムとを融合させることによって,第2言語としての日本語ライティング評価及びライティング教育の支援ツールを開発する。

方法としては,これまでコーパスで公開されることの少なかった欧米言語の5種類のプロンプト(ナラティブ,描写,比較対照の説明,論証等のモード)のデータを,海外11か国(クロアチア,フランス,ドイツ,ハンガリー,イタリア,オランダ,セルビア,スロベニア,スペイン,ロシア,アメリカ)よりオンラインで収集する。それを,ライティング評価班で評価し,レベル判定を行う。システム構築班は,学習者のライティングに含まれる潜在的なテキスト特徴量等の情報によって,レベル判別システムを開発する。パフォーマンス評価判定と自動判別システムによる評価判定の相互検討を行い,精度の高い自動評価ができるように試みる。

第2言語ライティング能力は,基本的に「内容」や「構成」等の「文章を書くための能力」(writing expertise)と「言語能力」(L2 proficiency)から成ると考えられる。自動評価において測れるのは主に「言語能力」に関する要素だと考えられるが,前者の「構成」に関しては,「マクロ構成」や「メタ言語」等をハイライトするツールを開発し,ライティング教育の支援を行う。

最終年には,本研究の評価システムによるレベル別ライティング・サンプルとともに,学習者のライティングを総合評価するウェブ型レベル判別システム「構成」の教育支援を行うシステムをウェブで公開する予定である。