2023~25年度 科研(基盤B)
「ICNALE-WE22:アジア圏22か国を網羅する新しい英語学習者作文コーパスの構築と分析」(23H00641)1326万円
■概要
ICNALEのコアとなっている作文モジュール(Written Essays)の地域カバレージを向上させるため、収集対象国を、現状の10か国から大幅に拡大することを目指す。これにより、アジア圏におけるEFL/ESL比較の精緻化と分析の妥当性の向上をはかる。
■資料
ICNALEメインサイト
ICNALE-WE22プロジェクト進捗報告
2020~23年度 科研(挑戦的研究(萌芽))※当初予定を1年間延長し、2023年度末に完了。
「言語から見た日米マインドスケープ比較:データサイエンス志向型小説研究の試行」(20K20699)598万円
■概要
世界初の本格的な英語コーパスとされるBrown Corpusの"Fiction"セクションのサンプリング基準を現代日本語小説に適用して新たな小規模コーパスを構築し,比較可能性を担保した上で,日米小説におけるキーイメージの表象の差異を解明する。プロジェクトでは、1961年か2021年までの60年間を対象に、10年ごとにサンプリング年を決め、三大文芸誌に掲載された作品からデータを収集し、著作権処理を済ませた上で「6121 JFIC」コーパスとして公開した。本コーパスは、(1)60年間の言語変化が観察できる、(2)収録された2種のAI英訳データによって英語からの検索が可能である、(3)オンライン検索システム上で使用が可能で、各種のコーパス検索技術が平易に適用できる、といった特徴を有する。また、同様のコーパス構築の作業を軽減する目的で、日本語と英語のテキストデータから統合語彙表を自動作成するJapanese/English Word Frequency Table Generator(JEWFTG)を開発し、公開した。
■資料
6121 JFICプロジェクト進捗報告
6121 JFIC Online検索システム
J/E WFTGシステム(解説論文)
2020~23年度 科研(基盤研究B)※当初予定を1年間延長し、2023年度末に完了。
「アジア圏英語学習者の作文・発話に対する世界最大級公開型評価データセット開発と分析」(20H01282)1,300万円
■概要
アジア圏10か国・地域の学習者による産出(作文・対話各140本)に関して,異なるL1・国籍・職業・習熟度を有する国際評価委員会による体系的な評価データ(ICNALE Grobal Rating Archives)を収集し,分析を行う。最終的に160名の評価者によるデータを収集し、世界最大級の評価データセットとして公開した。v1.0、v2.0を経て、2024年3月には、データの補完と修正をふまえたICNALE GRA v2.1が公開された。
■資料
ICNALEメインサイト
ICNALE Global Rating Archives(GRA)科研プロジェクト進捗報告
ICNALE GRA v2.1解説論文