学年 | 人数 | 作文数 | 学年 | 人数 | 作文数 |
---|---|---|---|---|---|
小1 | 37 | 74 | 中2 | 112 | 224 |
小2 | 43 | 86 | 中3 | 45 | 90 |
小3 | 35 | 70 | 高1 | 90 | 180 |
小4 | 27 | 54 | 高2 | 86 | 172 |
小5 | 58 | 116 | 高3 | 30 | 60 |
小6 | 62 | 124 | 大1 | 53 | 106 |
中1 | 22 | 44 | Total | 700 | 1,400 |
(1)
ケンは、かぎがないので、ちゃいむをならしましたが、マリは、でてくれませんでた。マリは、ねているので、きこえませんでした。ケンは、きんじょから、はしごをもってきてしまいました。けいさつの、さいれんに、マリは、おきてケンの、ほうをみたら、ケンが、マリのほうをゆびさして、びっくりしました。(小1、G01_001) (2) マリはよるの12じだからぐっすりねむりについていました。だからはしごでまどからはいろうとしたらけいかんがきてケンをちゅういしてケンがおえりてきてじじょうをはなしたらマリがおきてけいかんがなっとくしておわり。(小3、G03_001) (3) 家のチャイムをならしてもだれも出てきません。「2階でねているのか」と思ってマリをいくら呼んでも聞こえていません。しかたなくケンは庭のはしごを使って家のカーテンが開いている窓をたたこうとしました。「あともう少し」というところで警官にあやしまれ、事情聴取されました。わけを話すと警官も分かってくれたらしく、その声が2階にも聞こえたらしくマリが気づいてくれました。(小5、G05_001) (4) ケンは言いました。「どうしよう。今日はマリちゃんと今後について話し合う予定なのに…」そこでケンは大声でさけんでマリに気づいてもらおうとしました。しかしぐっすりねてしまっているマリには届きません。そして考えあぐねた結果、自分のカバンからはしごを取り出しました。そうこのやけに小さなカバンはまほうのカバンだったのです。そしてそのはしごをやねにかけ、登ろうとしたその時、「何してるんですか」と声をかけられました。ふりむくとそこには警官が。「あやしいものではないんです、ただ鍵を…」とケンは説明しましたが、警官は、「分かっています。ただ私の話を聞いて下さい。あなたが結婚しようとしている「マリ」こと佐藤魔利は、結婚さぎ師です。佐藤に新たなカモができたと分かったので調査していました、あなたのことです。」「ええっ!?」「あのマリちゃんが?」「はい。今後について話しあうと言って金をまき上げる、彼女のさぎの方法です。」「そうだったのか…ありがとうございます。今日鍵を忘れていたおかげで金を取られずに済みました…ありがとうございました、」「あのマリがさぎ師だったなんて…」二人がほほえみあった時、窓が開き、マリが「何してるのケンちゃん、おそかったわね。明日のピクニック、用意してるわよ。」「では明後日にもう一度うかがいます」と言い残し、警官は去って行きました。(中1, G07_001) (5) マリに声をかけたが、マリはねていたので反応がありませんでした。しかたなく、はしごを使ってあいている二階のまどから中に入ろうとしましたが、警官が勘違いして、呼び止められました。その後警官と和解し、その音でマリも起きてしまいました!(中3,G09_001) (6) 家の二階にいるマリに助けを求めますが、寝ているため、返事がありません。そこでケンが、はしごを使い、二階のマリに気づいてもらおうとしたところ、不審に思った警官にとがめられました。ケンが事情を説明し、警官の誤解を解いていると、マリが起きてきて、外のようすを窓からのり出して確かめました。(高2、G11_001) (7) 夜中だったのでインターホンを鳴らしても、家の中にいるマリは気づいてくれませんでした。ケンはマリの寝室の窓が空いていることに気付いたので「開けてくれ〜!」と呼びかけましたがマリは返事をくれません。なぜならマリはぐっすり眠っているからです。ケンはしばらく呼び続けましたが、庭にはしごをおいてあったことを思い出しました。はしごを開いている窓に立てかけ登っていると、たまたま通りかかった警察に呼び止められました。散々説明しても納得してくれませんでしたが、その話し声でマリが目覚め、ケンは無事、家に入ることができました。(大1、G13_001) |
(1) JASWRIC 開発チームは、本コーパスの使用により使用者に何らかの損害が生じても、責任を負いません。 JASWRIC Development Team shall not be liable to the user for any trouble, damage or loss caused by his/her use of theJASWRIC, regardless of the cause. (2) JASWRIC 開発チームは、一般的なレベルでの注意を払い、提供する情報に誤りが含まれないよう努力していますが、このことは、コーパスデータに誤りが含まれないことを意味しません。JASWRIC開発チームは、提供するデータに含まれる誤りについて、責任を負いません。 The JASWRIC Development Team takes utmost care not to make any errors or omissions in providing the data and the information of the JASWRIC, however they may include inaccurate contents, typographical errors, or improper information. The JASWRIC Development Team shall not be liable for any such inaccuracy, incompleteness, inadequacy and the unfairness of the data and the information presented in the JASWRIC (3) JASWRIC 開発チームは、提供するデータの真正性・完全性・適切性・妥当性を法的に保証することはしません。 The JASWRIC Development Team makes no legal warranty or representation regarding the accuracy, completeness, adequacy and fairness of the data and the information of the JASWRIC. (4) JASWRIC のデータは、事前の告知なく、修正・変更されることがあります。また、JASWRIC の検索サイトも、事前の告知なく、閉鎖されることがあります。 The data and the information of the JASWRIC may be changed or modified without any prior notice, and the JASWRIC Site may be discontinued or closed without any prior notice. (5) JASWRIC 開発チームは、前項に示したデータの修正・変更、また、検索サイトのサービス停止により、利用者に損害が発生しても、責任も負いません。 The JASWRIC Development Team shall not be liable for any loss caused by the modification of the data and the information and also by the discontinuation or closing of the JASWRIC Site, regardless of the reason. (6) JASWRIC の利用者は、コーパスの参加者や彼らが所属する学校等について、一切の批判または批判と解釈されうる行為を行ってはいけません。 It is prohibited to criticize the participants and the schools to which they belong. (7) JASWRIC の利用者は、コーパスの参加者の特定につながる一切の行為を行ってはいけません。 It is prohibited to attempt to identify the participating students. (8) JASWRIC の利用者は、JASWRIC のデータの一部または全体を複製ないし再配布する行為を行ってはいけません。 It is prohibited to reproduce and/or redistribute a part or the whole of the JASWRIC data. (9) JASWRIC のデータを使用して研究を行った場合は、必ず、以下の参考文献を表示しなければなりません。 JASWRIC users are required to mention the work below appropriately in the references. 石川慎一郎・友永達也・大西遼平・岡本利昭・勝部尚樹・川嶋久予・岸本達也・村中礼子(2023)「『小中高大生による日本語絵描写ストーリーライティングコーパス』(JASWRIC)の構築:L1/L2日本語研究の新しい資料として」『言語資源ワークショップ発表論文集』7, 393-416. |
注1)中国の方で、利用者申請(Google Form)サイトにつながらない方は、お名前・所属・使用目的を添えて、直接、石川宛、メールで連絡ください。 注2)検証目的などで、過去の版(v1.0)が必要な方も、上記同様、お名前・所属・使用目的を添えて、直接、石川宛、メールで連絡ください。 宛先: iskwshin@gmail.com |
検索タイプ | 検索機能の概要 |
---|---|
KWIC検索 | ターゲット語を中央に、左右に前後の文脈を配置して用例を一括出力する。 |
Collocation 検索 | ターゲット語について、左右3語以内の各々の位置で頻出する語を一括表示する。共起スコアは、頻度・tスコア・対数尤度比・相互情報量の4種から選択可能。 |
Wordlist検索 | 表層形(表記形)または語彙素(短単位)の単位で、単語頻度表を一括出力する。全データ対象のほか、特定の学年のみ、特定のトピックのみ、を指定することも可能。 |
Keyword 検索 | 関心対象の書き手群(Target)と、参照グループの書き手群(reference)との間で、使用されたすべての語(表層形)の頻度を比較し、Target側で統計的に有意に過剰使用または過少使用されている語を抽出し、一覧表示する。たとえば、小1 vs 全学年(小1~大1)の比較で、小1作文の特徴語を抽出できる。また、中1~中3 vs 全学年(小1~大1)の比較で、中学生作文の特徴語を抽出できる。 |
Word Freq検索 | ターゲット語の頻度を学年別で比較し、棒グラフを出力する。学年ごとにもとの作文の総量が異なるため、調整頻度に変換してグラフを描画する。 |
JASWRIC Online 検索語入力ガイド(2022/08/29) 1)語の単位(lemmatization):JASWRICでは、語彙リスト検索と特徴語分析に限って、書字形(※実際にテキストに出現した形)と語彙素(※活用形を1つにまとめた単位、英語で言うlemmaに相当)を指定した上で分析することが可能です。書字形の「する」は「する」だけを意味します。語彙素の「する」は、「さ(れる)「し(ない)」「すれ(ば)」「する」など、活用形のすべてを意味します。細かい語の用法(たとえば動詞形など)の違いに関心がある場合は書字形単位で、語彙のざっくりした内容に関心がある場合は語彙素単位を選ぶとよいでしょう。 2)検索語入力(Words)に関して、KWIC分析における検索は、常に、書字形(短単位)の単位で行われます。検索ボックスに「する」を入れれば「する」を含む用例が抽出されます。語彙素をまとめているわけではないので、「する」を入れても、その活用形(「さ(れる)「し(ない)」「すれ(ば)」など)は抽出されません。 3)活用形を同時に検索したい場合は、縦棒(|)を使ってOR検索を行います。たとえば、「さ|し|する|すれ|しろ」と入力すれば、「する」とその活用形を同時に検索することができます。 4)書字形のため、異表記は別語扱いになっています。たとえば、「鍵」と「カギ」は表記が異なるため、両方を一度に検索するには、OR検索を用いて「鍵|カギ」のように入力します。 5)連語や複合形(=複数の形態素の連続シーケンス)を検索する際は、形態素の切れ目ごとに、半角のスペース(以下では[sp]で表示)が必要です。たとえば、「見ている」という表現を探すには、「見[sp]て[sp]いる」と入力し、「見ていた」を探すには「見[sp]て[sp]い[sp]た」と入力します。自分の探したい表現がどのように区切られるかわからない場合は、「Web茶まめ」に当該表現を入力し、どのように区切られるか確認してください。 6)OR検索は、連語の中でも使用できます。たとえば、「ケン|マリ[sp]は|が|の|を|に」と入力すれば、「ケンは」「マリが」「ケンの」など、「ケン」または「マリ」の直後に主要な助詞が後続する例を同時に検索することができます。 7)品詞情報(POS)を検索条件に加えることもできます。検索ボックスの右側にある[POS]を押すと、以下のような品詞選択画面(下記は名詞を選んだ場合)がポップアップ表示されます。 品詞選択画面は上段(大区分)と下段(小区分)の二階層構造になっており、上部(赤色で表示)で品詞の大区分を指定すると、下部(グレーで表示)に当該品詞の小区分が表示される仕様になっています。下段に表示されるボタンのいずれかを押すと、当該品詞を示すコードが自動的に検索ボックスに入力されます。なお、[ALL]とは全小区分の同時指定のことを意味します。小区分のうち、固有名詞を選ぶと絵課題の登場人物名である「ケン」や「マリ」が、普通名詞を選べば「鍵」や「チャイム」が、数詞を選べば「二(階)」などが、助動詞語幹を選べば「(でき)そう」や「(その)よう」などが抽出されます。品詞と書字形を連語として指定することもできるます。たとえば、「[名詞] は」と入れると、名詞の後に「は」が後続する例が抽出されます。 8)以下は、主な検索ルールの早見表です。
|
JASWRIC Online 統計ガイド(2022/08/29) JASWRIC Onlineでは、共起語分析と特徴語分析の結果画面で、複数の統計量(Statistics)を切り替えて結果を比較することができます。主な統計量としては、粗頻度(Raw Frequency)、t統計量(t-score)、 カイ二乗統計量(Chi2)、対数尤度比(Log-likelihood)、相互情報量(Mutual Information (Score))などがあります。使い分けについては下記をご覧ください。 共起語分析の結果表示における統計値の選択 ・Raw Frequency 粗頻度(共起語の頻度そのまま) ・t score t t統計量(検定で使用するt統計量の値です。共起が偶然の誤差を超えて多く出ているかどうかを数値で示します) ・Log-likelihood (Ratio) 対数尤度比(差がない場合の期待値と実測値の差を加工した値です。カイ二乗統計量に比べ、コーパスサイズに違いがある場合でも安定した結果を返すと言われます) ・Mutual Information (Score) 相互情報量(頻度の情報を対数化で圧縮するため、低頻度だけれど強力に結びついているものを高く評価します) 特徴語分析の結果表示における統計値の選択 ・Chi 2 カイ二乗統計量(頻度の差の検定で広く使われる統計量です。分割表のセルごとに、期待値と実測値の差を期待値で割った値を求め、それらを総計した値です。Chi2=3.84以上ならα=5%で、Chi2=6.63ならα=1%で、Chi2=10.83ならα=0.1%で、それぞれ有意な結びつきと解釈できます。ただし、特徴語の分析では検定を反復して行うため、より大きな値を出しているものに限って議論したほうが安全と言えます。) ・Log-likelihood (Ratio) 対数尤度比(カイ二乗統計量の微修正版。対数化をかけることで、頻度の影響を緩和しています。したがって、頻度が大きく離れたデータ間での比較などを行う場合は、Chi2よりも妥当性が高いと言われています。統計量の解釈はChi2と同様です。) |