本文へスキップ

KOJIMA Masumi's Website

語彙の豊かさ指標 S(Kojima & Yamashita, 2014)

S (小島, 2010, 2011)

小島 (2010、 2011) は、語彙の豊かさ指標Sを開発した。Sは、テクストから50語ずつ取った各サンプルにおける高頻度語の累積カバー率をデータとし、データに最も近似するモデルを求め、累積カバー率が100%に達する単語の頻度順位を推定する。

Sは、Lexical Frequency Profile (Laufer and Nation 1995)、 Beyond 2000 (Laufer、 1995)、P_Lex (Meara and Bell、 2001)、 Advanced TTR や Advanced Guiraud (Daller et al.、 2003) と同じように、語彙リストを使用してテクストにおける語彙の豊かさを測定する。Sとこれらの指標との重要な違いは、Beyond 2000、 P_Lex、 Advanced TTR、 Advanced Guiraud が学習者の使用する語彙を高頻度語と低頻度語2分類するのみであるのに対し、Sは語彙の頻度順位を連続データとして扱うという点である。前者は例えば、頻度順位1001番目の語も3000番目の語も同じ「低頻度語」として扱われるなど、語彙の頻度順位が持つ情報量を著しく減少させると考えられる。それに対しSは、LFPと同様に異なる頻度レベルの語彙のカバー率を考慮するが、SはLFPように4つの数字をスコア(例:80%-10%-5%-5%)とすることなく、学習者の産出語彙の頻度分布を1つの数値(S値)で要約する。またLFPのようなパーセントのデータではないので、統計処理が容易であるという利点もある。

さらに、Meara & Bell (2001) は、P_Lexにおける典型的なλ値は0〜4.5と述べているが、それらのλ値が具体的に何を示すのか、イメージしにくい。それに対し、例えばS が2,016の場合、そのテクストの発表語彙レベルは2,016語と解釈できるという利点がある。また、Kojima and Yamashita (2014) は、S が Beyond 2000、P_Lex、 Advanced Guiraud よりも短いテクストで信頼性が高いことを示した。

小島 (2011) は開発したSの妥当性検証を行い、学習者のエッセイにおけるS値は、書き手の語彙テストのスコアと有意な相関があり、習熟度の異なる学習者グループ間や上級学習者と母語話者のグループを有意に区別することを示した。


S の分析ツール

参考文献

  • 小島ますみ (2010) 「新しいlexical richness 指標Sの提案:学習者の産出語彙頻度レベルの推定」『英語コーパス研究』 第17号 1-15頁
  • 小島ますみ (2011) 「英語学習者の産出語彙における語彙の豊かさ指標Sの提案と論証によるSの妥当化」名古屋大学大学院国際開発研究科提出博士論文
  • 小島ますみ (2013) 「語彙の豊かさと習熟度の関係」 投野由紀夫・金子朝子・杉浦正利・和泉絵美(編著)『英語学習者コーパス活用ハンドブック』108-116頁 大修館書店
  • Kojima, M., & Yamashita, J. (2014). Reliability of lexical richness measures based on word lists in short second language productions.
    System: An International Journal of Educational Technology and Applied Linguistics, 42, 23-33