「語彙プロファイラー」で学習すべき英単語を見つける方法:Compleat Lexical Tutorの使い方

「語彙プロファイラー」で学習すべき英単語を見つける方法:Compleat Lexical Tutorの使い方

英単語を学ぶ上では、重要な単語を、様々な活動でバランスよく学習することが欠かせません。それでは、どのようにすれば「重要な単語」を特定できるのでしょうか?

ある単語が重要であるかどうかを判断する際に役立つ基準の1つとして、その単語の出現頻 (frequency) 挙げられます。わかりやすくいえば、会話や書籍で頻繁に使用される単語は、たまにしか出てこないマイナーな単語よりも優先して学ぶに値する、ということです。

単語の出現頻度に関して重要なことは、ごく少数の単語があらゆるテキストの大部分を占め、それ以外の大多数の単語は、ほとんどまれにしか出現しないということです。これは「Zipfの法則」と呼ばれます(Zipfの法則に関しては、こちらのYouTubeビデオの解説がわかりやすく、お勧めです)。

重要な英単語とそうでない英単語

英語では頻度に応じて、単語を以下の3つのグループに分類することが一般的で (Nation, 2013)。

単語グループ 頻度レベル 語数 カバー率
(1)    高頻度語(high-frequency words) 1000語~3000語 3000語 約94~95%
(2)    中頻度語(mid-frequency words) 4000語~9000語 6000語 約3~4%
(3)    低頻度語(low-frequency words) 10000語以上 多数 約2%

上表の「カバー率」とは、ある単語がテキスト全体の何%を占めているか(カバーしているか)を指します。例えば、英語で最も頻繁に使われる単語は定冠詞the ですが、the だけであらゆるテキストの約7%を占めると言われています(つまり、英語で文章を読むと、100語に7回の割合でtheが出てくる、ということです)。この場合、the のカバー率は7%となります。ちなみに、一般的な英語の書籍では、1ページに含まれる単語は約300語程度だと言われています。the のカバー率が7%だと考えると、1ページ中に21回もtheという単語が登場する計算になります。

英単語の3つのグループについて見てみましょう。1つ目のグループである高頻度語は、英語で最も頻度が高い3000語から構成されます。このグループに属する3000語だけで、一般的な英文テキストの約94~95%をカバーします。1語を学ぶごとにカバー率を大きく増やすことができるので、非常にコスト・パフォーマンス(費用対効果)が高い単語と言えます。英語を学習する上では、まずこの高頻度語をどのような手段(単語カードや単語帳など)を使ってでも良いので覚えましょう。

2つ目のグループである中頻度語は6000語から構成され、一般的な英文テキストの約3~4%を占めます。高頻度語と比べると1語あたりのカバー率はだいぶ下がりますが、会話・映画・小説・新聞を理解するには、6000~9000語程度を知っている必要があるという研究があります(Nation, 2006)。英語の上級者になるためには、高頻度語3000に加えて、中頻度語6000もぜひおさえておきたいところです。

3つ目のグループは、低頻度語と呼ばれます。高頻度語・中頻度語以外の単語は、すべて低頻度語に分類されます。低頻度語は数多くありますが、一般的な英文テキストにおけるカバー率はすべて合わせても2%程度にしかなりません。そのため、学習すべき優先順位は低くなります。高頻度語と中頻度語を完全にマスターしたという学習者でない限り、低頻度語をあえて学習する必要はないでしょう。

英単語を学ぶ上で重要なことは、ごく少数の単語(高頻度語)があらゆるテキストの大部分を占め、それ以外の大多数の単語(中頻度語や低頻度語)は、ほとんどまれにしか出現しないということです。例えるなら、英単語はごく少数の働き者と、その他大勢の怠け者から成り立っている、ということです。

注)「最も頻度が高い単語3000語で、あらゆるテキストの約94~95%をカバーする」といった場合の「1語」とは、「ワードファミリー」(word families) 呼ばれるものです。ワードファミリーでは、ある英単語の活用形や派生形も含めて、「1語」と数えます。例えば、includeのワードファミリーには、その活用形であるincludes, included, includingや、派生形であるinclusive, inclusionが含まれます。

語彙プロファイラーで英単語の頻度を調べる

せっかく英単語を学習するのであれば、めったに出会わない怠け者の単語ではなく、頻繁に出会う働き者の単語を学ぶようにしたいものです。働き者の単語と怠け者の単語を見分けるためには、「語彙プロファイラー」というツールが有益です。

語彙プロファイラーには様々なものがありますが、本稿ではVocabProfilerをご紹介します。VocabProfilerはケベック大学モントリオール校のTom Cobb教授が開発したもので、https://www.lextutor.ca/vp/comp/から無料で使用できます。

VocabProfilerの使い方

VocabProfilerで語彙レベルを調べるためには、画面中央のボックスに、分析したい英文テキストを貼り付けます。ここでは、例としてNew York Timesの“Republicans Grind Impeachment Inquiry to Halt as Evidence Mounts Against Trump”という記事 (2019年10月23日) を貼り付けます。

*画面中央のボックス(上の写真で青く囲った部分です)に、分析したい英語の文章を貼り付けます。

テキストを貼り付けた後は、画面右上にある“FRAMEWORKS”というボックスの中から、分析に使用する語彙リストを選択します。通常は一番上にある「BNC-COCA 1-25k」を選択することをお勧めします。

その後、画面右下にある黄色い [SUBMIT_window] ボタンをクリックします。すると、以下のように分析結果が表示されます。

分析結果の上の方にある表をご覧ください。この表の「Tokens (%)」は、それぞれの頻度レベルの単語が文中の何%を占めて(=カバーして)いるかを表します。例えば、「K-1」という行の「Tokens (%)」には「78.7%」とあります。これは、1000語レベルの単語(K-1)がこの文章全体の78.7%を占めているという意味です(1kや2kの“k”とはkilo、すなわち1000という意味です)。つまり、この英文記事中で用いられている単語の約8割は、英語で最も頻度が高い1000語が占めている、ということです。

次に、「K-2」という行の「Tokens (%)」には「7.0」とあります。これは、2000語レベルの単語(K-2)がこの文章全体の7.0%を占めているという意味です。

次に、同じ表の一番右にある「Cumul. token(%)」の行をご覧ください。この列は、「累積カバー率」(cumulative coverage) 表します。例えば、「K-1」という行の「Cumul. token (%)」には「78.7%」とあります。これは、1000語レベルまでの単語(K-1)がこの文章全体の78.7%を占めているという意味です。

その下の「K-2」という行の「Cumul. token (%)」には「85.7%」とあります。これは、2000 (k-2) ベルまでの全ての単語、すなわち、1000語レベルと2000レベルの単語を合計すると、英文中の85.7% (= 78.7% + 7.0%) 単語をカバーできる、という意味です。つまり、この英文記事で用いられている単語の85.7%は、英語で最も頻度が高い2000語から構成されている、ということです。

この表はさらに、「Coverage 95」と「Coverage 98」という2つの線で区切られています。

「Coverage 95」とは、「英文中で用いられている95%の単語をカバーするのに必要な語彙レベル」を表します。この表では、5000語レベル(k-5)の下に「Coverage 95」という区切りが入っています。つまり、この英文記事で用いられている単語の95%をカバーする上では、少なくとも5000語を知っている必要がある、ということを意味します。念のため5000語レベル(k-5)の「Cumul. token (%)」を見てみると「95.6%」となっており、英語で最も頻度が高い5000語を知っていれば、この英文記事の95%以上をカバーできる、ということが確認できました。

ちなみに、標準的なテキストであれば、3000語レベルまでの単語(高頻度語)で94〜95%の単語はカバーできることが知られています。5000語を知らないと95%のカバー率に達しないという点で、このNew York Timesの記事は比較的難易度が高いと言えます。

「Coverage 98」とは、「英文中で用いられている98%の単語をカバーするのに必要な語彙レベル」を表します。この表では、8000語レベル(k-8)の下に「Coverage 98」という区切りが入っています。つまり、この英文記事で用いられている98%の単語をカバーする上では、少なくとも8000語を知っている必要がある、ということを意味します。8000語レベル(k-8)の「Cumul. token (%)」を見てみると「98.1%」となっており、英語で最も頻度が高い8000語を知っていれば、この英文記事の98%以上をカバーできる、ということが確認できました。

95%・98%のカバー率がなぜ重要なのか?

ところで、なぜ英文中で用いられている95%(あるいは98%)の単語をカバーするのに必要な語彙レベルを知る必要があるのでしょうか? それは、「学習者が辞書などを使わずに自力で文章を理解するためには、文中の95〜98%以上の単語を知っている必要がある」という研究結果があるからです。すなわち、100語から構成されるテキストを自力で読んで理解するためには、その内の95〜98語以上が既知であることが望ましいということです。

VocabProfilerによる分析結果をふまえると、今回分析したNew York Timesの記事を自力で理解するためには、5000〜8000語レベルの語彙力が必要であると推定されます。

なお、どのくらいの英単語を知っているかを調べる際には、以下のwebサイトに掲載されているVocab Levels Test, Vocab Size Test, Updated Vocab Levels Test等のテストが活用できます。

https://www.lextutor.ca/tests/

難しい単語を特定する

分析結果の画面で一番下までスクロールすると、「Families List」と書かれたセクションがあります。ここでは、英文テキストに登場した単語が頻度レベルごとに提示されています。例えば、このセクションで1kに分類されている単語は、「最も頻度が高い単語1000」を示します。下の画面では、青字で表示されている単語がこれに該当します (a, about, across, Adam, afterなど)。

次に、2kに分類されている単語は、2000語レベルの単語を示します。上の画面では、緑色で表示されている単語がこれに該当します (accuse, aid, assist, damage, denyなど)。

各単語の後の[ ]は、その単語がテキスト中に登場した回数を指します。例えば、a_[16]は、“a”という単語が全部で16回登場したことを表します。

ここで、冒頭に示した英単語の分類に戻りましょう。英語では頻度に応じて、単語を「高頻度語」(1000語〜3000語レベル)、「中頻度語」(4000語〜9000語レベル)、「低頻度語」(10000語レベル)という3つのグループに分類することが一般的でした。

今回分析で用いたNew York Timesの記事では、中頻度語(4000語~9000語レベル)に該当するのは以下の単語です。

語彙レベル 英単語
4000語レベル chaos, ms, obstacle, senator, sergeant, suite, testimony
5000語レベル chant, enlist, smear, sow, withhold
6000語レベル deflect, deposition, hush, impeach, juror, notwithstanding
7000語レベル defiance, transparency
8000語レベル onslaught, quid, unearth
9000語レベル incriminate, subpoena

また、低頻度語(10000語レベル以上)に該当するのは以下の単語です。

語彙レベル 英単語
10000語レベル 該当なし
11000語レベル quo
12000語レベル standoff
13000〜17000語レベル 該当なし
18000語レベル ultraconservative

VocabProfiler以外の語彙プロファイラーも使ってみよう

今回ご紹介したVocabProfiler以外にも、語彙プロファイラーは多くあります。例えば、関西大学の水本篤教授が開発したNew Word Level Checker (https://nwlc.pythonanywhere.com) は、(1) New JACET 8000、(2) SVL 12000、(3) The New General Service List (NGSL)、(4) CEFR-J Wordlistという4つの語彙リストに基づいて、英単語の語彙レベルを調べることが出来ます。

New JACET 8000では、母語話者の使用頻度だけでなく、日本国内で使用されている英語教科書や入試問題などにおける出現頻度に基づき、語彙レベルを補正しています。そのため、日本における英語学習者にとっての難易度を推定したい際には、母語話者の使用頻度のみを元にした語彙リストよりも、New JACET 8000の方が適している場合もあります。

母語話者の使用頻度を知りたい場合はVocabProfilerでBNC-COCA等のリストを使い、日本における英語学習者にとっての難易度を推定したい際にはNew Word Level CheckerのNew JACET 8000を使うなど、目的に応じて使い分けると良いでしょう。

ある英文テキストの難易度を調べたり、テキスト中の重要な単語を特定する上では、語彙プロファイラーは非常に有益です。本記事の内容を参考に、語彙プロファイラーで様々なテキストを分析されてみてはいかがでしょうか?

ちなみに本記事でご紹介したVocabProfilerは、Compleat Lexical Tutor (https://www.lextutor.ca/) というwebサイトの機能の1つです。Compleat Lexical Tutorは機能が豊富で非常に素晴らしいwebサイトなのですが、多機能であるゆえに使用方法が若干わかりにくく、さらに90年代を彷彿させるデザインであるため(ずっと見ていると目がチカチカします)、とっつきにくい印象があります。本記事をきっかけに、英語学習者や英語教師にとって、Compleat Lexical Tutorがより身近なツールとなることを願っております。

なお、VocabProfilerについては、拙著『英単語学習の科学』(研究社)の2章でもご紹介していますので、そちらも合わせてご覧ください。

文責:
中田達也(立教大学異文化コミュニケーション学部准教授)
江口政貴(オレゴン大学言語学部博士課程在籍)
柳沢明文(ウェスタンオンタリオ大学教育学部博士課程在籍)

参考文献

Nation, I. S. P. (2006). How large a vocabulary is needed for reading and listening? Canadian Modern Language Review, 63, 59–82.

Nation, I. S. P. (2013). Learning vocabulary in another language (2nd ed.). Cambridge, UK: Cambridge University Press.

【研究結果】単語テストを累積的にするだけで英単語学習が3倍以上促進される

私が執筆した以下の論文が、TESOL Quarterly (Wiley-Blackwell)に掲載されました。

Nakata, T., Tada, S., McLean, S., & Kim, Y. A. (2020). Effects of distributed retrieval practice over a semester: Cumulative tests as a way to facilitate second language vocabulary learning. TESOL Quarterly. doi:10.1002/tesq.596

(研究の背景)

中学校や高校の英語授業で、単語に関する小テストは一般的に行われていることと思います。私も中学生や高校生の頃に英語の授業で単語帳が配布され、毎回決められた範囲に関する小テストが行われていたことを覚えています。

「テスト自体に学習効果がある」という研究結果を考慮すると、単語テストの学習効果をいかにして高めることが出来るかは、重要な研究課題であると考えられます。

* なお、テスト自体に学習効果があるというのは「テスト効果」(testing effect)と呼ばれる現象です。テスト効果に関しては、以下の記事をご覧ください。

【研究結果】本当に何かを習得したいなら、学習ではなく〇〇が効果的

先日出版された私たちの研究では、英語語彙学習における非累積テスト(non-cumulative test)と累積テスト(cumulative test)の効果を比較しました。

ここで言う「非累積テスト」とは、それぞれの出題範囲に重なりがないテストを指します。例えば、「中間テスト」では学期の前半で学習した内容が出題され、「期末テスト」では学期の後半で学習した内容が出題される時、中間テストと期末テストの出題範囲には重複がありません。よって、これらのテストは非累積テストです。

一方、「累積テスト」では、その名の通り出題範囲が累積的に増えていきます。例えば、「中間テスト」では学期の前半で学習した内容が出題され、「期末テスト」では学期の後半だけでなく前半でも学習した内容が出題される時、このテストは累積テストと呼ばれます。

数学や心理学の分野においては、累積テストの方が非累積テストよりも学習を促進することが示されています (Beagley & Capaldi, 2016; Khanna, Brack, & Finken, 2013; Lawrence, 2013; Mayfield & Chase, 2002)。しかしながら、外国語学習においても累積テストが記憶保持を促進するかどうかは、これまでの研究では明らかになっていません。

(研究の概要と結果)

上で述べたような背景をふまえ、我々の研究では英語語彙学習における累積テストと非累積テストの効果を比較しました。

参加者は薬学を専攻している日本の大学生72名でした。参加者は非累積グループと累積グループとに割り当てられました。いずれのグループでも、参加者は8週間にわたって80の医学用語を学習しました。授業は1週間に1回行われ、毎週10の英単語が導入されました。翌週の授業では、学習した単語に関する小テストが行われました。

非累積グループでは、前の週で導入された10単語が次週の小テストで出題されました。一方、累積グループでは、前の週で導入された単語だけでなく、それ以前の授業で導入された単語も出題範囲として指定されていました。

以下に非累積グループと累積グループのイメージを示します。

図1. 非累積グループのイメージ。小テスト1では「単語1~10」、小テスト2では「単語11~20」、小テスト3では「単語21~30」が出題範囲。それぞれの出題範囲に重なりがない。
図2. 累積グループのイメージ。小テスト1では「単語1~10」、小テスト2では「単語1~20」、小テスト3では「単語1~30」が出題範囲。回数を重ねるにつれて、出題範囲が累積的に増えていく。

注)累積グループ・非累積グループともに、毎週の小テストでは10問ずつ出題され、問題数に違いはありませんでした。唯一の違いは、出題範囲が異なっていたということでした。

最後の小テストの3週間後に事後テストを行い、学習効果を測定しました。その結果、累積グループの得点が非累積グループの得点を大きく上回っていました。両グループの差は非常に大きく、累積テストは非累積テストよりも3.4倍も効果的でした(日英翻訳テストで学習効果を測定した場合)。この結果は、累積テストは非累積テストと比較して語彙習得を大きく促進する可能性を示唆しています。

本研究で興味深かったのは、毎週の小テストでは非累積グループの方が累積グループよりも高い得点をとっていたにもかかわらず、学期末の事後テストでは結果が逆転し、累積グループの方が高い得点につながった、ということです。

この結果は、「短期的に学習を促進する学習法が、長期的な記憶保持を促進するとは限らない」ということを示唆しています。言い換えれば、「短期的に学習を阻害する(ように見える)学習法が、長期的な記憶保持を促進することもある」と言うことです(これは、“desirable difficulties”と呼ばれる現象です)。


図3. 累積グループと非累積グループの小テストおよび事後テスト得点。小テスト得点に関しては、非累積グループ(赤い線)が累積グループ(黒い線)を常に上回っていた。一方、事後テスト得点(グラフの一番右)に関しては両者が逆転し、累積グループ(黒い線)が非累積グループ(赤い線)よりも3倍以上高い得点に結びついた。

また、本研究の非累積グループでは80単語全てが小テストで1回ずつ出題されましたが、累積グループでは8回の小テストで全く出題されない単語が23個ありました。

しかしながら、累積グループで小テストに出題されなかった単語の事後テスト得点 (40%)は、非累積グループで小テストに出題された単語の得点(25%)を有意に上回っていました。言い換えれば、「小テストに出題されるかもしれない」と学習者に思わせるだけで良く、実際には出題しなくても十分な学習効果が期待できる、ということです。

ただし、それと同時に、累積グループで小テストに出題された単語の事後テスト得点 (56%)は、累積グループで小テストに出題されなかった単語の得点(40%)を有意に上回っていました。この結果は、「小テストに出題されるかもしれない」と学習者に期待させるだけで学習効果があるものの、実際に小テストに出題された単語の方が、そうでない単語よりも記憶保持が促進されるということを示唆しています。

すなわち、「この単語は重要なのでどうしても覚えて欲しい」という単語に関しては、小テストの出題範囲に入れるだけでなく、実際に小テストで出題した方が良い、ということです。


図4. 累積グループで小テストに出題されなかった単語の事後テスト得点 (40%)は、非累積グループで小テストに出題された単語の得点(25%)より高かった。同時に、累積グループで小テストに出題された単語の事後テスト得点 (56%)は、累積グループで小テストに出題されなかった単語の得点(40%)よりも高かった。
注)非累積グループではすべての単語が小テストに出題されたため、「非累積グループで小テストに出題されなかった」という組み合わせは存在しない。

毎週の英単語テストにひと手間加える(出題範囲を累積される)だけで単語学習が大きく促進されるというのは、非常に有益な研究結果であると考えられます。次回単語テストをする際には、新出語だけでなく、以前のテストでカバーされた単語も出題範囲に入れてみてはいかがでしょうか?

「なぜ累積テストは非累積テストよりも学習を促進するのか?」という理論的な側面に関心がある方は、以下の拙論をご参照ください。

Nakata, T., Tada, S., McLean, S., & Kim, Y. A. (2020). Effects of distributed retrieval practice over a semester: Cumulative tests as a way to facilitate second language vocabulary learning. TESOL Quarterly. doi:10.1002/tesq.596

(参考文献)

Beagley, J. E., & Capaldi, M. (2016). The effect of cumulative tests on the final exam. Problems, Resources & Issues in Mathematics Undergraduate Studies, 26, 878–888. doi:10.1080/10511970.2016.1194343

Khanna, M. M., Brack, A. S. B., & Finken, L. L. (2013). Short- and long-term effects of cumulative finals on student learning. Teaching of Psychology, 40, 175–182. doi:10.1177/0098628313487458

Lawrence, N. K. (2013). Cumulative exams in the introductory psychology course. Teaching of Psychology, 40, 15–19. doi:10.1177/0098628312465858

Mayfield, K. H., & Chase, P. N. (2002). The effects of cumulative practice on mathematics problem solving. Journal of Applied Behavior Analysis, 35, 105–123. doi:10.1901/jaba.2002.35-105

 

講談社「現代ビジネス」のwebサイトで連載を始めました

講談社「現代ビジネス」のwebサイトで英語学習に関する連載を始めました。今のところ、以下の3本の記事を公開しています。

第1回:
【研究結果】本当に何かを習得したいなら、学習ではなく〇〇が効果的

第2回:
「その学習法は正しいか? 『うまくいっている』という幻想に要注意」

第3回:
「【学習法】最も効果的な「復習スケジュール」に関する驚きの研究結果」

どうぞよろしくお願いいたします。

Studies in Second Language Acquisitionに共著論文が掲載されました

査読付き国際誌Studies in Second Language Acquisition(Cambridge University Press)に、鈴木祐一先生(神奈川大学)との共著論文が掲載されました。

Nakata, T., & Suzuki, Y. (2019). Effects of massing and spacing on the learning of semantically related and unrelated wordsStudies in Second Language Acquisition. 41, 287–311. doi:10.1017/S0272263118000219 [PDF]

研究の概要

外国語の単語を学ぶ上で、果物の名前(例. apple, banana, orange)、動物の名前(例. dog, cat, horse)、曜日の名前(例. Sunday, Monday, Tuesday)など、意味的に関連した単語を同時に学習することは一般的に行われていると考えられます。

意味的に関連した単語をまとめて学習することは、“semantic clustering”と呼ばれています。semantic clusteringは、日本に限らず、様々な国で広く行われている学習法であると指摘されています。

しかし、多くの研究者は、semantic clusteringは干渉(interference)を引き起こすため、語彙習得を阻害する有害な学習法であると警鐘を鳴らしています。例えば、right(右)とleft(左)という単語を同時に学習すると、それぞれが競合(干渉)し、どちらが「右」でどちらが「左」を意味するのか、混乱してしまうということです。

「semantic clusteringが学習を阻害する」という主張は、語彙習得に関する多くの専門書籍や学術論文において見られます。しかし、その主張の根拠として挙げられている研究を仔細に検討すると、「semantic clusteringが学習を阻害する」という主張は必ずしも妥当ではないように考えられます。

そこで、我々の研究では、semantic clusteringに関する今までの研究の限界をふまえた上で、semantic clusteringの効果を改めて調査しました。

また、「意味的に類似した単語を学習する上では、特に分散学習が効果的である」という主張を検証するため、集中学習(massed learning)と分散学習(spaced learning)が意味的に類似した単語の学習に与える効果も検証しました。

研究の結果

研究結果を要約すると、以下の通りです。

(a) これまで「semantic clusteringが学習を阻害する」と考えられてきたが、事後テスト得点において、そのような結果は得られなかった。

(b) しかし、意味的に関連がある単語の方が、そうでない単語よりも、より多くの干渉エラーに結びついた。すなわち、weasel(イタチ)という単語を和訳することが求められた時に、「イタチ」ではなく別の哺乳類の名前(アライグマやカワウソなど)を答えてしまうことが多かった。

(c) 意味的に類似した単語と類似していない単語のいずれにおいても、分散学習は集中学習よりも効果的だった。しかし、「意味的に類似した単語を学習する上では、特に分散学習が効果的である」という仮説とは反対に、分散学習は意味的に類似していない単語の学習に特に有効であった。

コメント

本論文は所定の費用を支払うことでopen accessとして無料で公開されています。「意味的に似た単語を一緒に学ぶのは良くない」というのは語彙習得研究者の間では長い間定説になっていましたが、その定説に疑問を投げかけたという点で、色々な方に読んでいただきたいと思い、open accessにしてもらいました。

書籍『英単語学習の科学』が研究社から発売されました

書籍『英単語学習の科学』が研究社から発売されました。

効果的な英単語の学習法や教授法について、最新の研究を元に解説しています。

出版社による内容紹介は以下の通りです。


著者:中田達也

版元:研究社

価格:1,800円+税

「単語帳で暗記しても実用英語には活用できない」「単語集ではなく文脈で覚えることこそ正しい」「忘れる前に復習しないと覚えられない」「選択問題をやっても語彙学習には役に立たない」などなど、ちまたにはびこる間違った「常識」をばっさり斬って、本当に効果的な英単語学習法・教授法をとことん解説。最新の第二言語習得研究の成果を紹介しながら、本当に役立つ英単語の覚え方を考察。多くの英語学習者・英語教師が待ち望んでいた英単語学習法のエッセンス集。


研究者・教員・学習者など、幅広い読者を念頭に執筆したつもりなので、色々な方に手に取って頂けるとうれしいです。

詳細は以下のwebページをご覧ください。

編著者として関わったTOEIC書籍「TOEIC L&R TEST ベーシックアプローチ」が発売されました

編著者として関わったTOEIC書籍が発売されました。詳細は以下の通りです。

書名『TOEIC L&R TEST ベーシックアプローチ』

安河内哲也 監修 / 土屋知洋 編著 / 中田達也 編著 / 中西のりこ 著 / 仁科恭徳 著 / 中川右也 著

発行:三修社

TOEIC L&R TESTに精通した著者陣が、確実に力をつけるための学習法を指南。英語が苦手な方、TOEIC L&R TESTをはじめて受験する方、スコアが300点前後で伸び悩んでいる方にお勧めの対策教材。TOEIC新形式対応。

スコアに直結し、応用が効く問題に焦点をあて、詳しく解説しました。「ワークブック」と「解答と解説」に分けて使える、便利な2分冊構成。

『TOEIC TEST即効15日計画 』の改訂版です。 詳細は、三修社のwebサイトをご覧下さい。

TOEIC L&R TEST ベーシックアプローチ

TOEIC L&R TEST ベーシックアプローチ

記憶術:復習間隔を少しずつ大きくしていく学習法は長期的な記憶保持を促進するのか? Part 2

forgetting-curve_ja

(写真はWord Engineのwebサイトより)

前回の記事では、1970年代~1980年代に行われた研究を元に、「復習間隔を少しずつ大きくしていく学習法は、語彙習得に効果的である」と主張することは妥当でない可能性がある、ということを述べてきました。

今回は、1990年以降に行われた近年の研究を元に、「復習間隔を少しずつ大きくしていくスケジュールは効果的なのか?」という点について引き続き検討したいと思います。

拡張分散学習に関する近年の研究:1990年以降

拡張分散学習の効果に関しては、1990年以降にも数多くの研究が行われています。近年の研究では、Landauer & Bjork (1978)とは反対に、「拡張分散学習は長期的な記憶保持を必ずしも促進しない」という結果も得られています。

拡張分散学習(復習間隔を少しずつ大きくしていくスケジュール)と均等分散学習(ある学習項目を一定の間隔で繰り返すスケジュール)を比較した研究の結果をまとめると、以下の通りになります。

(1) 拡張分散学習の方が均等分散学習よりも効果的(7研究)
Cull et al., 1996; Dobson, 2011; Karpicke & Roediger, 2007; Landauer & Bjork, 1978; Maddox et al., 2011, Exp 2; Logan & Balota, 2008; Storm, Bjork, & Storm, 2010

(2) 拡張分散学習と均等分散学習との間に大きな差はない(10研究)
Balota et al., 2006; Carpenter & DeLosh, 2005; Cull, 2000; Kang et al., 2014; Karpicke & Bauernschmidt, 2011; Karpicke & Roediger, 2010; Maddox et al., 2011, Exp 2; Nakata, 2015; Pyc & Rawson, 2007; Shaughnessy & Zechmeister, 1992

(3) 均等分散学習の方が拡張分散学習よりも効果的(3研究)
Cull, 2000; Karpicke & Roediger, 2007; Logan & Balota, 2008

上の一覧に示した通り、7つの研究では、拡張分散学習の方が均等分散学習よりも効果的(= 復習間隔を少しずつ大きくしていくことは記憶保持を促進する)という結果が出ています。一方で、10個の研究では、拡張分散学習と均等分散学習との間に大きな差はない(= 復習間隔を少しずつ大きくしていくことは記憶保持を促進しない)という結果が得られています。残りの3つの研究では、均等分散学習の方が拡張分散学習よりも効果的(= 復習間隔を少しずつ大きくしていくことは記憶保持を阻害する)という結果です。

このように、研究によって得られた結果はまちまちです。なぜ、これまでの研究の結果は一貫していないのでしょうか? その理由として、「拡張分散学習の効果は、少なくとも2つの要因に左右されるからである」という指摘があります (Balota et al., 2007; Dobson, 2012; Karpicke & Roediger, 2007; Logan & Balota, 2008; Maddox et al., 2011; Roediger & Karpicke, 2010; Storm, Bjork, & Storm, 2010)。

具体的には、「フィードバックの有無」と「事後テストのタイミング」という2つの要因が、拡張分散学習の効果に影響すると指摘されています。この2つの要因について、見ていきましょう。

「フィードバック」とは、想起練習の後に提示される正解のことです。例えば、「appleとはどういう意味ですか?」と尋ねられ、その正解(りんご)が学習者に提示された場合、フィードバックがあります。一方で,正解が学習者に提示されない場合、フィードバックはありません。

拡張分散学習の方が均等分散学習よりも効果的であることを示した7つの研究では、いずれも想起練習の後にフィードバックが提供されていません。一方で、想起練習の後にフィードバックが提供されている研究では、拡張分散学習の有効性は示されていません。

この結果から、「想起練習の後にフィードバックが提供されない場合に限って、拡張分散学習は記憶保持を促進する」という傾向が読み取れます(なぜフィードバックの有無が拡張分散学習の効果に影響するのかという点に関しては、こちらの論文をご覧下さい)。

2つめの要因は、事後テストのタイミングです。これまでの研究では、事後テストが学習から24時間以内に実施された場合に限って、拡張分散学習が記憶保持を促進するという傾向が見られます。言い換えれば、学習から24時間以上経過して行われたテストでは、拡張分散学習の有効性はほとんど示されていません。すなわち、「拡張分散学習は短期的な記憶保持を促進する可能性があるものの、長期的な記憶保持は促進しない」ということです(なぜ事後テストのタイミングが拡張分散学習の効果に影響するのかという点に関しても、こちらの論文をご覧下さい)。

一方で、「均等分散学習は短期的な記憶保持を促進しないものの、長期的な記憶保持を促進する」という研究結果もあります(Karpicke & Roediger, 2007)。Karpicke & Roedigerは2007年に、”Expanding retrieval practice promotes short-term retention, but equally spaced retrieval enhances long-term retention.”という論文を出版していますが、この論文のタイトルにある通り、「拡張分散学習は短期的な記憶保持を促進するが、均等分散学習は長期的な記憶保持を促進する」ということです。

これまでに行われた研究を検討してみると、「想起練習の後にフィードバックが提供されていない場合に限って、拡張分散学習は短期的な記憶保持を促進するが、長期的な記憶保持は阻害する可能性がある」ということがわかりました。この結果を元に、「復習間隔を少しずつ大きくしていくスケジュールは長期的な記憶保持を促進する」と主張することは、無理があるように思われます。

第1に、想起練習の後にフィードバックが提供されていない場合に限って、拡張分散学習が記憶保持を促進することが示されていますが、想起練習の後にフィードバックが与えられない状況というのは、外国語学習ではあまり一般的ではありません。例えば、「この単語の意味を以下の選択肢から選んでください」という問題を出しておきながら、その答えを教えてくれないような不親切な英単語学習ソフトは、あまり見たことがありません。また、単語帳や単語カードで学習をする際も、単語の意味が正しく思い出せなければ、答えを確認することが一般的でしょう(この点については、前回の記事もご覧ください)。

第2に、「拡張分散学習は短期的な記憶保持を促進するが、長期的な記憶保持は阻害する可能性がある」という結果が得られていますが、短期的にしか記憶保持を促進しない学習法が外国語学習者にとって有益なものとは考えられません。

一夜漬けをしなくてはならない等、特殊な状況は別ですが、外国語の単語を学習する目的は、その単語を長期的に保持することであるはずです。

拡張分散学習に関してこれまでに行われた研究の結果を考えると、拡張分散学習を効果的な語彙学習法として薦めることは、妥当ではないように考えられます。

第二言語語彙習得における拡張分散学習の効果

前項でご紹介した研究の多くは、実は外国語の単語学習を調査したものではありません。第一言語の単語や人名など、外国語の単語以外の項目を用いています。

外国語の単語学習において拡張分散学習の効果を調べた研究は、今のところ4つしかありません(Kang, Lindsey, Mozer, & Pashler, 2014; Karpicke & Bauernschmidt, 2011; Nakata, 2015; Pyc & Rawson, 2007; 学習に影響するであろう要因が統制されていないなど、方法論上の問題がある研究は除いています)。

第二言語語彙習得における拡張分散学習の効果を調べた研究では、いずれも拡張分散学習が長期的な記憶保持を促進するという結果は得られていません。

このように、拡張分散学習の効果は必ずしも実証されていないものの、「復習間隔を少しずつ大きくしていくスケジュールは効果的である」と主張する研究者は、第二言語語彙習得の分野にも多くいます。例えば、Norbert Schmitt, Nick Ellis, Jan Hulstijnといった世界的に著名な研究者も、拡張分散学習が語彙習得を促進すると述べています(e.g., Ellis, 1995; Hulstijn, 2001; Schmitt, 2000, 2007; Schmitt & Schmitt, 1995)。

ちなみに、第二言語語彙習得において最も広く読まれている書籍は、Paul Nationの”Learning vocabulary in another language” (Cambridge University Press)だと思いますが、2001年に出版された初版では、「拡張分散学習が語彙習得を促進する」という旨の記述がありました。しかし、2013年に出版された第2版では、「均等分散学習は、少なくとも拡張分散学習と同じくらい効果的」という記述に変更されています。

* 注
ちなみに、私が2015年に出版した論文(Nakata, 2015)のAbstract(概要)には、以下の1文があります。

“The finding is significant because this is the first second language study to find the superiority of expanding over equal spacing.”(本研究は、第二言語習得において拡張分散学習の有効性を初めて示した研究という点で、意義深い)

上の文章から、「Nakata (2015)では拡張分散学習が均等分散学習よりも記憶保持を促進するという結果が得られているのではないか?」と思われる方もいらっしゃるかもしれません。

確かにNakata (2015)の研究では、expandingのスコアの方がequal spacingのスコアよりも高い場合があり、その差は統計的に有意でした。しかし、以下の理由から差はあまりないと考えています。

・ expandingとequal spacingの間に統計的な有意差はあるが、効果量は小さい

・ productive testとreceptive testをしたが、有意差が出たのはproductive testのみ。

・ productive testとreceptive testでは、productive testのスコアの方が信憑性が高い

(receptive test の後にproductive testを実施したため、receptive test のスコアはproductive test に影響されている可能性がある。さらに、学習中のタスクはproductiveだったため、タスクと形式が一致しているproductive test の方が学習成果をより正確に反映している可能性がある)

Nakata (2015) の論文でも、上のような理由から、はじめは「expandingとequalでは差があまりない」と結論付けていました。

しかし、査読者の一人が「効果量は小さいといっても、有意差が出ているのだから、expanding > equalであることを強調すべき」 と指摘してきて、結論を渋々書き直したという経緯があります。以上、裏話でした。

参考文献

Bjork, R. A. (1994). Memory and metamemory considerations in the training of human beings. In J. Metcalfe & A. Shimamura (Eds.), Metacognition: Knowing about knowing (pp. 185–205). Cambridge, MA: MIT Press.

Bjork, R. A. (1999). Assessing our own competence: Heuristics and illusions. In D. Gopher & A. Koriat (Eds.), Attention and performance XVII: Cognitive regulation of performance: Interaction of theory and application (pp. 435–459). Cambridge, MA: MIT Press.

Ellis, N. (1995). The psychology of foreign language vocabulary acquisition: Implications for CALL. Computer Assisted Language Learning, 8, 103–128.

Hulstijn, J. H. (2001). Intentional and incidental second language vocabulary learning: A reappraisal of elaboration, rehearsal, and automaticity. In P. Robinson (Ed.), Cognition and second language instruction (pp. 258–286). Cambridge, UK: Cambridge University Press.

Kang, S. H. K., Lindsey, R. V., Mozer, M. C., & Pashler, H. (2014). Retrieval practice over the long term: Should spacing be expanding or equal-interval? Psychonomic Bulletin & Review, 21, 1544–1550.

Karpicke, J. D., & Bauernschmidt, A. (2011). Spaced retrieval: Absolute spacing enhances learning regardless of relative spacing. Journal of Experimental Psychology: Learning, Memory, and Cognition, 37, 1250–1257.

Karpicke, J. D., & Roediger, H. L. (2007). Expanding retrieval practice promotes short-term retention, but equally spaced retrieval enhances long-term retention. Journal of Experimental Psychology: Learning, Memory, and Cognition, 33, 704–719.

Karpicke, J. D., & Roediger, H. L. (2010). Is expanding retrieval a superior method for learning text materials? Memory and Cognition, 38, 116–124.

Landauer, T. K., & Bjork, R. A. (1978). Optimum rehearsal patterns and name learning. In M. M. Gruneberg, P. E. Morris, & R. N. Sykes (Eds.), Practical aspects of memory (pp. 625–632). London, UK: Academic Press.

Logan, J. M., & Balota, D. A. (2008). Expanded vs. equal interval spaced retrieval practice: Exploring different schedules of spacing and retention interval in younger and older adults. Aging, Neuropsychology, and Cognition, 15, 257–280.

Nakata, T. (2015). Effects of expanding and equal spacing on second language vocabulary learning: Does gradually increasing spacing increase vocabulary learning? Studies in Second Language Acquisition, 37, 677–711.

Pashler, H., Zarow, G., & Triplett, B. (2003). Is temporal spacing of tests helpful even when it inflates error rates? Journal of Experimental Psychology: Learning, Memory, and Cognition, 29, 1051–1057.

Pyc, M. A., & Rawson, K. A. (2007). Examining the efficiency of schedules of distributed retrieval practice. Memory & Cognition, 35, 1917–1927.

Rea, C. P., & Modigliani, V. (1985). The effect of expanded versus massed practice on the retention of multiplication facts and spelling lists. Human Learning: Journal of Practical Research & Applications, 4, 11–18.

Schmidt, R. A., & Bjork, R. A. (1992). New conceptualizations of practice: Common principles in three paradigms suggest new concepts for training. Psychological Science, 3, 207–217.

Schmitt, N. (2000). Vocabulary in language teaching. Cambridge, UK: Cambridge University Press.

Schmitt, N. (2007). Current trends in vocabulary learning and teaching. In J. Cummins & C. Davison (Eds.), The international handbook of English language teaching (pp. 827–842). Norwell, MA: Springer.

Schmitt, N., & Schmitt, D. (1995). Vocabulary notebooks: Theoretical underpinnings and practical suggestions. ELT Journal, 49, 133–143.

Schneider, V. I., Healy, A. F., & Bourne, L. E. (2002). What is learned under difficult conditions is hard to forget: Contextual interference effects in foreign vocabulary acquisition, retention, and transfer. Journal of Memory and Language, 46, 419–440.

Siegel, M. A., & Misselt, A. L. (1984). Adaptive feedback and review paradigm for computer-based drills. Journal of Educational Psychology, 76, 310–317.

Storm, B. C., Bjork, R. A., & Storm, J. C. (2010). Optimizing retrieval as a learning event: When and why expanding retrieval practice enhances long-term retention. Memory & Cognition, 38, 244–253.

注)本稿は、以下の論文をwebサイト向けに再編集したものです。
復習間隔を少しずつ広げていくことは長期的な記憶保持を促進するか? 先行研究の批判的検証 (pdf)

記憶術:復習間隔を少しずつ大きくしていく学習法は長期的な記憶保持を促進するのか? Part 1

expanding

新しい単語を覚えたとしても、時間とともにその記憶は減衰し、やがて忘却されてしまいます。したがって、記憶を定着させるためには、定期的な復習が欠かせません。それでは、どのようなスケジュールで復習するのが最も効果的なのでしょうか?

語彙の復習スケジュールに関しては、拡張分散学習(expanding spacing)と均等分散学習(equal spacing)という2つのスケジュールがよく知られています。拡張分散学習とは「1日後→1週間後→2週間後→4週間後」というように、回数を重ねるにつれて、復習間隔を少しずつ大きくしていくスケジュールのことです(expanding spacingは、expanding rehearsal, expanded rehearsal, expanded retrieval等と呼ばれることもあります)。一方で、均等分散学習とは、「2週間後→2週間後→2週間後」というように、ある学習項目を一定の間隔で繰り返すスケジュールのことです。

一般的には、拡張分散学習が最も効果的な復習スケジュールであると考えられています。市販の英単語学習ソフトでも、拡張分散学習を売り文句にしているものが数多く見られます(例えば、iKnow, AnkiWord Engine など)。webサイトでも、「復習間隔を少しずつ大きくしていくスケジュールが効果的である」と述べているものが多くあります(例えば、こちらなど)。

しかしながら、近年の研究では、「拡張分散学習は短期的な記憶保持を促進する可能性はあるものの、長期的な記憶保持は促進しない」という結果が得られています(e.g., Kang, Lindsey, Mozer, & Pashler, 2014; Karpicke & Roediger, 2007; Karpicke & Bauernschmidt, 2011; Nakata, 2015; Pyc & Rawson, 2007)。

理論的背景:復習間隔を少しずつ大きくしていく学習法が効果的だと考えられている理由

拡張分散学習の効果は必ずしも実証されていないものの、「復習間隔を少しずつ大きくしていく学習法は効果的である」という考えは、いまだに根強いようです。それでは、なぜ拡張分散学習は記憶保持を促進すると考えられているのでしょうか?

拡張分散学習が記憶保持を促進するという考えの理論的背景となっているのが、「想起練習効果」(the retrieval practice effect)と「想起努力仮説」(the retrieval effort hypothesis)という仮説です(Ellis, 1995; Karpicke & Bauernschmidt, 2011; Karpicke & Roediger, 2010; Logan & Balota, 2008; Storm, Bjork, & Storm, 2010)。「想起練習効果」とは、「記憶を正しく想起することで、長期的な記憶保持が促進される」というものです。

例えば、「appleの意味は何ですか?」ときかれたとします。この場合、正しい答え(りんご)を思い出せた方が、思い出せなかった場合よりも、appleという語に関する記憶が強固になるということです。これは、「思い出す」という行為を行うことで記憶へたどり着くための経路が強化され、記憶が取り出しやすくなるためであると考えられています。

2番目の「想起努力仮説」とは、「難しい状態で記憶を想起することで、長期的な記憶保持が促進される」というものです。例えば、appleという新出語を学んだばかりの学習者がいたとします。この学習者に、学習の直後に「appleの意味は何ですか?」と尋ねた場合と、学習の1週間後に同じ質問をした場合とでは、後者の方がより記憶保持を促進すると考えられています。これは、学習の1週間後にappleの記憶をテストされた方が、学習の直後にテストされるよりもより大きな心的努力を必要とし、この心的努力が記憶保持を促進すると考えられているためです。

「想起練習効果」と「想起努力仮説」は、それぞれ相反する内容です。なぜなら、想起努力仮説によれば、復習間隔は長ければ長いほど良いことになります。しかしながら、想起練習効果によると、復習間隔が長すぎるのは好ましくありません。想起練習効果によれば、英単語に関する記憶を正しく思い出した時に初めて記憶が強化されます。復習と復習の間隔が空きすぎてしまうと、その単語の記憶を正しく想起することが不可能になるため、あまりに復習間隔が長くなるのは逆効果です。

つまり、記憶が最も強化されるのは、想起練習効果と想起努力仮説に折り合いをつけ、記憶が忘却されるぎりぎりの時点で、その項目に関する記憶を想起した際であるということになります。例えば、30秒後にある単語に関する記憶が忘却されるのであれば、29秒後にその単語の記憶を思い出すのが、最も効果的な復習スケジュールであるということになります。

「想起練習効果」と「想起努力仮説」から、どのような結論が導き出せるでしょうか? 2つの仮説から言えることは、「新しい単語を学習した場合は、学習の直後に復習した方が良い」ということです。学習の直後に復習をしないと、記憶を正しく想起することができないため、「記憶を正しく想起することで、長期的な記憶保持が促進される」という想起練習効果に反してしまいます。

2回目の復習は、1回目の復習よりも長い間隔を空けることができます。これは、1回目の復習で語の記憶が強化されることで、記憶の減衰速度が緩やかになり、間隔を長くしても正しく想起されると考えられるからです。3回目の復習は、2回目の復習よりももっと長い間隔を空けることができます。これは、1回目と2回目の復習を行ったことで、復習間隔をさらに長くしても正しく想起されると考えられるからです。

同じようにして、復習回数が増えるごとに間隔を徐々に広くしていくことで、「記憶が忘却されるぎりぎりの時点で、その項目に関する記憶を想起する」ことが実現できる可能性が高くなります。ゆえに、拡張型のスケジュールが最も長期的な保持を可能にすると一般的には考えられているわけです。

拡張分散学習に関する記念碑的研究:Landauer & Bjork (1978)

「復習間隔を少しずつ大きくしていく学習法が効果的である」ことを示した研究として最も知られているのは、Landauer & Bjork (1978)によって行われた研究でしょう。例えば、彼らの研究は、‘influential paper’ (Roediger & Butler, 2011), ‘landmark paper’ (Roediger & Karpicke, 2010), ‘often-cited chapter’ (Balota et al., 2007)などと評されています。

引用の数も多く、Google Scholarによると、Landauer & Bjork (1978)は600を越える研究に引用されています(2016年8月現在。なお、2011年に調べた際には約350の研究に引用されていましたので、出版から40年近く経っても引き続き引用され続けていることがわかります)。

Landauer & Bjork (1978)は、拡張分散学習(復習間隔を少しずつ大きくしていくスケジュール)と均等分散学習(ある学習項目を一定の間隔で繰り返すスケジュール)を比較し、拡張分散学習の方が均等分散学習よりもより高い記憶保持に結びつくという結果を得ました。

第二言語語彙習得の分野でも、Landauer & Bjork (1978)の研究を引用して、「復習間隔を少しずつ大きくしていく学習法が語彙習得を促進する」と主張している研究者が多くいます。しかしながら、Landauer & Bjorkの研究結果を元に、「復習間隔を少しずつ大きくしていくことは語彙習得を促進する」と主張することには、慎重であるべきだと考えられます。それは、以下の5つの理由によります。

第1に、Landauer & Bjork (1978)は学習の直後に行ったテストのみで学習効果を測定しており、遅延テストは行っていません。すなわち、短期的な学習効果を測定しているものの、長期的な記憶保持は測定していない、ということです。

近年の研究では、「短期的に学習を促進する学習法が、長期的な記憶保持を促進するとは限らない」ということが示されています(e.g., Bjork, 1994, 1999; Karpicke & Bauernschmidt, 2011; Pashler, Zarow, & Triplett, 2003; Schmidt & Bjork, 1992; Schneider, Healy, & Bourne, 2002)。したがって、学習の直後に行ったテストで拡張分散学習の方がより高い記憶保持に結びついたとしても、それが長期的な記憶保持を促進することを必ずしも意味しません。

第2に、研究で使用した項目数が極端に少ないという方法論上の問題もあります。Landauer & Bjork (1978)は拡張分散学習条件と均等分散学習条件の効果を比較しましたが、それぞれの条件につき、1つあるいは2つの項目しか使用していません。どのくらいの項目数が必要であるかは意見が分かれるところですが、トップ・ジャーナルと呼ばれるような国際的な学術誌では、1つの条件につき少なくとも8~10項目以上を使用した研究でなければ出版することは困難でしょう。

一方で、Landauer & Bjork (1978)は1つの条件につき1~2の項目しか使用していません。したがって、彼らの研究結果が十分に妥当なものであるかどうかは、意見が分かれるところです。

第3に、Landauer & Bjork (1978)の研究では、想起練習の後にフィードバックが与えられていません。フィードバックとは、想起練習の後に提示される正解のことです。

例えば、「appleとはどういう意味ですか?」と尋ねられ、その正解(りんご)が学習者に提示された場合、フィードバックがあります。一方で,正解が学習者に提示されない場合、フィードバックはありません。

想起練習の後にフィードバックが与えられない状況というのは、外国語学習ではあまり一般的ではありません。例えば、「この単語の意味を以下の選択肢から選んでください」という問題を出しておきながら、その答えを教えてくれないような不親切な英単語学習ソフトは、あまり見たことがありません(2011年に出版したこの論文では外国語の単語学習ソフトについて調査しましたが、想起練習の後にフィードバックが表示されないソフトは1つもありませんでした)。また、単語帳や単語カードで学習をする際も、単語の意味が正しく思い出せなければ、答えを確認することが一般的でしょう。

想起練習の後にフィードバックが提供されなかったという点で、Landauer & Bjork (1978)の研究は一般的な単語学習の状況とはかけ離れていると言えます。したがって、彼らの研究結果を外国語の語彙学習にあてはめることには、慎重になるべきだと考えられます。

第4に、Landauer & Bjork (1978)では拡張分散学習の方が均等分散学習よりも高い記憶保持に結びつくという結果が得られましたが、その差はわずかなものでした。学習の直後に行われたテストでは、拡張分散学習の正答率が45%であったのに対して、均等分散学習の正答率は40%で、その差は5%に過ぎませんでした。

拡張分散学習と均等分散学習の差は統計的に有意なものでしたが、これは被験者の数が多かったこと(それぞれの条件につき468人)によるものだと考えられます(サンプル・サイズが大きいと、わずかな差であっても統計的に有意という結果が得られます)。

Landauer & Bjork (1978)は効果量(effect sizes)を報告していませんが、計算してみるとr = .21で、これは小さい効果(small effect)と見なされる範囲です(統計的有意差とは異なり、効果量はサンプル・サイズの影響を受けません)。すなわち、Landauer & Bjorkは拡張分散学習と均等分散学習の間に差があったことを示しましたが、その差が実質的に意味があるとは必ずしも言い切れないと考えられます。

最後に、これはLandauer & Bjork自体の問題ではありませんが、彼らの研究は外国語の単語学習を調査してはいません。Landauer & Bjorkが研究で使用したのは、人名でした。

彼らは2つの実験を行っていますが、実験1では苗字と名前の組み合わせ(例. Robert Bjork)を覚えるように指示されました。そして、名前が提示されて(例. Robert _____ )、それに対応する苗字(例. Bjork)を答えるように指示されました。実験2では、人の顔を見て、その人の名前を答えるように指示されました。

人名を覚えることと、外国語の単語を覚えることには共通点もありますが、違いもあるため、Landauer & Bjork (1978)の結果をそのまま外国語の単語学習に応用して良いか、疑問が残ります。

このように、「復習間隔を少しずつ大きくしていくスケジュールが効果的である」ということの根拠として語彙習得研究者にも引用されることが多いLandauer & Bjork (1978)ですが、詳細を検討してみると、外国語の語彙学習にあてはめることには慎重になるべきだと考えられます。

また、拡張分散学習の効果を示している研究として、他にもRea & Modigliani (1985)、Siegel & Misselt (1984)の研究が引用されることがあります。しかしながら、これらの研究は、拡張分散学習と集中学習(massed learning)の効果のみしか比較していない、ということに注意すべきです。

集中学習とは、間隔を置かずにある学習項目を複数回繰り返すことを指します。拡張分散学習が集中学習よりも高い保持率に結びついたからといって、「復習間隔を少しずつ大きくしていくスケジュールが効果的である」とは必ずしも言い切れません。なぜなら、拡張分散学習が集中学習よりも高い保持率に結びついたとしても、その原因が、「復習間隔を少しずつ大きくしていったから」なのか、あるいは、単に「復習と復習の間に間隔が空いていたから」なのか、はっきりしないからです。

拡張分散学習が効果的な復習スケジュールであることを調査するためには、他の種類の分散学習スケジュール(例. 均等分散学習など)と比較して、拡張分散学習がより効果的であることを示す必要があります。

まとめ

今回は、1970年代~1980年代に行われた研究を元に、「復習間隔を少しずつ大きくしていくスケジュールは、語彙習得に効果的である」と主張することは妥当でない可能性がある、ということを述べてきました。拡張分散学習の効果に関しては、1990年以降にも数多くの研究が行われています。近年の研究では、Landauer & Bjork (1978)とは反対に、「拡張分散学習は長期的な記憶保持を必ずしも促進しない」という結果が得られています。

次回は、1990年以降に行われた近年の研究を元に、「復習間隔を少しずつ大きくしていくスケジュールは効果的なのか?」、「もし効果的でないとしたら、それはなぜなのか?」という点について引き続き検討したいと思います。

参考文献

Bjork, R. A. (1994). Memory and metamemory considerations in the training of human beings. In J. Metcalfe & A. Shimamura (Eds.), Metacognition: Knowing about knowing (pp. 185–205). Cambridge, MA: MIT Press.

Bjork, R. A. (1999). Assessing our own competence: Heuristics and illusions. In D. Gopher & A. Koriat (Eds.), Attention and performance XVII: Cognitive regulation of performance: Interaction of theory and application (pp. 435–459). Cambridge, MA: MIT Press.

Ellis, N. (1995). The psychology of foreign language vocabulary acquisition: Implications for CALL. Computer Assisted Language Learning, 8, 103–128.

Kang, S. H. K., Lindsey, R. V., Mozer, M. C., & Pashler, H. (2014). Retrieval practice over the long term: Should spacing be expanding or equal-interval? Psychonomic Bulletin & Review, 21, 1544–1550.

Karpicke, J. D., & Bauernschmidt, A. (2011). Spaced retrieval: Absolute spacing enhances learning regardless of relative spacing. Journal of Experimental Psychology: Learning, Memory, and Cognition, 37, 1250–1257.

Karpicke, J. D., & Roediger, H. L. (2007). Expanding retrieval practice promotes short-term retention, but equally spaced retrieval enhances long-term retention. Journal of Experimental Psychology: Learning, Memory, and Cognition, 33, 704–719.

Karpicke, J. D., & Roediger, H. L. (2010). Is expanding retrieval a superior method for learning text materials? Memory and Cognition, 38, 116–124.

Landauer, T. K., & Bjork, R. A. (1978). Optimum rehearsal patterns and name learning. In M. M. Gruneberg, P. E. Morris, & R. N. Sykes (Eds.), Practical aspects of memory (pp. 625–632). London, UK: Academic Press.

Logan, J. M., & Balota, D. A. (2008). Expanded vs. equal interval spaced retrieval practice: Exploring different schedules of spacing and retention interval in younger and older adults. Aging, Neuropsychology, and Cognition, 15, 257–280.

Nakata, T. (2015). Effects of expanding and equal spacing on second language vocabulary learning: Does gradually increasing spacing increase vocabulary learning? Studies in Second Language Acquisition, 37, 677–711.

Pashler, H., Zarow, G., & Triplett, B. (2003). Is temporal spacing of tests helpful even when it inflates error rates? Journal of Experimental Psychology: Learning, Memory, and Cognition, 29, 1051–1057.

Pyc, M. A., & Rawson, K. A. (2007). Examining the efficiency of schedules of distributed retrieval practice. Memory & Cognition, 35, 1917–1927.

Rea, C. P., & Modigliani, V. (1985). The effect of expanded versus massed practice on the retention of multiplication facts and spelling lists. Human Learning: Journal of Practical Research & Applications, 4, 11–18.

Schmidt, R. A., & Bjork, R. A. (1992). New conceptualizations of practice: Common principles in three paradigms suggest new concepts for training. Psychological Science, 3, 207–217.

Schneider, V. I., Healy, A. F., & Bourne, L. E. (2002). What is learned under difficult conditions is hard to forget: Contextual interference effects in foreign vocabulary acquisition, retention, and transfer. Journal of Memory and Language, 46, 419–440.

Siegel, M. A., & Misselt, A. L. (1984). Adaptive feedback and review paradigm for computer-based drills. Journal of Educational Psychology, 76, 310–317.

Storm, B. C., Bjork, R. A., & Storm, J. C. (2010). Optimizing retrieval as a learning event: When and why expanding retrieval practice enhances long-term retention. Memory & Cognition, 38, 244–253.

注)本稿は、以下の論文をwebサイト向けに再編集したものです。
復習間隔を少しずつ広げていくことは長期的な記憶保持を促進するか? 先行研究の批判的検証 (pdf)