(Update:2008-1-12 6:35:35)
本当の「正の強化」
『陽性強化』だとか、『正の強化』だとか、言葉だけが独り歩きしていてるように思えます。『正の強化』は、動物の学習の原理と呼ばれる科学的に、実験によって証明された動物の学習の基本の2つのうちの1つである、オペラント条件づけと呼ばれる「動物は行動の結果によって、その行動をくり返す頻度が左右される」の4つの法則からなります。
正の強化 正の罰 負の強化 負の罰
「正の」は、行動の直後に何かを与えるという意味です。
「負の」は、その逆に行動の直後に何かが取り去られるという意味です。
そして、
「強化」は、行動がくり返される(現れる頻度が多くなる)
「罰」は、行動が減る、なくなる(現れる頻度が少なくなる)
これを組み合わせて
頻度が多くなる
正の強化 とは
行動が起きた直後に、犬にとって良いことを与えると、その行動がくり返される。
負の強化 とは
行動が起きた直後に、犬にとって悪いことが取り去られると、その行動がくり返される。
行動が起きた直後に、犬にとって良いことを与えると、その行動がくり返される。
負の強化 とは
行動が起きた直後に、犬にとって悪いことが取り去られると、その行動がくり返される。
頻度が少なくなる
正の罰 とは
行動が起きた直後に、犬にとって悪いことを与えると、その行動が減る、なくなる。
負の罰 とは
行動が起きた直後に、犬にとって良いことが取り去られると、その行動が減る、なくなる。
行動が起きた直後に、犬にとって悪いことを与えると、その行動が減る、なくなる。
負の罰 とは
行動が起きた直後に、犬にとって良いことが取り去られると、その行動が減る、なくなる。
となるのです。
4つの法則の言葉の中には、与えるもの、取り去るものについての言葉は含まれていませんが、何を与えるとどうなるか、取り去るとどうなるかは、推測できます。
与えるもの、取り去るものは、犬にとって良いもの(好子)、悪いものを(嫌子)の2つです。
注意!
これが科学的に考えられた『犬の学習のしくみ』なのですが、実際にトレーニングしている人の中に、これを誤解している人が多いのが気になります。
1つは、犬にとって良いこと、悪いことは、行動の後に出てくるものなのです。
そう、結果なのですから。
「これが正の強化です!」と自信を持って説明する人の中にも、ルアーと呼ばれるごほうびを手に持って犬を誘導し、行動させてから手に持ったそのごほうびを犬に与えているのです。
残念ながらこれは、『正の強化』では、ありません。
ごほうび、つまり犬の喜ぶものが行動の前に出ているからです。
また、その行動は、犬が自分の意思で起こしたものでなく、人が無理矢理にさせているだけなのです。
リードを引張ったり、犬の体を押さえつけたりして行動をとらせる身体的誘導と、犬にとっての負担は異なるかも知れませんが、意味的には同じなのです。
また、『強化』の意味は、行動がくり返される(頻度が多くなる)となっているのに、犬の行動の変化を全く意識せず、ごほうびを与えただけで学習が成立すると思い込んでいるように思えます。
つまり、「正の強化」は、犬が起こした行動に対して、直後にごほうびを与えるを何度もくり返して、行動の頻度が多くなれば学習しているということになるのです。
ごほうびを手に持って誘導することが、悪いことではありません。
でも、ルアーを続けていても学習にはならないのです。
ルアーをなくして犬が自分から行動をするようにして、それに対して何度も丁寧にごほうびを出す経験をさせることが重要なのです。
投票数:414
平均点:4.83
学習を伴うごほうび |
トレーニングの手引 Training theory |
トレーニングの4段活用 |