ЭВАРД ЧЕЙЗ ТОЛМЕН(1886-1959)
Получил диплом по эксперимантельной и теоретической химии.
В годы, когда у Толмена проснулся интерес к психологии, доминировали подходы Титчнера и Джемса, и психология по-прежнему определялась как наука о сознательном опыте. Это вызывало Т. большое беспокойство: как можно построить науку на столь шатком основании? Его «успокоил» курс Йеркса, в рамках которого он ссылался на Уотсона. И все сразу стало хорошо – не интроспекция, а объективные измерения.
Учился в Германии к Коффкой, влияние которого не было решающим, но ощутимо у позднего Толмэна. Пацифизм (квакерское воспитание). Достойное поведение во время «охоты на ведьм»: отказался подписать клятву, и его вытурили из Калифорнийского универа.
Целенаправленный бихевиоризм.
В начале 1920-х годов существовало два основных способа понимания процесса научения.
Уотсон: ассоциативный принцип смежности и частоты.
Убогость схемы «стимул – реакция». Неприемлимо то, что поведение понимается как агрегат, совокупность изолированных реакций.
Научение не является автоматическим процессом, основанным на смежности и повторении.
Торндайк: закон эффекта.
Не верил, что основным фактором научения является подкрепление. (Научение происходит постоянно, независимо от того, есть ли подкрепление и есть ли мотивация). Закон эффекта не просто привязывает закрепление определенного поведения к подкреплению, но апеллирует к состояниям удовольствия, дискомфорта и пр.
Толман и Уотсон: психология действительно должна быть наукой о поведении, но понимать поведение иначе, нежели Уотсон (нужно изучать другой тип поведения - целенаправленное). Поведение не как молекулярный, но молярный феномен.
Молекулярный– поведение как совокупность элементарных ответов на стимулы. «Молекулярному» понятию поведения Уотсона противопоставил свое понимание, которое назвал «молярным». Единицей поведенияявляется целенаправленный акт, использующий мускульные движения, организованные вокруг цели и обслуживаемые и направляемые когнитивными моментами.
Примеры целевого поведения: крыса, бегающая по лабиринту, ребенок, играющий в прятки, болтовня по телефону, психолог, ставящий эксперимент на крысах и пр. Знать, какие нервы, мускулы и физиологические механизмы были задействованы, совсем необязательно. Эти типы реакций имеют другие, вполне узнаваемые (поддающиеся идентификации) свойства.
Отношение к крысам (восторженные) и экспериментам с ними. Практически все значимые феномены (не считая тех, для понимания которых, нужно учитывать влияние слова и общества) в психологии могут быть прояснены на основании экспериментов с крысами. Точнее – на основании эксперимента и теоретического анализа поведения крысы в развилке лабиринта.
Промежуточные переменные— понятие, введенное необихевиоризмом с целью преодолеть ограниченность трактовки поведения как процесса, сводимого к формуле «стимул — реакция». Под промежуточными переменными понимались недоступные прямому наблюдению психические компоненты («значение», «цель», «мотив», «когнитивная карта» и др.), выступающие в роли посредника междустимулом как независимой переменнойиответной реакцией как зависимой переменной.
Голодкак промежуточная переменная: это состояние может быть описано через объективные параметры – время, которое крысы оставались без корма; скорость, с которой они поедают корм, когда его наконец дают и т. п.
Толмен приложил много усилий для того, чтобы операционализировать ПП, привязать их к наблюдаемому поведению. Ное В конце пути Толмен определял ПП как теоретические конструкты, применение которых может быть оправданно тем, что они позволяют описывать, предсказывать и объяснять поведение.
Гипотеза– предположение относительно связи между целью и средством, которое формируется на раннем этапе обучения.
Ожидание– гипотеза, которая получила предварительное подтверждение.
Убеждение– ожидание того, что опыт получит систематическое подтверждение (готовность связывать средство с целью).
Когнитивная карта– целостный пространственный образ окружающей обстановки, сложившийся на основании предшествующего опыта животного или человека и определяющего их поведение
Позиция Толмена относительно подкрепления.
См. выше по поводу отношения к Торндайку. Научение происходит как бы само собой, через наблюдение. Не подкрепление, но подтверждение(подтверждение гипотезы, ожидания или убеждения приводит к формированию когнитивной карты). В силу того, что Т акцентировал в научении выявление связей между стимулами, его бихевиоризм называют S-S бихевиоризмом.
Научение versus исполнение.
По Халлу, мы постоянно учимся, но то, будем ли мы применять свои знания, зависит от мотивации.
Латентное научение– это научение, которое не переводится в исполнение. Опыт Толмена и Хонзика с тремя группами крыс. 1) постоянное улучшение; 2) незначительное улучшение; 3) прекрасный результат на 11 день.
Опыты с радиальным лабиринтом. Показали, что животные могут определить пространственное расположение (прикорма), а не заучивают определенные реакции на определенные стимулы. Научаются пространственным отношениям.
Влияние Толмена:
Он сохранил элементы когнитивного подхода в ситуации засилья поведенческого. Не столько хотел избавиться от менталистских понятий, сколько операционализировать их, описать с помощью объективно наблюдаемых параметров. Близость к когнитивной психологии: организм как вычислительная машина.
Сложность теории Толмена. Он ввел несколько независимых переменных и промежуточных переменных и получилось огромное количество возможных сочетаний (он сам сожалел об этой сложности). Если бы в его время были нормальные компьютеры, то проблема бы просто не возникла.
КЛАРК ЛЕОНАРД ХАЛЛ(1884-1952)
Трудное детство и юность (тиф, полиомелит; нехватка средств). Диссертация по проблеме формирования понятий очень долгое время никем не замечалась, не цитировалась.
Подход Халла к построению научной теории.
Опора на гипотетико-дедуктивную модель:
ГИПОТЕТИКО-ДЕДУКТИВНЫЙ МЕТОД – метод научного исследования, заключающийся в выдвижении некоторых утверждений в качестве гипотез и проверке этих гипотез путем вывода из них эмпирически проверяемых следствий.
Оценка исходной гипотезы на основе такого вывода носит сложный и многоступенчатый характер, т.к. только достаточно длительный процесс испытания гипотезы в контексте системы научного знания может привести к обоснованному ее принятию или опровержению. Очевидно, что система знания, построенная на таких принципах, будет носить динамичный и принципиально незавершенный характер.
Промежуточные переменные.К. Халл, как и его современник Эдвард Толмен, исходил из необходимости введения между элементами классического бихевиоризма «стимул — реакция» определенных «промежуточных переменных», то есть условий, опосредующих двигательную реакцию (зависимая переменная) на раздражитель (независимая переменная), в качестве которых предлагал рассматриватьпобуждение,потенциал реакции,силу навыка, цель. Учёного интересовало развитие такой теории, которая объяснила бы, каким образом телесные потребности, окружающая среда и поведение вступают во взаимодействие для увеличения вероятности выживания организма. Пытаясь подойти строго математически к анализу поведения, К. Халл вместе с тем не придавал существенного значения познавательным факторам и нейрофизиологическим механизмам.
Как Торндайк, он был сторонником теории подкрепления, но понимал подкрепление как уменьшение побуждения. Все, что способствует уменьшению побуждения, является подкреплением.
Побуждение. Согласно Халлу, основанием для мотивации поведения являются потребности организма, возникающие в результате отклонения от оптимальных биологических условий. (Побуждение определяется как стимул, возникающий в результате такого состояния, которое инициирует или активизирует поведение. Согласно взглядам Халла, подавление или удовлетворение побуждений является единственной основой для подкрепления). Силу воздействия побуждений можно определить эмпирическим путем, либоизмеряя продолжительность депривации, либо путемизмерения интенсивности, силы или затрат энергии при результирующем поведении. Халл считал, что продолжительность депривации не является идеальным измеряемым параметром, и в основном делал акцент на силе реакции организма.
Неспецифичность побуждений. Кроме того, Халл отрицал какую–либо специфичность побуждений. Иными словами, любая депривация – например, лишение пищи, воды или сексуальной жизни – одинаковым образом вносит свой вклад в формирование побуждения (хотя и в различной степени). Эта неспецифичность означает, что побуждения не направляют поведение, они только придают ему энергию.Целенаправленность поведения определяется стимулами окружающей среды.
Первичные и вторичные побуждения. Халл постулировал два вида побуждений: первичные и вторичные.Первичныеассоциируются с биологическими потребностями и непосредственно связаны с выживанием организма.
Вторичные побуждения. Появляются в результате научения и относящихся к стимулам окружающей среды. Они связаны с устранением первичных потребностей, но в результате сами могут стать насущными потребностями. Это означает, что прежде нейтральные стимулы могут приобрести характеристики потребности, поскольку они способны вызвать ответные реакции, сходные с теми реакциями, которые порождаются первичными побуждениями или исходным состоянием неудовлетворенной потребности (прикосновение к горячей плите и получение ожога: сам вид плиты может стать тем стимулом, который приводит к заученному побуждению избавиться от страха).
Сила привычки. (SНR) . Сила привычки – сила связи «стимул–реакция», которая является функцией количества подкреплений. Операциональное определение: сила привычки измеряется количеством подкрепленных связок С-Р. Увеличение силы привычки равнозначно научению
Потенциал реакции.(SER) Потребность – не только основа подкрепления, но и внутренняя сила действия. ПР – вероятность выученного ответа, возникающего в конкретной ситуации. Эта верояность является функций силы потребности и силы привычки.
Халл ввел еще несколько промежуточных переменных4, которые увеличивают или уменьшают потенциал реакции.Реактивное торможение, условное торможение, эффект осцилляции; порог реакции, скрытый период реакции, вероятность реакции, амплитуда реакции, количество попыток угасания. Вероятность выученного поведения оказывается совокупным эффектом позитивных и негативных влияний этих переменных.
Несмотря на то, что система основана на принципах формирования условных рефлексов, Халл считал, что ее можно расширить и включить в нее такие процессы, как решение проблем, социальное поведение, формы научения, отличные от формирования условных рефлексов. К сожалению, смерть помешала ему воплотить в жизнь большую долю своих устремлений.
Хотя Халл был невероятно влиятелен, чем дальше, тем больше его критиковали за стерильность концепции, выведения из которой оказывались действенными только в рамках лабаратории.
БЕРРЕС ФРЕДЕРИК СКИННЕР(1904-1990 гг.)
Радикальный бихевиоризм Скиннера. Радикальный - в смысле отказа любых понятий, отсылающих к ментализму – побуждение, цель, намерение. Наблюдаемые и измеряемые аспекты среды, поведения и последствия поведения – достаточный материал для научного анализа. Скиннер как позитивист маховского толка (функционализм вместо причинно-следственных объяснений). Скиннер не верил в то, что феномены сознания образуют какую-то отдельную область, феномены сознания – вербальные ярлыки, с помощью которых обозначаются телесные состояния. (Более того, само обыкновение использовать менталистские термины при объяснении своего поведения имеет под собой какую-то неизвестную пока физиологическую основу).Таким образом, ментальные образования не обладают каузальной силой, психическое не порождает собственных эффектов. Происходит что-то вроде естественного отбора: в зависимости от случайностей и констелляций подкреплений, сохраняются, воспроизводятся, меняются паттерны поведения.
Респондентное и оперантное поведение.
Павлова и Уотсон больше всего интересовало рефлекторное поведение, как реакция на определенные (известные) стимулы. (респондентное поведение5, S-R психология). Торндайка (потом – Скиннера) интересовало поведение в его соотнесенности с последствиями. Торндайк не строил гипотез о том, как возникает инструментальное (приводящее к успеху) действие кошки, которой удалось выбраться из ящика.(инструментальное обусловливание6, инструментальное поведение).
Оперантное поведение возникает без воздействия каких–либо внешних наблюдаемых раздражителей. Реакция организма кажется спонтанной в том смысле, что внешне она никак не связана с каким–либо наблюдаемым раздражителем. Это вовсе не означает, что стимула, вызывающего ту или иную реакцию, не существует; это значит, что при возникновении данной реакции ни один стимул не является наблюдаемым. И это не столь уж важно, акцент делается на другом. С экспериментальной же точки зрения, если стимул отсутствует, то это значит, что он не применялся, а потому и не наблюдается.
Респондентное и оперантное обусловливание. Респондентное (классичесое о.) - подчеркивается важность стимула, вызывающего определенную реакцию. ОО – тип обусловливания, вызывающий оперантное поведение, измеряется силой реакции (акцент на реакции). Работа Скиннера связана именно с ОО.
Оперантное поведение определяется событиями, которые следуют за реакцией организма (обусловливание типа Р). То есть, последствия поведения изменяют тенденцию организма повторять данное поведение в будущем. Если последствия благоприятны для организма, то вероятность повторения данного поведения в будущем увеличивается. В этом случае говорят, что произошло подкрепление реакции. Напротив, если последствия реакции неблагоприятны для организма, тогда вероятность появления данного поведения в будущем уменьшается.
Как видно, поведение определяется подкреплением. Этот термин пришел в бихевиоризм из работ И.П. Павлова и обозначает объекты или условия, которые удовлетворяют те или иные потребности организма и способствуют закреплению предшествующего поведения. Скорость, с которой оперантное поведение приобретается и сохраняется, зависит от режима подкрепления. Режим подкрепления – это правило, устанавливающее вероятность, с которой будет происходить подкрепление. Скиннер выделял несколько режимов подкрепления.
Изучая возможности научения и контроля за поведением человека, Скиннер обращал особое внимание на различные типы подкрепления и их сравнительную эффективность. С точки зрения способности удовлетворять биологические потребности организма, он выделял два вида подкрепления – первичное и вторичное. Первичное подкрепление – это любое событие или объект, само по себе способное удовлетворять потребности организма. Его ценностное значение абсолютно и не зависит от научения. Вторичное (условное) подкрепление – это событие или объект, которые приобрели способность подкреплять поведение организма в результате тесной ассоциации с первичным подкреплением.
В жизни современного человека условное подкрепление является основным видом подкрепления при научении социальному поведению и контроле за ним. Наиболее яркий пример такого условного подкрепления – это деньги. Сами по себе деньги не могут удовлетворить ни одну биологическую потребность; но, ассоциируясь с тем, что на них можно приобрести (еда, питье, физический комфорт), они становятся значительной подкрепляющей поведение силой. Обратите внимание на тот факт, что деньги ассоциируются более чем с одним первичным подкреплением. Это явление называется генерализацией условного подкрепления. Другие виды генерализованных условных подкреплений – это внимание, похвала, подчинение себе других и социальное одобрение.
Изучая возможности контролировать поведение людей в социуме, Скиннер попытался определить сравнительную эффективность подкрепления и наказания. Изначально наказание рассматривалось как противоположность подкреплению, как предъявление аверсивного (неприятного или болевого) стимула в ответ на определенную оперантную реакцию. Цель наказания – побудить организм не повторять данную реакцию. Позднее Скиннер расширил свою концепцию наказания, включив в нее позитивное и негативное наказание. Позитивное наказание происходит тогда, когда поведение приводит к появлению аверсивного стимула. Негативное наказание имеет место тогда, когда поведение приводит к устранению (возможного) позитивного стимула. По аналогии с наказанием, подкрепление также может быть позитивным (предъявление положительно стимула) и негативным (удаление аверсивного стимула).
Скиннер считал, что все формы контроля за поведением, использующие аверсивные стимулы, неэффективны и поэтому нежелательны в обществе. Особенно неэффективным средством контроля он считал наказание. Причина в том, что из-за своей угрожающей природы наказание может вызывать нежелательные эмоциональные и социальные побочные эффекты. Более того, наказанный человек предположительно знает, что делать нельзя, но может не знать, какое поведение является желательным. Неэффективность современной пеницитарной системы Скиннер связывал именно с тем, что в ней используются неэффективные методы контроля за поведением осужденных.