شرطیسازی عاملی (کنشگر)
اکبر ربیعی – دانشجوی دکتری روانشناسی تربیتی – ۱۴۰۰
شرطیسازی عاملی که به آن شرطیسازی کنشگر یا ابزاری هم گفته میشود یک روش یادگیری است که از طریق پاداش و تنبیه در ازای یک رفتار واقع میشود. از طریق شرطیسازی عامل یک فرد ارتباطی را بین یک رفتار خاص و یک نتیجه برقرار میسازد درواقع ارتباطی بین یک رفتار و نتیجه آن رفتار ایجاد میشود.
بهعنوانمثال؛ هنگامیکه موش آزمایشگاهی یک دکمه آبی را فشار میدهد؛ او یک گلوله غذا بهعنوان پاداش دریافت میکند؛ اما هنگامیکه دکمه قرمز را فشار میدهد یک شوک الکتریکی خفیف دریافت میکند درنتیجه او یاد میگیرد که در صورت فشردن دکمه آبی پاداش دریافت میکند (غذا) و از فشردن دکمه قرمز (شوک خفیف) خودداری میکند.
اما شرطیسازی عاملی فقط چیزی نیست که در حین انجام آزمایشها انجام شود. آموزش حیوانات آزمایشگاهی همچنین نقش مهمی در یادگیری روزمره دارد.
پاداش و تنبیه تقریباً بهطور روزانه در محیطهای طبیعی و همچنین ساختارهای منظمتری مانند کلاس یا جلسات درمانی انجام میشود.
بیایید نگاهی دقیقتر به چگونگی پیدایش و کشف شرطیسازی عاملی و تأثیر آن بر روانشناسی و نحوه استفاده از آن برای روند یادگیری تغییر رفتارهای قدیمی و آموزش رفتارهای جدید بیندازیم.
تاریخچه شرطیسازی عاملی (کنشگر)
شرطیسازی عاملی توسط بی اف اسکینر (رفتارگرا) ابداع شد. به همین دلیل ممکن است گاهی اوقات با عنوان شرطیسازی اسکینر نیز یاد شود. اسکینر بهعنوان یک رفتارگرا معتقد بود که برای توضیح و تفسیر رفتار افراد نیز واقعاً لازم نیست که به افکار و انگیزههای درونی فرد نگاه کنیم. در عوض وی پیشنهاد داد ما باید فقط بر روی علل بیرونی و قابلمشاهده رفتار انسان نگاه و توجه کنیم.
در اوایل قرن بیستم رفتارگرایی بهعنوان نیروی اصلی در روانشناسی تبدیل شده است. اندیشههای جان بی واتسون از ابتدا بر این مکتب فکری حاکم بود. واتسون بر روی اصول شرطیسازی کلاسیک متمرکز شد
درجایی که رفتارگرایان اولیه بیشتر بر روی یادگیری گروهی و انجمنی معطوف بودند اسکینر بیشتر به این موضوع علاقه داشت که عواقب و نتیجه اعمال افراد بر روی رفتار آنها تأثیرگذار است. او معتقد بود که بهترین راه برای درک رفتار این است که نگاه به علتهای یک عمل و عواقب و پیامدهای آن باشد. اسکینر اصطلاح عملگرا را برای اشاره به هرگونه رفتار فعالی که درنتیجهی آن عملی در پی دارد نیز به کار برد.
نظریه اسکینر توضیح داد که چگونه طیف وسیعی از رفتارهای آموختهشده را که هر روز از خود بروز میدهیم نیز به دست میآوریم. نظریه او بهشدت تحت تأثیر کار روانشناس ادوارد ثورندایک بود کار او بر اساس قانون اثر ثورندایک استوار بود با توجه به این اصل نیز رفتاری که به دنبال نتایجی دلپذیر و خوشایند هستند نیز احتمالاً تکرار میشود و رفتاری که ناشی از نتایج ناخوشایند باشد نیز از احتمال کمتری برای تکرار شدن نیز برخوردار است. (اعمالی که نتایج مطلوبی را در پی دارند احتمال تکرار شدنشان بالاست اما رفتاری که نتایج نامطلوبی به دنبال دارد نیز احتمال کمتری تکرار میشود).
شرطیسازی عاملی به یک پیشفرض ساده متکی است تقویت رفتار تقویتشده تمایل به تکرار شدن دارد (بهعبارتدیگر تحکیم شده) رفتار تقویت نشده نیز تمایل دارد تا که از بین رفته و خاموش شود (بهعبارتدیگر تضعیفشده). درواقع رفتاری که تقویتشده احتمال بروز آن در آینده بیشتر است نسبت به رفتاری که تقویت دریافت نکرده است. برای مثال گفتن یک داستان خندهدار در کلاس و در پی آن خندیدن همه به آن احتمال تکرار این عمل را افزایش میدهد و احتمالاً شما آن داستان را در آینده تکرار میکنید یا داستان جدید تعریف میکنید. یا مثلاً پرسیدن سؤال در کلاس اگر شما دستتان را بلند کرده و پاسخ دهید و در پی آن معلم از شما تعریف کند احتمال اینکه سری بعد همدستتان را بلند کنید پاسخ دهید یا نظرتان را بگویید افزایش مییابد. ازآنجاییکه این رفتار با تقویت و نتیجه مطلوبی همراه بوده است اعمال و اقدامات قبلی تقویت میشوند. برعکس اعمالی که منجر به تنبیه یا پیامدهای نامطلوب میشوند نیز ضعیف میشوند؛ و احتمال تکرار آنها در آینده نیز کمتر است. اگر در کلاس دیگری دوباره همین داستان را بگویید اما این بار هیچکس به آن نخندد احتمال تکرار آن در آینده کم است یا مثلاً در کلاسی پاسخی را فریاد بزنید و معلم شما را سرزنش کند در این صورت نیز احتمال کمتری برای پاسخ دادن دوباره در آن کلاس نیز وجود دارد.
پس درنتیجه رفتاری که نتیجه مطلوب و تقویت را دریافت میکند تکرارشونده است اما رفتاری که با نتیجه نامطلوب و تنبیه همراه است احتمال اینکه دوباره تکرار شود کم است.
انواع رفتارها
اسکینر بین دو نوع رفتار تمایز قائل شده است:
- رفتارهای بازتابی (رفتارهای انعکاسی)؛ مواردی هستند که بهصورت خودکار و انعکاسی رخ میدهند و نیازی نیست این رفتارها را شما یاد بگیرید این رفتارها بهصورت خودکار و غیرارادی رخ میدهند؛ مانند کشیدن دست از اجاقگاز داغ یا تکان دادن پای هنگام ضربه پزشک بر روی زانوی شما.
- رفتارهای کنشگر یا غیر بازتابی (عاملی)؛ از طرف دیر رفتارهای عملیاتی رفتارهایی هستند که تحت کنترل آگاهانه ما قرار دارند. برخی ممکن است خودبهخود و برخی دیگر بهعمد رخ دهند اما پیامدهای این اقدامات است که سپس بر روی تکرار یا عدم وقوع آنها در آینده نیز تأثیر میگذارد. اقدامات ما در مورد محیط و عواقب و پیامدهای ناشی از آن نیز بخشی مهمی از فرایند یادگیری را تشکیل میدهد.
درحالیکه شرطیسازی کلاسیک میتواند پاسخگوی رفتارهای پاسخدهندگان باشد اسکینر به این نتیجه رسید که یادگیری در پی شرطیسازی کلاسیک کمتر صورت میپذیرد و همچنین اظهار داشت که شرطیسازی عملیاتی از اهمیت بیشتری برخوردار است و تأثیر بیشتری بر یادگیری میگذارد.
اسکینر در دوران کودکی دستگاههای مختلفی را اختراع کرد و این مهارتها را در طول کارش نیز به کار گرفت.
مطالعات اسکینر در مورد شرطیسازی عاملی
اسکینر در پی تحقیقات خود دستگاهی را ابداع کرد که بهعنوان یک اتاق شرطیسازی عاملی شناخته میشود و امروزه اغلب از آن بهعنوان جعبه اسکینر یاد میشود. محفظه در اصل یک جعبهای بود که میتوانست حیوان کوچکی مانند موش یا کبوتر را در خود جای دهد. این جعبه همچنین حاوی میله یا کلیدی بود که حیوان میتوانست برای دریافت پاداش آن را فشار دهد. بهمنظور ردیابی پاسخها نیز اسکینر همچنین دستگاهی را توسعه داد که بهعنوان ضبط کننده تجمعی نیز شناخته میشود. دستگاه پاسخها را بهعنوان یک حرکت به سمت بالا از یک خط ثبت میکند تا نرخ پاسخها بتواند با نگاهی به شیب خطوط خوانده شود.
اجزای شرطیسازی کنشگر (عاملی)
چندین مفهوم اصلی در شرطیسازی عاملی وجود دارد؛ که در اینجا به توضیح آنها میپردازیم:
تقویت در شرطیسازی عاملی؛ تقویتکنندهها؛ پاسخهایی از جانب محیط که باعث افزایش احتمال تکرار رفتار میشوند (به عبارتی تقویت هر رویدادی است که رفتاری را که به دنبال آن میآید تقویت یا افزایش میدهد)
دو نوع تقویتکننده وجود دارد:
- تقویتکنندههای مثبت
- تقویتکنندههای منفی
تقویتکننده مثبت؛ تقویتکنندهی رفتاری است که درنتیجهی آن فردی پاداش دریافت میکند.
درواقع تقویتکنندههای مثبت رویدادها یا نتایج مطلوبی هستند که پس از رفتار ارائه میشوند. در موقعیتهایی که تقویت مثبت را منعکس میکند یا افزایش چیزی مانند ستایش یا پاداش مستقیم نیز پاسخ یا رفتاری تقویت میشود. بهعنوانمثال اگر در محل کار خود کار خوبی انجام دهید و مدیرتان به شما جایزه دهد شما ترغیب میشوید که کارتان و رفتاری که نتیجه خوبی در پی داشته را تکرار کنید.
تقویتکنندههای منفی؛ حذف یک تقویتکنندهی ناخوشایند نیز میتواند رفتاری را تقویت کند این مورد با عنوان تقویت منفی شناخته میشود زیرا حذف یک محرک نامطلوب است که برای افراد یا حیوان، پاداش را در پی خواهد داشت تقویت منفی موجب تقویت رفتار میشود زیرا تجربهای ناخوشایند را متوقف میکند و یا آن را از بین میبرد.
درواقع تقویتکنندههای منفی شامل حذف رفتار یا نتایج نامطلوب پسازآن است. در این شرایط درواقع با حذف چیزی که ناخوشایند تلقی میشود، پاسخ نیز تقویت میشود. بهعنوانمثال اگر کودک شما وسط فروشگاه مواد غذایی شروع به فریاد زدن کند اما هنگامیکه برخورد یا رفتار شما باعث آرام شدن کودک شود درواقع بار دیگر که کودک شروع به فریاد زدن کرد رفتاری که باعث آرام شدن فریاد کودک انجام میدهید درواقع اقدام شما منجر به حذف وضعیت ناخوشایند (جیغ کودک) منفی نیز رفتار شما را تقویت میکند. در هر دو مورد تقویت نیز رفتار افزایش مییابد.
تنبیه (مجازات) در شرطیسازی عاملی
تنبیه ارائه یک رویداد یا نتیجه نامطلوب است که باعث کاهش رفتاری میشود که به دنبال آن میآید. درواقع این یک رویداد ناگوار است که درنتیجه رفتاری را در پی آن اتفاق میافتد را کاهش میدهد.
تنبیه در مقابل تقویت تعریف میشود زیرا بهجای اینکه به دنبال افزایش دادن یک پاسخ باشد در پی کاهش یا حذف است. تنبیه دو نوع است:
- تنبیه مثبت
- تنبیه منفی
تنبیه مثبت؛ که بعضاً با استفاده از آن تنبیه و مجازات با اعمال خوانده میشود یک رویداد یا نتیجه نامطلوب را ارائه میدهد تا بتواند پاسخی را که در پی دارد تضعیف کند. تهمت زدن برای رفتار نامناسب نمونهای از تنبیه یا مجازات با اعمال است.
تنبیه (مجازات) منفی؛ که به آن مجازات با حذف معروف است. تنبیه منفی شامل برداشتن محرک مطلوب بعد از وقوع رفتاری است. درواقع هنگامی روی میدهد که یک اتفاق یا نتیجه مطلوب پس از وقوع یک رفتار برداشته شود. بردن بازی ویدئویی کودک پیروی از رفتار نامناسب مثالی از مجازات یا تنبیه منفی است.
در هردو مورد تنبیه منفی و مثبت نیز رفتار کاهش مییابد.
برنامههای تقویت
تقویت لزوماً روندی مستقیم و سرراست برای یادگیری محسوب نمیشود و عوامل مختلفی در سرعت یادگیری چیزهای جدید نیز میتوانند تأثیر بگذارند. اسکینر دریافت که چه زمانی و اینکه اغلب رفتارها نیز تقویت میشوند در سرعت و قدرت کسب و یادگیری نقش دارند. بهعبارتدیگر زمان و دفعات تقویت بر نحوهی رفتارهای جدید و آموختهشده و حتی اینکه چگونه تغییر و اصلاح رفتارهای قدیمی صورت میپذیرد نیز تأثیر میگذارد.
اسکینر چندین برنامه مختلف از تقویت را شناسایی کرد که بر روند شرطیسازی عاملی تأثیر میگذارند که این برنامهها عبارتاند از:
- تقویت پیوسته
- تقویت نسبت ثابت
- تقویت فاصله ثابت
- تقویت نسبت متغیر
- تقویت فاصله متغیر
- تقویت پیوسته؛ شامل تحویل تقویتکننده در هر میزان پاسخ است. یادگیری نسبتاً سریع اتفاق میافتد. بااینوجود سرعت پاسخ بسیار کم است با توقف تقویت نیز خاموشی و حذف رفتار نیز خیلی سریع اتفاق میافتد.
- برنامههای با نسبت ثابت نوعی تقویت جزئی است. پاسخها فقط پس از وقوع تعداد مشخصی از پاسخها تقویت میشوند. این بهطورمعمول منجر به نرخ پاسخ نسبتاً ثابت میشود. درواقع تقویت بعد از تعدادی پاسخ از قبل تعیینشده صورت میگیرد
- در برنامه فاصلهای ثابت پس از گذشت مدتزمان ثابتی از آخرین تقویت نیز اولین پاسخ تقویت میشود. درواقع برنامه فاصلهای ثابت شکل دیگری از تقویت جزئی است و تقویت پس از سپری شدن یک بازهی زمانی مشخص انجام میشود. نرخ پاسخ نسبتاً ثابت باقیمانده و با نزدیک شدن به زمان تقویت شروع به افزایش میکند اما بلافاصله پس از تحویل تقویت نیز کند میشود.
- ✔ در برنامههای با نسبت متغیر مانند برنامه نسبی ثابت نیز در این برنامه نیز تقویت پس از تعدادی پاسخ ارائه میشود اما در این برنامه تعداد پاسخهایی که بین تقویتها منظور میشود از تقویتی به تقویت دیگر متغیر است. درواقع این نوع تقویت نوعی تقویت جزئی است که پس از پاسخهای متنوع شامل تقویت رفتار است. این امر هم منجر به نرخ پاسخ بالا و هم سرعت خاموشی و حذف کند میشود.
- برنامههای با فاصله متغیر نیز شکل نهایی تقویتکننده جزئی اسکینر است که شرح داده شده است در برنامه فاصلهای متغیر تقویت هر بار بعد از سپری شدن مدتزمان معینی که مقدار آن از تقویتی به تقویت دیگر متغیر است نیز ارائه میشود. همچنین منجر بهسرعت پاسخ سریع و سرعت خاموشی و حذف کاهش مییابد.
نمونههایی از شرطیسازی عاملی
ما میتوانیم نمونههایی از شرطیسازی عاملی را در محیط اطراف خود پیدا کنیم. عملی را که کودکان برای دریافت جایزه و پاداش از والدین یا معلم خود به پایان میرسانند یا کار یا موردی را که کارکنان پروژههایی را برای دریافت ستایش یا تبلیغات به دایان میرسانند. میتوانیم ببینیم.
چند نمونه دیگر از شرطیسازی کنشگر در عمل یا رفتار:
- اگر رفتارهای کودک شما در حین خرید غیرقابلکنترل است (مثلاً گریه کردن بهانهجویی جیغ) احتمالاً ممکن است برای ساکت کردنش یک خوراکی بخرید یا به او یک وعده بدهید ازآنجاکه شما رفتارهای نادرست او را تقویت کردهاید نیز احتمالاً او در آینده این رفتار را تکرار میکند. (کودک یاد میگیرد که در پی گریه کردن خواستهاش تأمین میشود)
- پس از اجرا در یک گروه تئاتر و ایفای نقش در تئاتر نیز زمانی که از طرف تماشاگران تشویق میشوید و این پاداش را دریافت میکنید بهنوعی این بهعنوان یک تقویتکننده مثبت الهامبخش شما تلقی میشود و همین باعث میشود که شما برای نقشهای دیگر و اجراهای دیگر ترغیب شوید و امتحان کنید.
- ● هر زمان که سگ خود رفتاری را بهدرستی انجام داد با ارائه تعریف و تمجید و ضربه زدن به سش نیز به او آموزش میدهید تا واکشی کند و رفتار را یاد بگیرد
- یک استاد به دانشجویان خود میگوید اگر در تمام طولترم نیز حضوری کامل داشته باشد پس مجبور نیستند در امتحان جامع نهایی شرکت کنند. درواقع با حذف یک محرک ناخوشایند و منفی (آزمون نهایی) دانشجویان را برای حضور منظم در کلاس ترغیب کرده است.
- اگر نتوانید بهموقع پروژهای را تحویل دهید رئیس شما عصبانی میشود و عملکرد شما را در مقابل همکاران زیر سؤال برده و شما را تحقیر میکند. این بهعنوان یک مجازات کننده یا تنبیه مثبت عمل میکند و احتمال اینکه در آینده پروژهها را با تأخیر به پایان برسانید نیز کمتر است. (درواقع برای تحقیر نشدن در مقابل همکارانتان کار و پروژههایتان را بهموقع به پایان میرسانید و تحویل میدهید.)
- ● دختر نوجوانی که از او خواسته شد تا اتاق خود را مرتب کند اما این کار را نکرده است والدینش برای تنبیه او تلفن او را در طول روز از او میگیرند و او را از داشتنش محروممی کنند. این نمونهای از مجازات منفی است که در آن محرک مثبت از بین رفته است.
در برخی از این مثالها وعده یا احتمال پاداش باعث تقویت رفتار میشود اما از شرطیسازی عاملی نیز میتوان برای کاهش رفتار استفاده کرد. از نتیجه مطلوب یا برنامه منفی میتوان برای کاهش یا پیشگیری رفتار نامطلوب استفاده کرد. بهعنوانمثال؛ ممکن است به کودکی گفته شود اگر در کلاس خارج از نوبت صحبت کند نیز امتیاز تعطیلات خود را از دست میدهد. این پتانسیل مجازات ممکن است منجر به کاهش رفتارهای مختلکننده شود.
کلام آخر
درحالیکه رفتارگرایی ممکن است تسلط زیادی را که در اوایل دوره کار و شکوفایی خود داشت را ازدستداده باشد اما در قرن بیستم شرطیسازی عاملی (کنشگر) ابزاری مهم و اغلب مورداستفاده در روند یادگیری و اصلاح رفتار محسوب میشد. بعضیاوقات عواقب و نتایج طبیعی منجر به تغییراتی در رفتار ما میشوند رفتار ـ اخلاق در مواردی دیگر ممکن است پاداشها و تنبیه (مجازات) ها بهطور آگاهانه انجام پذیرد تا تغییری در رفتار ما شکل گیرد.
شرطیسازی عاملی چیزی است که ممکن است بلافاصله در زندگی خود تشخیص دهید و آن را به کار بگیرید. خواهناخواه در رویکرد شما برای آموزش رفتار خوب و درست به فرزندان یا آموزش سگ خانواده برای جلوگیری از جویدن دمپایی موردعلاقه شما است. نکته مهمی که باید به خاطر داشته باشید و به آن توجه کنید این است که با هر نوع یادگیری که برای تغییر یا اصلاح رفتار نیز گاهی ممکن است زمانبر باشد. نوع تقویت یا مجازات را در نظر بگیرید که ممکن است برای شرایط منحصربهفرد شما بهترین نتیجه را داشته باشد و ارزیابی کنید که کدام نوع برنامه تقویت ممکن است به بهترین نتیجه ممکن نیز منجر شود.
Sources:
Coon.D. Mitterer.JO. Psychology: A journey. Belmont. CA: Wadsworth:2014.
Domhan, M. The Principes of Learning and Behavior, Seventh Edition. Stamford, CT: Cengage Learning:2015.
با سلام
به عنوان یک دانشجو خدا را شکر می نمایم که استاد گرانقدر جناب آقای دکتر اکبر رضایی را بر سر راه ما قرار دادند و از دانش و فضیلت های بی نظرشان بهره مند می شویم برای سلامتی و توفیق روز افزون این استاد گرانمایه از در گاه الهی خواهان و خواستارم.
ممنون از لطف شما آقای ربیعی عزیز