تست هوش و استعدادیابی در تبریز – مفهوم و نظریههای هوش – ماهیت و هدف آزمونهای استعداد (MAB-II) – استانداردسازی و ویژگیهای روانسنجی آن – دکتر اکبر رضایی – متخصص سنجش هوش و استعدادیابی در تبریز
مفهوم و نظریههای هوش
هوش بهعنوان یک سازه فرضی
صاحبنظران و نویسندگان زیادی تلاش کردهاند هوش را تعریف کنند. تعاریف تکتک آنها در ادبیات پژوهشی موجود است (اسنو، ۱۹۷۸؛ استرنبرگ، ۱۹۸۵ الف؛ ۱۹۸۵ ب؛ استرنبرگ و دترمن، ۱۹۸۶). برای مثال، وکسلر (۱۹۵۸) هوش را اینگونه تعریف کرده است:
ظرفیت کلی افراد برای عمل کردن بهصورت هدفمند، تفکر منطقی و سازگاری مؤثر با محیط خود. ازآنجهت کلی است که از عناصر یا تواناییهایی مختلف تشکیل یافته است. اگرچه بهصورت کامل مستقل از هم نیستند، بااینحال ازنظر کیفی متفاوت از هم میباشند. (ص. ۷)
وکسلر چنین استدلال کرده است که رفتار هوشمندانه چیزی بیشتر از مجموع تواناییهای جداگانه است. چون (الف) ترکیبهای خاص تواناییها نشان دادهاند که کارآمدتر از بقیه ترکیبها میباشند، (ب) سایر ویژگیها ازجمله انگیزش بر رفتار تأثیر میگذارد و (پ) سطوح توانایی فراتر از مقدار موردنیاز آن برای انجام یک تکلیف خاص بر رفتار خاص تأثیر نمیگذارد. تلویحات متعددی در استدلال وکسلر از ماهیت هوش وجود دارد. از موارد قابلتوجه میتوان به چند مورد اشاره کرد: (۱) هوش شامل تواناییهای مستقل از هم است که با هم سازماندهی شدهاند، (۲) هوش و رفتار هوشمندانه قابلتمایز از هم میباشند، (۳) عوامل دیگری غیر از تواناییها بر رفتار هوشمندانه تأثیر میگذارند، (۴) توانایی بالا در یک حوزه مشخص الزاماً یا همیشه نتیجه رفتار هوشمندانه در حوزه دیگر نیست.
چنین عقایدی سابقه طولانی دارند و توجه نظریهپردازان معاصر را به خود جلب کرده است. درواقع، بررسی عقاید گذشته و حال یک مبنای غنی و پرباری برای پرداختن به دامنه وسیعی از موضوعات مربوط به ماهیت و نظریه هوش، راهبرد اندازهگیری، نقش بافت فرهنگی و روندهای آتی فراهم میآورد. بسیاری از این موضوعات توسط گروهی یازدهنفره از محققان موردبحث و بررسی قرار گرفته و نتایج آن در برخی از شمارههای مجله روانشناسان آمریکا منتشر شده است (نیسر و همکاران، ۱۹۹۶). در این زمینه، مقالات بسیاری متعددی منتشر شده است که بهعنوان نمونه میتوان به مقاله هرنستاین و مورای (۱۹۹۴) اشاره کرد. هرچند که کتابچه دستورالعمل آزمونها جای مناسبی برای پرداختن به این موضوعات نیست، بااینوجود اگر هوش بهعنوان یک سازه فرضی، چیزی متفاوت ازآنچه توسط آزمونهای هوش اندازهگیری میشود، در نظر گرفته شود، در آن صورت لازم است به برخی از نظریهها در مورد هوش پرداخته شود؛ یعنی فهرست کردن و بحث در مورد مفروضههای ارائهشده در مورد هوش که از مطالعات معاصر درباره تواناییهای شناختی بهدستآمدهاند (استرنبرگ، ۱۹۸۵ الف؛ ورنون، ۱۹۷۹). چنین مفروضههایی نباید بهعنوان واقعیتهای محض و عاری از بحث و مجادله در نظر گرفته شوند. بلکه این مفروضهها را میتوان بهعنوان فرضیههایی در نظر گرفت که مبنایی برای اندازهگیری و پژوهشهای جاری و همچنین تبیینها و بازنگریهای بعدی فراهم میآورند.
برخی مفروضهها در مورد تواناییهای شناختی
۱٫ هوش و تواناییهای شناختی بازنمایی کننده سازههای فرضی هستند که از مطالعات مختلف میدانی، روانسنجی، مشاهدهای و آزمایشگاهی بهدستآمدهاند. به معنی دقیق کلمه، این نظام سازهای بهطور مستقیم قابلمشاهده نیست، بلکه از طریق مشاهده مجموعهای از نمونههای رفتاری این سازهها قابل استنباط هستند. از این لحاظ، هوش تا حدودی از سازههای مورداستفاده برای تفسیر رویدادهای فیزیکی مانند دما یا الکترومغناطیس متفاوت است (همپل، ۱۹۵۲).
۲٫ هوش یک واحد چندوجهی است، مجموعهای از نظامهای مجزا که بهطور نیمهخودکار عمل میکنند ولی بهعنوان یک فرا نظام سازماندهی شده است. این فرا نظام بهنوبه خود ممکن است بهعنوان جنبهای از شخصیت افراد مانند رفتارهای هوشمندانه مفهومسازی شود (یعنی هدفمند، فعالیتهای جهت دادهشده توسط هدف)، ممکن است نهتنها تابع کنش تواناییهای دقیق تعریف شده باشد بلکه صفات شخصیتی مانند انعطافپذیری یا مقاومت را نیز شامل میشود.
۳٫ مبنای فیزیولوژیکی برای هوش نیز وجود دارد. برای مثال نشان داده شده است که روندهای تحولی و رشدی بهعنوان بخشی از کنش رسش بیولوژیکی حاصل میشوند؛ بنابراین هوش با مسن شدن و کهولت کاهش نشان میدهد که بخشی از آن حاصل فرایند افت بیولوژیکی است. همخوان با این مفروضهها پژوهشها نیز نشان دادهاند که بین اندازه مغز که با تصویربرداری تشدید مغناطیسی (MRI) ارزیابی گردیده است و هوش اندازهگیری شده رابطه وجود دارد (ورنون و ویکت، ۱۹۹۷؛ ویکت و ورنون، ۱۹۹۴)، یافتهها همچنین رفتار هوشمندانه را به تأخیر در پاسخدهی مرتبط میدانند (جنسن، ۱۹۷۹؛ میلر و ورنون، ۱۹۹۲؛ ورنون و کانتور، ۱۹۸۶؛ ورنون و مورای، ۱۹۹۲؛ ورنون و وس، ۱۹۹۳). سرعت پردازش اطلاعات، حل مسئله و زمان واکنش، اطلاعات مهمی درباره عملکرد هوشمندانه در اختیار قرار میدهند که بهطور مناسبی در اندازهگیری تواناییهای هوش مورداستفاده قرار میگیرند.
۴٫ تعداد زیادی از فرایندهای شناختی جزء رفتارهای هوشمندانه محسوب میشوند. این فرایندها را میتوان از طریق محتواها و شکلهای متنوع آزمون کرد. همبستگی بین آزمونها و عوامل گروهی تابعی از فرایندهای مشابه است که از تکالیف شناختی مختلف استنباط میشود. اکثر این اندازههای توانایی شناختی بهصورت مثبت با همدیگر ارتباط دارند؛ بنابراین، برای توصیف رفتار هوشمندانه بر اساس عامل کلی به همراه مجموعهای از عاملهای گروهی کلامی و غیرکلامی مفید هستند.
۵٫ اگرچه تعداد زیادی از عملکردهای شناختی برای اندازهگیری توانایی هوشی کلی به کار میروند، بااینحال تعمیمپذیری به عملکرد ملاکی هنگامیکه نمونه وسیعی از انواع مختلف اندازهگیری مورد ارزیابی قرار میگیرد مطلوب خواهد بود. هرچه نمونه معرفتر باشد تعمیمپذیری فرایندهای شناختی نیز بهتر خواهد بود. از دیدگاه تخصصی، اگر نمرات آزمون را بهصورت ترکیبی بهعنوان یک مؤلفه، دارای واریانس و کوواریانس نشان داده شوند در آن صورت کوواریانس در میان انواع عملکردهای مختلف درصورتیکه نمرات با هم جمع بسته شوند حالتی تجمعی خواهند داشت و برآورد بهتر از مجموعه اندازهگیریها نشان خواهند داد.
۶٫ آنچه بهعنوان رفتار هوشمندانه ارزیابی میشود، وابسته به بافت است و بهصورت اجتماعی تعریف میشود؛ اما در تعریفهای اجتماعی سازگاری و رفتارهای هوشمندانه اشتراکاتی وجود دارد. تعریف یا اندازهگیری رفتار هوشمندانه مجزا از محیطی که در آن نشان داده میشود غیرممکن است. جوامع پیشرفته تأکید زیادی روی مهارتهای مفهومی مانند خواندن، اعداد و دستکاری نمادهای انتزاعی دارند. سازگاری در جوامع سنتی شامل مهارتهای مختلفی از قبیل شکار، دانش در مورد شرایط آب و هوایی، یخ و توانایی محافظت افراد از خودشان در زمستان است. بااینحال، در جامعه مدرن افراد نیازمند یادگیری دانش و مهارتهای موردنیاز خودشان، بهعنوانمثال، تعمیر برفروبها هستند. ازاینرو، غیرموجه است که سؤالهای آزمون که شدیداً به دانش زبان انگلیسی وابسته است به افراد ناآشنا با آن اجرا کنیم. بااینحال نباید چنین تصور کرد که آزمونها مختص به یک فرهنگ خاص میباشند.
برای مثال، لین (۱۹۸۲) نشان داد هنگامیکه بر روی کودکان ژاپنی آزمون هوشی وکسلر به زبان ژاپنی اجرا میشود آنها هیچ مشکلی در کامل کردن تکالیف نداشتند. درواقع نمرات آنها بهطور قابلتوجهی بالاتر از نمرات کودکان آمریکای شمالی بود؛ بنابراین اگر بتوان نشان داد که ابزار آزمون متناسب با فرهنگ جامعه است (یعنی زبان و دیگر علائم و نشانههای ارتباطی فهمیده شوند) و آزمودنیها دارای مهارتهای موردنیاز برای انجام سنجش ازجمله مهارت خواندن باشند در این صورت سطح عملکرد هوش را میتوان به صورتی مناسب مشخص کرد. البته محیط غنیشده، یعنی محیطی که در آن مهارتهای هوش، تمرین شده باشد و جایی که فرصت زیادی برای مواجه با مسائل جدید وجود داشته باشد، در آن صورت میتوان انتظار داشت که آنها در رشد و پیشرفت تواناییهای هوش نقش داشته باشند.
۷٫ رفتار هوشمندانه تنها در تواناییهای عملکرد شناختی سنتی منعکس نمیشود، بلکه در محیط اجتماعی نیز به صورتی مناسب عمل میکند. نظریهپردازانی مانند بینه و ثرندایک، نقش هوش اجتماعی را بهطور صریح تشخیص داده بودند. برخی نظریهپردازان جدید (گیلفورد، ۱۹۶۷؛ استرنبرگ، ۱۹۸۴ الف؛ استرنبرگ، ۱۹۸۴ ب؛ ۱۹۸۵ الف؛ ۱۹۸۵ ب؛ جکسون، ۱۹۶۱)، سازگاری با محیط رفتاری را بهعنوان بعد اصلی نظامهای خودشان قرار دادهاند.
بافت تاریخی آزمودن هوش
مبانی تست هوش
ازنظر تاریخی، ریشههای آزمونهای استعداد چندبعدی (MAB) به آغاز آزمودن هوش – سال ۱۹۰۵- برمیگردد، یعنی زمانی که بینه و سیمون اولین یافتههای خود را در مورد کودکان مدارس فرانسوی منتشر کردند. ولی در این میان پیشرفتهای واسطهای بسیار مهمی نیز وجود داشتند که در زیر خلاصهای از آنها ارائه شده است:
۱٫ معرفی ابزارهایی که با بهکارگیری آنها میتوان تواناییهای شناختی را برحسب نمره استاندارد مشخص کرد، ازاینرو، مقایسه نمره شخص با دیگران میسر شد. استرن (۱۹۱۲) پیشنهاد داد که سن عقلی و سن فیزیولوژیکی را میتوان بهعنوان نسبتی برای نشان دادن هوشبهر به کار برد، ازجمله نخستین پیشرفتها در این زمینه بود. خیلی زود مشخص شد که گروه هنجاری یا مقایسه برای بازنمایی درست عملکرد افراد مهم و ضروری است.
۲٫ ایدهای توسط ترمن (۱۹۱۶) مطرح شد مبنی بر اینکه اندازهگیری توانایی هوش باید به صورتی استاندارد و هنجار شده باشد. این پیشرفت منجر به انتشار آزمون هوشی استنفورد- بینه شد که معیار استانداردی برای آزمودن هوش برای بیش از نیمقرن بنا نهاد. ترمن نشان داد که نمرات IQ به صورتی نرمال یا بهنجار توزیع شده است.
۳٫ اوتیس و همکارانش (۱۹۱۸) ابزارهایی برای اندازهگیری توانایی هوش معرفی کردند که کاربردهای کمهزینهتری از سنجشهای توانایی ذهنی بهویژه در زمینههای آموزشی فراهم میکرد.
۴٫ کشف اینکه توانایی ذهنی کلی را میتوان از طریق انواع مختلفی از تکالیف، عملکرد و شکلهای پاسخ مورداندازهگیری قرار داد که تا حدودی فراتر از روشهای کلامی پردازش اطلاعات گسترش یافت. برای مثال، ریون (۱۹۶۰) ماتریسهای پیشرونده ریون و کهس (۱۹۲۳) طراحی مکعبها را معرفی کردند. ورنون (۱۹۸۳) با استفاده از تکالیف خاص سرعت پردازش اطلاعات و هوش کلی را موردبررسی قرار داد و همچنین انواع مختلفی از ابزارها توسط گیلفورد (۱۹۶۷) به کار گرفته شد.
۵٫ معرفی اولین برنامه آزمودن ذهنی با مقیاس بزرگ برای بزرگسالان توسط ارتش ایالاتمتحده در جنگ جهانی اول (یرکس، ۱۹۲۱) و گسترش آزمونهای آلفا (برای افراد تحصیلکرده) و آزمون بتای ارتش (برای افراد بیسواد). برخی از پیشرفتهای مهم، ریشه در این دوره زمانی دارند: (الف) ایدهای که توانایی کلی از طریق نمونهبرداری از انواع مختلف حیطههای عملکردی مختلف اندازهگیری میشود، (ب) تشخیص اینکه آزمونهای وابسته به دستورالعملهای کلامی و محتوای آزمون ممکن است در افرادی که از فرصت کافی برای یادگیری مهارتهای زبان برخوردار نباشد سوگیری ایجاد کند (برای مثال افراد متولدشده در کشورهای دیگر)؛ (پ) معرفی انواع مختلف ابزارهای اندازهگیری بهمنظور ارزیابی تواناییهای کلی هوش و (ت) کشف اینکه توانایی هوش با تفاوتهای موجود در ویژگیهای جمعیت شناختی مانند سطح آموزش، زمینه خانوادگی، محل جغرافیایی و کیفیت آموزش تغییر میکند (یرکس، ۱۹۲۱).
۶٫ ایده مربوط به ارائه عملکرد هوش افراد در قالب جدول نیمرخ، امکان نمایش نقاط قوتوضعف افراد، برای مثال در مقیاس توانایی عملکرد پینتنر– پترسون (۱۹۱۷) فراهم آورد.
۷٫ پیشنهاد اینکه واریانس آزمون را میتوان از طریق روشهای ارائهشده توسط هولزینگر (۱۹۳۸)، اسپیرمن (۱۹۰۴) به بخشهایی تقسیم کرد که این امر توسط گیلفورد (۱۹۶۷) و ترستون (۱۹۳۸) رایج شد. بر اساس این فکر آزمونهای مختلف از ترکیب مؤلفههای خاص و همچنین مؤلفههای بازنمایی کننده عوامل گروهی نظیر تواناییهای کلامی و فضایی و عامل کلی تشکیل مییابند.
۸٫ گسترش کاربرد هوشبهر انحرافی توسط وکسلر که برای اندازهگیری هوش بزرگسالان مناسب به نظر میرسید. از طریق تبدیل توزیع نمرهها به توزیعی با میانگین تقریبی ۱۰۰، انحراف استاندارد ۱۵، هوشبهر انحرافی امکان مقایسه اشخاص را با گروههای سنی بر پایه معیار آماری در گروههای مناسب فراهم آورد.
۹٫ تعریف گسترشیافته هوش که آن را بهعنوان جنبهای از شخصیت نشان میدهد. گیلفورد (۱۹۶۷) و همکارانش نشان دادند که تواناییهای هوش ممکن است در بافت گسترده شخصیت قابلدرک باشد. اگرچه از دیگر جنبههای شخصیت قابلتفکیک است، بااینحال کارکردش بهعنوان سازه نظری هوش تنها یکی از تعیینکنندههای رفتار هوشمندانه است.
جنبههای کلی و خاص هوش
توسعه مفاهیم مربوط به تواناییها ازنظر تاریخی ارتباط تنگاتنگی با نوآوریهای تحلیل آماری دارد. ازاینرو، در بین نخستین مطالعات در مورد تواناییهای شناختی، مطالعات وایسلر در سال ۱۹۰۱ قرار دارد، فردی که روش همبستگی گشتاوری را در تحلیل اندازههای زمان واکنش و تیز حسی به کار گرفت. او نشان داد که این اندازهها، پیشبینهای ضعیفی از پیشرفت تحصیلی هستند. او بیش از یک نسل روانشناسان آمریکایی را مجبور به پذیرش این باور کرد که تواناییهای شناختی بهطور نسبتاً زیادی حالتی ویژه و خاص دارند و در تبیین رفتارهای مهم اجتماعی قابلتعمیم نیستند. یک مشکل با این تعبیر و تفسیرهای اولیه دادههای همبستگی نظریه پایایی بود. همانطور که ما امروزه میدانیم آن ناقص و نادرست فهمیده شده است. همانطور که میدانید نمونههای واحدی از رفتار، اندازه نهفته پاسخ واحد یا پاسخ واحد به یک سؤال آزمون هوش، پایایی کمی دارد و ازاینرو روایی محدود میشود؛ اما هنگامیکه مشاهدات بیشتر شود، اندازههای پایایی و روایی افزایش پیدا میکند.
بهعنوان جایگزینی برای این فرضیههای اختصاصی، اسپیرمن در سال ۱۹۰۴ برای اولین بار شواهدی ارائه کرد که آزمونهای فرایندهای حسی و هوش با هم همبستگی دارند و اینکه یک کارکرد زیربنایی مشترک در همه شاخههای فعالیت شناختی وجود دارد و عناصر خاص هر فعالیت با فعالیتهای دیگر مشترک نیستند. اسپیرمن این دیدگاهها را به یک نظریه دوعاملی از هوش ارتقاء داد که در آن هر آزمون هوش از واریانس مرتبط به هوش کلی یا عامل g (اگرچه اسپیرمن بهصورت آشکار g را با هوش کلی معادل نمیدانست) و یک عامل s، خاص به آن عملکرد تشکیل شده است. اندازه مؤلفههای g و s در آزمونهای مختلف متفاوتاند. اسپیرمن بر این باور بود که آزمونهای اشباعشده g در شناسایی مهارتهای هوش برای درک رابطهها نقش دارند و آن را ”دانش رابطهها و همبستهها“ نامگذاری کرد. ایدههای اسپیرمن تأثیرگذار بود ولی در مورد مشاهده مربیان چیزی برای گفتن نداشت. بهعبارتدیگر دانش آموزان در پیشرفت شناختی خود نابرابریهای بیشتری نشان میدادند- برخی در حوزه کلامی، تعدادی در مکانیکی یا فضایی و برخی نیز در فعالیتهای عددی برتر بودند.
مشاهده احتمال وجود عاملهای گروهی در تواناییهای شناختی توسط تعدادی از روانشناسان ازجمله بورت، ال کوسی، کلی و استفنسون در مطالعات متعددی در سالهای ۱۹۲۵ تا ۱۹۴۰ موردحمایت قرار گرفت. درواقع این مطالعات نشان دادهاند که شواهد مهمی برای عامل g وجود دارد که درکل تبیینی برای نسبت بزرگتر واریانس در مقایسه با عوامل گروهی بود. ترستون روشهایی را برای تحلیل عامل چندگانه در دهه ۱۹۳۰ ارائه داد و در سال ۱۹۳۸ تکنگاری کلاسیک منتشر کرد که در آن به اجرای ۵۶ آزمون به ۲۴۰ دانشجو اشاره شده بود. بر این اساس ترستون، هشت عامل اولیه را مشخص کرد: کلامی، سرعت ادراکی، استدلال استقرایی، عددی، حافظه تکراری، استدلال قیاسی، روانی کلامی و فضا. عامل g اسپیرمن از سوی ترستون تشخیص داده نشد. اسپیرمن و همکارانش توجه افراد را به این واقعیت جلب کردند که آزمونهای ترستون بهطور مثبت به هم مرتبط میباشند. واقعیتی که در بررسیها بعدی هنگامیکه نمونههای ناهمگنی مورداستفاده قرار گرفت شواهد بیشتری برای آن به دست آمد، اما تفاوتها مورد تأکید بودند. ترستون بعدها، روشهایی را برای تحلیل سلسلهمراتبی عاملها ارائه کرد که در آن همبستگی عاملهای اولیه برای نشان دادن یک عامل سطح بالاتر کلی موردبررسی قرار میگرفت. اگرچه این موضوع اهمیت کمی در مقایسه با دیگر موارد مهم در نظام او داشت.
فیلیپ ورنون (۱۹۶۱-۱۹۷۱) سعی در یکپارچه کردن تحقیقات اولیه انگلیسیها و آمریکاییها از طریق تفسیر عملکردهای شناختی برحسب یک مدل عامل گروهی سلسلهمراتبی داشت که در آن g عامل کلی زیربنایی را نشان میداد که عاملهای گروهی عمده و عاملهای فرعی و عاملهای خاص را سازماندهی میکرد. عاملهای گروهی اصلی دو نوع بودند: کلامی- عددی– تحصیلی (v:ed) و عملی– مکانیکی– فضایی– فیزیکی (k:m). این عاملهای عمده به عاملهای گروهی کوچکتر تقسیم میشوند: عامل v:ed به عاملهای گروهی کلامی و عددی و عامل k:m به عاملهای گروهی اطلاعات مکانیکی، فضایی و مهارت یدی. مفهومسازی ورنون موازی با کارهای وکسلر (۱۹۳۹) بود، او یک آزمون هوشی را طراحی کرد که از دو بخش عمده کلامی و عملی تشکیل شده بود و اینها هم بهنوبه خود ترکیب میشدند تا مقیاس کامل IQ را به وجود آورند.
بااینحال، ورنون از فعالیتهای اسپیرمن قدردانی کرد و از محدودیتهای مدل سلسلهمراتبی او استفادههای لازم را به عمل آورد. ورنون (۱۹۷۱-۱۹۶۱) بیان میکند که:
ازنقطهنظر واقعیت، اسپیرمن حق بیشتری نسبت به روانشناسان تربیتی و شغلی دارد … عاملهای گروهی در این حوزه دارای محدودیتهای بیشتری هستند و خاصتر میباشند؛ بنابراین درواقع متمایز کردن انواع مختلف استعداد کاری بسیار دشواری است. (ص. ۱۵)
ورنون ادعا میکرد که تصویری سلسلهمراتبی از ساختار تواناییهای شناختی، به چندین دلیل تصویری بسیار سادهسازی شده است: (الف) با انتخاب مناسب آزمونها میتوان تقریباً هرکدام از عاملهای گروهی را بر اساس تواناییهای ویژه مشخص کرد، (ب) عاملهای گروهی تا حدودی بهعنوان نتیجه انواع خاص آموزش و تحصیلات متفاوت خواهد بود، (پ) ازاینرو تنها باید عاملهای گروهی را که منعکسکننده پیامدهای کاربردی باشند در نظر گرفت و (ت) خلقوخو، شخصیت، فیزیک، جنسیت، سن و علایق روی عملکرد بالا تأثیر میگذارند که فراتر از تأثیر تواناییهای محض است.
نظریههای نوین درباره هوش
در سالهای اخیر ازسرگیری مطالعات مربوط به ماهیت هوش منجر به برخی مفاهیم جدید، توجه به جنبههای جدید، فرایندها و درک عمیقتر موضوعات شده است (مراجعه شود به استرنبرگ، ۱۹۸۱). در این زمینه میتوان به صاحبنظرانی نظیر کارول (۱۹۷۶، ۱۹۹۳)، گیلفورد (۱۹۶۷)، هامفریس (۱۹۹۴)، جنسن (۱۹۹۸) و استرنبرگ (۱۹۸۴ الف، ۱۹۸۴ ب، ۱۹۸۵ الف، ۱۹۸۵ ب) و ورنون (۱۹۶۱/۱۹۷۱، ۱۹۷۹) اشاره کرد.
نظریه گیلفورد، هوش را در سه بعد گسترده موردبررسی قرار میدهد: عملیات، محتوا و تولیدات. پنج نوع عملیات (شناخت، حافظه، تولید واگرا، تولید همگرا و ارزیابی)؛ شش نوع تولید (واحدها، طبقات، روابط، نظامها، گشتارها و تلویحات) و چهار نوع مختلف محتوا (عددی، نمادی، معنایی و رفتاری). سه بعد ماتریس از ۱۲۰ خانه تشکیل شده است. تمرکز پژوهشهای گیلفورد معطوف به جستجوی تشخیص عاملها برای تعدادی از این ۱۲۰ خانه بود. اگرچه این احتمال وجود دارد که این عاملها با یکدیگر مرتبط و بهصورت سلسلهمراتبی سازماندهی شده باشند، بااینحال گیلفورد به این سؤال جواب نداده است.
بهجای تلاش برای ساخت یک طبقهبندی از عاملهای اولیه، کارول (۱۹۷۶) با نظریه کلی از فرایندهای شناختی شروع کرد و به مشخص کردن تفاوتهای فردی زیربنایی فرایندهایی که در هر عامل وجود دارند، پرداخت. در این نظام، عاملهای توانایی اولیه ذهنی زمانی ظاهر میشوند که یک مجموعه از آزمونها دربرگیرنده تفاوتهای فردی در چهار حیطه باشند: انواع و محتویات حافظه (برای مثال، معنای واژگان و عددی)، ماهیت و نظم عملیات شناختی، راهبردهای شناختی و حل مسئله و طبقات پاسخ. از دیدگاه کارول، فرایندهای کنترل بر سه نوعاند: توجهی، خطابی و حافظه بلندمدت و همچنین چندین عملیات ازجمله اجرایی و کارکردهای یکپارچه ساز درگیر در حافظه کوتاهمدت.
همانند کارول، استرنبرگ (۱۹۸۴ الف، ب؛ ۱۹۸۵ الف، ب) نیز به بررسی پژوهشهای پردازش اطلاعات و شناختی تجربی نوین (هانت، ۱۹۸۰- ۱۹۷۸؛ کیتنگ، ۱۹۸۳؛ نیسر، ۱۹۷۹؛ سیمون، ۱۹۷۶؛ استرنبرگ، ۱۹۷۸) و همچنین عقل و خرد سنتی از پژوهشهای هوش برای شکلدهی نظریه سهبخشی از هوش انسان پرداخت. نظریه پیشنهادی او شامل سه نظریه فرعی است: یک نظریه فرعی بافتی که به شیوه سازگاری، انتخاب و شکلدهی محیط بیرونی میپردازد. بخش دیگر نظریه او بر نقش تجربه در واکنش بهتازگی و خودکارسازی میپردازد و این نظریه فرعی هوش را به جهان درون فرد مرتبط میسازد. نظریه فرعی سوم، سه گروه از مؤلفهها را مشخص میکند که شامل پردازش اطلاعات برای یادگیری عملیات ضروری، برنامهریزی و انتقال آنهاست. ایدههای استرنبرگ در چندین زمینه حالت انقلابی دارند. ازجمله اینکه: (الف) تعریف هوش را در چندین جهت گسترش داد؛ برای مثال، در حوزه سازگاری شغلی و هوش اجتماعی، (ب) فرضیههای روشنی در مورد فرایندهای زیربنایی ارائه داد و (ج) منبع خوبی برای ایدههای پژوهشی به وجود آورد.
نظریههای نوین هوش به علت اینکه حوزه گستردهای را شامل میشوند مبنایی برای ارزیابی بافتهایی که آزمونهای هوش مناسب هستند فراهم مینمایند و همچنین مجموعهای از محتوا و عملیات را پیشنهاد میکنند و ممکن است سرنخهایی درباره تقویت آزمونهای هوش ارائه کنند. بهویژه، نظریات گیلفورد (۱۹۶۷)، کارول (۱۹۹۳) و استرنبرگ (۱۹۸۴ الف) جهتهای روشنی برای گنجاندن نظامهای سازمانیافته به شیوههای خاص ارائه میکنند. چنین نظامهایی مبنای غنی برای طرحریزی فرضیههایی با توجه به حیطههای جدید برای اندازهگیری فراهم میکنند.
اولین موضوعی که توسط نظریههای چندعاملی هوش در سنت ترستون (۱۹۳۸) که نظریه گیلفورد مورد پیشرفته و متفاوتتری از آن در نظر گرفته میشود، مورد سؤال قرار میگیرد این است که آیا آنها فرمولبندیهایی را ارائه میدهند که ممکن است بهطور مناسبی به کار گرفته شوند. آیا این فرمولبندیها مفید هستند؟ مطمئناً این سؤالات دانش ما را از ماهیت هوش عمیقتر و گستردهتر خواهد کرد و به بهبود روشهایی که راهبردهای پردازش اطلاعات، محتواها و الزامات تکلیف بر روی افراد میگذارند منجر خواهد شد و در توسعه نظریههای آتی نقش خواهند داشت (استرنبرگ، ۱۹۸۲)؛ اما تأثیر این رویکردها بر مجریان محدود است. روانشناسان بالینی ترجیح میدهند تا استفاده از سازه هوش کلی را ادامه دهند (هامفریز، ۱۹۷۹؛ وکسلر، ۱۹۵۸). آنها هوش را بهعنوان اندازه کلی از توانایی شناختی در نظر میگیرند که اهمیت زیادی در فهم رفتار شخص دارد. اگرچه نظریه مبتنی بر عامل تواناییهای شناختی امیدهایی را برای پیشبینی تفکیکی ایجاد کرده است؛ برای مثال، از نگرشهای خاص پیشبینی کننده جنبههای خاص عملکرد شغلی، بااینحال، این امیدها در عمل بینتیجه ماندهاند (هامفریز، ۱۹۷۹؛ ری و ارلز، ۱۹۹۰؛ اسمیت و هانتر، ۱۹۸۱).
ماهیت و هدف مجموعه آزمونهای استعداد چندبعدی (MAB-II)
مجموعه آزمونهای استعداد چندبعدی– ویرایش دوم (MAB-II) بهمنظور فراهم آوردن آزمونی مناسب و مفید با نمرهگذاری عینی تواناییهای شناخت کلی یا هوش در قالب پنج خرده آزمون کلامی و پنج خرده آزمون عملی تهیه شده است. ازنظر تاریخی، ریشههای آن به آزمودن هوش- سال ۱۹۰۵ برمیگردد، یعنی به زمانی که بینه و سیمون یافتههای خود را درباره کودکان آموزشگاهی فرانسه منتشر کردند. اقدامات آنها الهامبخش استانداردسازی رسمی معروف استنفورد- بینه توسط ترمن (۱۹۱۶) گردید. همچنین موجب توسعه آزمونهای فردی غیرکلامی هوش نیز شد که از آن جمله میتوان به آزمونهای تکمیل تصاویر پینتنر و اندرسون (۱۹۱۷) و هیلی (۱۹۲۱) و آزمون طرح مکعبهای کهس (۱۹۲۳) اشاره کرد. همچنین پینتنر و پترسون در سال ۱۹۱۷ آزمون عملی چند تکلیفی انفرادی خود را استاندارد و گسترش دادند.
اولین اجرای آزمودن توانایی شناختی گروهی جدید در مقیاسی بزرگ توسط روانشناسانی که مجموعه آزمونهای طبقهبندی استعداد کارکنان ارتش آمریکا را توسعه دادند، انجام گرفت که هم شامل خرده آزمونهای گروهی و هم عملکردی بود. این کار مبنایی برای بسیاری از فعالیتهای بعدی قرار گرفت که از آن جمله میتوان به آزمون عملی استانداردشده دقیق کورنل و کاکس (۱۹۳۴) و آزمون هوشی وکسلر و بلویو (وکسلر، ۱۹۳۹) اشاره کرد.
آزمونهای چندبعدی تواناییهای ذهنی متأثر از آزمونهای آلفا و بتای ارتش آمریکا بنا به دلایل زیر بسیار موفقیتآمیز بودند: (الف) آنها تکالیف متعددی ازجمله محتوای یاد گرفتهشده در مدرسه و تکالیف کلامی را با مهارتهای کارکردی و عملی را در برداشتند؛ (ب) این آزمونها علاوه بر کودکان برای نوجوانان و بزرگسالان نیز مناسب بودند؛ (ج) نمرات این آزمونها منعکسکننده مفاهیم تازهای از ماهیت هوش بودند که در آنها به آسیبهای عصبشناختی، اختلالات هیجانی یا روانپریشی نیز توجه میشد؛ (د) بیشتر آنها به صورتی بسیار دقیق هنجاریابی و استاندارد شده بودند؛ (ﻫ) آنها پژوهشهای زیادی را برانگیخته بودند و مقالات زیادی بر اساس دادههای حاصل از اندازههای هوشی چاپ شده بود؛ (و) آزمونهای هوش سطوح بالایی از ویژگیهای روانسنجی را نشان میدادند؛ و (ز) دادههای روا و معتبر زیادی درباره آزمونهای هوش در طول چندین سال منتشر شده بود که از نمرات دانشگاهی گرفته تا مطالعات مربوط به شغل و سازگاری با محیط را شامل میشدند (آناستازی و اربینا، ۱۹۹۷). درواقع، مقیاسهای هوش استانداردشده معیاری برای کارکرد هوش درآمد.
اگرچه این آزمونها به صورتی گسترده مورداستفاده قرار میگیرند، بااینحال حداقل یک مشکل جدی در بهکارگیری آزمونهای هوش وجود دارد. به عبارتی این آزمونها نیازمند اجرای انفرادی و نمرهگذاری توسط فردی متخصص میباشند. در برخی موارد، مشاهدات بالینی آزمودنیها در جلسه آزمون مفید است. به همین دلیل در بیماران روانپریش و افرادی که ازنظر ذهنی دچار مشکل جدی هستند مستلزم اجرای انفرادی است؛ اما در مورد اکثر قریب بهاتفاق آزمودنیها که صرفاً میخواهند کارکرد ذهنی خود را برآورد کنند اجرای انفرادی هزینهبر و غیرضروری است. علاوه بر این، زمانی که آزمون گروهی توانایی ذهنی با آزمونهای وکسلر برای پیشبینی ملاکهایی نظیر عملکرد تحصیلی مورد مقایسه قرار میگیرد، آزمونهای انفرادی درکل هیچگونه مزیتی نسبت به انواع دیگر آزمونها نشان نمیدهند (ماتارازو، ۱۹۷۲)؛ بنابراین این سؤال مطرح میشود که آیا تبدیل برخی از ویژگیهای مثبت آزمونهای چندبعدی انفرادی به یک شکل ساختیافتهتر که بهصورت گروهی بتوان اجرا کرد امکانپذیر است یا نه. هدف این مجموعه ارائه آزمونهایی برای تحقق این هدف بود.
ویژگیهای عمومی MAB-II
کاربردهای موردنظر
مجموعه آزمونهای استعداد چندبعدی- ویرایش دوم برای سنجش دامنه وسیعی از تواناییهای ذهنی بزرگسالان و نوجوانان سنین ۱۶ و بالاتر طراحی شده است. همانند سایر ابزارهای اندازهگیری تواناییهای ذهنی، این آزمون را میتوان برای اهداف مختلف و در بافتهای مختلف به کار گرفت. این بافتها میتوانند شامل موقعیتهای آموزشی، مشاوره شغلی، تجاری و صنعتی، خدمات بهداشت روانی و درمانی و سایر پژوهشهای پایهای باشند. برای سنجش مناسب این آزمون ضروری است آزمودنیها از مهارتهای خواندن و توانایی درک دستورالعملهای نوشتاری و گفتاری برخوردار باشند. استفاده از این آزمون برای تعیین سطح عملکرد ذهنی افراد عقبمانده ذهنی و افراد روانپریش که ممکن است دستورالعملها را بهدرستی درک و اجرا نکنند، توصیه نمیشود. بااینحال، تجربه سازنده اصلی این آزمون نشان داده است که اکثر بیماران روانی قادر هستند به صورتی هدفمند مجموعه آزمونهای استعداد چندبعدی را تکمیل نمایند.
ماهیت مقیاسها
همانند سایر آزمونهای مربوط به اندازهگیری تواناییهای ذهنی که به آزمونهای آلفا و بتای ارتش آمریکا و پیش از آن برمیگردد، مجموعه آزمونهای استعداد چندبعدی- ویرایش دوم متشکل از مقیاسهای گروهی کلامی و غیرکلامی است. پنج خرده آزمون کلامی در یک دفترچه و پنج آزمون غیرکلامی یا بهعبارتدیگر عملی در قالب دفترچه دیگری ارائه شده است. پاسخنامههای مجزا برای مقیاسهای کلامی و عملی تهیه شده که میتوان بهصورت دستی نمرهگذاری کرد. ازاینرو، این امکان وجود دارد که بخش کلامی یا عملی را بهصورت مجزا یا هر دو بخش را بهصورت همزمان برای به دست آوردن سنجش جامعی از تواناییهای ذهنی اجرا کرد. علاوه بر نمرات ده خرده آزمون، مجموعه آزمونهای استعداد چندبعدی- ویرایش دوم یک هوشبهر کلامی، یک هوشبهر عملی و یک هوشبهر کلی به دست میدهد. همچنین نمرات استاندارد را میتوان بهجای هوشبهر کلی، عملی و کلامی مورداستفاده قرار داد.
کلامی | عملی |
اطلاعات عمومی | نماد ارقام |
درک و فهم | تکمیل تصاویر |
محاسبه | تجسم دیداری |
شباهتها | تنظیم تصاویر |
واژگان | الحاق قطعات |
اگرچه عناوین ۹ خرده آزمون از میان ۱۰ خرده آزمون همان عنوانهای استفادهشده برای سایر آزمونها ازجمله آزمون آلفا و بتای ارتش آمریکا و آزمون وکسلر است، بااینحال آزمون استعداد چندبعدی- ویرایش دوم دارای فرمت و شکل متفاوت بوده و وجه مشترک دیگری با سایر ابزارها ندارد.
نوع سؤالات
در مجموعه آزمونهای استعداد چندبعدی- ویرایش دوم از سؤالات چندگزینهای برای همه خرده آزمونها استفاده شده است. اگرچه محتوای سؤالهای این آزمونها بهصورت کلامی، عددی، شکلی و تصویری است، ولی در هر سؤال یا ماده، فرد باید از بین پنج گزینه یکی را که درستتر است انتخاب کند. این نوع آزمون امکان ثبت پاسخهای ارائهشده توسط افراد مختلف و نمرهگذاری آنها را بدون توجه به قضاوتهای حرفهای میسر میسازد.
اهداف تأثیرگذار در توسعه MAB-II
شاید بارزترین جنبه توسعه مجموعه آزمونهای استعداد چندبعدی این است که این مجموعه آزمونها چندین بار قبل از تدوین نسخه اصلی موردبازنگری قرار گرفته است. سه بار سؤالات قبل از انتشار بهصورت میدانی اجرا، تحلیل، تجدیدنظر و موردبررسی قرار گرفتهاند. در انتخاب محتوای سؤالها به تفاوتهای گروهی افراد جامعه از قبیل جنسیت، ملیت، سن و فرهنگ توجه خاص شده است.
جنبه دوم از ساخت مجموعه آزمونهای استعداد چندبعدی، فراهم آوردن ابزاری است که نهتنها دارای ویژگیهای روانسنجی قابلقبول باشد، بلکه شامل ویژگیهایی نظیر سهولت در استفاده و تفسیر نیز باشد. دستورالعمل آزمون بهگونهای استانداردشده که بتوان آن را بهراحتی اجرا کرد. مدتزمان اجرای ده خرده آزمون برابر بوده و نمرهگذاری دستی بهمنظور تسریع کار در نظر گرفته شده است.
سومین جنبه آزمون استعداد چندبعدی- ویرایش دوم، هنجار مرتبط با سن است. ویرایش اول آزمون استعداد چندبعدی دربرگیرنده هنجارهایی بود که با WAIS-R کالیبره (درجهبندی) شده بود، حالآنکه ویرایش دوم آن شامل هنجارهایی برای نه گروه سنی بر پایه اطلاعات سرشماری آمریکا است.
خاستگاه خرده آزمونهای کلامی و عملی MAB
فعالیتهای علمی دیوید وکسلر در اندازهگیری هوش بزرگسالان و همچنین مجموعه آزمونهای او را میتوان خاستگاه اصلی تهیه آزمونهای چندبعدی استعداد دانست. لازم به ذکر است که همه فرمتها و نامهای مقیاسهای آزمون، ریشه در آزمونهای کلامی و عملی وکسلر دارند. این آزمونها نیز قبلاً در آزمونهای آلفا و بتای ارتش آمریکا در جنگ جهانی اول مورداستفاده قرار میگرفتند (یرکس، ۱۹۲۱). بعد از جنگ جهانی اول آزمونهای آلفا و بتای ارتش آمریکا کاربردهای گستردهای یافتند و مؤلفان و ناشران این آزمونها را برای توزیع همگانی انطباق دادند. در بین این آزمونهای انطباق یافته، خرده آزمونهای بتای ارتش کورنل- کاکس (۱۹۳۴) بود که دارای پنج خرده آزمون عملی بود: تنظیم تصاویر، تکمیل تصاویر، ساخت مکعبها، نماد ارقام و حافظه طرحها.
آزمونها بهطور قابلملاحظهای مشابه با آزمونهای بتا بودند. وکسلر مجموعهای از خرده آزمونهای عملی از مقیاس کورنل-کاکس انطباق یابی کرد و پنج خرده آزمون با عنوان مقیاس هوش وکسلر- بلویو ارائه کرد. بهجای ساخت مکعب، وکسلر از بلوکهای کهس (۱۹۲۳) در آزمون خود استفاده کرد؛ بنابراین اگرچه مقیاسهای وکسلر برخی ویژگیهای مثبت، ازجمله ایده برآورد هوش بر اساس اندازههای کلامی و عملی و همچنین گزارش نتایج برحسب نیمرخ دارد. بااینحال، خدمات وکسلر به خاطر این نبود که برای نخستین بار به این ایدهها تحقق بخشید و نه به خاطر توسعه انواع مختلفی از مطالب آزمون، بلکه به خاطر ترکیب آنها در بسته مفید با هنجارهای مبتنی بر سن بود. از زمان انتشار مقیاس وکسلر، این آزمون پژوهشهای زیادی و بهتبع آن مقالات و دادههای روا ایجاد کرده است. البته شاید این به خاطر ویژگیهای مقیاس وکسلر نیست بلکه ماهیت خود هوش نیز در این زمینه نقش دارد.
ویژگیهای منحصربهفرد MAB-II
علیرغم مقبولیت عمومی استفاده از آزمونهای انفرادی هوش، این آزمونها در حال حاضر دارای سه مشکل اساسی هستند: (۱) ضرورت اجرای فردی، (۲) نمرهگذاری ذهنی و قضاوتی و (۳) هنجارها. آزمون انفرادی هوش باید توسط فردی متخصص و آموزشدیده اجرا و نمرهگذاری شود. فعالیتی تخصصی و مهم که نیازمند زمان و اجرای دقیق است، بنابراین گران تمام میشود. دومین مشکل در انتخاب نیمرخ اندازه توانایی هوش کلی، مربوط به نمرهگذاری ساختیافته در برابر نمرهگذاری قضاوتی است. نمرهگذاری قضاوتی در گذشته در اندازهگیریهای کلینیکی هوش مورداستفاده قرار میگرفت، اما به عللی استفاده از آن نیازمند دقت فراوانی است که از این موارد میتوان به نمونههای زیر اشاره کرد: (الف) زمان بیشتری موردنیاز است، (ب) بعد ناپایایی از نمرهگذاری آزمون بهدست میدهد، (پ) مشکلاتی در ساخت و استانداردسازی آزمون وجود دارد و تحلیل سؤال و انتخاب سؤالهای دقیق برای آزمونها با نمرهگذاری قضایی مناسب نیست. برخی از تحقیقات (برای مثال، ریان، پریفتریا و پاورز، ۱۹۸۳) نشان دادهاند که نمره گذاران اختلاف فاحشی در ارزیابی مقیاسهای وکسلر دارند. سومین مشکل آزمونهای انفرادی هوش مسئله هنجاریابی است. انتخاب نمونه معرف آزمودنیها با آزمونهای فردی نسبت به استفاده از آزمونهای گروهی مشکلتر است.
با توجه به این ملاحظات و با هدف یکپارچه کردن مزایای رویکردهای نوین برای آزمونهای استاندارد با فرمت اجرای انفرادی برای اندازهگیری توانایی کلی، مجموعه آزمونهای استعداد چندبعدی اصلی تهیه و تدوین شد. آزمون استعداد چندبعدی- ویرایش دوم بهگونهای طراحی شد که امکان اجرای گروهی و نمرهگذاری ماشینی و دستی آسان را فراهم میآورد. اگرچه نسخه نخست آزمون استعداد چندبعدی هنجارهای معادل با هنجارهای WAIS-R را مورداستفاده قرار میداد ولی برای نسخه دوم این آزمون هنجارهای آمریکای شمالی بر پایه دادههای مربوط به جامعه آماری ایالاتمتحده و نمونههای کانادایی تهیه شده است.
تفسیر تفاوتهای خرده آزمونهای استعداد چندبعدی (MAB-II)
تفسیر تفاوتهای خرده آزمونهای MAB همانطور که ازلحاظ تشخیصی بسیار مهماند، وسوسهانگیز نیز میباشند. روانشناسان بالینی و پژوهشگرانی که میخواهند چنین دادههایی را مطالعه و بهکارگیرند، باید این نکته را در نظر داشته باشند که تفاوتهای مشاهدهشده بین نمرات خرده آزمونهای مشارکتکنندگان باید بهاندازه کافی بزرگ باشند تا ازلحاظ آماری پایا باشند. پایایی تفاوتهای خرده آزمونها تابع پایایی خود آنها و همچنین تابع استقلال آماری آنها است. خرده آزمونهای MAB-II بهواسطه عامل مشترک توانایی شناختی عمومی، اساساً همبسته هستند. ازاینرو، اگرچه خرده آزمونها پایا هستند، اما واریانس مشترک آنها بر تفسیر تفاوتهای خرده آزمونها تأثیر میگذارد. کرافورد (۱۹۹۷)، روشهایی را برای ارزیابی پایایی چنین تفاوتهایی ارائه کرده است.
نسبت پایداری/ ناپایداری
هنجارهای آزمون استعداد چندبعدی (MAB-II) و دادههای دیگر نشان دادهاند که نمرات خام در خرده آزمونهای خاص بیشتر از نمرات دیگر خرده آزمونهای خاص MAB-II با سن کاهش مییابند. ازاینرو، اصطلاح پایداری به آزمونهایی مرتبط است که حداقل کاهشهایی را با سن نشان دادهاند و اصطلاح ناپایداری با آزمونهایی ارتباط دارند که کاهش قابلملاحظهای را بهواسطه افزایش سن از خود نشان میدهند.
در مجموعه آزمونهای استعداد چندبعدی، همه خرده آزمونهای کلامی(بهاستثنای بخش شباهتها) اندازههایی به دست میدهند که با سن پایدار باقی میمانند. برعکس، همه خرده آزمونهای عملی اندازههایی دارند که با سن پایدار باقی نمیمانند. شباهتها حد واسط هستند و در نظر گرفته نشدهاند.
پایدار | ناپایدار |
اطلاعات عمومی | نماد ارقام |
درک و فهم | تکمیل تصاویر |
محاسبه | تجسم دیداری |
واژگان | تنظیم تصاویر |
الحاق قطعات |
نسبت پایداری/ ناپایداری برای ارزیابی این مسئله مورداستفاده قرار میگیرد که آیا کاهش عملکرد فرد در MAB-II بیشتر از کاهش طبیعی ناشی از افزایش و کهولت سنی است یا نه. این مسئله از طریق به دست آوردن میانگین نمره میزان شده برای یک آزمودنی در خرده آزمونهای پایدار و خرده آزمونهای ناپایدار محاسبه میگردد. سپس نسبت پایداری/ ناپایداری از طریق تقسیم میانگین خرده آزمونهای پایدار بر میانگین خرده آزمونهای ناپایدار به دست میآید. نسبت بالاتر نشان میدهد که بر اساس هنجارهای سنی متناسب، خرده آزمونهای پایدار برای آزمودنیها بالاتر از خرده آزمونهای ناپایدار هستند. مقدار مورد انتظار این نسبت در جامعه نرمال ۰۰/۱ است. اگر نسبت پایداری/ ناپایداری بالای ۰۰/۱ باشد، در این صورت این احتمال وجود دارد که تغییر در تواناییهای شناختی به تغییرات وابسته به پیری زودرس که برای آزمودنی روی داده است شباهت دارد؛ اما باید توجه داشت که دامنهای از نسبت پایداری/ ناپایداری در جامعه نرمال کلی حتی برای افراد جوانتر نیز وجود دارد. ازاینرو، در بهکارگیری نسبت پایداری/ ناپایداری در تصمیمگیریهای شخصی باید احتیاط کرد. نسبت پایداری/ ناپایداری MAB-II ممکن است در تحقیقات تشخیص کاهش زودرس تواناییهای ذهنی بهواسطه زوال کارکردی یا عضوی مرتبط با افزایش و کهولت سنی، آسیب روانی، سوءمصرف مواد یا عوامل دیگر مفید باشد.
استانداردسازی و ویژگیهای روانسنجی MAB-II
استانداردسازی MAB-II
نمونه هنجاری
استانداردسازی مجدد آزمون استعداد چندبعدی با یک نمونه هنجاری با استفاده از نمونهگیری نظامدار یا سامانمند از نه گروه سنی در ایالاتمتحده آمریکا و کانادا صورت گرفت. افراد طوری انتخاب شدند که گروه نمونه شامل اقشار مختلفی از جامعه بر اساس نژاد، قومیت و موقعیت جغرافیایی باشند. گروه هنجار از تعداد یکسانی از مردها و زنها تشکیل شده بود. هرکدام از نه گروه سنی شامل ۲۰۰ نفر بودند، بهاستثنای دو گروه با شرایط سنی بالا که هرکدام از این دو گروه سنی از ۱۰۰ نفر تشکیل شده بودند.
جنسیت | تعداد |
مردان | ۸۰۰ |
زنان | 800 |
نژاد | % |
سفید | ۴/۸۷% |
غیر سفید | 6/12% |
گروه سنی | تعداد |
۱۷ – ۱۶ | ۲۰۰ |
۱۹ – ۱۸ | ۲۰۰ |
۲۴ – ۲۰ | ۲۰۰ |
۳۴ – ۲۵ | ۲۰۰ |
۴۴ – ۳۵ | ۲۰۰ |
۵۴ – ۴۵ | ۲۰۰ |
۶۴ – ۵۵ | ۲۰۰ |
۶۹ – ۶۵ | ۲۰۰ |
۷۴ – ۷۰ | ۲۰۰ |
تحصیلات | سال |
میانگین سطح تحصیلات | 92/12 |
شغل | % |
مدیریت/ حرفهای، تخصصی | ۵۰% |
فنی، فروشنده، خدماتی و کارگری | 50% |
منطقه / کشور | % |
شمال غرب آمریکا و غرب کانادا | ۵/۲۱ |
جنوب غرب آمریکا | ۱/۱۷ |
باختر میانه آمریکا | ۹/۲۹ |
جنوب شرق آمریکا | ۹/۸ |
شمال شرق آمریکا و شرق کانادا | 6/22 |
تعداد کل | ۱۶۰۰ |
هنجارهای گروههای سنی
میانگین و انحراف استاندارد نمرات خام خرده آزمونها برای هر گروه سنی محاسبه گردید. ازآنجاییکه میانگین سطح تحصیلات برای سه نمونه با سن بالا (۶۴–۵۵، ۶۹ –۶۵ و ۷۴–۷۰) تا حدودی بیش از میانگین تحصیلات جامعه بود، میانگین نمرات خام این سه گروه از طریق تعدیل رگرسیون با در نظر گرفتن میانگین تحصیلات جامعه، میانگین تحصیلات گروه نمونه و همبستگی بین نمرات خرده آزمونها و سطح تحصیلات انطباق داده شدند. میانگینها و نمرات استانداردها برای هر گروه سپس با استفاده از ملاک حداقل مجذورات مشخص و تعدیل شدند. میانگینها و نمرات استاندارد بهدستآمده برای محاسبه نمره میزان شده (نمره استانداردشده با میانگین ۵۰ و انحراف استاندارد ۱۰) و معادلهای درصدی نمرات خام ارائهشده در پیوست ج استفاده شد. این نمرات میزان شده باید برای مقایسه نمرات آزمونشونده در گروه سنی خود آزمونشوندگان مورداستفاده قرار گیرند. آنها را نمیتوان برای تبدیل نمرات خام به نمرات میزان شده در محاسبه نمرات مجموعه آزمونهای کلامی، عملی و کلی استفاده کرد.
هنجارهای تبدیل نمره میزان شده
میانگین و انحراف استاندارد نمرات خام خرده آزمونها برای کل نمونه هنجار محاسبه شد. باز هم، نمرات حاصل از نمونههای با سن بالا در تحصیلات با استفاده از تعدیل رگرسیون همانطور که در بالا توضیح داده شد انطباق یافتند. میانگینها و نمرات استانداردها برای هر گروه سپس با استفاده از ملاک حداقل مجذورات مشخص و تعدیل شدند.
هنجارهای مجموعه آزمونهای کلامی، عملی و مقیاس کامل
نمرات کلامی، عملی و مقیاس کامل برای هر گروه سنی با استفاده از میانگین و انحراف استاندارد که در بخش قبل توضیح داده شد محاسبه گردید. نمرات حاصله برای محاسبه میانگین و انحراف استاندارد گروههای سنی و همچنین برای جدولهای هوشبهر، نمرات استاندارد و درصدهای موجود در پیوست ب مورداستفاده قرار گرفت.
پایایی
پایایی همسانی درونی
مفهوم پایایی که در آزمونهای توانایی شناختی بکار میرود به قابلیت اطمینان اندازهگیری اشاره دارد. پایایی خرده آزمونها بهطور جداگانه برای ۲۳۰ نوجوان پسر و ۲۸۵ نوجوان دختر در پیوستار سنی ۱۵ تا ۲۰ سال محاسبه گردید که نتایج آن در جدول ۱ ارائه شده است. باید توجه داشت که تکتک خرده آزمونها با محدودیت زمانی اجرا شدهاند، بنابراین فرمول کودر- ریچاردسون ۲۰، پایایی همسانی درونی حد کرانی پایین را بیشازاندازه برآورد میکند. همانطور که در جدول ۱ مشاهده میشود، دامنه این پایاییها در گروههای سنی مختلف از ۹۴/۰ تا ۹۷/۰ برای آزمون کلامی، ۹۵/۰ تا ۹۸/۰ برای آزمون عملی و ۹۶/۰ تا ۹۸/۰ برای کل مقیاس است.
جدول ۱ پایاییهای همسانی درونی: نوجوانان دختر و پسر
سن | ||||||
15 | 16 | 17 | 18 | 19 | 20 | |
مقیاس | ۳۲=N | 100=N | 134=N | 100=N | 59=N | 91=N |
اطلاعات عمومی | ۸۴ | ۸۵ | ۸۳ | ۸۷ | ۹۰ | ۸۷ |
درک و فهم | ۸۴ | ۸۴ | ۸۲ | ۸۸ | ۹۰ | ۸۸ |
محاسبه | ۷۴ | ۷۰ | ۷۲ | ۷۶ | ۸۴ | ۸۰ |
شباهتها | ۸۶ | ۸۶ | ۸۵ | ۸۹ | ۹۰ | ۹۰ |
واژگان | 89 | 76 | 72 | 83 | 84 | 88 |
نماد ارقام | ۹۳ | ۹۷ | ۸۹ | ۹۴ | ۹۴ | ۹۵ |
تکمیل تصاویر | ۸۸ | ۹۰ | ۷۶ | ۸۸ | ۸۹ | ۸۸ |
تجسم دیداری | ۹۵ | ۹۴ | ۹۵ | ۹۵ | ۹۶ | ۹۶ |
تنظیم تصاویر | ۹۱ | ۷۵ | ۷۳ | ۸۱ | ۸۴ | ۸۵ |
الحاق قطعات | 91 | 83 | 78 | 87 | 88 | 89 |
مقیاس کلامی | ۹۶ | ۹۴ | ۹۴ | ۹۶ | ۹۷ | ۹۷ |
مقیاس عملی | ۹۷ | ۹۵ | ۹۶ | ۹۸ | ۹۸ | ۹۸ |
کل مقیاس | ۹۷ | ۹۶ | ۹۶ | ۹۸ | ۹۸ | ۹۸ |
توجه: اعداد اعشاری حذفشدهاند. برای مثال ضریب پایایی اطلاعات عمومی برای گروه سنی ۱۵ سال ۸۴/۰ است. پایاییها بر اساس فرمول کودر- ریچاردسون ۲۰ محاسبه شدهاند. |
روش دیگر ارزیابی پایایی نمرات خرده آزمونها محاسبه میزان یا درجهای است که هرکدام از مقیاسها با ترکیب خطی مابقی مقیاسها رابطه دارند. با استفاده از این روش فرض میکنیم که ترکیب وزنی نه مقیاس باقیمانده فرم موازی هر مقیاس را تشکیل میدهد. البته نه مقیاس باقیمانده با هرکدام از مقیاسها کاملاً موازی نیستند، چراکه محتوای سؤال و نوع آنها متفاوت است. چنین روشی با اشتراکات در تحلیل عامل همبسته است، طوری که حد کرانی پایین برآورد پایایی در آزمونهای با زمانبندیهای جداگانه ارائه میدهد. ستون ۱ جدول ۲ نشاندهنده مقادیری برای همبستگی چندگانه میان هر مقیاس و نه مقیاس باقیمانده بر اساس نمونه همارز یا معادل است. روش مرتبط دیگر برای برآورد پایایی حد کرانی پایین، محاسبه همبستگی میان خرده آزمونهای کلامی و عملی خاص و مقیاس عملی یا کلامی متناظر با آن میباشد که قبلاً اجرا شده است. این بهصورت ترکیب کلامی- عملی در ستون دو جدول ۲ ارائه گردیده است که بر اساس نمونه باز آزمایی توصیفشده در پاراگراف بعدی است. چون این آزمونها در شرایط مختلفی اجرا شدهاند، نمیتوان هر نوع وابستگی خطی جزء-کل آنها را با این روش مشخص کرد. پایاییهای ذکرشده در دو ستون اول جدول ۲ را میتوان برای بخش واریانس پایایی در هر مقیاس در ارتباط با عامل هوش کلی (ستون یک) و عاملهای کلامی و عملی مربوط به آن (ستون دو) در نظر گرفت.
جدول ۲ دادههای پایایی بر اساس ترکیبهای وزنی، ترکیب کلامی- عملی و دونیمه کردن
ترکیبهای وزنی | کلامی- عملی | دونیمه کردن | |
مقیاس | ۱۶۰=N | 51=N | 71=N |
اطلاعات عمومی | ۸۴/۰ | ۸۷/۰ | ۷۸/۰ |
درک و فهم | ۸۵/۰ | ۹۰/۰ | ۷۱/۰ |
محاسبه | ۷۷/۰ | ۸۰/۰ | ۷۵/۰ |
شباهتها | ۸۶/۰ | ۹۰/۰ | ۸۰/۰ |
واژگان | 82/0 | 85/0 | 79/0 |
نماد ارقام | ۸۳/۰ | ۷۸/۰ | ۶۴/۰ |
تکمیل تصاویر | ۸۰/۰ | ۸۵/۰ | ۶۶/۰ |
تجسم دیداری | ۶۷/۰ | ۷۵/۰ | ۸۷/۰ |
تنظیم تصاویر | ۸۰/۰ | ۸۴/۰ | ۵۵/۰ |
الحاق قطعات | 72/0 | 83/0 | 78/0 |
مقیاس کلامی | 92/0 | ||
مقیاس عملی | 94/0 | ||
کل مقیاس | 95/0 |
ستون سوم از جدول ۲ به خرده آزمونهای زوج و فرد با زمانبندی جداگانه اشاره دارد. نصف آزمونهای کلامی و عملی بهصورت جداگانه برای ۷۱ دانشآموز دبیرستانی با میانگین سنی ۱۶ تا ۱۸ سال اجرا شد. پایاییهای آزمونهای کلامی، عملی و مقیاس کلی با استفاده از فرمول اسپیرمن- براون به ترتیب ۹۲/۰، ۹۴/۰ و ۹۵/۰ به دست آمد.
پایایی باز آزمایی
در سنجش شناختی مشخص کردن درجه یا میزانی که اندازههای بهدستآمده در یک زمان معین ثابت بوده و برای زمانهای آتی قابل تعمیماند، همواره موردتوجه است. شواهدی از ثبات برای استفاده مطمئن از آزمون جهت پیشبینی رفتار آتی لازم و ضروری است. پایایی نمرات در یک بیمارستان روانی ارزیابی گردید. باوجوداینکه مشخص بود که در سایر جوامع ممکن است نمرات ثبات بالایی را نشان دهند، اما این شرایط ازآنجهت انتخاب شد که دارای کاربرد بالینی نوعی بوده و معرف مناسبی برای پایایی باز آزمایی است.
درمجموع از ۵۲ بیمار روانی بزرگسال جوان در دو زمان مختلف که بهطور میانگین ۴۵ روز از هم فاصله داشت با استفاده از دستورالعملهای استاندارد، آزمون به عمل آمد. پاسخنامهها اسکن شده و با کامپیوتر (رایانه) نمرهگذاری شدند. جدول ۳ میانگین نمرات استاندارد در این دو دوره زمانی و همچنین همبستگی گشتاوری میان نمرات حاصل از هر دو شرایط را نشان میدهد. نتایج حاکی از افزایش اندک نمرات آزمون در بار دوم اجرا است، این خود نشان میدهد که تمرین و حافظه تأثیر چندانی بر نمرات باز آزمایی این افراد در طول مدتزمانی مشخصشده ندارد. ثبات مقیاسها از طریق همبستگیهای باز آزمایی در جدول ۳ ارائه شده است. پایایی باز آزمایی برای خرده آزمونهای کلامی۸۳/۰ تا ۹۷/۰ با میانه ۹۰ بود، درحالیکه برای خرده آزمونهای عملی از ۸۷/۰ تا ۹۴/۰ با میانه ۹۳/۰ است. پایاییهای باز آزمایی برای مقیاسهای کلامی، عملی و مقیاس کامل به ترتیب ۹۵/۰، ۹۶/۰ و ۹۷/۰ است.
همچنین در جدول ۳ خطای استاندارد اندازهگیری برای زمانهای جداگانه آزمودن در واحدهای نمره استاندارد بر اساس فرمول رولون (۱۹۳۹) ارائه شده است. مقدار خطای استاندارد، دامنه نمرات مورد انتظار را هنگام اجرای دوباره مجموعه آزمونها نشان میدهد. نمرات استاندارد آزمودن دوم انتظار میرود با مثبت یا منفی یک خطای استاندارد در حدود ۶۸ درصد موارد قرار گیرند.
جدول ۳ آمارههای باز آزمایی ۵۲= N (به زیرنویس جدول مراجعه شود)
مقیاس | میانگین آزمون I | میانگین آزمون II | پایایی باز آزمایی | خطای استاندارد اندازهگیری |
اطلاعات عمومی | ۳/۴۰ | ۵/۴۰ | ۹۷/۰ | ۵/۲ |
درک و فهم | ۹/۴۳ | ۶/۴۴ | ۹۵/۰ | ۲/۳ |
محاسبه | ۳/۳۹ | ۶/۳۹ | ۸۸/۰ | ۶/۴ |
شباهتها | ۸/۴۱ | ۲/۴۳ | ۸۳/۰ | ۹/۶ |
واژگان | 9/44 | 1/46 | 90/0 | 4/4 |
نماد ارقام | ۸/۳۹ | ۰/۴۰ | ۹۰/۰ | ۱/۶ |
تکمیل تصاویر | ۹/۴۳ | ۱/۴۴ | ۹۴/۰ | ۶/۴ |
تجسم دیداری | ۴/۴۴ | ۴/۴۴ | ۹۳/۰ | ۳/۴ |
تنظیم تصاویر | ۸/۴۶ | ۶/۴۸ | ۸۷/۰ | ۴/۷ |
الحاق قطعات | 4/42 | 5/43 | 93/0 | 0/4 |
مقیاس کلامی | ۲/۲۱۰ | ۰/۲۱۴ | ۹۵/۰ | ۵/۱۵ |
مقیاس عملی | ۳/۲۱۷ | ۷/۲۲۰ | ۹۶/۰ | ۳/۱۶ |
کل مقیاس | ۴/۴۲۷ | ۱/۴۳۵ | ۹۷/۰ | ۲/۲۷ |
توجه: میانگینها و خطاهای استاندارد خرده مقیاسها در واحدهای نمره استاندارد (T) ارائه شده است. دادهها بر اساس پاسخهای بیماران روانی بستری است. چون سه بیمار موفق نشدند خرده آزمونها را در اجرای اول یا باز آزمایی تکمیل کنند، همبستگیها بر اساس اطلاعات ۴۹ تا ۵۱ نفر محاسبه شد. |
اثرات محدودیت زمانی
یکی از هدفهای ساخت آزمون استعداد چندبعدی این بود که سرعت و قدرت با هم ترکیب کند. آزمونی با محتوایی نسبتاً دشوار جهت به چالش کشیدن سرآمدها، آزمونی که نهتنها به کیفیت بلکه به کمیت نیز همزمان امتیاز بدهد. این دو جنبه عملکرد به هم مرتبط میباشند؛ اما مهم است نشان داده شود که عملکرد در آزمونهای با محدودیت زمانی خیلی هم از طریق عامل سرعت تحت تأثیر قرار نمیگیرد. دو مطالعه برای ارزیابی اثرات محدودیت زمانی متفاوت اجرا شد. در مطالعه اول، از پاسخدهندهها خواسته شد بعد از پاسخ دادن به پرسشهای هر خرده آزمون در مدتزمان هفت دقیقه، خطی را روی برگه پاسخ خود بکشند. سپس به آنها اجازه داده شد که سه دقیقه دیگر هم کار کنند. جدول ۴ مقایسه میانگین و انحراف استاندارد بین محدودیت زمانی هفت و ده دقیقه و جدول ۵ ماتریس همبستگی متناظر را نشان میدهد.
جدول ۴ میانگینها و انحراف استانداردها با محدودیت زمانی ۷ و ۱۰ دقیقه
میانگینها انحراف استانداردها | |||||
مقیاس | تعداد سؤالها | ۷ | ۱۰ | ۷ | ۱۰ |
اطلاعات عمومی | ۴۰ | ۲۰/۲۲ | ۰۳/۲۵ | ۷۰/۶ | ۸۲/۶ |
درک و فهم | ۲۵ | ۴۸/۱۴ | ۵۳/۲۰ | ۱۴/۴ | ۲۰/۴ |
محاسبه | ۲۶ | ۴۵/۱۳ | ۱۰/۱۵ | ۱۱/۳ | ۷۰/۳ |
شباهتها | ۳۰ | ۱۲/۲۲ | ۰۷/۲۳ | ۷۵/۴ | ۵۷/۴ |
واژگان | 46 | 78/20 | 27/22 | 31/7 | 31/7 |
نماد ارقام | ۲۵ | ۸۴/۲۲ | ۱۱/۲۳ | ۲۶/۳ | ۴۰/۳ |
تکمیل تصاویر | ۳۰ | ۸۴/۲۲ | ۸۷/۲۳ | ۲۶/۵ | ۹۷/۴ |
تجسم دیداری | ۴۰ | ۷۷/۲۹ | ۴۳/۳۳ | ۶۰/۷ | ۵۴/۶ |
تنظیم تصاویر | ۲۱ | ۱۰/۱۰ | ۷۲/۱۲ | ۴۹/۲ | ۸۵/۲ |
الحاق قطعات | 20 | 50/12 | 70/14 | 61/4 | 42/4 |
مقیاس کلامی | ۱۶۷ | ۹۶/۹۷ | ۵۲/۱۰۵ | ۹۶/۲۰ | ۶۸/۲۲ |
مقیاس عملی | ۱۳۶ | ۳۴/۱۰۱ | ۸۴/۱۰۷ | ۷۶/۱۷ | ۰۹/۱۶ |
کل مقیاس | ۳۰۳ | ۷۳/۲۰۰ | ۳۶/۲۱۳ | ۴۵/۳۳ | ۹۶/۳۵ |
توجه: ۲۲۸=N برای محدودیت زمانی ۱۰ دقیقه. در محدودیت زمانی ۷ دقیقه برای مقیاسهای مختلف N در دامنهای بین ۹۱ و ۱۰۶ قرار داشت. |
همانطور که در جدول ۵ مشاهده میشود همبستگیهای خرده آزمونهای کلامی مرتبط به هم بسیار بالا و در دامنهای از ۹۱/۰ تا ۹۶/۰ قرار دارند. درحالیکه این مقادیر برای خرده آزمونهای عملی تا حدودی پایین است یعنی در دامنهای از ۷۸/۰ تا ۹۲/۰٫ همبستگیهای آزمونهای کلامی، عملی و مقیاس کامل به ترتیب ۹۷/۰، ۹۴/۰ و ۹۶/۰ بود. رتبهبندی آزمودنیها بر اساس نمرات آزمونهای کلامی، عملی و مقیاس کامل بین محدودیت زمانی هفت و ده دقیقه خیلی مشابه بود. بر اساس این یافتهها تصمیم گرفته شد، محدودیت زمانی هفت دقیقه بهعنوان استاندارد برای هرکدام از خرده آزمونها در نظر گرفته شود.
جدول ۵ همبستگیهای بین نمرات ۷ و ۱۰ دقیقه
نمرات ۱۰ دقیقه | |||||||||||||
نمرات ۷ دقیقه ۱٫ اطلاعات عمومیf | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
95/0 | 64/0 | 56/0 | 66/0 | 73/0 | 87/0 | 34/0 | 52/0 | 43/0 | 41/0 | 41/0 | 58/0 | 84/0 | |
2. درک و فهمf | 59/0 | 91/0 | 48/0 | 69/0 | 58/0 | 76/0 | 39/0 | 40/0 | 34/0 | 54/0 | *23/0 | 49/0 | 72/0 |
3. محاسبهd | 54/0 | 53/0 | 93/0 | 51/0 | 56/0 | 70/0 | 36/0 | 34/0 | 39/0 | 33/0 | 46/0 | 51/0 | 70/0 |
4. شباهتها f | 59/0 | 77/0 | 51/0 | 93/0 | 57/0 | 78/0 | 39/0 | 48/0 | 40/0 | 64/0 | 33/0 | 57/0 | 77/0 |
5. واژگانg | 72/0 | 59/0 | 52/0 | 59/0 | 96/0 | 85/0 | 29/0 | 36/0 | *28/0 | *28/0 | 33/0 | 41/0 | 75/0 |
6. مقیاس کلامیb | 84/0 | 82/0 | 67/0 | 80/0 | 87/0 | 97/0 | 40/0 | 34/0 | 45/0 | 51/0 | 42/0 | 61/0 | 91/0 |
7. نماد ارقامe | 32/0 | 45/0 | 38/0 | 45/0 | *26/0 | 40/0 | 83/0 | 34/0 | 39/0 | 55/0 | 44/0 | 62/0 | 55/0 |
8. تکمیل تصاویرc | 51/0 | 44/0 | 32/0 | 45/0 | 57/0 | 54/0 | *25/0 | 89/0 | 47/0 | 44/0 | 44/0 | 69/0 | 63/0 |
9. تجسم دیداریg | 38/0 | *24/0 | *27/0 | 33/0 | *25/0 | 45/0 | *25/0 | 36/0 | 84/0 | 40/0 | 35/0 | 70/0 | 54/0 |
10. تنظیم تصاویرe | 39/0 | 50/0 | 35/0 | 51/0 | 33/0 | 31/0 | 47/0 | 40/0 | 41/0 | 78/0 | 42/0 | 63/0 | 59/0 |
11. الحاق قطعاتf | 37/0 | *25/0 | 45/0 | 31/0 | 33/0 | 42/0 | 33/0 | 35/0 | 36/0 | 41/0 | 92/0 | 67/0 | 56/0 |
12. مقیاس عملیb | 56/0 | 52/0 | 50/0 | 57/0 | 43/0 | 61/0 | 53/0 | 66/0 | 78/0 | 62/0 | 72/0 | 94/0 | 80/0 |
13. کل مقیاسa | 80/0 | 76/0 | 66/0 | 78/0 | 76/0 | 91/0 | 52/0 | 69/0 | 68/0 | 63/0 | 61/0 | 85/0 | 96/0 |
توجه: ضرایب همبستگی گزارششده با علامت * در سطح ۰۵/۰ > P و بقیه ضرایب همبستگی در سطح ۰۱/۰ > P معنیدار هستند. a (91= n)؛ b(98= n)؛ c(101= n)؛ d(103= n)؛ e(104= n)؛ f(105= n)؛ g(106= n)؛ |
مطالعه دیگری نیز توسط ورنون، نادور و کانتور (۱۹۸۵) انجام شد. در این پژوهش ۸۸ پاسخدهنده خرده آزمونها را با محدوده زمانی پنج دقیقه به اتمام رساندند. بعدازاینکه آزمودنیها هر آزمون را با محدوده زمانی پنج دقیقه به پایان رساندند، از آنها خواسته شد مدادهای خود را کنار گذاشته و از خودکار استفاده کنند و سه دقیقه دیگر به پاسخ دادن سؤالات ادامه دهند که در این مدتزمان تقریباً تمامی پاسخدهندهها به سؤالات پاسخ داده بودند. پس از اتمام تمامی خرده آزمونها، به پاسخدهندهها اجازه داده شد به خرده آزمونهای تمام نشده برگردند و تا آنجا که میتوانند بدون محدودیت زمانی روی سؤالات کار کنند. ورنون و همکارانش درصدد ارزیابی رابطه میان نمرات تحت شرایط سرعت و قدرت خالص مستقل برای توجیه احتمال اثرات سقف یا تارک بود. ورنون و همکارانش همبستگی نمرههای بهدستآمده از محدودیت زمانی پنج دقیقه با نسبت درست سؤالهای باقیمانده را با نمرات در شرایط زمان نامحدود محاسبه کردند. همبستگی میان دو مجموعه از نمرات ۷۱/۰ بود، این نتایج حاکی از آن است که فرایندهای موردسنجش تحت شرایط سرعت و بدون سرعت تا حد زیادی به هم مرتبط هستند.
همبستگی متقابل مقیاسها و تحلیل عاملی
جدول ۶ همبستگیهای متقابل میان نمرات خام برای هر یک از ده خرده آزمون را بر اساس نمونهای متشکل از ۳۱۲۱ دانشآموز دبیرستانی پسر و دختر بین سنین ۱۶ و ۱۹ سال را نشان میدهد. همانطور که مشاهده میشود همه همبستگیها، مثبت و در دامنهای از ۲۴/۰ تا ۷۳/۰ قرار دارند. بررسی دقیق این همبستگیها نشان میدهند که هرکدام از مقیاسهای کلامی با دیگر مقیاسهای کلامی و مقیاسهای عملی نیز با دیگر مقیاسهای عملی همبستگی بالایی دارند. این روند همچنین در نتایج تحلیل عامل آشکار شد. تحلیل عاملی مؤلفههای اصلی، برای نمونه متشکل از ۳۱۲۱ دانشآموز دبیرستانی پسر و دختر بر اساس همبستگیهای گزارششده در جدول ۶ اجرا شد. دو عامل که مقادیر ویژه مرتبط با آنها بیشتر از یک بود، نگه داشته شدند. اینها با معیار واریماکس ساختار ساده چرخش داده شدند (به جدول ۷ مراجعه شود).
جدول ۶ ماتریس همبستگیهای متقابل برای دانش آموزان دبیرستانی (۳۱۲۱= N)
مقیاس 1. اطلاعات عمومی | ۱ | ۲ | ۳ | ۴ | ۵ | ۶ | ۷ | ۸ | ۹ | ۱۰ |
۰۰/۱ | ||||||||||
2. درک و فهم | ۷۰/۰ | ۰۰/۱ | ||||||||
3. محاسبه | ۵۰/۰ | ۵۱/۰ | ۰۰/۱ | |||||||
4. شباهتها | ۶۲/۰ | ۷۳/۰ | ۴۸/۰ | ۰۰/۱ | ||||||
5. واژگان | 65/0 | 63/0 | 42/0 | 61/0 | 00/1 | |||||
6. نماد ارقام | ۲۴/۰ | ۳۶/۰ | ۳۲/۰ | ۳۵/۰ | ۲۵/۰ | ۰۰/۱ | ||||
7. تکمیل تصاویر | ۴۷/۰ | ۴۶/۰ | ۳۶/۰ | ۴۴/۰ | ۳۹/۰ | ۲۷/۰ | ۰۰/۱ | |||
8. تجسم دیداری | ۳۱/۰ | ۳۱/۰ | ۳۷/۰ | ۲۸/۰ | ۲۴/۰ | ۳۴/۰ | ۳۹/۰ | ۰۰/۱ | ||
9. تنظیم تصاویر | ۳۷/۰ | ۴۱/۰ | ۳۴/۰ | ۴۰/۰ | ۳۲/۰ | ۳۶/۰ | ۴۰/۰ | ۳۶/۰ | ۰۰/۱ | |
10. الحاق قطعات | ۳۷/۰ | ۳۹/۰ | ۴۰/۰ | ۳۶/۰ | ۳۲/۰ | ۳۷/۰ | ۴۶/۰ | ۴۷/۰ | ۴۳/۰ | ۰۰/۱ |
در جدول ۷، بارهای عاملی برای نخستین مؤلفههای اصلی برای هر نمونه نشان داده شده است. این نشان میدهد که هر خرده آزمون با g اشباعشده یا با عامل هوش کلی رابطه دارد. بررسی عوامل چرخش دادهشده، تفکیک خرده آزمونهای کلامی و عملی را در الگویابی بارهای عاملی مشخص میکند. خرده آزمونهای کلامی همواره بالاترین بارها را روی عامل اول داشتند و خرده آزمونهای عملی همواره بالاترین بارها را روی عامل دوم نشان دادند. برای ارزیابی ثبات بارهای عامل، تحلیل عاملی دیگری روی نمونه دوم متشکل از ۵۱۶ دانشآموز دبیرستانی انجام گرفت و بهصورت مستقل با واریماکس چرخش داده شد. ضرایب همسانی عاملی برای هر دو عامل بیشتر از ۹۹/۰ بود؛ بنابراین مبنایی در ساختار درونی MAB برای تقسیم خرده آزمونها به مقیاسهای کلامی و عملی وجود دارد.
همبستگی با WAIS-R
ضرایب همبستگی بین نمرات MAB و WAIS-R در جدول ۸ ارائه شده است. بهمنظور مقایسه، جدول ۸ همچنین دربرگیرنده خلاصهای از پنج مطالعه است که همبستگیهای بین WAIS-R و WAIS را گزارش میکند. چنین مقایسهای از اهمیت زیادی برخوردار است، زیرا برخلاف مقایسه MAB با WAIS-R؛ و WAIS-R با WAIS روش اجرا، شکل سؤال و سؤالهای مشترک زیادی دارند. همبستگیهای خرده آزمونهای MAB/WAIS-R در دامنه همبستگیهای خرده آزمونهای WAIS/WAIS-R قرار میگیرند، بهاستثنای مقایسه نماد ارقام، تجسم فضایی و طراحی مکعبها. همبستگیهای نمرات مقیاس کامل آزمون MAB با WAIS-R برابر ۹۱/۰ و همبستگی نمرات آزمونهای کامل WAIS با WAIS-R برابر ۹۳/۰ است که تا حدودی مشابهاند.
جدول ۷ بارهای عاملی
مقیاس | عاملها | ||
G | V | P | |
1. اطلاعات عمومی | ۷۷/۰ | ۸۳/۰ | ۲۳/۰ |
۲٫ درک و فهم | ۸۲/۰ | ۸۳/۰ | ۲۸/۰ |
۳٫ محاسبه | ۶۸/۰ | ۵۴/۰ | ۴۳/۰ |
۴٫ شباهتها | ۷۹/۰ | ۸۱/۰ | ۲۵/۰ |
۵٫ واژگان | 73/0 | 82/0 | 14/0 |
6. نماد ارقام | ۵۳/۰ | ۱۷/۰ | ۶۳/۰ |
۷٫ تکمیل تصاویر | ۶۷/۰ | ۴۴/۰ | ۵۳/۰ |
۸٫ تجسم دیداری | ۵۶/۰ | ۱۰/۰ | ۷۷/۰ |
۹٫ تنظیم تصاویر | ۶۳/۰ | ۳۰/۰ | ۶۳/۰ |
۱۰٫ الحاق قطعات | ۶۵/۰ | ۲۲/۰ | ۷۵/۰ |
توجه: عامل G مؤلفه اصلی نخست بدون چرخش است. عاملهای V و P نتیجه چرخش واریماکس مؤلفههای اصلی هستند.
مقایسه ساختارهای عاملی MAB و WAIS-R
برای مقایسه ساختار زیربنایی تواناییهای بازنمایی شده در MAB و WAIS-R، تحلیل عاملی مؤلفههای اصلی بر روی دو آزمون توسط استوکول (۱۹۸۴) انجام شد. ماتریسهای همبستگی گزارششده در دفترچه راهنمای WAIS-R برای آزمودنیهای ۱۶-۱۷ ساله (۲۰۰= N) و ۱۸-۱۹ ساله (۲۰۰= N) با استفاده از تبدیل z فیشر میانگینگیری شد. به خاطر اینکه در آزمون MAB هیچ خرده آزمون متناظری با خرده آزمون فراخنای ارقام WAIS-R وجود نداشت، دادهها برای این آزمون از ماتریس همبستگی WAIS-R حذف گردید. آزمونهای مشابه در هرکدام از مجموعهها در ردیفهای یکسانی قرار داشتند. همانند تحلیل عاملی گزارششده برای MAB، دو عامل استخراج و با واریماکس چرخش داده شدند و ضرایب همسانی عاملی محاسبه شد. این ضرایب همسانی بین MAB و WAIS-R برای عاملهای V و P به ترتیب ۹۷/۰ و ۹۶/۰ بود. این مقادیر نسبتاً در سطح بالا هستند، بخصوص هنگامیکه این واقعیت در نظر گرفته میشود که چرخشهای عاملی کاملاً مستقل از یکدیگر بوده و هیچ تلاشی برای به حداکثر رساندن همسانی انجام نشده است. بر اساس این دادهها، نتیجهگیری شد که الگویابی تواناییها در ماتریس همبستگی MAB و WAIS-R علیرغم محتوا، اجرا و شکلهای متفاوت پاسخها در اصل مشابه هستند.
مقایسه MAB و ماتریسهای پیشرونده پیشرفته ریون
ماتریسهای پیشرونده پیشرفته ریون (RAPM) (ریون، ۱۹۶۰)، اندازه غیرکلامی از تواناییهای شناختی کلی است که بهطور گستردهای مورداستفاده قرار میگیرد. بررسی همبستگی آن با خرده آزمونهای MAB از اهمیت شایانی برخوردار است. جدول ۹ این همبستگیها را بر اساس نمونه متشکل از دانشجویان لیسانس دانشگاه کالیفرنیا در برکلی گزارش میکند که این همبستگی در اصل توسط کرانزلر و جانسن (۱۹۹۱) منتشر شده است. اگرچه مقدار این همبستگیها به خاطر محدودیت دامنه این جامعه در اصل کاهش یافته است، اما الگوی همبستگیها از اهمیت بسزایی برخوردارند. بالاترین ضریب همبستگی در بین خرده آزمونهای عملی برای الحاق قطعات و تجسم فضایی و در بین خرده آزمونهای کلامی برای محاسبات به چشم میخورد. خرده آزمونهای دیگر مقیاسهای کلامی، همبستگیهای پایینتری را نشان میدهند. واضح است اندازههای ماتریسهای پیشرونده پیشرفته بیشتر شبیه مؤلفههای سیالی توانایی ذهنی عمومی ازجمله مقیاسهای عملی MAB است تا مؤلفههای متبلور که شامل خرده آزمونهای مقیاس کلامیMAB.
جدول ۸ همبستگیها با WAIS-R
خرده آزمون | MABa با WAIS-R | WAISb با WAIS-R | ||
r | متوسط r | دامنه | ||
اطلاعات عمومی | ۸۲/۰ | 87/0 | 91/0-81/0 | |
درک و فهم | ۷۳/۰ | 80/0 | 93/0-52/0 | |
محاسبه | ۸۹/۰ | 82/0 | 93/0-27/0 | |
شباهتها | ۶۶/۰ | 78/0 | 90/0-33/0 | |
واژگان | 89/0 | 86/0 | 96/0-26/0 | |
نماد ارقام | ۴۵/۰ | 84/0 | 98/0-29/0 | |
تکمیل تصاویر | ۸۷/۰ | 74/0 | 90/0-30/0 | |
تجسم دیداری | ۴۴/۰ | 88/0 | 97/0-74/0 | |
تنظیم تصاویر | ۸۶/۰ | 62/0 | 84/0-15/0 | |
الحاق قطعات | 65/0 | 80/0 | 98/0-14/0 | |
مقیاس کلامی | ۹۴/۰ | 91/0 | 96/0-73/0 | |
مقیاس عملی | ۷۹/۰ | 89/0 | 97/0-76/0 | |
کل مقیاس | ۹۱/۰ | 93/0 | 98/0-85/0 | |
توجه: a از جکسون (۱۹۸۴) ۱۴۵= N؛ نمونه ترکیبی، همبستگیهای محاسبهشده با استفاده از نمرات استانداردشده (برای خرده آزمونها) و مجموع نمرات استانداردشده (برای کل مقیاسها). b همبستگیهای گزارششده توسط لیپولد و کالیبورن (۱۹۸۳)، میشرا و براون (۱۹۸۳)، رابورن (۱۹۸۳)، اسمیت (۱۹۸۳) و وکسلر (۱۹۸۱) که با استفاده از تبدیل r به z فیشر میانگینگیری شدهاند. |
جدول ۹ همبستگیهای بین MAB و ماتریسهای پیشرونده پیشرفته ریون (۱۰۳=N)
خرده آزمون | همبستگی |
کلامی اطلاعات عمومی | 19/0 |
درک و فهم | ۲۳/۰ |
محاسبه | ۴۶/۰ |
شباهتها | ۱۳/۰ |
واژگان عملی | ۱۴/۰ |
نماد ارقام | ۲۵/۰ |
تکمیل تصاویر | ۳۰/۰ |
تجسم دیداری | ۴۴/۰ |
تنظیم تصاویر | ۳۱/۰ |
الحاق قطعات | 56/0 |
توجه: اقتباس از کرانزلر و جنسن (۱۹۹۱) با همبستگیها از جی اچ. کرانزلر، ارتباط شخصی با مایکل سی. اشتون، ۱۵ آوریل ۱۹۹۸٫ |
اجرای تستهای هوش و استعدادیابی در مرکز مشاوره جوانه رشد تبریز
لازم به ذکر است که مجموعه آزمونهای استعداد چندبعدی (جکسون، ۲۰۰۳) توسط دکتر اکبر رضایی در سال۱۳۹۰ در ایران ترجمه و انطباق یابی شده است. مرکز جوانه رشد تبریز این افتخار را دارد که به مدیریت دکتر اکبر رضایی در جهت کشف استعداد دانش آموزان و دانشجویان با استفاده از این آزمون و دیگر آزمونهای معتبر هوش خدماتی به همشهریان عزیز ارائه دهد.