تست هوش و استعدادیابی – مفهوم و نظریه‌های هوش – ماهیت و هدف آزمون‌های استعداد (MAB-II) – استانداردسازی و ویژگی‌های روان‌سنجی آن

توسط

مدیر سایت

1399-03-20

2581

تست هوش و استعدادیابی در تبریز- ویژه کودکان، نوجوانان و جوانان - مرکز مشاوره جوانه رشد تبریز

تست هوش و استعدادیابی در تبریز – مفهوم و نظریه‌های هوش – ماهیت و هدف آزمون‌های استعداد (MAB-II) – استانداردسازی و ویژگی‌های روان‌سنجی آن – دکتر اکبر رضایی – متخصص سنجش هوش و استعدادیابی در تبریز

مفهوم و نظریه‌های هوش

هوش به‌عنوان یک سازه فرضی

صاحب‌نظران و نویسندگان زیادی تلاش کرده‌اند هوش را تعریف کنند. تعاریف تک‌تک آن‌ها در ادبیات پژوهشی موجود است (اسنو، ۱۹۷۸؛ استرنبرگ، ۱۹۸۵ الف؛ ۱۹۸۵ ب؛ استرنبرگ و دترمن، ۱۹۸۶). برای مثال، وکسلر (۱۹۵۸) هوش را این‌گونه تعریف کرده است:

ظرفیت کلی افراد برای عمل کردن به‌صورت هدفمند، تفکر منطقی و سازگاری مؤثر با محیط خود. ازآن‌جهت کلی است که از عناصر یا توانایی‌هایی مختلف تشکیل یافته است. اگرچه به‌صورت کامل مستقل از هم نیستند، بااین‌حال ازنظر کیفی متفاوت از هم می‌باشند. (ص. ۷)

وکسلر چنین استدلال کرده است که رفتار هوشمندانه چیزی بیشتر از مجموع توانایی‌های جداگانه است. چون (الف) ترکیب‌های خاص توانایی‌ها نشان داده‌اند که کارآمدتر از بقیه ترکیب‌ها می‌باشند، (ب) سایر ویژگی‌ها ازجمله انگیزش بر رفتار تأثیر می‌گذارد و (پ) سطوح توانایی فراتر از مقدار موردنیاز آن برای انجام یک تکلیف خاص بر رفتار خاص تأثیر نمی‌گذارد. تلویحات متعددی در استدلال وکسلر از ماهیت هوش وجود دارد. از موارد قابل‌توجه می‌توان به چند مورد اشاره کرد: (۱) هوش شامل توانایی‌های مستقل از هم است که با هم سازمان‌دهی شده‌اند، (۲) هوش و رفتار هوشمندانه قابل‌تمایز از هم می‌باشند، (۳) عوامل دیگری غیر از توانایی‌ها بر رفتار هوشمندانه تأثیر می‌گذارند، (۴) توانایی بالا در یک حوزه مشخص الزاماً یا همیشه نتیجه رفتار هوشمندانه در حوزه دیگر نیست.

چنین عقایدی سابقه طولانی دارند و توجه نظریه‌پردازان معاصر را به خود جلب کرده ‌است. درواقع، بررسی عقاید گذشته و حال یک مبنای غنی و پرباری برای پرداختن به دامنه وسیعی از موضوعات مربوط به ماهیت و نظریه هوش، راهبرد اندازه‌گیری، نقش بافت فرهنگی و روندهای آتی فراهم می‌آورد. بسیاری از این موضوعات توسط گروهی یازده‌نفره از محققان موردبحث و بررسی قرار گرفته و نتایج آن در برخی از شماره‌های مجله روان‌شناسان آمریکا منتشر شده است (نیسر و همکاران، ۱۹۹۶). در این زمینه، مقالات بسیاری متعددی منتشر شده است که به‌عنوان نمونه می‌توان به مقاله هرنستاین و مورای (۱۹۹۴) اشاره کرد. هرچند که کتابچه دستورالعمل آزمون‌ها جای مناسبی برای پرداختن به این موضوعات نیست، بااین‌وجود اگر هوش به‌عنوان یک سازه فرضی، چیزی متفاوت ازآنچه توسط آزمون‌های هوش اندازه‌گیری می‌شود، در نظر گرفته شود، در آن صورت لازم است به برخی از نظریه‌ها در مورد هوش پرداخته شود؛ یعنی فهرست کردن و بحث در مورد مفروضه‌های ارائه‌شده در مورد هوش که از مطالعات معاصر درباره توانایی‌های شناختی به‌دست‌آمده‌اند (استرنبرگ، ۱۹۸۵ الف؛ ورنون، ۱۹۷۹). چنین مفروضه‌هایی نباید به‌عنوان واقعیت‌های محض و عاری از بحث و مجادله در نظر گرفته شوند. بلکه این مفروضه‌ها را می‌توان به‌عنوان فرضیه‌هایی در نظر گرفت که مبنایی برای اندازه‌گیری و پژوهش‌های جاری و همچنین تبیین‌ها و بازنگری‌های بعدی فراهم می‌آورند.

تست هوش و استعدادیابی در تبریز - مرکز مشاوره جوانه رشد تبریز — تست هوش وکسلر در تبریز – مرکز مشاوره جوانه رشد تبریز

برخی مفروضه‌ها در مورد توانایی‌های شناختی

۱٫ هوش و توانایی‌های شناختی بازنمایی کننده سازه‌های فرضی هستند که از مطالعات مختلف میدانی، روان‌سنجی، مشاهده‌ای و آزمایشگاهی به‌دست‌آمده‌اند. به معنی دقیق کلمه، این نظام سازه‌ای به‌طور مستقیم قابل‌مشاهده نیست، بلکه از طریق مشاهده مجموعه‌ای از نمونه‌های رفتاری این سازه‌ها قابل استنباط هستند. از این لحاظ، هوش تا حدودی از سازه‌های مورداستفاده برای تفسیر رویدادهای فیزیکی مانند دما یا الکترومغناطیس متفاوت است (همپل، ۱۹۵۲).

۲٫ هوش یک واحد چندوجهی است، مجموعه‌ای از نظام‌های مجزا که به‌طور نیمه‌خودکار عمل می‌کنند ولی به‌عنوان یک فرا نظام سازمان‌دهی شده است. این فرا نظام به‌نوبه خود ممکن است به‌عنوان جنبه‌ای از شخصیت افراد مانند رفتارهای هوشمندانه مفهوم‌سازی شود (یعنی هدفمند، فعالیت‌های جهت داده‌شده توسط هدف)، ممکن است نه‌تنها تابع کنش توانایی‌های دقیق تعریف‌ شده باشد بلکه صفات شخصیتی مانند انعطاف‌پذیری یا مقاومت را نیز شامل می‌شود.

۳٫ مبنای فیزیولوژیکی برای هوش نیز وجود دارد. برای مثال نشان داده شده است که روندهای تحولی و رشدی به‌عنوان بخشی از کنش رسش بیولوژیکی حاصل می‌شوند؛ بنابراین هوش با مسن ‌شدن و کهولت کاهش نشان می‌دهد که بخشی از آن حاصل فرایند افت بیولوژیکی است. همخوان با این مفروضه‌ها پژوهش‌ها نیز نشان داده‌اند که بین اندازه مغز که با تصویربرداری تشدید مغناطیسی (MRI) ارزیابی گردیده است و هوش اندازه‌گیری شده رابطه وجود دارد (ورنون و ویکت، ۱۹۹۷؛ ویکت و ورنون، ۱۹۹۴)، یافته‌ها همچنین رفتار هوشمندانه را به تأخیر در پاسخ‌دهی مرتبط می‌دانند (جنسن، ۱۹۷۹؛ میلر و ورنون، ۱۹۹۲؛ ورنون و کانتور، ۱۹۸۶؛ ورنون و مورای، ۱۹۹۲؛ ورنون و وس، ۱۹۹۳). سرعت پردازش اطلاعات، حل مسئله و زمان واکنش، اطلاعات مهمی درباره عملکرد هوشمندانه در اختیار قرار می‌دهند که به‌طور مناسبی در اندازه‌گیری توانایی‌های هوش مورداستفاده قرار می‌گیرند.

۴٫ تعداد زیادی از فرایندهای شناختی جزء رفتارهای هوشمندانه محسوب می‌شوند. این فرایندها را می‌توان از طریق محتواها و شکل‌های متنوع آزمون کرد. همبستگی بین آزمون‌ها و عوامل گروهی تابعی از فرایندهای مشابه است که از تکالیف شناختی مختلف استنباط می‌شود. اکثر این اندازه‌های توانایی شناختی به‌صورت مثبت با همدیگر ارتباط دارند؛ بنابراین، برای توصیف رفتار هوشمندانه بر اساس عامل کلی به همراه مجموعه‌ای از عامل‌های گروهی کلامی و غیرکلامی مفید هستند.

۵٫ اگرچه تعداد زیادی از عملکردهای شناختی برای اندازه‌گیری توانایی هوشی کلی به کار می‌روند، بااین‌حال تعمیم‌پذیری به عملکرد ملاکی هنگامی‌که نمونه وسیعی از انواع مختلف اندازه‌گیری مورد ارزیابی قرار می‌گیرد مطلوب خواهد بود. هرچه نمونه معرف‌تر باشد تعمیم‌پذیری فرایندهای شناختی نیز بهتر خواهد بود. از دیدگاه تخصصی، اگر نمرات آزمون را به‌صورت ترکیبی به‌عنوان یک مؤلفه، دارای واریانس و کوواریانس نشان داده شوند در آن صورت کوواریانس در میان انواع عملکردهای مختلف درصورتی‌که نمرات با هم جمع بسته شوند حالتی تجمعی خواهند داشت و برآورد بهتر از مجموعه اندازه‌گیری‌ها نشان خواهند داد.

۶٫ آنچه به‌عنوان رفتار هوشمندانه ارزیابی می‌شود، وابسته به بافت است و به‌صورت اجتماعی تعریف می‌شود؛ اما در تعریف‌های اجتماعی سازگاری و رفتارهای هوشمندانه اشتراکاتی وجود دارد. تعریف یا اندازه‌گیری رفتار هوشمندانه مجزا از محیطی که در آن نشان داده می‌شود غیرممکن است. جوامع پیشرفته تأکید زیادی روی مهارت‌های مفهومی مانند خواندن، اعداد و دست‌کاری نمادهای انتزاعی دارند. سازگاری در جوامع سنتی شامل مهارت‌های مختلفی از قبیل شکار، دانش در مورد شرایط آب و هوایی، یخ و توانایی محافظت افراد از خودشان در زمستان است. بااین‌حال، در جامعه مدرن افراد نیازمند یادگیری دانش و مهارت‌های موردنیاز خودشان، به‌عنوان‌مثال، تعمیر برف‌روب‌ها هستند. ازاین‌رو، غیرموجه است که سؤال‌های آزمون که شدیداً به دانش زبان انگلیسی وابسته است به افراد ناآشنا با آن اجرا کنیم. بااین‌حال نباید چنین تصور کرد که آزمون‌ها مختص به یک فرهنگ خاص می‌باشند.

برای مثال، لین (۱۹۸۲) نشان داد هنگامی‌که بر روی کودکان ژاپنی آزمون هوشی وکسلر به زبان ژاپنی اجرا می‌شود آن‌ها هیچ مشکلی در کامل کردن تکالیف نداشتند. درواقع نمرات آن‌ها به‌طور قابل‌توجهی بالاتر از نمرات کودکان آمریکای شمالی بود؛ بنابراین اگر بتوان نشان داد که ابزار آزمون متناسب با فرهنگ جامعه است (یعنی زبان و دیگر علائم و نشانه‌های ارتباطی فهمیده شوند) و آزمودنی‌ها دارای مهارت‌های موردنیاز برای انجام سنجش ازجمله مهارت خواندن باشند در این صورت سطح عملکرد هوش را می‌توان به صورتی مناسب مشخص کرد. البته محیط غنی‌شده، یعنی محیطی که در آن مهارت‌های هوش، تمرین شده باشد و جایی که فرصت زیادی برای مواجه با مسائل جدید وجود داشته باشد، در آن صورت می‌توان انتظار داشت که آن‌ها در رشد و پیشرفت توانایی‌های هوش نقش داشته باشند.

۷٫ رفتار هوشمندانه تنها در توانایی‌های عملکرد شناختی سنتی منعکس نمی‌شود، بلکه در محیط اجتماعی نیز به صورتی مناسب عمل می‌کند. نظریه‌پردازانی مانند بینه و ثرندایک، نقش هوش اجتماعی را به‌طور صریح تشخیص داده بودند. برخی نظریه‌پردازان جدید (گیلفورد، ۱۹۶۷؛ استرنبرگ، ۱۹۸۴ الف؛ استرنبرگ، ۱۹۸۴ ب؛ ۱۹۸۵ الف؛ ۱۹۸۵ ب؛ جکسون، ۱۹۶۱)، سازگاری با محیط رفتاری را به‌عنوان بعد اصلی نظام‌های خودشان قرار داده‌اند.

بافت تاریخی آزمودن هوش

مبانی تست هوش

ازنظر تاریخی، ریشه‌های آزمون‌های استعداد چندبعدی (MAB) به آغاز آزمودن هوش – سال ۱۹۰۵- برمی‌گردد، یعنی زمانی که بینه و سیمون اولین یافته‌های خود را در مورد کودکان مدارس فرانسوی منتشر کردند. ولی در این میان پیشرفت‌های واسطه‌ای بسیار مهمی نیز وجود داشتند که در زیر خلاصه‌ای از آن‌ها ارائه شده است:

۱٫ معرفی ابزارهایی که با به‌کارگیری آن‌ها می‌توان توانایی‌های شناختی را برحسب نمره استاندارد مشخص کرد، ازاین‌رو، مقایسه نمره شخص با دیگران میسر شد. استرن (۱۹۱۲) پیشنهاد داد که سن عقلی و سن فیزیولوژیکی را می‌توان به‌عنوان نسبتی برای نشان دادن هوش‌بهر به کار برد، ازجمله نخستین پیشرفت‌ها در این زمینه بود. خیلی زود مشخص شد که گروه هنجاری یا مقایسه برای بازنمایی درست عملکرد افراد مهم و ضروری است.

۲٫ ایده‌ای توسط ترمن (۱۹۱۶) مطرح شد مبنی بر اینکه اندازه‌گیری توانایی هوش باید به صورتی استاندارد و هنجار شده باشد. این پیشرفت منجر به انتشار آزمون هوشی استنفورد- بینه شد که معیار استانداردی برای آزمودن هوش برای بیش از نیم‌قرن بنا نهاد. ترمن نشان داد که نمرات IQ به صورتی نرمال یا بهنجار توزیع شده‌ است.

۳٫ اوتیس و همکارانش (۱۹۱۸) ابزارهایی برای اندازه‌گیری توانایی هوش معرفی کردند که کاربردهای کم‌هزینه‌تری از سنجش‌های توانایی ذهنی به‌ویژه در زمینه‌های آموزشی فراهم می‌کرد.

۴٫ کشف اینکه توانایی ذهنی کلی را می‌توان از طریق انواع مختلفی از تکالیف، عملکرد و شکل‌های پاسخ مورداندازه‌گیری قرار داد که تا حدودی فراتر از روش‌های کلامی پردازش اطلاعات گسترش یافت. برای مثال، ریون (۱۹۶۰) ماتریس‌های پیش‌رونده ریون و کهس (۱۹۲۳) طراحی مکعب‌ها را معرفی کردند. ورنون (۱۹۸۳) با استفاده از تکالیف خاص سرعت پردازش اطلاعات و هوش کلی را موردبررسی قرار داد و همچنین انواع مختلفی از ابزارها توسط گیلفورد (۱۹۶۷) به کار گرفته شد.

۵٫ معرفی اولین برنامه آزمودن ذهنی با مقیاس بزرگ برای بزرگ‌سالان توسط ارتش ایالات‌متحده در جنگ جهانی اول (یرکس، ۱۹۲۱) و گسترش آزمون‌های آلفا (برای افراد تحصیل‌کرده) و آزمون بتای ارتش (برای افراد بی‌سواد). برخی از پیشرفت‌های مهم، ریشه در این دوره زمانی دارند: (الف) ایده‌ای که توانایی کلی از طریق نمونه‌برداری از انواع مختلف حیطه‌های عملکردی مختلف اندازه‌گیری می‌شود، (ب) تشخیص اینکه آزمون‌های وابسته به دستورالعمل‌های کلامی و محتوای آزمون ممکن است در افرادی که از فرصت کافی برای یادگیری مهارت‌های زبان برخوردار نباشد سوگیری ایجاد کند (برای مثال افراد متولدشده در کشورهای دیگر)؛ (پ) معرفی انواع مختلف ابزارهای اندازه‌گیری به‌منظور ارزیابی توانایی‌های کلی هوش و (ت) کشف اینکه توانایی هوش با تفاوت‌های موجود در ویژگی‌های جمعیت شناختی مانند سطح آموزش، زمینه خانوادگی، محل جغرافیایی و کیفیت آموزش تغییر می‌کند (یرکس، ۱۹۲۱).

۶٫ ایده مربوط به ارائه عملکرد هوش افراد در قالب جدول نیمرخ، امکان نمایش نقاط قوت‌وضعف افراد، برای مثال در مقیاس توانایی عملکرد پینت‌نر– پترسون (۱۹۱۷) فراهم آورد.

۷٫ پیشنهاد اینکه واریانس آزمون را می‌توان از طریق روش‌های ارائه‌شده توسط هولزینگر (۱۹۳۸)، اسپیرمن (۱۹۰۴) به بخش‌هایی تقسیم کرد که این امر توسط گیلفورد (۱۹۶۷) و ترستون (۱۹۳۸) رایج شد. بر اساس این فکر آزمون‌های مختلف از ترکیب مؤلفه‌های خاص و همچنین مؤلفه‌های بازنمایی کننده عوامل گروهی نظیر توانایی‌های کلامی و فضایی و عامل کلی تشکیل می‌یابند.

۸٫ گسترش کاربرد هوش‌بهر انحرافی توسط وکسلر که برای اندازه‌گیری هوش بزرگ‌سالان مناسب به نظر می‌رسید. از طریق تبدیل توزیع نمره‌ها به توزیعی با میانگین تقریبی ۱۰۰، انحراف استاندارد ۱۵، هوش‌بهر انحرافی امکان مقایسه اشخاص را با گروه‌های سنی بر پایه معیار آماری در گروه‌های مناسب فراهم آورد.

۹٫ تعریف گسترش‌یافته هوش که آن را به‌عنوان جنبه‌ای از شخصیت نشان می‌دهد. گیلفورد (۱۹۶۷) و همکارانش نشان دادند که توانایی‌های هوش ممکن است در بافت گسترده شخصیت قابل‌درک باشد. اگرچه از دیگر جنبه‌های شخصیت قابل‌تفکیک است، بااین‌حال کارکردش به‌عنوان سازه نظری هوش تنها یکی از تعیین‌کننده‌های رفتار هوشمندانه است.

جنبه‌های کلی و خاص هوش

توسعه مفاهیم مربوط به توانایی‌ها ازنظر تاریخی ارتباط تنگاتنگی با نوآوری‌های تحلیل آماری دارد. ازاین‌رو، در بین نخستین مطالعات در مورد توانایی‌های شناختی، مطالعات وایسلر در سال ۱۹۰۱ قرار دارد، فردی که روش همبستگی گشتاوری را در تحلیل اندازه‌های زمان واکنش و تیز حسی به کار گرفت. او نشان داد که این اندازه‌ها، پیش‌بین‌های ضعیفی از پیشرفت تحصیلی هستند. او بیش از یک نسل روان‌شناسان آمریکایی را مجبور به پذیرش این باور کرد که توانایی‌های شناختی به‌طور نسبتاً زیادی حالتی ویژه و خاص دارند و در تبیین رفتارهای مهم اجتماعی قابل‌تعمیم نیستند. یک مشکل با این تعبیر و تفسیرهای اولیه داده‌های همبستگی نظریه پایایی بود. همان‌طور که ما امروزه می‌دانیم آن ناقص و نادرست فهمیده شده است. همان‌طور که می‌دانید نمونه‌های واحدی از رفتار، اندازه نهفته پاسخ واحد یا پاسخ واحد به یک سؤال آزمون هوش، پایایی کمی دارد و ازاین‌رو روایی محدود می‌شود؛ اما هنگامی‌که مشاهدات بیشتر شود، اندازه‌های پایایی و روایی افزایش پیدا می‌کند.

به‌عنوان جایگزینی برای این فرضیه‌های اختصاصی، اسپیرمن در سال ۱۹۰۴ برای اولین بار شواهدی ارائه کرد که آزمون‌های فرایندهای حسی و هوش با هم همبستگی دارند و اینکه یک کارکرد زیربنایی مشترک در همه شاخه‌های فعالیت شناختی وجود دارد و عناصر خاص هر فعالیت با فعالیت‌های دیگر مشترک نیستند. اسپیرمن این دیدگاه‌ها را به یک نظریه دوعاملی از هوش ارتقاء داد که در آن هر آزمون هوش از واریانس مرتبط به هوش کلی یا عامل g (اگرچه اسپیرمن به‌صورت آشکار g را با هوش کلی معادل نمی‌دانست) و یک عامل s، خاص به آن عملکرد تشکیل شده است. اندازه مؤلفه‌های g و s در آزمون‌های مختلف متفاوت‌اند. اسپیرمن بر این باور بود که آزمون‌های اشباع‌شده g در شناسایی مهارت‌های هوش برای درک رابطه‌ها نقش دارند و آن را ”دانش رابطه‌ها و همبسته‌ها“ نام‌گذاری کرد. ایده‌های اسپیرمن تأثیرگذار بود ولی در مورد مشاهده مربیان چیزی برای گفتن نداشت. به‌عبارت‌دیگر دانش آموزان در پیشرفت شناختی خود نابرابری‌های بیشتری نشان می‌دادند- برخی در حوزه کلامی، تعدادی در مکانیکی یا فضایی و برخی نیز در فعالیت‌های عددی برتر بودند.

مشاهده احتمال وجود عامل‌های گروهی در توانایی‌های شناختی توسط تعدادی از روان‌شناسان ازجمله بورت، ال کوسی، کلی و استفنسون در مطالعات متعددی در سال‌های ۱۹۲۵ تا ۱۹۴۰ موردحمایت قرار گرفت. درواقع این مطالعات نشان داده‌اند که شواهد مهمی برای عامل g وجود دارد که درکل تبیینی برای نسبت بزرگ‌تر واریانس در مقایسه با عوامل گروهی بود. ترستون روش‌هایی را برای تحلیل عامل چندگانه در دهه ۱۹۳۰ ارائه داد و در سال ۱۹۳۸ تک‌نگاری کلاسیک منتشر کرد که در آن به اجرای ۵۶ آزمون به ۲۴۰ دانشجو اشاره شده بود. بر این اساس ترستون، هشت عامل اولیه را مشخص کرد: کلامی، سرعت ادراکی، استدلال استقرایی، عددی، حافظه تکراری، استدلال قیاسی، روانی کلامی و فضا. عامل g اسپیرمن از سوی ترستون تشخیص داده نشد. اسپیرمن و همکارانش توجه افراد را به این واقعیت جلب کردند که آزمون‌های ترستون به‌طور مثبت به هم مرتبط می‌باشند. واقعیتی که در بررسی‌ها بعدی هنگامی‌که نمونه‌های ناهمگنی مورداستفاده قرار گرفت شواهد بیشتری برای آن به دست آمد، اما تفاوت‌ها مورد تأکید بودند. ترستون بعدها، روش‌هایی را برای تحلیل سلسله‌مراتبی عامل‌ها ارائه کرد که در آن همبستگی عامل‌های اولیه برای نشان دادن یک عامل سطح بالاتر کلی موردبررسی قرار می‌گرفت. اگرچه این موضوع اهمیت کمی در مقایسه با دیگر موارد مهم در نظام او داشت.

فیلیپ ورنون (۱۹۶۱-۱۹۷۱) سعی در یکپارچه کردن تحقیقات اولیه انگلیسی‌ها و آمریکایی‌ها از طریق تفسیر عملکردهای شناختی برحسب یک مدل عامل گروهی سلسله‌مراتبی داشت که در آن g عامل کلی زیربنایی را نشان می‌داد که عامل‌های گروهی عمده و عامل‌های فرعی و عامل‌های خاص را سازمان‌دهی می‌کرد. عامل‌های گروهی اصلی دو نوع بودند: کلامی- عددی– تحصیلی (v:ed) و عملی– مکانیکی– فضایی– فیزیکی (k:m). این عامل‌های عمده به عامل‌های گروهی کوچک‌تر تقسیم می‌شوند: عامل v:ed به عامل‌های گروهی کلامی و عددی و عامل k:m به عامل‌های گروهی اطلاعات مکانیکی، فضایی و مهارت یدی. مفهوم‌سازی ورنون موازی با کارهای وکسلر (۱۹۳۹) بود، او یک آزمون هوشی را طراحی کرد که از دو بخش عمده کلامی و عملی تشکیل شده بود و این‌ها هم به‌نوبه خود ترکیب می‌شدند تا مقیاس کامل IQ را به وجود آورند.

بااین‌حال، ورنون از فعالیت‌های اسپیرمن قدردانی کرد و از محدودیت‌های مدل سلسله‌مراتبی او استفاده‌های لازم را به عمل آورد. ورنون (۱۹۷۱-۱۹۶۱) بیان می‌کند که:

ازنقطه‌نظر واقعیت، اسپیرمن حق بیشتری نسبت به روان‌شناسان تربیتی و شغلی دارد … عامل‌های گروهی در این حوزه دارای محدودیت‌های بیشتری هستند و خاص‌تر می‌باشند؛ بنابراین درواقع متمایز کردن انواع مختلف استعداد کاری بسیار دشواری است. (ص. ۱۵)

ورنون ادعا می‌کرد که تصویری سلسله‌مراتبی از ساختار توانایی‌های شناختی، به چندین دلیل تصویری بسیار ساده‌سازی شده است: (الف) با انتخاب مناسب آزمون‌ها می‌توان تقریباً هرکدام از عامل‌های گروهی را بر اساس توانایی‌های ویژه مشخص کرد، (ب) عامل‌های گروهی تا حدودی به‌عنوان نتیجه انواع خاص آموزش و تحصیلات متفاوت خواهد بود، (پ) ازاین‌رو تنها باید عامل‌های گروهی را که منعکس‌کننده پیامدهای کاربردی باشند در نظر گرفت و (ت) خلق‌وخو، شخصیت، فیزیک، جنسیت، سن و علایق روی عملکرد بالا تأثیر می‌گذارند که فراتر از تأثیر توانایی‌های محض است.

نظریه‌های نوین درباره هوش

در سال‌های اخیر ازسرگیری مطالعات مربوط به ماهیت هوش منجر به برخی مفاهیم جدید، توجه به جنبه‌های جدید، فرایندها و درک عمیق‌تر موضوعات شده است (مراجعه شود به استرنبرگ، ۱۹۸۱). در این زمینه می‌توان به صاحب‌نظرانی نظیر کارول (۱۹۷۶، ۱۹۹۳)، گیلفورد (۱۹۶۷)، ‌هامفریس (۱۹۹۴)، جنسن (۱۹۹۸) و استرنبرگ (۱۹۸۴ الف، ۱۹۸۴ ب، ۱۹۸۵ الف، ۱۹۸۵ ب) و ورنون (۱۹۶۱/۱۹۷۱، ۱۹۷۹) اشاره کرد.

نظریه گیلفورد، هوش را در سه بعد گسترده موردبررسی قرار می‌دهد: عملیات، محتوا و تولیدات. پنج نوع عملیات (شناخت، حافظه، تولید واگرا، تولید همگرا و ارزیابی)؛ شش نوع تولید (واحدها، طبقات، روابط، نظام‌ها، گشتارها و تلویحات) و چهار نوع مختلف محتوا (عددی، نمادی، معنایی و رفتاری). سه بعد ماتریس از ۱۲۰ خانه تشکیل شده است. تمرکز پژوهش‌های گیلفورد معطوف به جستجوی تشخیص عامل‌ها برای تعدادی از این ۱۲۰ خانه بود. اگرچه این احتمال وجود دارد که این عامل‌ها با یکدیگر مرتبط و به‌صورت سلسله‌مراتبی سازمان‌دهی شده باشند، بااین‌حال گیلفورد به این سؤال جواب نداده است.

به‌جای تلاش برای ساخت یک طبقه‌بندی از عامل‌های اولیه، کارول (۱۹۷۶) با نظریه کلی از فرایندهای شناختی شروع کرد و به مشخص کردن تفاوت‌های فردی زیربنایی فرایندهایی که در هر عامل وجود دارند، پرداخت. در این نظام، عامل‌های توانایی اولیه ذهنی زمانی ظاهر می‌شوند که یک مجموعه از آزمون‌ها دربرگیرنده تفاوت‌های فردی در چهار حیطه باشند: انواع و محتویات حافظه (برای مثال، معنای واژگان و عددی)، ماهیت و نظم عملیات شناختی، راهبرد‌های شناختی و حل مسئله و طبقات پاسخ. از دیدگاه کارول، فرایندهای کنترل بر سه نوع‌اند: توجهی، خطابی و حافظه بلندمدت و همچنین چندین عملیات ازجمله اجرایی و کارکردهای یکپارچه ساز درگیر در حافظه کوتاه‌مدت.

همانند کارول، استرنبرگ (۱۹۸۴ الف، ب؛ ۱۹۸۵ الف، ب) نیز به بررسی پژوهش‌های پردازش اطلاعات و شناختی تجربی نوین (هانت، ۱۹۸۰- ۱۹۷۸؛ کیتنگ، ۱۹۸۳؛ نیسر، ۱۹۷۹؛ سیمون، ۱۹۷۶؛ استرنبرگ، ۱۹۷۸) و همچنین عقل و خرد سنتی از پژوهش‌های هوش برای شکل‌دهی نظریه سه‌بخشی از هوش انسان پرداخت. نظریه پیشنهادی او شامل سه نظریه فرعی است: یک نظریه فرعی بافتی که به شیوه سازگاری، انتخاب و شکل‌دهی محیط بیرونی می‌پردازد. بخش دیگر نظریه او بر نقش تجربه در واکنش به‌تازگی و خودکارسازی می‌پردازد و این نظریه فرعی هوش را به جهان درون فرد مرتبط می‌سازد. نظریه فرعی سوم، سه گروه از مؤلفه‌ها را مشخص می‌کند که شامل پردازش اطلاعات برای یادگیری عملیات ضروری، برنامه‌ریزی و انتقال آن‌هاست. ایده‌های استرنبرگ در چندین زمینه حالت انقلابی دارند. ازجمله اینکه: (الف) تعریف هوش را در چندین جهت گسترش داد؛ برای مثال، در حوزه سازگاری شغلی و هوش اجتماعی، (ب) فرضیه‌های روشنی در مورد فرایندهای زیربنایی ارائه داد و (ج) منبع خوبی برای ایده‌های پژوهشی به وجود آورد.

نظریه‌های نوین هوش به علت اینکه حوزه گسترده‌ای را شامل می‌شوند مبنایی برای ارزیابی بافت‌هایی که آزمون‌های هوش مناسب هستند فراهم می‌نمایند و همچنین مجموعه‌ای از محتوا و عملیات را پیشنهاد می‌کنند و ممکن است سرنخ‌هایی درباره تقویت آزمون‌های هوش ارائه کنند. به‌ویژه، نظریات گیلفورد (۱۹۶۷)، کارول (۱۹۹۳) و استرنبرگ (۱۹۸۴ الف) جهت‌های روشنی برای گنجاندن نظام‌های سازمان‌یافته به شیوه‌های خاص ارائه می‌کنند. چنین نظام‌هایی مبنای غنی برای طرح‌ریزی فرضیه‌هایی با توجه به حیطه‌های جدید برای اندازه‌گیری فراهم می‌کنند.

اولین موضوعی که توسط نظریه‌های چندعاملی هوش در سنت ترستون (۱۹۳۸) که نظریه گیلفورد مورد پیشرفته و متفاوت‌تری از آن در نظر گرفته می‌شود، مورد سؤال قرار می‌گیرد این است که آیا آن‌ها فرمول‌بندی‌هایی را ارائه می‌دهند که ممکن است به‌طور مناسبی به کار گرفته شوند. آیا این فرمول‌بندی‌ها مفید هستند؟ مطمئناً این سؤالات دانش ما را از ماهیت هوش عمیق‌تر و گسترده‌تر خواهد کرد و به بهبود روش‌هایی که راهبرد‌های پردازش اطلاعات، محتواها و الزامات تکلیف بر روی افراد می‌گذارند منجر خواهد شد و در توسعه نظریه‌های آتی نقش خواهند داشت (استرنبرگ، ۱۹۸۲)؛ اما تأثیر این رویکردها بر مجریان محدود است. روان‌شناسان بالینی ترجیح می‌دهند تا استفاده از سازه هوش کلی را ادامه دهند (هامفریز، ۱۹۷۹؛ وکسلر، ۱۹۵۸). آن‌ها هوش را به‌عنوان اندازه کلی از توانایی شناختی در نظر می‌گیرند که اهمیت زیادی در فهم رفتار شخص دارد. اگرچه نظریه مبتنی بر عامل توانایی‌های شناختی امیدهایی را برای پیش‌بینی تفکیکی ایجاد کرده است؛ برای مثال، از نگرش‌های خاص پیش‌بینی کننده جنبه‌های خاص عملکرد شغلی، بااین‌حال، این امیدها در عمل بی‌نتیجه مانده‌اند (هامفریز، ۱۹۷۹؛ ری و ارلز، ۱۹۹۰؛ اسمیت و‌ هانتر، ۱۹۸۱).

ماهیت و هدف مجموعه آزمون‌های استعداد چندبعدی (MAB-II)

مجموعه آزمون‌های استعداد چندبعدی– ویرایش دوم (MAB-II) به‌منظور فراهم آوردن آزمونی مناسب و مفید با نمره‌گذاری عینی توانایی‌های شناخت کلی یا هوش در قالب پنج خرده آزمون کلامی و پنج خرده آزمون عملی تهیه شده است. ازنظر تاریخی، ریشه‌های آن به آزمودن هوش- سال ۱۹۰۵ برمی‌گردد، یعنی به زمانی که بینه و سیمون یافته‌های خود را درباره کودکان آموزشگاهی فرانسه منتشر کردند. اقدامات آن‌ها الهام‌بخش استانداردسازی رسمی معروف استنفورد- بینه توسط ترمن (۱۹۱۶) گردید. همچنین موجب توسعه آزمون‌های فردی غیرکلامی هوش نیز شد که از آن جمله می‌توان به آزمون‌های تکمیل تصاویر پینتنر و اندرسون (۱۹۱۷) و هیلی (۱۹۲۱) و آزمون طرح مکعب‌های کهس (۱۹۲۳) اشاره کرد. همچنین پینتنر و پترسون در سال ۱۹۱۷ آزمون عملی چند تکلیفی انفرادی خود را استاندارد و گسترش دادند.

اولین اجرای آزمودن توانایی شناختی گروهی جدید در مقیاسی بزرگ توسط روان‌شناسانی که مجموعه آزمون‌های طبقه‌بندی استعداد کارکنان ارتش آمریکا را توسعه دادند، انجام گرفت که هم شامل خرده آزمون‌های گروهی و هم عملکردی بود. این کار مبنایی برای بسیاری از فعالیت‌های بعدی قرار گرفت که از آن جمله می‌توان به آزمون عملی استانداردشده دقیق کورنل و کاکس (۱۹۳۴) و آزمون هوشی وکسلر و بلویو (وکسلر، ۱۹۳۹) اشاره کرد.

آزمون‌های چندبعدی توانایی‌های ذهنی متأثر از آزمون‌های آلفا و بتای ارتش آمریکا بنا به دلایل زیر بسیار موفقیت‌آمیز بودند: (الف) آن‌ها تکالیف متعددی ازجمله محتوای یاد گرفته‌شده در مدرسه و تکالیف کلامی را با مهارت‌های کارکردی و عملی را در برداشتند؛ (ب) این آزمون‌ها علاوه بر کودکان برای نوجوانان و بزرگ‌سالان نیز مناسب بودند؛ (ج) نمرات این آزمون‌ها منعکس‌کننده مفاهیم تازه‌ای از ماهیت هوش بودند که در آن‌ها به آسیب‌های عصب‌شناختی، اختلالات هیجانی یا روان‌پریشی نیز توجه می‌شد؛ (د) بیشتر آن‌ها به صورتی بسیار دقیق هنجاریابی و استاندارد شده بودند؛ (ﻫ) آن‌ها پژوهش‌های زیادی را برانگیخته بودند و مقالات زیادی بر اساس داده‌های حاصل از اندازه‌های هوشی چاپ شده بود؛ (و) آزمون‌های هوش سطوح بالایی از ویژگی‌های روان‌سنجی را نشان می‌دادند؛ و (ز) داده‌های روا و معتبر زیادی درباره آزمون‌های هوش در طول چندین سال منتشر شده بود که از نمرات دانشگاهی گرفته تا مطالعات مربوط به شغل و سازگاری با محیط را شامل می‌شدند (آناستازی و اربینا، ۱۹۹۷). درواقع، مقیاس‌های هوش استانداردشده معیاری برای کارکرد هوش درآمد.

اگرچه این آزمون‌ها به صورتی گسترده مورداستفاده قرار می‌گیرند، بااین‌حال حداقل یک مشکل جدی در به‌کارگیری آزمون‌های هوش وجود دارد. به عبارتی این آزمون‌ها نیازمند اجرای انفرادی و نمره‌گذاری توسط فردی متخصص می‌باشند. در برخی موارد، مشاهدات بالینی آزمودنی‌ها در جلسه آزمون مفید است. به همین دلیل در بیماران روان‌پریش و افرادی که ازنظر ذهنی دچار مشکل جدی هستند مستلزم اجرای انفرادی است؛ اما در مورد اکثر قریب به‌اتفاق آزمودنی‌ها که صرفاً می‌خواهند کارکرد ذهنی خود را برآورد کنند اجرای انفرادی هزینه‌بر و غیرضروری است. علاوه بر این، زمانی که آزمون گروهی توانایی ذهنی با آزمون‌های وکسلر برای پیش‌بینی ملاک‌هایی نظیر عملکرد تحصیلی مورد مقایسه قرار می‌گیرد، آزمون‌های انفرادی درکل هیچ‌گونه مزیتی نسبت به انواع دیگر آزمون‌ها نشان نمی‌دهند (ماتارازو، ۱۹۷۲)؛ بنابراین این سؤال مطرح می‌شود که آیا تبدیل برخی از ویژگی‌های مثبت آزمون‌های چندبعدی انفرادی به یک شکل ساخت‌یافته‌تر که به‌صورت گروهی بتوان اجرا کرد امکان‌پذیر است یا نه. هدف این مجموعه ارائه آزمون‌هایی برای تحقق این هدف بود.

ویژگی‌های عمومی ‌ MAB-II

کاربردهای موردنظر

مجموعه آزمون‌های استعداد چندبعدی- ویرایش دوم برای سنجش دامنه وسیعی از توانایی‌های ذهنی بزرگ‌سالان و نوجوانان سنین ۱۶ و بالاتر طراحی شده است. همانند سایر ابزارهای اندازه‌گیری توانایی‌های ذهنی، این آزمون را می‌توان برای اهداف مختلف و در بافت‌های مختلف به کار گرفت. این بافت‌ها می‌توانند شامل موقعیت‌های آموزشی، مشاوره شغلی، تجاری و صنعتی، خدمات بهداشت روانی و درمانی و سایر پژوهش‌های پایه‌ای باشند. برای سنجش مناسب این آزمون ضروری است آزمودنی‌ها از مهارت‌های خواندن و توانایی درک دستورالعمل‌های نوشتاری و گفتاری برخوردار باشند. استفاده از این آزمون برای تعیین سطح عملکرد ذهنی افراد عقب‌مانده ذهنی و افراد روان‌پریش که ممکن است دستورالعمل‌ها را به‌درستی درک و اجرا نکنند، توصیه نمی‌شود. بااین‌حال، تجربه سازنده اصلی این آزمون نشان داده است که اکثر بیماران روانی قادر هستند به صورتی هدفمند مجموعه آزمون‌های استعداد چندبعدی را تکمیل نمایند.

ماهیت مقیاس‌ها

همانند سایر آزمون‌های مربوط به اندازه‌گیری توانایی‌های ذهنی که به آزمون‌های آلفا و بتای ارتش آمریکا و پیش از آن برمی‌گردد، مجموعه آزمون‌های استعداد چندبعدی- ویرایش دوم متشکل از مقیاس‌های گروهی کلامی و غیرکلامی است. پنج خرده آزمون کلامی در یک دفترچه و پنج آزمون غیرکلامی یا به‌عبارت‌دیگر عملی در قالب دفترچه دیگری ارائه شده است. پاسخنامه‌های مجزا برای مقیاس‌های کلامی و عملی تهیه شده که می‌توان به‌صورت دستی نمره‌گذاری کرد. ازاین‌رو، این امکان وجود دارد که بخش کلامی یا عملی را به‌صورت مجزا یا هر دو بخش را به‌صورت هم‌زمان برای به دست آوردن سنجش جامعی از توانایی‌های ذهنی اجرا کرد. علاوه بر نمرات ده خرده آزمون، مجموعه آزمون‌های استعداد چندبعدی- ویرایش دوم یک هوش‌بهر کلامی، یک هوش‌بهر عملی و یک هوش‌بهر کلی به دست می‌دهد. همچنین نمرات استاندارد را می‌توان به‌جای هوش‌بهر کلی، عملی و کلامی مورداستفاده قرار داد.

کلامی	عملی
اطلاعات عمومی	نماد ارقام
درک و فهم	تکمیل تصاویر
محاسبه	تجسم دیداری
شباهت‌ها	تنظیم تصاویر
واژگان	الحاق قطعات

اگرچه عناوین ‌۹ خرده آزمون از میان ۱۰ خرده آزمون همان عنوان‌های استفاده‌شده برای سایر آزمون‌ها ازجمله آزمون آلفا و بتای ارتش آمریکا و آزمون وکسلر است، بااین‌حال آزمون استعداد چندبعدی- ویرایش دوم دارای فرمت و شکل متفاوت بوده و وجه مشترک دیگری با سایر ابزارها ندارد.

نوع سؤالات

در مجموعه آزمون‌های استعداد چندبعدی- ویرایش دوم از سؤالات چندگزینه‌ای برای همه خرده آزمون‌ها استفاده شده است. اگرچه محتوای سؤال‌های این آزمون‌ها به‌صورت کلامی، عددی، شکلی و تصویری است، ولی در هر سؤال یا ماده، فرد باید از بین پنج گزینه یکی را که درست‌تر است انتخاب کند. این نوع آزمون‌ امکان ثبت پاسخ‌های ارائه‌شده توسط افراد مختلف و نمره‌گذاری آن‌ها را بدون توجه به قضاوت‌های حرفه‌ای میسر می‌سازد.

اهداف تأثیرگذار در توسعه MAB-II

شاید بارزترین جنبه توسعه مجموعه آزمون‌های استعداد چندبعدی این است که این مجموعه آزمون‌ها چندین بار قبل از تدوین نسخه اصلی موردبازنگری قرار گرفته است. سه بار سؤالات قبل از انتشار به‌صورت میدانی اجرا، تحلیل، تجدیدنظر و موردبررسی قرار گرفته‌اند. در انتخاب محتوای سؤال‌ها به تفاوت‌های گروهی افراد جامعه از قبیل جنسیت، ملیت، سن و فرهنگ توجه خاص شده است.

جنبه دوم از ساخت مجموعه آزمون‌های استعداد چندبعدی، فراهم آوردن ابزاری است که نه‌تنها دارای ویژگی‌های روان‌سنجی قابل‌قبول باشد، بلکه شامل ویژگی‌هایی نظیر سهولت در استفاده و تفسیر نیز باشد. دستورالعمل آزمون به‌گونه‌ای استانداردشده که بتوان آن را به‌راحتی اجرا کرد. مدت‌زمان اجرای ده خرده آزمون برابر بوده و نمره‌گذاری دستی به‌منظور تسریع کار در نظر گرفته شده است.

سومین جنبه آزمون استعداد چندبعدی- ویرایش دوم، هنجار مرتبط با سن است. ویرایش اول آزمون استعداد چندبعدی دربرگیرنده هنجارهایی بود که با WAIS-R کالیبره (درجه‌بندی) شده بود، حال‌آنکه ویرایش دوم آن شامل هنجارهایی برای نه گروه سنی بر پایه اطلاعات سرشماری آمریکا است.

خاستگاه خرده آزمون‌های کلامی ‌و عملی MAB

فعالیت‌های علمی ‌دیوید وکسلر در اندازه‌گیری هوش بزرگ‌سالان و همچنین مجموعه آزمون‌های او را می‌توان خاستگاه اصلی تهیه آزمون‌های چندبعدی استعداد دانست. لازم به ذکر است که همه فرمت‌ها و نام‌های مقیاس‌های آزمون، ریشه در آزمون‌های کلامی و عملی وکسلر دارند. این آزمون‌ها نیز قبلاً در آزمون‌های آلفا و بتای ارتش آمریکا در جنگ جهانی اول مورداستفاده قرار می‌گرفتند (یرکس، ۱۹۲۱). بعد از جنگ جهانی اول آزمون‌های آلفا و بتای ارتش آمریکا کاربردهای گسترده‌ای یافتند و مؤلفان و ناشران این آزمون‌ها را برای توزیع همگانی انطباق دادند. در بین این آزمون‌های انطباق یافته، خرده آزمون‌های بتای ارتش کورنل- کاکس (۱۹۳۴) بود که دارای پنج خرده آزمون عملی بود: تنظیم تصاویر، تکمیل تصاویر، ساخت مکعب‌ها، نماد ارقام و حافظه طرح‌ها.

آزمون‌ها به‌طور قابل‌ملاحظه‌ای مشابه با آزمون‌های بتا بودند. وکسلر مجموعه‌ای از خرده آزمون‌های عملی از مقیاس کورنل-کاکس انطباق یابی کرد و پنج خرده آزمون با عنوان مقیاس هوش وکسلر- بلویو ارائه کرد. به‌جای ساخت مکعب، وکسلر از بلوک‌های کهس (۱۹۲۳) در آزمون خود استفاده کرد؛ بنابراین اگرچه مقیاس‌های وکسلر برخی ویژگی‌های مثبت، ازجمله ایده برآورد هوش بر اساس اندازه‌های کلامی و عملی و همچنین گزارش نتایج برحسب نیمرخ دارد. بااین‌حال، خدمات وکسلر به خاطر این نبود که برای نخستین بار به این ایده‌ها تحقق بخشید و نه به خاطر توسعه انواع مختلفی از مطالب آزمون، بلکه به خاطر ترکیب آن‌ها در بسته مفید با هنجارهای مبتنی بر سن بود. از زمان انتشار مقیاس وکسلر، این آزمون پژوهش‌های زیادی و به‌تبع آن مقالات و داده‌های روا ایجاد کرده است. البته شاید این به خاطر ویژگی‌های مقیاس وکسلر نیست بلکه ماهیت خود هوش نیز در این زمینه نقش دارد.

ویژگی‌های منحصربه‌فرد MAB-II

علی‌رغم مقبولیت عمومی استفاده از آزمون‌های انفرادی هوش، این آزمون‌ها در حال حاضر دارای سه مشکل اساسی هستند: (۱) ضرورت اجرای فردی، (۲) نمره‌گذاری ذهنی و قضاوتی و (۳) هنجارها. آزمون انفرادی هوش باید توسط فردی متخصص و آموزش‌دیده اجرا و نمره‌گذاری شود. فعالیتی تخصصی و مهم که نیازمند زمان و اجرای دقیق است، بنابراین گران تمام می‌شود. دومین مشکل در انتخاب نیمرخ اندازه توانایی هوش کلی، مربوط به نمره‌گذاری ساخت‌یافته در برابر نمره‌گذاری قضاوتی است. نمره‌گذاری قضاوتی در گذشته در اندازه‌گیری‌های کلینیکی هوش مورداستفاده قرار می‌گرفت، اما به عللی استفاده از آن نیازمند دقت فراوانی است که از این موارد می‌توان به نمونه‌های زیر اشاره کرد: (الف) زمان بیشتری موردنیاز است، (ب) بعد ناپایایی از نمره‌گذاری آزمون به‌دست می‌دهد، (پ) مشکلاتی در ساخت و استانداردسازی آزمون وجود دارد و تحلیل سؤال و انتخاب سؤال‌های دقیق برای آزمون‌ها با نمره‌گذاری قضایی مناسب نیست. برخی از تحقیقات (برای مثال، ریان، پریفتریا و پاورز، ۱۹۸۳) نشان داده‌اند که نمره گذاران اختلاف فاحشی در ارزیابی مقیاس‌های وکسلر دارند. سومین مشکل آزمون‌های انفرادی هوش مسئله هنجاریابی است. انتخاب نمونه معرف آزمودنی‌ها با آزمون‌های فردی نسبت به استفاده از آزمون‌های گروهی مشکل‌تر است.

با توجه به این ملاحظات و با هدف یکپارچه کردن مزایای رویکردهای نوین برای آزمون‌های استاندارد با فرمت اجرای انفرادی برای اندازه‌گیری توانایی کلی، مجموعه آزمون‌های استعداد چندبعدی اصلی تهیه و تدوین شد. آزمون استعداد چندبعدی- ویرایش دوم به‌گونه‌ای طراحی شد که امکان اجرای گروهی و نمره‌گذاری ماشینی و دستی آسان را فراهم می‌آورد. اگرچه نسخه نخست آزمون استعداد چندبعدی هنجارهای معادل با هنجارهای WAIS-R را مورداستفاده قرار می‌داد ولی برای نسخه دوم این آزمون هنجارهای آمریکای شمالی بر پایه داده‌های مربوط به جامعه آماری ایالات‌متحده و نمونه‌های کانادایی تهیه شده است.

تفسیر تفاوت‌های خرده آزمون‌های استعداد چندبعدی (MAB-II)

تفسیر تفاوت‌های خرده آزمون‌های MAB همان‌طور که ازلحاظ تشخیصی بسیار مهم‌اند، وسوسه‌انگیز نیز می‌باشند. روان‌شناسان بالینی و پژوهشگرانی که می‌خواهند چنین داده‌هایی را مطالعه و به‌کارگیرند، باید این نکته را در نظر داشته باشند که تفاوت‌های مشاهده‌شده بین نمرات خرده آزمون‌های مشارکت‌کنندگان باید به‌اندازه کافی بزرگ باشند تا ازلحاظ آماری پایا باشند. پایایی تفاوت‌های خرده آزمون‌ها تابع پایایی خود آن‌ها و همچنین تابع استقلال آماری آن‌ها است. خرده آزمون‌های MAB-II به‌واسطه عامل مشترک توانایی شناختی عمومی، اساساً همبسته هستند. ازاین‌رو، اگرچه خرده آزمون‌ها پایا هستند، اما واریانس مشترک آن‌ها بر تفسیر تفاوت‌های خرده آزمون‌ها تأثیر می‌گذارد. کرافورد (۱۹۹۷)، روش‌هایی را برای ارزیابی پایایی چنین تفاوت‌هایی ارائه کرده است.

نسبت پایداری/ ناپایداری

هنجارهای آزمون استعداد چندبعدی (MAB-II) و داده‌های دیگر نشان داده‌اند که نمرات خام در خرده آزمون‌های خاص بیشتر از نمرات دیگر خرده آزمون‌های خاص MAB-II با سن کاهش می‌یابند. ازاین‌رو، اصطلاح پایداری به آزمون‌هایی مرتبط است که حداقل کاهش‌هایی را با سن نشان داده‌اند و اصطلاح ناپایداری با آزمون‌هایی ارتباط دارند که کاهش‌ قابل‌ملاحظه‌ای را به‌واسطه افزایش سن از خود نشان می‌دهند.

در مجموعه آزمون‌های استعداد چندبعدی، همه خرده آزمون‌های کلامی‌(به‌استثنای بخش شباهت‌ها) اندازه‌هایی به دست می‌دهند که با سن پایدار باقی می‌مانند. برعکس، همه خرده آزمون‌های عملی اندازه‌هایی دارند که با سن پایدار باقی نمی‌مانند. شباهت‌ها حد واسط هستند و در نظر گرفته نشده‌اند.

پایدار	ناپایدار
اطلاعات عمومی	نماد ارقام
درک و فهم	تکمیل تصاویر
محاسبه	تجسم دیداری
واژگان	تنظیم تصاویر
	الحاق قطعات

نسبت پایداری/ ناپایداری برای ارزیابی این مسئله مورداستفاده قرار می‌گیرد که آیا کاهش عملکرد فرد در MAB-II بیشتر از کاهش طبیعی ناشی از افزایش و کهولت سنی است یا نه. این مسئله از طریق به دست آوردن میانگین نمره میزان شده برای یک آزمودنی در خرده آزمون‌های پایدار و خرده آزمون‌های ناپایدار محاسبه می‌گردد. سپس نسبت پایداری/ ناپایداری از طریق تقسیم میانگین خرده آزمون‌های پایدار بر میانگین خرده آزمون‌های ناپایدار به دست می‌آید. نسبت بالاتر نشان می‌دهد که بر اساس هنجارهای سنی متناسب، خرده آزمون‌های پایدار برای آزمودنی‌ها بالاتر از خرده آزمون‌های ناپایدار هستند. مقدار مورد انتظار این نسبت در جامعه نرمال ۰۰/۱ است. اگر نسبت پایداری/ ناپایداری بالای ۰۰/۱ باشد، در این صورت این احتمال وجود دارد که تغییر در توانایی‌های شناختی به تغییرات وابسته به پیری زودرس که برای آزمودنی روی داده است شباهت دارد؛ اما باید توجه داشت که دامنه‌ای از نسبت پایداری/ ناپایداری در جامعه نرمال کلی حتی برای افراد جوان‌تر نیز وجود دارد. ازاین‌رو، در به‌کارگیری نسبت پایداری/ ناپایداری در تصمیم‌گیری‌های شخصی باید احتیاط کرد. نسبت پایداری/ ناپایداری MAB-II ممکن است در تحقیقات تشخیص کاهش زودرس توانایی‌های ذهنی به‌واسطه زوال کارکردی یا عضوی مرتبط با افزایش و کهولت سنی، آسیب روانی، سوءمصرف مواد یا عوامل دیگر مفید باشد.

استانداردسازی و ویژگی‌های روان‌سنجی MAB-II

استانداردسازی MAB-II

نمونه هنجاری

استانداردسازی مجدد آزمون استعداد چندبعدی با یک نمونه هنجاری با استفاده از نمونه‌گیری نظام‌دار یا سامانمند از نه گروه سنی در ایالات‌متحده آمریکا و کانادا صورت گرفت. افراد طوری انتخاب شدند که گروه نمونه شامل اقشار مختلفی از جامعه بر اساس نژاد، قومیت و موقعیت جغرافیایی باشند. گروه هنجار از تعداد یکسانی از مردها و زن‌ها تشکیل شده بود. هرکدام از نه گروه سنی شامل ۲۰۰ نفر بودند، به‌استثنای دو گروه با شرایط سنی بالا که هرکدام از این دو گروه سنی از ۱۰۰ نفر تشکیل شده بودند.

جنسیت	تعداد
مردان	۸۰۰
زنان	800
نژاد	%
سفید	۴/۸۷%
غیر سفید	6/12%
گروه سنی	تعداد
۱۷ – ۱۶	۲۰۰
۱۹ – ۱۸	۲۰۰
۲۴ – ۲۰	۲۰۰
۳۴ – ۲۵	۲۰۰
۴۴ – ۳۵	۲۰۰
۵۴ – ۴۵	۲۰۰
۶۴ – ۵۵	۲۰۰
۶۹ – ۶۵	۲۰۰
۷۴ – ۷۰	۲۰۰
تحصیلات	سال
میانگین سطح تحصیلات	92/12
شغل	%
مدیریت/ حرفه‌ای، تخصصی	۵۰%
فنی، فروشنده، خدماتی و کارگری	50%
منطقه / کشور	%
شمال غرب آمریکا و غرب کانادا	۵/۲۱
جنوب غرب آمریکا	۱/۱۷
باختر میانه آمریکا	۹/۲۹
جنوب شرق آمریکا	۹/۸
شمال شرق آمریکا و شرق کانادا	6/22
تعداد کل	۱۶۰۰

هنجارهای گروه‌های سنی

میانگین و انحراف استاندارد نمرات خام خرده آزمون‌ها برای هر گروه سنی محاسبه گردید. ازآنجایی‌که میانگین سطح تحصیلات برای سه نمونه با سن بالا (۶۴–۵۵، ۶۹ –۶۵ و ۷۴–۷۰) تا حدودی بیش از میانگین تحصیلات جامعه بود، میانگین نمرات خام این سه گروه از طریق تعدیل رگرسیون با در نظر گرفتن میانگین تحصیلات جامعه، میانگین تحصیلات گروه نمونه و همبستگی بین نمرات خرده آزمون‌ها و سطح تحصیلات انطباق داده شدند. میانگین‌ها و نمرات استانداردها برای هر گروه سپس با استفاده از ملاک حداقل مجذورات مشخص و تعدیل شدند. میانگین‌ها و نمرات استاندارد به‌دست‌آمده برای محاسبه نمره میزان شده (نمره استانداردشده با میانگین ۵۰ و انحراف استاندارد ۱۰) و معادل‌های درصدی نمرات خام ارائه‌شده در پیوست ج استفاده شد. این نمرات میزان شده باید برای مقایسه نمرات آزمون‌شونده در گروه سنی خود آزمون‌شوندگان مورداستفاده قرار گیرند. آن‌ها را نمی‌توان برای تبدیل نمرات خام به نمرات میزان شده در محاسبه نمرات مجموعه آزمون‌های کلامی، عملی و کلی استفاده کرد.

هنجارهای تبدیل نمره میزان شده

میانگین و انحراف استاندارد نمرات خام خرده آزمون‌ها برای کل نمونه هنجار محاسبه شد. باز هم، نمرات حاصل از نمونه‌های با سن بالا در تحصیلات با استفاده از تعدیل رگرسیون همان‌طور که در بالا توضیح داده شد انطباق یافتند. میانگین‌ها و نمرات استانداردها برای هر گروه سپس با استفاده از ملاک حداقل مجذورات مشخص و تعدیل شدند.

هنجارهای مجموعه آزمون‌های کلامی، عملی و مقیاس کامل

نمرات کلامی، عملی و مقیاس کامل برای هر گروه سنی با استفاده از میانگین و انحراف استاندارد که در بخش قبل توضیح داده شد محاسبه گردید. نمرات حاصله برای محاسبه میانگین و انحراف استاندارد گروه‌های سنی و همچنین برای جدول‌های هوش‌بهر، نمرات استاندارد و درصدهای موجود در پیوست ب مورداستفاده قرار گرفت.

پایایی

پایایی همسانی درونی

مفهوم پایایی که در آزمون‌های توانایی شناختی بکار می‌رود به قابلیت اطمینان اندازه‌گیری اشاره دارد. پایایی خرده آزمون‌ها به‌طور جداگانه برای ۲۳۰ نوجوان پسر و ۲۸۵ نوجوان دختر در پیوستار سنی ۱۵ تا ۲۰ سال محاسبه گردید که نتایج آن در جدول ۱ ارائه شده است. باید توجه داشت که تک‌تک خرده آزمون‌ها با محدودیت زمانی اجرا شده‌اند، بنابراین فرمول کودر- ریچاردسون ۲۰، پایایی همسانی درونی حد کرانی پایین را بیش‌ازاندازه برآورد می‌کند. همان‌طور که در جدول ۱ مشاهده می‌شود، دامنه این پایایی‌ها در گروه‌های سنی مختلف از ۹۴/۰ تا ۹۷/۰ برای آزمون کلامی، ۹۵/۰ تا ۹۸/۰ برای آزمون عملی و ۹۶/۰ تا ۹۸/۰ برای کل مقیاس است.

جدول ۱ پایایی‌های همسانی درونی: نوجوانان دختر و پسر

	سن
	15	16	17	18	19	20
مقیاس	۳۲=N	100=N	134=N	100=N	59=N	91=N
اطلاعات عمومی	۸۴	۸۵	۸۳	۸۷	۹۰	۸۷
درک و فهم	۸۴	۸۴	۸۲	۸۸	۹۰	۸۸
محاسبه	۷۴	۷۰	۷۲	۷۶	۸۴	۸۰
شباهت‌ها	۸۶	۸۶	۸۵	۸۹	۹۰	۹۰
واژگان	89	76	72	83	84	88
نماد ارقام	۹۳	۹۷	۸۹	۹۴	۹۴	۹۵
تکمیل تصاویر	۸۸	۹۰	۷۶	۸۸	۸۹	۸۸
تجسم دیداری	۹۵	۹۴	۹۵	۹۵	۹۶	۹۶
تنظیم تصاویر	۹۱	۷۵	۷۳	۸۱	۸۴	۸۵
الحاق قطعات	91	83	78	87	88	89
مقیاس کلامی	۹۶	۹۴	۹۴	۹۶	۹۷	۹۷
مقیاس عملی	۹۷	۹۵	۹۶	۹۸	۹۸	۹۸
کل مقیاس	۹۷	۹۶	۹۶	۹۸	۹۸	۹۸
توجه: اعداد اعشاری حذف‌شده‌اند. برای مثال ضریب پایایی اطلاعات عمومی برای گروه سنی ۱۵ سال ۸۴/۰ است. پایایی‌ها بر اساس فرمول کودر- ریچاردسون ۲۰ محاسبه شده‌اند.

روش دیگر ارزیابی پایایی نمرات خرده آزمون‌ها محاسبه میزان یا درجه‌ای است که هرکدام از مقیاس‌ها با ترکیب خطی مابقی مقیاس‌ها رابطه دارند. با استفاده از این روش فرض می‌کنیم که ترکیب وزنی نه مقیاس باقیمانده فرم موازی هر مقیاس را تشکیل می‌دهد. البته نه مقیاس باقیمانده با هرکدام از مقیاس‌ها کاملاً موازی نیستند، چراکه محتوای سؤال و نوع آن‌ها متفاوت است. چنین روشی با اشتراکات در تحلیل عامل همبسته است، طوری که حد کرانی پایین برآورد پایایی در آزمون‌های با زمان‌بندی‌های جداگانه ارائه می‌دهد. ستون ۱ جدول ۲ نشان‌دهنده مقادیری برای همبستگی چندگانه میان هر مقیاس و نه مقیاس باقیمانده بر اساس نمونه هم‌ارز یا معادل است. روش مرتبط دیگر برای برآورد پایایی حد کرانی پایین، محاسبه همبستگی میان خرده آزمون‌های کلامی و عملی خاص و مقیاس عملی یا کلامی ‌متناظر با آن می‌باشد که قبلاً اجرا شده است. این به‌صورت ترکیب کلامی- عملی در ستون دو جدول ۲ ارائه گردیده است که بر اساس نمونه باز آزمایی توصیف‌شده در پاراگراف بعدی است. چون این آزمون‌ها در شرایط مختلفی اجرا شده‌اند، نمی‌توان هر نوع وابستگی خطی جزء-کل آن‌ها را با این روش مشخص کرد. پایایی‌های ذکرشده در دو ستون اول جدول ۲ را می‌توان برای بخش واریانس پایایی در هر مقیاس در ارتباط با عامل هوش کلی (ستون یک) و عامل‌های کلامی و عملی مربوط به آن (ستون دو) در نظر گرفت.

جدول ۲ داده‌های پایایی بر اساس ترکیب‌های وزنی، ترکیب کلامی- عملی و دونیمه کردن

	ترکیب‌های وزنی	کلامی- عملی	دونیمه کردن
مقیاس	۱۶۰=N	51=N	71=N
اطلاعات عمومی	۸۴/۰	۸۷/۰	۷۸/۰
درک و فهم	۸۵/۰	۹۰/۰	۷۱/۰
محاسبه	۷۷/۰	۸۰/۰	۷۵/۰
شباهت‌ها	۸۶/۰	۹۰/۰	۸۰/۰
واژگان	82/0	85/0	79/0
نماد ارقام	۸۳/۰	۷۸/۰	۶۴/۰
تکمیل تصاویر	۸۰/۰	۸۵/۰	۶۶/۰
تجسم دیداری	۶۷/۰	۷۵/۰	۸۷/۰
تنظیم تصاویر	۸۰/۰	۸۴/۰	۵۵/۰
الحاق قطعات	72/0	83/0	78/0
مقیاس کلامی			92/0
مقیاس عملی			94/0
کل مقیاس			95/0

ستون سوم از جدول ۲ به خرده آزمون‌های زوج و فرد با زمان‌بندی جداگانه اشاره دارد. نصف آزمون‌های کلامی و عملی به‌صورت جداگانه برای ۷۱ دانش‌آموز دبیرستانی با میانگین سنی ۱۶ تا ۱۸ سال اجرا شد. پایایی‌های آزمون‌های کلامی، عملی و مقیاس کلی با استفاده از فرمول اسپیرمن- براون به ترتیب ۹۲/۰، ۹۴/۰ و ۹۵/۰ به دست آمد.

پایایی باز آزمایی

در سنجش شناختی مشخص کردن درجه یا میزانی که اندازه‌های به‌دست‌آمده در یک زمان معین ثابت بوده و برای زمان‌های آتی قابل تعمیم‌اند، همواره موردتوجه است. شواهدی از ثبات برای استفاده مطمئن از آزمون جهت پیش‌بینی رفتار آتی لازم و ضروری است. پایایی نمرات در یک بیمارستان روانی ارزیابی گردید. باوجوداینکه مشخص بود که در سایر جوامع ممکن است نمرات ثبات بالایی را نشان دهند، اما این شرایط ازآن‌جهت انتخاب شد که دارای کاربرد بالینی نوعی بوده و معرف مناسبی برای پایایی باز آزمایی است.

درمجموع از ۵۲ بیمار روانی بزرگ‌سال جوان در دو زمان مختلف که به‌طور میانگین ۴۵ روز از هم فاصله داشت با استفاده از دستورالعمل‌های استاندارد، آزمون به عمل آمد. پاسخنامه‌ها اسکن شده و با کامپیوتر (رایانه) نمره‌گذاری شدند. جدول ۳ میانگین نمرات استاندارد در این دو دوره زمانی و همچنین همبستگی گشتاوری میان نمرات حاصل از هر دو شرایط را نشان می‌دهد. نتایج حاکی از افزایش اندک نمرات آزمون در بار دوم اجرا است، این خود نشان می‌دهد که تمرین و حافظه تأثیر چندانی بر نمرات باز آزمایی این افراد در طول مدت‌زمانی مشخص‌شده ندارد. ثبات مقیاس‌ها از طریق همبستگی‌های باز آزمایی در جدول ۳ ارائه شده است. پایایی باز آزمایی برای خرده آزمون‌های کلامی‌۸۳/۰ تا ۹۷/۰ با میانه ۹۰ بود، درحالی‌که برای خرده آزمون‌های عملی از ۸۷/۰ تا ۹۴/۰ با میانه ۹۳/۰ است. پایایی‌های باز آزمایی برای مقیاس‌های کلامی، عملی و مقیاس کامل به ترتیب ۹۵/۰، ۹۶/۰ و ۹۷/۰ است.

همچنین در جدول ۳ خطای استاندارد اندازه‌گیری برای زمان‌های جداگانه آزمودن در واحدهای نمره استاندارد بر اساس فرمول رولون (۱۹۳۹) ارائه شده است. مقدار خطای استاندارد، دامنه نمرات مورد انتظار را هنگام اجرای دوباره مجموعه آزمون‌ها نشان می‌دهد. نمرات استاندارد آزمودن دوم انتظار می‌رود با مثبت یا منفی یک خطای استاندارد در حدود ۶۸ درصد موارد قرار گیرند.

جدول ۳ آماره‌های باز آزمایی ۵۲= N (به زیرنویس جدول مراجعه شود)

مقیاس	میانگین آزمون I	میانگین آزمون II	پایایی باز آزمایی	خطای استاندارد اندازه‌گیری
اطلاعات عمومی	۳/۴۰	۵/۴۰	۹۷/۰	۵/۲
درک و فهم	۹/۴۳	۶/۴۴	۹۵/۰	۲/۳
محاسبه	۳/۳۹	۶/۳۹	۸۸/۰	۶/۴
شباهت‌ها	۸/۴۱	۲/۴۳	۸۳/۰	۹/۶
واژگان	9/44	1/46	90/0	4/4
نماد ارقام	۸/۳۹	۰/۴۰	۹۰/۰	۱/۶
تکمیل تصاویر	۹/۴۳	۱/۴۴	۹۴/۰	۶/۴
تجسم دیداری	۴/۴۴	۴/۴۴	۹۳/۰	۳/۴
تنظیم تصاویر	۸/۴۶	۶/۴۸	۸۷/۰	۴/۷
الحاق قطعات	4/42	5/43	93/0	0/4
مقیاس کلامی	۲/۲۱۰	۰/۲۱۴	۹۵/۰	۵/۱۵
مقیاس عملی	۳/۲۱۷	۷/۲۲۰	۹۶/۰	۳/۱۶
کل مقیاس	۴/۴۲۷	۱/۴۳۵	۹۷/۰	۲/۲۷
توجه: میانگین‌ها و خطاهای استاندارد خرده مقیاس‌ها در واحدهای نمره استاندارد (T) ارائه شده است. داده‌ها بر اساس پاسخ‌های بیماران روانی بستری است. چون سه بیمار موفق نشدند خرده آزمون‌ها را در اجرای اول یا باز آزمایی تکمیل کنند، همبستگی‌ها بر اساس اطلاعات ۴۹ تا ۵۱ نفر محاسبه شد.

اثرات محدودیت زمانی

یکی از هدف‌های ساخت آزمون استعداد چندبعدی این بود که سرعت و قدرت با هم ترکیب کند. آزمونی با محتوایی نسبتاً دشوار جهت به چالش کشیدن سرآمدها، آزمونی که نه‌تنها به کیفیت بلکه به کمیت نیز هم‌زمان امتیاز بدهد. این دو جنبه عملکرد به هم مرتبط می‌باشند؛ اما مهم است نشان داده شود که عملکرد در آزمون‌های با محدودیت زمانی خیلی هم از طریق عامل سرعت تحت تأثیر قرار نمی‌گیرد. دو مطالعه برای ارزیابی اثرات محدودیت زمانی متفاوت اجرا شد. در مطالعه اول، از پاسخ‌دهنده‌ها خواسته شد بعد از پاسخ دادن به پرسش‌های هر خرده آزمون در مدت‌زمان هفت دقیقه، خطی را روی برگه پاسخ خود بکشند. سپس به آن‌ها اجازه داده شد که سه دقیقه دیگر هم کار کنند. جدول ۴ مقایسه میانگین و انحراف استاندارد بین محدودیت زمانی هفت و ده دقیقه و جدول ۵ ماتریس همبستگی متناظر را نشان می‌دهد.

جدول ۴ میانگین‌ها و انحراف استانداردها با محدودیت زمانی ۷ و ۱۰ دقیقه

	میانگین‌ها انحراف استانداردها
مقیاس	تعداد سؤال‌ها	۷	۱۰	۷	۱۰
اطلاعات عمومی	۴۰	۲۰/۲۲	۰۳/۲۵	۷۰/۶	۸۲/۶
درک و فهم	۲۵	۴۸/۱۴	۵۳/۲۰	۱۴/۴	۲۰/۴
محاسبه	۲۶	۴۵/۱۳	۱۰/۱۵	۱۱/۳	۷۰/۳
شباهت‌ها	۳۰	۱۲/۲۲	۰۷/۲۳	۷۵/۴	۵۷/۴
واژگان	46	78/20	27/22	31/7	31/7
نماد ارقام	۲۵	۸۴/۲۲	۱۱/۲۳	۲۶/۳	۴۰/۳
تکمیل تصاویر	۳۰	۸۴/۲۲	۸۷/۲۳	۲۶/۵	۹۷/۴
تجسم دیداری	۴۰	۷۷/۲۹	۴۳/۳۳	۶۰/۷	۵۴/۶
تنظیم تصاویر	۲۱	۱۰/۱۰	۷۲/۱۲	۴۹/۲	۸۵/۲
الحاق قطعات	20	50/12	70/14	61/4	42/4
مقیاس کلامی	۱۶۷	۹۶/۹۷	۵۲/۱۰۵	۹۶/۲۰	۶۸/۲۲
مقیاس عملی	۱۳۶	۳۴/۱۰۱	۸۴/۱۰۷	۷۶/۱۷	۰۹/۱۶
کل مقیاس	۳۰۳	۷۳/۲۰۰	۳۶/۲۱۳	۴۵/۳۳	۹۶/۳۵
توجه: ۲۲۸=N برای محدودیت زمانی ۱۰ دقیقه. در محدودیت زمانی ۷ دقیقه برای مقیاس‌های مختلف N در دامنه‌ای بین ۹۱ و ۱۰۶ قرار داشت.

همان‌طور که در جدول ۵ مشاهده می‌شود همبستگی‌های خرده آزمون‌های کلامی مرتبط به هم بسیار بالا و در دامنه‌ای از ۹۱/۰ تا ۹۶/۰ قرار دارند. درحالی‌که این مقادیر برای خرده آزمون‌های عملی تا حدودی پایین است یعنی در دامنه‌ای از ۷۸/۰ تا ۹۲/۰٫ همبستگی‌های آزمون‌های کلامی، عملی و مقیاس کامل به ترتیب ۹۷/۰، ۹۴/۰ و ۹۶/۰ بود. رتبه‌بندی آزمودنی‌ها بر اساس نمرات آزمون‌های کلامی، عملی و مقیاس کامل بین محدودیت زمانی هفت و ده دقیقه خیلی مشابه بود. بر اساس این یافته‌ها تصمیم گرفته شد، محدودیت زمانی هفت دقیقه به‌عنوان استاندارد برای هرکدام از خرده آزمون‌ها در نظر گرفته شود.

جدول ۵ همبستگی‌های بین نمرات ۷ و ۱۰ دقیقه

نمرات ۱۰ دقیقه

نمرات ۷ دقیقه ۱٫ اطلاعات عمومی^f

95/0

64/0

56/0

66/0

73/0

87/0

34/0

52/0

43/0

41/0

58/0

84/0

2. درک و فهم^f

59/0

91/0

48/0

69/0

58/0

76/0

39/0

40/0

34/0

54/0

^*23/0

49/0

72/0

3. محاسبه^d

54/0

53/0

93/0

51/0

56/0

70/0

36/0

34/0

39/0

33/0

46/0

51/0

70/0

4. شباهت‌ها ^f

59/0

77/0

51/0

93/0

57/0

78/0

39/0

48/0

40/0

64/0

33/0

57/0

77/0

5. واژگان^g

72/0

59/0

52/0

59/0

96/0

85/0

29/0

36/0

^*28/0

33/0

41/0

75/0

6. مقیاس کلامی^b

84/0

82/0

67/0

80/0

87/0

97/0

40/0

34/0

45/0

51/0

42/0

61/0

91/0

7. نماد ارقام^e

32/0

45/0

38/0

45/0

^*26/0

40/0

83/0

34/0

39/0

55/0

44/0

62/0

55/0

8. تکمیل تصاویر^c

51/0

44/0

32/0

45/0

57/0

54/0

^*25/0

89/0

47/0

44/0

69/0

63/0

9. تجسم دیداری^g

38/0

^*24/0

^*27/0

33/0

^*25/0

45/0

^*25/0

36/0

84/0

40/0

35/0

70/0

54/0

10. تنظیم تصاویر^e

39/0

50/0

35/0

51/0

33/0

31/0

47/0

40/0

41/0

78/0

42/0

63/0

59/0

11. الحاق قطعات^f

37/0

^*25/0

45/0

31/0

33/0

42/0

33/0

35/0

36/0

41/0

92/0

67/0

56/0

12. مقیاس عملی^b

56/0

52/0

50/0

57/0

43/0

61/0

53/0

66/0

78/0

62/0

72/0

94/0

80/0

13. کل مقیاس^a

80/0

76/0

66/0

78/0

76/0

91/0

52/0

69/0

68/0

63/0

61/0

85/0

96/0

توجه: ضرایب همبستگی گزارش‌شده با علامت ^* در سطح ۰۵/۰ > P و بقیه ضرایب همبستگی در سطح ۰۱/۰ > P معنی‌دار هستند. ^a(91= n)؛ ^b(98= n)؛ ^c(101= n)؛ ^d(103= n)؛ ^e(104= n)؛ ^f(105= n)؛ ^g(106= n)؛

مطالعه دیگری نیز توسط ورنون، نادور و کانتور (۱۹۸۵) انجام شد. در این پژوهش ۸۸ پاسخ‌دهنده خرده آزمون‌ها را با محدوده زمانی پنج دقیقه به اتمام رساندند. بعدازاینکه آزمودنی‌ها هر آزمون را با محدوده زمانی پنج دقیقه به پایان رساندند، از آن‌ها خواسته شد مداد‌های خود را کنار گذاشته و از خودکار استفاده کنند و سه دقیقه دیگر به پاسخ دادن سؤالات ادامه دهند که در این مدت‌زمان تقریباً تمامی پاسخ‌دهنده‌ها به سؤالات پاسخ داده بودند. پس از اتمام تمامی خرده آزمون‌ها، به پاسخ‌دهنده‌ها اجازه داده شد به خرده آزمون‌های تمام نشده برگردند و تا آنجا که می‌توانند بدون محدودیت زمانی روی سؤالات کار کنند. ورنون و همکارانش درصدد ارزیابی رابطه میان نمرات تحت شرایط سرعت و قدرت خالص مستقل برای توجیه احتمال اثرات سقف یا تارک بود. ورنون و همکارانش همبستگی نمره‌های به‌دست‌آمده از محدودیت زمانی پنج دقیقه با نسبت درست سؤال‌های باقیمانده را با نمرات در شرایط زمان نامحدود محاسبه کردند. همبستگی میان دو مجموعه از نمرات ۷۱/۰ بود، این نتایج حاکی از آن است که فرایندهای موردسنجش تحت شرایط سرعت و بدون سرعت تا حد زیادی به هم مرتبط هستند.

همبستگی متقابل مقیاس‌ها و تحلیل عاملی

جدول ۶ همبستگی‌های متقابل میان نمرات خام برای هر یک از ده خرده آزمون را بر اساس نمونه‌ای متشکل از ۳۱۲۱ دانش‌آموز دبیرستانی پسر و دختر بین سنین ۱۶ و ۱۹ سال را نشان می‌دهد. همان‌طور که مشاهده می‌شود همه همبستگی‌ها، مثبت و در دامنه‌ای از ۲۴/۰ تا ۷۳/۰ قرار دارند. بررسی دقیق این همبستگی‌ها نشان می‌دهند که هرکدام از مقیاس‌های کلامی با دیگر مقیاس‌های کلامی و مقیاس‌های عملی نیز با دیگر مقیاس‌های عملی همبستگی بالایی دارند. این روند همچنین در نتایج تحلیل عامل آشکار شد. تحلیل عاملی مؤلفه‌های اصلی، برای نمونه متشکل از ۳۱۲۱ دانش‌آموز دبیرستانی پسر و دختر بر اساس همبستگی‌های گزارش‌شده در جدول ۶ اجرا شد. دو عامل که مقادیر ویژه مرتبط با آن‌ها بیشتر از یک بود، نگه داشته شدند. این‌ها با معیار واریماکس ساختار ساده چرخش داده شدند (به جدول ۷ مراجعه شود).

جدول ۶ ماتریس همبستگی‌های متقابل برای دانش آموزان دبیرستانی (۳۱۲۱= N)

مقیاس 1. اطلاعات عمومی	۱	۲	۳	۴	۵	۶	۷	۸	۹	۱۰
۰۰/۱
2. درک و فهم	۷۰/۰	۰۰/۱
3. محاسبه	۵۰/۰	۵۱/۰	۰۰/۱
4. شباهت‌ها	۶۲/۰	۷۳/۰	۴۸/۰	۰۰/۱
5. واژگان	65/0	63/0	42/0	61/0	00/1
6. نماد ارقام	۲۴/۰	۳۶/۰	۳۲/۰	۳۵/۰	۲۵/۰	۰۰/۱
7. تکمیل تصاویر	۴۷/۰	۴۶/۰	۳۶/۰	۴۴/۰	۳۹/۰	۲۷/۰	۰۰/۱
8. تجسم دیداری	۳۱/۰	۳۱/۰	۳۷/۰	۲۸/۰	۲۴/۰	۳۴/۰	۳۹/۰	۰۰/۱
9. تنظیم تصاویر	۳۷/۰	۴۱/۰	۳۴/۰	۴۰/۰	۳۲/۰	۳۶/۰	۴۰/۰	۳۶/۰	۰۰/۱
10. الحاق قطعات	۳۷/۰	۳۹/۰	۴۰/۰	۳۶/۰	۳۲/۰	۳۷/۰	۴۶/۰	۴۷/۰	۴۳/۰	۰۰/۱

در جدول ۷، بارهای عاملی برای نخستین مؤلفه‌های اصلی برای هر نمونه نشان داده شده است. این نشان می‌دهد که هر خرده آزمون با g اشباع‌شده یا با عامل هوش کلی رابطه دارد. بررسی عوامل چرخش داده‌شده، تفکیک خرده آزمون‌های کلامی و عملی را در الگویابی بارهای عاملی مشخص می‌کند. خرده آزمون‌های کلامی همواره بالاترین بارها را روی عامل اول داشتند و خرده آزمون‌های عملی همواره بالاترین بارها را روی عامل دوم نشان ‌دادند. برای ارزیابی ثبات بارهای عامل، تحلیل عاملی دیگری روی نمونه دوم متشکل از ۵۱۶ دانش‌آموز دبیرستانی انجام گرفت و به‌صورت مستقل با واریماکس چرخش داده شد. ضرایب همسانی عاملی برای هر دو عامل بیشتر از ۹۹/۰ بود؛ بنابراین مبنایی در ساختار درونی MAB برای تقسیم خرده آزمون‌ها به مقیاس‌های کلامی و عملی وجود دارد.

همبستگی‌ با WAIS-R

ضرایب همبستگی بین نمرات MAB و WAIS-R در جدول ۸ ارائه شده است. به‌منظور مقایسه، جدول ۸ همچنین دربرگیرنده خلاصه‌ای از پنج مطالعه است که همبستگی‌های بین WAIS-R و WAIS را گزارش می‌کند. چنین مقایسه‌ای از اهمیت زیادی برخوردار است، زیرا برخلاف مقایسه MAB با WAIS-R؛ و WAIS-R با WAIS روش اجرا، شکل سؤال و سؤال‌های مشترک زیادی دارند. همبستگی‌های خرده آزمون‌های MAB/WAIS-R در دامنه همبستگی‌های خرده آزمون‌های WAIS/WAIS-R قرار می‌گیرند، به‌استثنای مقایسه نماد ارقام، تجسم فضایی و طراحی مکعب‌ها. همبستگی‌های نمرات مقیاس کامل آزمون MAB با WAIS-R برابر ۹۱/۰ و همبستگی نمرات آزمون‌های کامل WAIS با WAIS-R برابر ۹۳/۰ است که تا حدودی مشابه‌اند.

جدول ۷ بارهای عاملی

مقیاس	عامل‌ها
G	V	P
1. اطلاعات عمومی	۷۷/۰	۸۳/۰	۲۳/۰
۲٫ درک و فهم	۸۲/۰	۸۳/۰	۲۸/۰
۳٫ محاسبه	۶۸/۰	۵۴/۰	۴۳/۰
۴٫ شباهت‌ها	۷۹/۰	۸۱/۰	۲۵/۰
۵٫ واژگان	73/0	82/0	14/0
6. نماد ارقام	۵۳/۰	۱۷/۰	۶۳/۰
۷٫ تکمیل تصاویر	۶۷/۰	۴۴/۰	۵۳/۰
۸٫ تجسم دیداری	۵۶/۰	۱۰/۰	۷۷/۰
۹٫ تنظیم تصاویر	۶۳/۰	۳۰/۰	۶۳/۰
۱۰٫ الحاق قطعات	۶۵/۰	۲۲/۰	۷۵/۰

توجه: عامل G مؤلفه اصلی نخست بدون چرخش است. عامل‌های V و P نتیجه چرخش واریماکس مؤلفه‌های اصلی هستند.

مقایسه ساختارهای عاملی MAB و WAIS-R

برای مقایسه ساختار زیربنایی توانایی‌های بازنمایی شده در MAB و WAIS-R، تحلیل عاملی مؤلفه‌های اصلی بر روی دو آزمون توسط استوکول (۱۹۸۴) انجام شد. ماتریس‌های همبستگی گزارش‌شده در دفترچه راهنمای WAIS-R برای آزمودنی‌های ۱۶-۱۷ ساله (۲۰۰= N) و ۱۸-۱۹ ساله (۲۰۰= N) با استفاده از تبدیل z فیشر میانگین‌گیری شد. به خاطر اینکه در آزمون MAB هیچ خرده آزمون متناظری با خرده آزمون فراخنای ارقام WAIS-R وجود نداشت، داده‌ها برای این آزمون از ماتریس همبستگی WAIS-R حذف گردید. آزمون‌های مشابه در هرکدام از مجموعه‌ها در ردیف‌های یکسانی قرار داشتند. همانند تحلیل عاملی گزارش‌شده برای MAB، دو عامل استخراج و با واریماکس چرخش داده شدند و ضرایب همسانی عاملی محاسبه شد. این ضرایب همسانی بین MAB و WAIS-R برای عامل‌های V و P به ترتیب ۹۷/۰ و ۹۶/۰ بود. این مقادیر نسبتاً در سطح بالا هستند، بخصوص هنگامی‌که این واقعیت در نظر گرفته می‌شود که چرخش‌های عاملی کاملاً مستقل از یکدیگر بوده و هیچ تلاشی برای به حداکثر رساندن همسانی انجام نشده است. بر اساس این داده‌ها، نتیجه‌گیری شد که الگویابی توانایی‌ها در ماتریس همبستگی MAB و WAIS-R علی‌رغم محتوا، اجرا و شکل‌های متفاوت پاسخ‌ها در اصل مشابه هستند.

مقایسه MAB و ماتریس‌های پیش‌رونده پیشرفته ریون

ماتریس‌های پیش‌رونده پیشرفته ریون (RAPM) (ریون، ۱۹۶۰)، اندازه غیرکلامی از توانایی‌های شناختی کلی است که به‌طور گسترده‌ای مورداستفاده قرار می‌گیرد. بررسی همبستگی آن با خرده آزمون‌های MAB از اهمیت شایانی برخوردار است. جدول ۹ این همبستگی‌ها را بر اساس نمونه متشکل از دانشجویان لیسانس دانشگاه کالیفرنیا در برکلی گزارش می‌کند که این همبستگی در اصل توسط کرانزلر و جانسن (۱۹۹۱) منتشر شده است. اگرچه مقدار این همبستگی‌ها به خاطر محدودیت دامنه این جامعه در اصل کاهش یافته است، اما الگوی همبستگی‌ها از اهمیت بسزایی برخوردارند. بالاترین ضریب همبستگی در بین خرده آزمون‌های عملی برای الحاق قطعات و تجسم فضایی و در بین خرده آزمون‌های کلامی‌ برای محاسبات به چشم می‌خورد. خرده آزمون‌های دیگر مقیاس‌های کلامی، همبستگی‌های پایین‌تری را نشان می‌دهند. واضح است اندازه‌های ماتریس‌های پیش‌رونده پیشرفته بیشتر شبیه مؤلفه‌های سیالی توانایی ذهنی عمومی ‌ازجمله مقیاس‌های عملی MAB است تا مؤلفه‌های متبلور که شامل خرده آزمون‌های مقیاس کلامی‌MAB.

جدول ۸ همبستگی‌ها با WAIS-R

خرده آزمون	MAB^a با WAIS-R		WAIS^b با WAIS-R
r		متوسط r	دامنه
اطلاعات عمومی	۸۲/۰		87/0	91/0-81/0
درک و فهم	۷۳/۰		80/0	93/0-52/0
محاسبه	۸۹/۰		82/0	93/0-27/0
شباهت‌ها	۶۶/۰		78/0	90/0-33/0
واژگان	89/0		86/0	96/0-26/0
نماد ارقام	۴۵/۰		84/0	98/0-29/0
تکمیل تصاویر	۸۷/۰		74/0	90/0-30/0
تجسم دیداری	۴۴/۰		88/0	97/0-74/0
تنظیم تصاویر	۸۶/۰		62/0	84/0-15/0
الحاق قطعات	65/0		80/0	98/0-14/0
مقیاس کلامی	۹۴/۰		91/0	96/0-73/0
مقیاس عملی	۷۹/۰		89/0	97/0-76/0
کل مقیاس	۹۱/۰		93/0	98/0-85/0
توجه: ^a از جکسون (۱۹۸۴) ۱۴۵= N؛ نمونه ترکیبی، همبستگی‌های محاسبه‌شده با استفاده از نمرات استانداردشده (برای خرده آزمون‌ها) و مجموع نمرات استانداردشده (برای کل مقیاس‌ها). ^bهمبستگی‌های گزارش‌شده توسط لیپولد و کالیبورن (۱۹۸۳)، میشرا و براون (۱۹۸۳)، رابورن (۱۹۸۳)، اسمیت (۱۹۸۳) و وکسلر (۱۹۸۱) که با استفاده از تبدیل r به z فیشر میانگین‌گیری شده‌اند.

جدول ۹ همبستگی‌های بین MAB و ماتریس‌های پیش‌رونده پیشرفته ریون (۱۰۳=N)

خرده آزمون	همبستگی
کلامی اطلاعات عمومی	19/0
درک و فهم	۲۳/۰
محاسبه	۴۶/۰
شباهت‌ها	۱۳/۰
واژگان عملی	۱۴/۰
نماد ارقام	۲۵/۰
تکمیل تصاویر	۳۰/۰
تجسم دیداری	۴۴/۰
تنظیم تصاویر	۳۱/۰
الحاق قطعات	56/0
توجه: اقتباس از کرانزلر و جنسن (۱۹۹۱) با همبستگی‌ها از جی اچ. کرانزلر، ارتباط شخصی با مایکل سی. اشتون، ۱۵ آوریل ۱۹۹۸٫

اجرای تست‌های هوش و استعدادیابی در مرکز مشاوره جوانه رشد تبریز

لازم به ذکر است که مجموعه آزمون‌های استعداد چندبعدی (جکسون، ۲۰۰۳) توسط دکتر اکبر رضایی در سال۱۳۹۰ در ایران ترجمه و انطباق یابی شده است. مرکز جوانه رشد تبریز این افتخار را دارد که به مدیریت دکتر اکبر رضایی در جهت کشف استعداد دانش آموزان و دانشجویان با استفاده از این آزمون و دیگر آزمون‌های معتبر هوش خدماتی به همشهریان عزیز ارائه دهد.

مفهوم و نظریه‌های هوش

هوش به‌عنوان یک سازه فرضی

برخی مفروضه‌ها در مورد توانایی‌های شناختی

بافت تاریخی آزمودن هوش

مبانی تست هوش

جنبه‌های کلی و خاص هوش

نظریه‌های نوین درباره هوش

ماهیت و هدف مجموعه آزمون‌های استعداد چندبعدی (MAB-II)

ویژگی‌های عمومی ‌ MAB-II

کاربردهای موردنظر

ماهیت مقیاس‌ها

نوع سؤالات

اهداف تأثیرگذار در توسعه MAB-II

خاستگاه خرده آزمون‌های کلامی ‌و عملی MAB

ویژگی‌های منحصربه‌فرد MAB-II

تفسیر تفاوت‌های خرده آزمون‌های استعداد چندبعدی (MAB-II)

نسبت پایداری/ ناپایداری

استانداردسازی و ویژگی‌های روان‌سنجی MAB-II

استانداردسازی MAB-II

نمونه هنجاری

هنجارهای گروه‌های سنی

هنجارهای تبدیل نمره میزان شده

هنجارهای مجموعه آزمون‌های کلامی، عملی و مقیاس کامل

پایایی

پایایی همسانی درونی

پایایی باز آزمایی

اثرات محدودیت زمانی

همبستگی متقابل مقیاس‌ها و تحلیل عاملی

همبستگی‌ با WAIS-R

مقایسه ساختارهای عاملی MAB و WAIS-R

مقایسه MAB و ماتریس‌های پیش‌رونده پیشرفته ریون

اجرای تست‌های هوش و استعدادیابی در مرکز مشاوره جوانه رشد تبریز

جوانه رشد: یه مرکز مشاوره خوب

مرکزی برای سلامت رفتاری کودکان، نوجوانان، بزرگ‌سالان و خانواده‌ها

ارسال یک پاسخ لغو پاسخ

محبوب‌ترین ها

داغ‌ترین اخبار

ما را در اینستاگرام دنبال کنید @javaneyeroshd_com