مدیریت در قرن 21 ( انجمن علمی علوم تربیتی دانشگاه آزاد اسلامی کرمانشاه)
راز پیشــــرفت، در آغــاز کـــردن است. راز آغـــاز کــــردن در آن است که وظایـــف سخت و پیچیده خـود را به وظایــف کوچکـــی که قـابل مدیـــریت کــــردن باشند، بشکنید و سپس از اولیـن آنهــا آغـــاز کنیـــد.(مارک تواین)
کلمات کلیدی مطالب
نویسنده: امید حیدری فر - چهارشنبه ٢٠ شهریور ۱۳٩٢

یکی از هدفهای عمدة هر علم ، اندازه گیری پدیده های مورد نظر و دادن جنبة کمی به آنهاست. وقتی پدیده ای را با اعداد و ارقام نشان می دهیم براحتی می توانیم آن را طبقه بندی و قوانین دربارة آنها وضع کنیم.
هر علم روان شناسی، مجموعه شیوه هایی که به ما کمک می کند تا ویژگیهای روانی اسنان را از حالت کیفی به حالت کمی درآوریم.
اصطلاحاً «روش روان سنجی» نامیده می شود. روان سنجی، در معنای وسیع کلمه، یعنی استفاده از روش آزمایش. اما در معنای محدود کلمه یعنی بهره گیری از آزمونهای روانی برای اندازه گیری توانائیهای ذهنی.

تعریف آزمون روانی :
اگر استعداد را امکان انجام دادن یک عمل یا آشکار ساختن یک رفتار در نظر بگیریم. آزمون روانی به فن یا شیوه ای که به طور علمی تهیه می شود و امکان ارزشیابی عین استعدادهای فردی را فراهم می آورد تعریف می کنیم.
استعمال روزافزون آزمون ها و ظهور انواع مختلف آزمایشهای روانی باعث شده تا تعریف آزمونها از دقت و صراحت بیشتری نسبت به گذشته برخوردار شوند.
تعاریف مختلف آزمون عبارتند از:
پروفسور آندره زی (1970ـ پاریس) آزمون روانی را چنین تعریف می کند: وسیله تمایز بین افراد براساس یک درجه بندی.
تعریف آناستازی (1970ـ لندن) از آزمون: اندازة استاندارد و عینی از چگونگی یک رفتار.
تعریف پیرپیشو (روان شناس معاصر فرانسوی) از آزمون: یک موقعیت استاندارد شده که به عنوان انگیزه برای یک رفتاربه کار می رود. این رفتار، کمی یا کیفی، با میانگین افراد دیگری که در همان موقعیت قرار گرفته اند مقایسه می شود. این مقایسه اجازه می دهد تا رفتار فرد به صورت کمی نمره گذاری شود یا از نظر تیپ شناسی طبق بندی گردد. به عبارت دیگر، رفتار فرد به صورت عددی یا توصیفی ارزشیابی شود.
تعریف پیرپیشو از آزمون، چهار مورد را ایجاب می کند:
الف) موقعیت تجربی (محیط اجرای آزمون، مواد آزمون، نگرش آزماینده و ) باید به طور کامل تعریف شود و همة موارد بطور یکسان تکرار گردد.
ب) ثبت رفتاری که آزمودنی در مقابل آزمون نشان می دهد باید صریح و عینی باشد. بر حسب موارد آزمون، بسیار متنوع خواهد بود.
ج) رفتار ثبت شده باید، نسبت به رفتار گروهی از آزمودنیها مقایسه و ارزشیابی اماری قرار گیرد. این مقایسه الزامی است و آزمایش که مقایسه آماری نداشته باشد آزمون روانی به حساب نمی آید.
د) طبق بندی آزمودنی نسبت به گروه مرجع هدف نهایی یک آزمون می باشد.
تعریف انجمن بین المللی پیسکوتکنیک1 از آزمون که نسبت به تعاریف فوق کاملتر است. عبارت است از: یک آزمایش معین که انجام فعالیتی را ایجاب می کند، برای همة آزمودنیها یکسان است.
شیوة مشخص برای برآورد موفقیت یا شکست یا درجه بندی عددی موفقیت دارد. فعالیت آزمودن ممکن است شامل معلومات اکتسابی (ازمونهای معلومات)، کنشهای حس ـ حرکتی یا روانی (آزمونهای روان شناختی) باشد.
انواع آزمونهای روانی :
شروع واقعی آزمونهای روانی از سال 1896، با مقاله ای که توسط آلفرد بینه و ویلیام هانری در مجلة روان شناس منتشر کردند آغاز شد و در آن مقاله اکثر آزمونهای موجود را که به نظر آنها فقط اعمال بسیار ساده و پائین ذهن را اندازه می گرفتند مورد انتقاد قرار دادند. آنها ، برای اندازه گیری استعدادهای واقعی ذهن، آزمونهایی را پیشنهاد کردند که به رفتار زندگی واقعی نزدیکتر بود. آزمون یک روش نظامه ای برای سنجش نمونه ای از رفتار و یک وسیلة اندازه گیری در روان شناس و تعلیم و تربیت است. اندازه گیریهای روانی و تربیتی، علاوه بر آزمون که معروفترین وسیلة اندازه گیری است، با روشهای دیگری مثل مشاهده و مصاحبه و پرسشنامه و فهرست خصوصیات و مطالعات بالینی و نیز انجام می گیرد. با توجه به تعداد بسیار زیاد آزمونها و کثرت و پیچیدگی جنبه های مختلف رفتار آدمی، طبقه بندی انواع آزمونهای روانی و تربیتی بسیار مشکل است و نمی توان رضایت همگان را جلب کرد. طبقه بندی هایی که از آزمونها به عمل می آید، دیدگاههای مختلفی را منعکس می کند. البته هر نوع طبقه بندی ای که به عمل آید مطلق نخواهد بود بلکه تا اندازه ای نظر شخصی مؤلف را منعکس خواهد کرد. طبقه بندی آزمونها به خاطر تسهیل در کار انجام می گیرد.
می توان آزمونها را از دیدگاههای مختلف طبقه بندی کرد:
1ـ طبقه بندی از نظر عملکرد .
2ـ طبقه بندی از نظر ماهیت محتوا .
3ـ طبقه بندی از نظر شیوة کاربرد .
4ـ طبقه بندی از نظر هدف عملی .
5ـ طبقه بندی از نظر فن تهیه .
که ما در مورد هی یک توضیحی مختصر می دهیم.
1ـ طبقه بندی از نظر عملکرد : 
این نوع از طبقه بندی جنبة بنیادی دارد و تقریباً در همة کتابهای پیسکوتکنیک مورد قبول واقع شده است. مثلاً می گویند که فلان آزمون، هوش، استعداد، شخصیت، رغبت و فرد را اندازه می گیرد. با توجه به نظر فوق آزمونها، می توان دو گروه آزمون تشخیص داد که تا اندازه ای مستقل از یکدیگرند:
الف) آزمونهای کارآیی (بازده) .
ب) آزمونها شخصیت (کیفی) .
الف) آزمونهای کارآیی یا بازده : این آزمونها ایجاب می کنند تا آزمودنی بازدهی را از خود نشان دهد و یک واقعیت عینی را تحقق بخشد. این آزمونها زمینة غیرقابل اعتراض روان سنجی را تشکیل می دهند و نیز رضایتبخش ترین طبقه بندی که براساس درجه کمی متغیر مورد آزمایش انجام می گیرد، می باشد. در میان آزمونهای کارآیی، می توان آزمونهای هوش کلی و آزمونهای استعداد را تشخیص داد.
آزمونهای هوش کلی نیز به نوبة خود به دو گروه تقسیم می شوند :
الف) آزمونهای سنی (رشد) .
ب) آزمونهای هوش کمی (مطلق) .
الف) گروه اول آزمونهای سنی : هوش را به عنوان کنش در نظر می گیرد که به موازات پختگی متحول می شود. گروه دوم آزمونهای هوش کمی، سعی می کند تا استعداد ذهنی را مستقل از عامل رشد اندازه بگیرد و مخصوصاً اندازه گیری هوش بزرگسال را مورد توجه قرار می دهد. واقعیت این است که بسیار از آزمونها به هر دو گروه تعلق دارند. تنها شیوة بیان نتایج فرق یم کند. بعضی از آزمونها نیز به طبقة آزمونهای کارآیی تعلق دارند اما در کاربرد آنها جنبه های کیفی از اهمیت بیشتری برخوردار است. مانند مقیاسهای تحلیلی و آزمونهای تفکر مفهومی.
مقیاسهای تحلیل از سریهای مختلف تشکیل می شوند که هر یک بطور جداگانه نمره گذاری می شود و بعد جمع کل نمرات به دست می آید. بنابراین این آزمونها نه تنها سطح روان بلکه ساخت آن را نیز مشخص می کنند. آزمونهای تفکر مفهومی سعی می کنند بیشتر به روش بالینی نزدیکتر شوند و در اجرای آنها آزمایشگر سعی می کند تا شیوة تشکیل مفاهیم را در نظر بگیرد نه نتایج تشکیل آنها را. با وجود این آزمونهای تحلیلی بازده را نیز در نظر می گیرند. به کمک آنها می توان سطوح خاص و سطح کل را که از مجموع سطوح خاص حاصل می شود، به دست آورد. این آزمونها اجازه می دهند تا افراد از نظر بازده مطلق خود و از لحاظ ساخت ذهنی خود مورد مقایسه قرار گیرند.
ب) آزمونهای شخصیت یا کیفی : آزمونهای شخصیت به تعیین منش، جنبه های کیفی و عناصر غیرشناختی (غیرقابل اندازه گیری) رفتار زمینة روان توصیفی1 تعلق دارند. می توان آزمونهای شخصیت را که امروزه تعدادشان بسیار زیاد است به طور کلی به دو گروه بزرگ تقسیم کرد:
آزمونهای تحلیلی (عینی) ، آزمونهای فرافکن (ترکیبی) .
در مورد آزمونهای شخصیت، معمولاً آزمونهای عینی در مقابل آزمونهای فرافکن سخن به میان می آورند. در واقع آزمونهای عینی و فرافکن، نه دو مقولة کاملاً مخالف، بلکه آزمونهای عین شخصیت معمولاً شامل یک دسته سؤالات مکتوب هستند که پاسخ آنها به صورت صحیح یا غلط، آری یا نه، موافق یا مخالف و یا جوابهایی از این قبیل داده می شود. نمره گذاری این آزمونها کاملاً عینی است. زیرا پاسخهای آزمون شونده فاقد ابهام است. پرسشنامة شخصیتی کالیفرنیا، پرسشنامة شخصیتی چند وجهی مینه سوتا و آزمون زمینه یابی خلق و خویی گیلفرود ـ زیهرمان در شمار آزمونهای عینی شخصیت به حساب می آیند.
در آزمونهای فرافکن، آزمون شونده معمولاً باید پاسخ خود را با استفاده از اطلاعات بسیار محدود ارائه نماید و از آنجا که در ارزیابی پاسخها به جای شمردن سؤالاتی که پاسخ معینی به آنها داده شده باید به تعبیر و تفسیر پاسخها پرداخت، نمره گذاری این آزمونها جنبة ذهنی تری دارد. توسعة آزمونهای فرافکن با این فرض همراه بوده که وقتی شخص در مقابل یک وضعیت مبهم قرار داده شود، به ایجاد پاسخهایی می پردازد که برگرفته از شخصیت بی همتای خود اوست. آزمونهای فرافکن شخصیت، از نظر اجرا، نمره گذاری، و تعبیر و تفسیر نتایج نیازمند افراد حرفه ای و کاملاً آموزش دیده هستند. آزمون لکه های جوهر رورشاخ، آزمون اندریافت موضوع از جمله آزمونهای فرافکن هستند.
بسیار اتفاق می افتد که یک آزمون کارآیی در عین حال به عنوان یک آزمون شخصیت نیز به کار می رود. نتیجة عددی، سطح بازدهی آزمون را بیان می کند، رفتار هر جریان آزمایش و شیوة حل مسأله، شخصیت او را منعکس می سازد. اما در آزمون کارآیی فقط بازده فرد مورد نظر است، در حالی که در آزمون شخصیت، حتی اگر ایجاب کند که نتایج به صورت کمی درآیند، شیوة بودن فرد مورد توجه است.
2ـ طبقه بندی از نظر ماهیت (محتوا ظاهری) :
می توان دو نوع آزمون تشخیص داد: آزمونهای کلامی و آزمونهای غیرکلامی (عملی) .
در آزمونهای کلامی سعی می شود توانایی آزمودنی را در زبان گفتاری و نوشتاری اندازه بگیرد که البته بیشتر درک کلام مطرح است نه طرز بیان آن. در آزمونهای غیر کلامی، توانائیهای ملموس و واقعیتهای عملی را به کار می گیرند. این تقسیم بندی به این صورت توجیه می شود که دو نوع هوش یا دو نوع سازگاری وجود دارد: انتزاعی و ملموس، کلامی و عملی. به علاوه، در بعضی موارد به کار بردن آزمونهایی که زبان گفتاری و زبان نوشتاری را اندازه بگیرند امکان پذیر نیست. کودکان خردسال، نابهنجارها، کر و لالها، بیسوادها، افرادی که زبان آزمایشگر را نمی دانند. زمانی که اندازه گیری تواتائیهای لازم برای مشاغل فنی مورد نظر است، آزمونها الزاماً باید عملی باشند.
3ـ طبقه بندی از نظر شیوه کاربرد :
از لحاظ شیوة کاربرد نیز دو نوع آزمون وجود دارد: آزمونهای فردی و آزمونهای گروهی .
تا سال 1917 همة آزمونهای روان شناختی کاربرد انفرادی داشت، فقط آزمونهای تحصیلی بودند به صورت گروهی اجرا می شدند. آزمونهای ارتش، نقطه شروع آزمونهای گروهی را تشکیل می دهد. محاسن و معایت آزمونهای گروهی و آزمونهای فردی :
مهمترین امتیاز اجرای آزمونهای گروهی :
1ـ صرفه جویی در زمان: از آنجا که آزمودنیها در یک ساعت معین تحت آزمایش قرار می گیرند، همة دستورالعملهای یکساین را دریافت می کنند.
2ـ تضمین یکنواختی موقعیت آزمایش.
3ـ لزومی ندارد که اجراکنندة این آزمونها تخصص داشته باشد.
4ـ نمره گذاری در مجموع بسیار ساده، سریع و عینی انجام می گیرد: در بسیاری از موارد سعی می شود، پاسخها را با ماشین تصحیح کنند.
5ـ تهیه فرمهای موازی آزمونهای گروهی به پیچیدگی تهیه فرمهای موازی آزمونهای فردی نیست.
6ـ مقرون به صرفه بودن از نظر هزینه: زیرا فقط یک نوع مواد لازم دارند که معمولاً به صورت /// در اختیار داوطلبان قرار می گیرد، گاهی یک مواد و یک کاغذ کفایت می کند.
با این وجود آزمونهای گروهی معایبی نیز دارند. در مورد کودکان خردسال قابل اجرا نیستند. چون این کودکان غالباً در خانواده زندگی می کنند، جمع آوری آنها دشواراست. به همین دلیل کاربرد آزمونهای گروهی را محدود می سازد. این آزمونها را در مورد عقب مانده هایی که نمی توانند با گروه پیش بروند، نمی توان به کار برد. در اجرای این آزمونها نمی توان رفتار آزمودنی را در جریان آزمایش یادداشت کرد. خطر رونویسی از ورقة پهلودستی و مسابقة تمرین، در آزمونهای گروهی بیستر در آزمونهای فردی است. خطر افشا و انتشار آزمونهای فردی بسیار کم است. تصحیح آزمونهای گروهی به دلیل غیابی بودن در صورت ابهام در پاسخها مشکل است و نمی توان آنها را روشن کرد.
هر موقع به یک بررسی عمیق نیاز باشد باید حتماً از آزمونهای فردی کمک گرفت. از آزمونهای فردی در مورد برخی از گروههای جمعیت مانند کودکان خردسال، افراد معلول ذهنی، بیماران روانی و استفاده می شود. بعضی از آزمونهای فردی عبارتند از: مقیاس هوش استنفورد بینه، مقیاسهای هوش و کسلر، و مقیاسهای بیلی از رشد اطفال و پرسشنامه شخصیتی کالیفرنیا، شخصیت سنج جند وجهی مینه سوتا (MMPT)، آزمون استعداد تحصیلی SAT ، نمونه هایی از آزمونهای گروهی است.
4ـ طبقه بندی از نظر هدف عملی:
می توان آزمونها را به دو گروه آزمونهای تشخیص و آزمونهای پیش بینی تقسیم کرد. هدف گروه اول این است که حالت فعلی آزمایش شونده را تعیین کند تا اقداماتی در مورد او به عمل آید. هدف گروه دوم این است که پیش بینی کم و پیش دراز مدتی را در مورد افراد به عمل آورد. مثلاً آزمونهای راهنمایی شغلی. این تقسیم بندی براساس ماهیت مواد آزمونها انجام نمی گیرد. بلکه براساس کاربرد آنها انجام می گیرد. هر آزمونی الزماماً یک آزمون تشخیص است، اما این تشخیص، در بعضی موارد، ارزش یک پیش بینی را دارد.
5ـ طبقه بندی از نظر فن تهیه:
از این نظر نیز آزمونها دو گروه متمایز هستند: استفاده از روش های غیرتجربی برای تعیین روایی و تحلیل عاملی برای تعیین روایی.
گروه اول را معمولاً در مقابل گروه دوم قرار می دهند. روایی گروه اول رویهمرفته به معیارهای ذهنی استوار است. در حالی که روایی گروه دوم بر تحلیل /// تکیه می کند. در مودر این قسمت در بخش ویژگیهای آزمونها بخش روایی توضیح کاملتری خواهیم داد.
ویژگی های آزمون: تهیه علمی آزمون باید به صورتی باشد که دارای ویژگیهای خارجی و داخلی باشد تا نتایج قابل اطمینان و قابل مقایسه ای را فراهم آورد. مؤلفان شرایط یا ویژگیهای بسیار زیادی را برای یک آزمون قایلند مانند کلاپارد، که بیست ویژگی را نام می برد.
ویژگیهای آزمون به دو دسته ویژگیهای اصل و ویژگیهای فرعی تقسیم می شود:
ویژگیهای اصلی یک آزمون عبارتند از:
روایی، درجه بندی، اعتبار یا ثبات. استاندارد بودن این چهار ویژگی مستقل از یکدیگر نیستند، بلکه متقابلاً بر یکدیگر اثر می گذارند.
روایی: در لغت نامه دهخدا، روا یعنی این که آزمون باید حاجت آزمایشگر را برآورده کند. یک آزمون هوشی زمانی روایی خواهد داشت که اطلاعات صحیحی از آنچه معمولاً هوش نامیده می شود در اختیار ما بگذارد نه از حافظه و یا از توانائیهای دیگری که رابطة بسیار کمی باهوش دارد.
سنجش روایی :
چگونه باید روایی یک آزمونر را تعیین کرد؟ بنا به گفتة کلاپارد، چگونه باید تستها را تست کرد؟
برای سنجش روایی آزمون راهنمای مختلفی وجود دارد. در غالب این موارد همبستگی نمره های آزمون با معیار مورد نظر محاسبه می شود که این موارد عبارتند از:
1ـ معنی دار بودن آماری: اولین شرط روایی و مفید بودن یک آزمون هنجاری است. معنی دار بودن آماری این مفهوم را دارد که رابطة بین نمره های آزمون با معیار مورد نظر ناشی از تصادف نباشد. در کاربدر روشهای آماری، معنی دار بودن را معمولاً با احتمال خطای 5% یا کمتر معلوم می کنند. به این ترتیب، اگر یک آزمون همبستگی معنی داری با یک معیار نداشته باشد نمی توان گفت که آن آزمون برای سنجش صفت مورد نظر روایی دارد.
2ـ محاسبة خطای معیار برآورد: شاخص میزان اشتباه در پیش بینی یک متغیر مستقل (یا متغیر ملاک) از یک متغیر تابع (یا آزمون) است. فرمول محاسبة این شاخص عبارت است از: ////
در این فرمول: /// انحراف معیار متغیر ملاک، /// مجذور همبستگی میان متغیر پیش بین (n) و متغیر ملاک (y) است.
3ـ استفاده از جدولهای انتظار: نمره های آزمون یکی از ابعاد جدول است و احتمال نسبت موفقیت در کسب هر نمرة آزمون در بدنة جدول ارائه می شود. نسبت افرادی که در یک آزمون در مقایسه با معیار معین به موفقیت می رسند در جدول انتظار نشان داده می شود. مثلاً از روی نمرات کنکور دانش آموزان می توان سطح موفقیت دانشجویان در رشته های مختلف را پیش بینی کرد. یعنی هرچه نمرة آنها در آزمون سراسری بالاتر باشد، احتمال موفقیت آنها در امتحانات دانشگاهی نیز بیشتر است. مهمترین مزیت جدولهای انتظار برای تعیین روایی آزمون این است که فهم آن برای همگان آسان است. این جدولها در مشاورة دانشجوی و تعیین میزان موفقیت آنها در رشته های مختلف تحصیلی نیز مفید است.
4ـ روش استفاده از نرخهای پایه: نرخ پایه را در یک خصوصیت معین را به عنوان نسبت افرادی از جمعیت که دارای آن خصوصیت هستند تعریف می کنیم. این نرخها با استفاده از سوابق تجربه شدة موضوع و محاسبة تعداد دفعاتی که یک واقعة معین در زمانی خاص روی می دهد محاسبه می شود. مثلاً برای تعیین نرخ پایه در موفقیت در آزمون سراسری دانشگاهها برای تحصیلات فوق لیسانس در رشته ای خاص، نسبت افراد شرکت کننده به افراد پذیرفته شده در یک دوره زمانی معین را محاسبه می کنیم. در صورتی که نرخ پایه در یک آزمون خیلی کم یا خیلی زیاد باشد، نمی توان به روایی آن اعتماد کرد و می گوئیم که آن آزمون قدرت تشخیص کافی ندارد.
5ـ نسبتهای انتخاب: یعنی نسبت افرادی است که از یک گروه موجود برگزیده می شوند. مثلاً پذیرش دانشجو برای دورة کاردانی ادبیات فارسی دانشگاه آزاد نسبت به تعداد داوطلبان بسیار زیاد است. در چنین مواردی موقعی یک آزمون را دارای روایی بالا و مربوط به ملاک مورد نظر می دانیم که نرخ انتخاب پائین باشد و به این ترتیب افرادی را که نمره های خیلی بالایی دارند انتخاب می کنیم.
6ـ استفاده از تئوریهای تصمیم: در این روش از تحلیلهای آماری برای تصمیم گیری در شرایط معین استفاده می شود که سعی می شود از استراتژیهایی استفاده کنند که بهترین تصمیم گیری دربارة افراد به عمل آید. مثلاً برای انتخاب افراد برای یک شغل یا برای آموزشهای معین از این روش استفاده می شود. سؤال اصلی در تئوری تصمیم این است که حداقل نمرة قابل قبول برای یک آزمون باید چقدر باشد. در این موارد تصمیم گیرنده باید عوامل گوناگونی را مورد نظر قرار دهد تا انتخاب افراد مناسب به بهترین صورت ممکن انجام گیرد و از این طریق روایی لازم فراهم آید.
انواع روایی:
1ـ روایی ظاهری: یعنی این که مواد یا سؤالات آزمون از نظر ظاهر شبیه موضوعی باشد که مورد اندازه گیری است.
2ـ روایی محتوا: یعنی این که آزمون باید ارتباط کامل با کل زمینة مورد نظر داشته باشد. روایی محتوا بیشتر در آزمونهای پیشرفت تحصیلی مورد نظر است.
3ـ روایی پیش بینی: یعنی این که بین نتایج حاصله از اجرای آزمونها و نتایجی که بعداً به دست می آید همبستگی و قرابت وجود داشته باشد. اصولاً کاربرد روزافزون آزمونها به خاطر روایی پیش بینی آنهاست.
4ـ روایی همزمان: نتایج آزمونها را با نتایجی که همزمان با اجرای آنها پایه فاصلة کمی بعد از اجرای آنها به دست می آید مقایسه می کنند. مثلاً اگر ازمونی بسازیم و در همان زمان بخواهیم روایی آن را تعیین کنیم می توانیم نتایج آن را با نتایج آزمون دیگری که در همان زمینه وجود دارد و دربارة همان گروه اجرا می شود مقایسه کنیم.
5ـ روایی سازه (روایی مفهومی): عبارت است از تطابق نتایج یک آزمون با پیش بینی هایی که توسط یک نظریه یا سایر واقعیات شناخته شده به عمل آمده است. مثلاً نظریه های زیادی در مورد هوش وجود دارد. از جمله این که هوش موجب سازگاری با موقعیت تازه می شود. بنابراین، اگر نتایج حاصله از اجرای یک آزمون بر روی یک گروه، با نتایج حاصله از قدرت سازگاری همان گروه، که براساس معیارهای مورد قبول فراهم آمده است، همبستگی نشان دهد، خواهیم گفت که آزمون مذکور دارای روایی سازه یا رویایی مفهومی است.
درجه بندی:
درجه بندی یک آزمون یعنی تعیین درجات موفقیت و واحدهای رفتار به منظور مقایسة عینی نتایج افراد مختلف. این واحدها و این هنجارها، که امکان مقایسة افراد را فراهم می آورد، برحسب ماهیت متغیر مورد ارزشیابی، متفاوت است.
چگونه آزمونها را درجه بندی می کنند؟ آزمونها را درباره گروههایی که از تعداد زیادی آزمودنی تشکیل شده اند اجرا یم کنند. تعداد آزمودنیها حتماً باید زیاد باشد تا خطاهای تصادفی جبران شود و این شرط از ضروریات وضع قوانین آماری است. باید این گروهها معرفِ مجموعة کسانی باشند که آزمون بعداً دربارة آنها اجرا خواهد شد. به عبارت دیگر، لازم است که نمونة اولیه روایی داشته باشد. ترمن نیز آزمونهای مقیاس خود را در مورد هزاران کودکی که به همة طبقات اجتماعی و به اکثر ایالات کشورش تعلق داشتند، بدون انتخاب قبلی، اجرا کرد و با این طریق سؤالاتی را که رویهمرفته توسط یک گروه سنی پاسخ داده شده بود تعیین نمود. در واقع سؤالی را برای یک گروه سنی مناسب می دانند که 75% آن گروه پاسخ صحیح بدهند. اگر سؤالی توسط همة افراد یک گروه سنی پاسخ داده شود، بسیار آسان خواهد بود و قدرت تمایز نخواهد داشت. در این صورت گروههای کودکان همان سن، نسبت به متغیر، متجانس نخواهند بود. گروههای سنی معمولاً افرادی را شامل می شوند که تاریخ تولد آنها بین 12 ماه توزیع می گردد. به این ترتیب، گروه سنی 8 ساله ها کودکانی را شامل خواهد شد که بین 7 سال و 6 ماه و 8 سال و 6 ماه سن دارند.
چون محیط اجتماعی همیشه در مورد اکثر تواناییهایی که توسط آزمونها اندازه گیری می شود تا اندازه ای اثر می گذارد، یا لااقل شیوة تجلی آنها از لابلای رفتار را تحت تأثیر قرار می دهد، لازم است که درجه بندی آزمونها برای محیطهای تقریباً محدود صورت بگیرد.
بنابراین، آزمون مورد نظر هرچه باشد، نتیجة خام آن معنایی نخواهد داشت، زیرا به صورت نسبی نیست. برای این که نتیجة خام معنای روشنی داشته باشد باید با هنجارها (نورمها) مقایسه شود. فقط در این صورت می توان از بالاتر یا پایین تر، از بهنجار یا نابهنجار صحبت کرد.
بعضی مؤلفان از ظرافت، حساسیت و قدرت تشخیص آزمونها حرف می زنند. همة این خصایص به درجه بندی آزمونها بستگی دارد. هر اندازه یک آزمون امکان اندازه گیری تفاوتهای بسیار کوچک را بیشتر فراهم آورد به همان اندازه بیشتر حساسیت خواهد داشت. هر اندازه گستردگی مقیاس بزرگتر باشد، به همان اندازه حساسیت کمتر خواهد بود. در بسیاری از موارد، آزمونهای هوشی بزرگسالان فاقد حساسیت لازم است. این آزمونها نمراتی را فراهم می آورد که فاصلة زیادی از یکدیگر دارند و تغییرات ضعیف را نشان نمی دهند. زمانی که اندازه گیری کنشهای سطوح پایین مورد نظر است، مثلاً اندازه گیری زمان واکنش، سرعت حرکات و آستانه های حسی، تهیة ابزار حساس چندان مشکل نیست. بعضی روان شناسان آن قدر پیش می روند که سرعت اَعمال را تا یک صدم ثانیه اندازه می گیرند، چیزی که در عمل ضروری به نظر نمی رسد. بتدریج که در مقیاس کنشهای روانی بالاتر می رویم، دشواری تهیة وسایل دقیق و حساس افزایش می یابد. زیرا، هر چند تفاوتهای افراد در اعمال عالی ذهن بسیار آشکار است، این تفاوتها بطور نامحسوس از کمیت محض به کمیت آمیخته با کیفیت تبدیل می شود.
5ـ اعتبار (ثبات ـ ///) :
منظور از اعتبار عبارت است از اعتمادی که می توانی به نتایج یک ازمون (یا مجموعة آزمونها)، که از کاربردهای متوالی آن حاصل می شود، داشته باشیم. بنابراین در این جا انسجام داخلی آزمون مورد نظر است. نتایج یک آزمون می تواند تا اندازه ای تحت تأثیر تغییرات محیط و تمایل لحظه ای آزمودنی قرار گیرد.
برای محاسبة درجه بندی اعتبار و ثبات چهار روش پیشنهاد شده است:
الف) اجرای مجدد یک آزمون: اگر آزمونی را با فاصلة زمانی کم و بیش طولانی در مورد گروهی از آزمودنیها دوبار اجرا کنیم، نتایج ناپایدار و متغیری به دست آوریم، دیگر نمی توانیم به آن اعتماد داشته باشیم. زیرا درجة موفقیت در آن تحت تأثیر عواملی قرار می گیرد که برای ما پوشیده بوده یا کنترل آنها برای ما دشوار است. بدون تردید نمی توان امید داشت که نتایج دو نوبت همیشه یکسان باشد، مخصوصاً اگر فاصلة زمانی بین آنها تا اندازه ای طولانی گردد؛ اما تغییر نتایج هم نباید از حدود معینی تجاوز کند. اگر آزمونی را دوبار و به فاصلة کمی در مورد یک فرد اجرا کنند معمولاً ضریب همبستگی 70% را قابل قبول می دانند، اما اگر همین آزمون روی گروههای افراد اجرا شود ضریب همبستگی 90% مورد قبول خواهد بود.
ب) اجرای فرمهای موازی: دو فرم را وقتی موازی می گویند که در تعیین روایی و در درجه بندی آنها روش یکسانی به کار رود. بنابراین، دو فرم موازی یک آزمون ارزش تشخیصی یکسانی دارد و فقط از نظر محتوای ظاهری از یکدیگر متفاوت است. مثلاً مقیاس اصلی ترمن از دو فرم تشکیل شده بود: فرمهای M و L . آزمونهای نابسته به فرهنگ کتل نیز دارای دو فرم است: A و B . کاربرد دو فرم موازی یک آزمون برای این است که از تغییرات ناشی از یادآوری و تمرین قبلی جلوگیری شود. اگر آزمونها به کنشهای سطوح پایین (قدرت ماهیچه ای، زمان واکنش، دقت حرکات) تعلق داشته باشد، آثار یادآوری و تمرین یا وجود نخواهد داشت یا کم خواهد بود. به هر حال، تمرین، برحسب افراد مختلف، آثار متفاوتی به همراه دارد. افراد متوسط بهرة بیشتری از آن کسب می کنند. آزمونی که اعتبار کمی دارد شبیه ساعتی است که برحسب موقعیت جلو می رود
یا عقب می ماند، بدین معنی که مکانیسم آن به عوامل حرارت، درجة رطوبت هوا، طرز قرار گرفتن در دست، بستگی پیدا می کند.
به فاصلة چند ماه اجرا، ضرایب همبستگی مجموعه آزمونهای مختلف بین 54% تا 84% ، آزمونهای مهارت حرکتی فقط 40% و آزمونهای هوش بین 70% تا 93% به دست آمده است. لازم به یادآوری است که ارزش ضرایب اعتبار، به نسبت افزایش فاصله بین دو اجرا، کاهش می یابد. در مجموع می توان گفت که ضرایب 80% الی 90% اعتبار رضایت بخشی را برای آزمونها تضمین می کند.
ج) روش فرد ـ زوج: گاهی از یک آزمون دو فرم موازی در دست است اما امکان اجرای آن در دو نوبت وجود ندارد، گاهی هم از یک آزمون دو فرم موازی موجود نیست. در این گونه موارد، برای تعیین اعتبار یک آزمون، از روش فرد ـ زوج استفاده می کنند. بدین ترتیب که وقتی آزمون بطور طبیعی اجرا شد و هر سؤال نمره گذاری گردید، به جای محاسبة نمرة کل، آزمونر را به دو قسمت تقسیم می کنند و نمرة هر قسمت را جداگانه به دست می آورند. معمولاً سؤالات را به دو گروه فرد و زوج تقسیم می کنند تا آثار تمرین، خستگی و دشواری در هر دو قسمت بطور یکسان توزیع شود. این روش را در مورد همة آزمایش شوندگان به کار می برند و بین دو سری نتیجه ضریب همبستگی به دست می آورند. ضریب به دست آمده اعتبار نصف تست خواهد بود. برای محاسبة اعتبار تمام تست از فرمول اسپیرمن ـ براون، که به صورت زیر نوشته می شود، استفاده می کنند:
فرمول تایپ شود.
در این فرمول، 11 = ضریب اعتبار تمام تست، 
                     r = ضریب همبستگی بین دو نیمة تست.
مثال: اگر ضریب همبستگی بین دو نیمة آزمون برابر 60% باشد ضریب اعتبار کل آزمون چنین به دست خواهد آمد:
فرمول تایپ شود.
هرگز نباید نیمة اول یک آزمون را با نیمة دوم آن مقایسه کنیم، مخصوصاً اگر زمان اجرای آزمون محدود باشد. دو نیمة اول و دوم یک آزمون در موقعیت کاملاً متفاوت اجرا می شود، زیرا، از یک طرف، همة سؤالات نیمة دوم توسط همة آزمودنیها پاسخ داده نمی شود، از طرف دیگر، نیمة دوم از اثرات تمرین بهره مند می گردد. برای این که بتوان تستی را، با استفاده از روش فرد ـ زوج، دو قسمت کرد، تعداد سؤالات آن نباید زیاد محدود باشد.
د) ضریب انسجام: در این روش، مثل روش فرد ـ زوج، ازمون فقط یک بار اجرا می شود و میزان همبستگی درونی یا تجانس سؤالات مورد بررسی قرار می گیرد. در این جا ضریب به دست آمده بین 0 و 1 متغیر خواهد بود و هر اندازه به 1 نزدیکتر باشد به همان اندازه تعادل سؤالات آزمون بیشتر خواهد بود. برای محاسبة تجانس درونی آزمون، از فرمول 21 کودروریچاردسون (K1R21)36 استفاده می کنند. فرمول مذکور به صورت فرمول/// نوشته می شود که در آن n = تعداد سؤالات، X = میانگین نمرات و2 S  = واریانس نمرات. مثال: اگر میانگین نمرات یک آزمون 40 سؤالی برابر 25 و واریانس آنها 16 باشد ضریب انسجام آزمون به صورت زیر محاسبه خواهد شد:
فرمول تایپ شود.
6ـ استاندارد بودن :
به دنبال انجام یک آزمون، برای این که مقایسة افراد با یکدیگر مشروع باشد، باید در اجرا و نمره گذاری سؤالات روش یکسانی به کار رود. نمی توان نتایجی را که در موقعیتهای مختلف به وجود آمده است با یکدیگر مقایسه کرد. این امر یکی از قواعد اصلی روشهای تجربی است. در مورد آزمونها، غیر از تنوع استعداد مورد نظر، همة موقعیتها باید مساوی باشد. با وجود این، یادآور می شویم که در زمینة روان شناسی، ایجاد موقعیتی که بطور مطلق یکنواخت باشد غیرممکن است. عوامل بسیار متعدد و غیرقابل کنترلی بر آزمودنی تأثیر می گذارد.
به منظور تضمین یکنواختی شرایط اجرا، آزمونها همیشه دستورالعملهایی به همراه دارد. این دستورالعملها باید دقیقاً رعایت شود، زیرا در تنظیم نورمها مورد استفاده قرار گرفته است. کوچکترین تغییری که آگاهانه یا ناآگاهانه در دستورالعمل آزمونها داده شود الزاماً بر رفتار آزمودنی اثر خواهد گذاشت و این اثر گاهی قابل اغماض و در بسیاری از موارد آشکارا محسوس و مخلّ خواهد بود.
عناصر مورد نظر در استاندارد بودن یک آزمون:
1ـ زمان اجرای تست که می تواند محدود یا نامحدود باشد. در روشی که محدودیت زمانی دارد، مدت انجام آزمایش قبلاً تعیین می شود (مثلاً یک فرد چند علامت را می تواند در دو دقیقه خط بزند یا چند مسأله را می تواند در یک ربع ساعت حل کند) ؛ در روشی که محدودیت کاری دارد، آزمودنی باید کار محول شده را به اتمام برساند و به محض اتمام آن آزماینده زمان صرف شده را یادداشت می کند.
2ـ نظم ارائه سؤالات نیز همیشه بی اثر نیست و در مورد بعضی آزمونها این نظم از قبل تعیین شده است.
3ـ شکل سؤالات .
4ـ نگرش آزماینده .
5ـ محل اجرا و مواد مورد استفاده نیز جزء عناصر اصلی به حساب می آید. مسلماً عناصر دیگری نیز وجود دارد که در دستورالعمل صراحتاً به آنها اشاره می شود. نباید چیزی از دستورالعمل را تغییر دهیم، حتی اگر علت بعضی قواعد خاص را ندانیم و بعضی سؤالات به نظرمان مبهم یا غلط برسد؛ در غیر این صورت ممکن است بعضی کارها را خیلی آسان یا خیلی دشوار سازیم. گاهی اتفاق می افتد که اجراکنندگان آزمونها، دشواریهایی را در رعایت مواد دستورالعمل احساس می کنند. در واقع بسیاری از انتقادهای ناروا علیه آزمونها در اثر نتایج گمراه کننده یا نامناسبی است که به علت عدم توجه به استاندارد بودن آزمونها یا اجرای آنهایی که متناسب با موارد اجرا نبوده به وجود آمده است. کوششهایی که برای یکنواختی روش اجرای آزمونها به عمل آمده، بعضی مؤلفان را وادار کرده است تا از ضبط صوت استفاده کنند.
قطعاً آزمونها ماشینهای معجزه گر نیست و این چیزی است که باید با صراحت خاطر نشان شود. همیشه تغییراتی از یک آزمایش به آزمایش دیگر وجود خواهد داشت. قبول این که در دو نوبت متوالی بتوان موقعیت کاملاً یکسانی ایجاد کرد، خیالی بیش نیست و به همین دلیل است که حتی بهترین آزمونها هرگز اعتبار مطلق ندارد.
نمره گذاری پاسخها نیز باید با قواعد یکنواختی انجام گیرد. برای تفسیر و طبقه بندی پاسخهای آزمودنی فقط یک راه وجود دارد، راهی که توسط سازندگان آزمون پیش بینی و تثبیت شده است. نمره گذاری آزمونها گاهی به کمک ماشین انجام می گیرد و این امر موجب صرفه جویی در وقت می شود. با وجود این، استفاده از ماشین برای نمره گذاری همة انواع آزمونها امکان پذیر نیست.
قاعده ای که برای اجرای همة آزمونها لازم است خَلقِ جَوّ مناسب، بطوری که آزمودنی با خیال راحت کار محوله را انجام دهد. ایجاد حالت اعتماد از ضروریات است و هر نوع مزاحمت یا عامل بازدارنده را از بین می برد. خطر عدم اعتماد مخصوصاً زمانی بیشتر خواهد بود که آزمودنیها کودک یا افراد هیجانی باشند. شخصیت آزمایشگر مهمترین عاملی است که می تواند حصول یک فضای اطمینان بخش را تضمین کند. تخصص داشتن و آزمون را طبق دستورالعمل اجرا کردن به تنهایی کافی نیست، بلکه باید طرز برخورد با آزمودنی را یاد گرفت، نگرشها و سخنان لازم برای خلق یک جو مناسب، جهت انجام کار مورد نظر، را پیدا کرد.
تذکر: افزایش تعداد ویژگیهای یک آزمون خوب تا اندازه ای بیهوده است، زیرا موجب سردرگمی خواهد شد. بعضی ویژگیها استقلال واقعی ندارد و این مامر در مورد چهار خصیصه ای هم که شرح دادیم صادق است. مثلاً اصطلاح انگلیسی استاندارد،‌یک معنای پیچیده و کلی دارد. این اصطلاح حتی جوهر آزمون را تبیین می کند، آزمونی که خود از ویژگیهایی که بطور علمی تهیه شده است، ناشی می شود.
7ـ ویژگیهای فرعی یک آزمون :
ویژگیهایی وجود دارد که به ماهیت آزمون، به عنوان یک وسیلة اندازه گیری، مربوط نمی شود، اما هر وقت احساس شود که به وجود آنها نیازی هست رعایت خواهد شد. در سطور زیر به تعدادی از این ویژگیها اشاره می کنیم:
الف) اقتصاد: آزمونهای مداد ـ کاغذی در موقعیتهای عادی یا لااقل در زمینه های تحصیلی بیشترین امتیاز را دارد. در راهنمایی شغلی، مسألة اقتصاد به صورت دیگری تجلی می کند. استعمال روزافزون آزمونها در زمینه های تحصیلی آزمایشگران را وادار کرده است تا از روشهای کم خرج بهره بگیرند: استفاده از تخته سیاه، استفاده از پاسخنامه برای نوشتن پاسخ سؤالات، خلق تدابیر ماهرانه، که اجازه می دهد تا یک آزمون گروهی چند بار به کار رود.
ب) سرعت اجرا: امروز بیش از همیشه وقت طلاست. در بسیاری از موارد باید بتوان تستی را، بدون آن که صحت و دقت آن لطمه خورده باشد، بطور سریع اجرا کرد. بعضی آزمونها براساس این الزام تهیه شده است. تعداد زیادی از آزمونها نیز با دو فرم ارائه می شود: کامل و کوتاه، که برحسب فرصتی که آزماینده دارد، یکی از این دو انتخاب می شود. آزمونهای گروهی، از نظر صرفه جویی در زمان، بهترین نمونه است.
ج) سادگی اجرا: بعضی آزمونها واقعاً خوب تهیه شده است. اما اجرای آنها اطلاعات روان شناختی و فنی خاصی را ایجاب می کند. در عوض آزمونهای دیگری وجود دارد که برای اجرای آنها تخصص لازم نیست. در واقع نوع اخیر آزمونها موارد استعمال زیادی در زمینة تحصیلی دارد.
د) رغبت: تست باید رغبت لازم را در آزمودنی ایجاد کند و در حقیقت، رغبت جزء ویژگیهای ذاتی آزمونهاست. زیرا هر آزمونی مقداری از رغبت آزمودنی را بسیج می کند.
تجربه نشان داده است، آزمونهایی که برای اندازه گیری هوش کودکان تهیه شده است، برای بزرگسالان مناسب نیست. ماهیت مسائلی که باید حل شود و اعمالی که باید انجام گیرد فاقد رغبت واقعی بوده، در نتیجه توانائیهای حقیقی آزمودنی به دست نخواهد آمد.
برای اجرای هر آزمونی لازم است که در آزمودنی یک رغبت فعال به وجود آید. بهترین نمونة آنها مقیاس /// است. محتوای این تست یا ذهنیت انسان بالغ سازگاری دارد. هوش بزرگسالان را با آزمونهایی که برای کودکان اختصاص دارد، اندازه نمی گیرد.
تهیة آزمونها :
شرایط تهیة آزمونها، برحسب ماهیت آنها، تغییر می کند. ارائه قواعد دقیق بسیار دشوار و احتمالاً غیرممکن خواهد بود. بنابراین، به بیان چند قاعدة کلی اکتفا می کنیم.
الف) انتخاب سؤالات: این قسمت مهمترین و دشوارترین بخش تهیة آزمونهاست. بنابراین، لازم است که سازندة آزمونها اطلاعات دقیقی از یافته های تحلیل عاملی و از اصول کلی آزمون سازی داشته باشد. در این قسمت بهتر خواهد بود که با سایر روان شناسان دربارة تک تک مواد بحث شود.
بعضی سؤالات یا بعضی آزمایشها روایی ندارند. لذا تست سازان عادت کرده اند که از همان ابتدا تعداد سؤالات را بیشتر از تعداد مورد لزوم پیش بینی کنند و در پایان آنهایی را نگهدارند که روایی بیشتری دارند. اما این روش معایبی دارد زیرا احتمال نامتجانس بودن سوالات را افزایش می دهد و کنترل این امر بسیار دشوار است. از طرف دیگر، نتایج اجرای مقدماتی سؤالات، تحت تأثیر زیادی تعداد آنها قرار می گیرد و به شرایطی بستگی پیدا می کند که در اجرای قطعی و نهایی آزمون وجود نخواهند داشت.
روش دیگری که برای تهیة تعداد سؤالات مورد لزوم وجود دارد این است که آنها را به تعداد محدود و در سریهای مختلف تهیه کنند. توصیه شده است که برای هر سری لااقل 20 سؤال مقدماتی تهیه شود. اجرای سؤالات در گروههای 20 تایی اجازه می دهد تا تعداد زیادی از عواملی که نتایج را به طور تصادفی تحت تأثیر قرار می دهند کاسته شود. همچنین محدود بودن تعداد سؤالات به تهیه کنندگان آنها امکان می دهد تا در جهت متجانس بودن سؤالات، مخصوصاً گروه 20 تایی اول، تلاش بیشتری به کار ببرند. مقایسة گروههای 20 تایی بعدی با گروه 20 تایی اول تجانس آنها را نشان خواهد داد. لازم به یادآوری است که این روش به تعدادی سؤال تکمیلی نیز نیاز دارد، مثلاً به 20% تعداد کل سؤالات، زیرا تعیین روایی سؤالات از طریق محاسبات آماری، همیشه تعدادی از آنها را کنار خواهد گذاشت.
ب) بررسیهای آماری مقدماتی: پس از آن که سؤالات انتخاب شد باید آنها را روی یک گروه حتی الامکان معرف اجرا کرد و نتایج به دست آمده را به کمک محاسبات آماری مورد بررسی قرار داد.
قبل از هر چیز باید موارد زیر را دربارة تک تک سؤالات مشخص کرد:
1ـ سطح دشواری ، 2ـ قدرت تشخیص ، و در صورت استفاده از روش چند انتخابی، ارزش هر یک از پاسخهای پیشنهادی غلط.
1ـ سطح دشواری: اصولاً هدف از اجرای آزمونها این است که تفاوتهای فردی آزمودنیها مشخص شود. بنابراین هر یک از سؤالات آزمون باید قدرت تشخیص داشته باشد. از میان عواملی که قدرت تشخیص سؤال را تحت تأثیر قرار می دهند می توان سطح دشواری سؤال را نام برد. سؤال بسیار آسانی که همة آزمایش شوندگان به آن پاسخ می دهند یا سؤال بسیار دشواری که هیچ آزمایش شونده ای نمی تواند پاسخ آن را پیدا کند، فاقد قدرت تشخیص است. سطح دشواری یک سؤال، که گاهی تحت عناوین درجة دشواری یا شاخص دشواری نیز از آن نام برده می شود، عبارت است از درصد کسانی که توانسته اند پاسخ صحیح آن را پیدا کنند. هر اندازه این درصد بالاتر باشد سؤال به همان اندازه‌ آسانتر خواهد بود و برعکس.
ساده ترین و رضایت بخش ترین روش آماری برای تعیین سطح دشواری، قدرت تشخیص و حتی قضاوت دربارة ارزش هر یک از پاسخهای پیشنهادی به شرح زیر است. اوراق آزمودنیها را، براساس نمرة کامل هر ورقه، از بالا به پایین می چینند. 27% آنها را از بالا به عنوان گروه قوی و 27% آنها را از پایین به عنوان گروه ضعیف برمی دارند (البته این درصدها ممکن است، به تناسب تعداد آزمودنیها، متغیر باشد). برای هر سؤال جدولی نظیر جدول زیر تنظیم می کنند:
سؤال 1
جدول تحلیل سؤال
پاسخهای پیشنهادی
الف
ب
ج
د
 
گروه قوی (27% از بالا)
71
9
20
0
100
گروه ضعیف (27% از پایین)
15
50
35
0
100
 
در سؤال فرضی فوق، اگر پاسخ پیشنهادی «الف» صحیح باشد، سطح دشواری به ترتیب زیر محاسبه خواهد شد:
       100 × (پاسخهای صحیح گروه ضعیف + پاسخهای صحیح گروه قوی)  
   =                                                                                            = سطح دشواری
       جمع کل افراد دو گروه
 
                                                           100 × 86       100 × (15 + 71)
                                                                    43 =                    = 
                                                                                   200                   200
هر اندازه سطح دشواری از 50% بیشتر باشد سؤال به همان اندازه آسانتر خواهد بود و هر اندازه از 50% کمتر باشد سؤال به همان اندازه مشکلتر خواهد بود. بنابراین سؤال فرضی فوق در ردیف سؤالات مشکل طبقه بندی می شود.
2ـ قدرت تشخیص: منظور از قدرت تشخیص یا قوة تمیز عبارت است از توانایی سؤال در تقسیم بندی آزمودنیها به دو گروه قوی و ضعیف نسبت به متغیر مورد اندازه گیری. در عمل می توان قدرت تشخیص یک سؤال را براساس یک معیار خارجی، مثلاً موفقیت شغلی یا تحصیلی، یا از طریق مقایسة آن با نتیجة کل آزمون، که در اینجا به کار می بریم، پیدا کرد. اولین کاری که باید برای تعیین قدرت تشخیص سؤال فرضی انجام داد این است که تفاوت گروه قوی و ضعیف را در پاسخگویی به سؤال پیدا کرد. جدول نشان می دهد که 71 نفر از گروه قوی و 15 نفر از گروه ضعیف توانسته اند پاسخ صحیح سؤال را پیدا کنند. بنابراین تفاوت آنها 56 خواهد بود. چون در هر گروه 100 آزمودنی وجود دارد، تفاوت ماگزیمم 100 خواهد بود.
حال تفاوت مورد مشاهده را به تفاوت ماگزیمم تقسیم می کنیم تا قدرت تشخیص سؤال به دست آید:
15 ـ 71      پاسخهای صحیح گروه ضعیف ـ پاسخهای صحیح گروه قوی      
           =                                                                                    = قدرت تشخیص
100                                                       تفاوت ماگزیمم (تعداد افراد یک گروه)

 56

 100
 
                                                                                                                   

 

            56/0 =                =
 
قدرت تشخیص یک سؤال را معمولاً به صورت اعشار و سطح دشواری آن را به صورت درصد نشان می دهند. هر اندازه قدرت تشخیص یک سؤال به عدد 1 نزدیکتر باشد به همان اندازه قدرت تشخیص بیشتری خواهد داشت و برعکس. عدد 1 زمانی به دست می آید که سطح دشواری سؤال 50% باشد. یعنی صددرصد افراد گروه قوی و صفر درصد افراد گروه ضعیف به آن پاسخ صحیح بدهند. بنا به این دلیل، تهیه کنندگان آزمونها تمایل دارند سؤالاتی را انتخاب کنند که سطح دشواری آنها 50% است. چون این حالت بندرت اتفاق می افتد، لذا تست سازان در عمل سؤالاتی را ترجیح می دهند که سطح دشواری آنها بین 40% و 60% باشد. البته این امر زمانی صادق است که از آزمون به عنوان یک وسیله جهت اندازه گیری دقیق تفاوتهای فردی استفاده شود، اما اگر بخواهند از آزمون برای جدا کردن 20% بالای آزمودنیها از بقیة آنها استفاده کنند و تعیین تفاوتهای فردی چندان مطرح نباشد (مثلاً در انتخاب دانشجو برای دانشگاهها) سطح دشواری سؤالات آن باید نزدیک به 20% باشد. سؤالی که قدرت تشخیص آن از 25% کمتر باشد کنار گذاشته می شود.
3ـ ارزش پاسخهای پیشنهادی غلط: پاسخهای پیشنهادی غلط، که اصطلاحاً به پاسخهای انحرافی معروفند، طوری باید باشند که تا اندازه ای توجه آزمودنیها را به خود جلب کنند. پاسخ انحرافی خوب پاسخی است که گروه ضعیف را بیشتر از گروه قوی به اشتباه بیندازد. اگر پاسخ انحرافی، گروه قوی را بیشتر از گروه ضعیف به خطا وادار کند گول زننده خواهد بود.
ارزش هر یک از پاسخهای پیشنهادی غلط از طریق مقایسة تعداد آزمودنیهایی که از دو گروه قوی و ضعیف آن را انتخاب کرده اند معلوم می شود. در مثال فرضی هیچ یک از آزمودنیها گزینة «دال» را انتخاب نکرده است. بنابراین، مناسبترین جایی که باید تجدیدنظر در سؤال را شروع کرد همین پاسخ پیشنهادی «دال» است. دو پاسخ پیشنهادی «ب» و «ج» می توانند به عنوان گزینه های غلط مورد استفاده قرار گیرند. بطور کلی، در یک سؤال چند گزینه ای، اگر یک یا دو پاسخ پیشنهادی مثل پاسخ «دال» باشند می توان در سؤال تجدیدنظر کرد، اما اگر بیش از دو پاسخ دارای جنین معایبی باشند خود سؤال را باید کنار گذاشت.
ج) درجه بندی (نورم یابی) : پس از حذف سؤالات نامناسب و تنظیم بقیه برحسب سطح دشواری، می توان پس از انتخاب دقیق گروههای آزمودنیها اقدام به درجه بندی آزمون کرد. بدیهی است که باید دستورالعمل واحدی را به کار برد و برای آشنایی آزمودنیها با شیوة پاسخگویی چند سؤال نمونه هم داد.
اگر اجرای آزمون محدودیت زمانی داشته باشد حتماً باید رعایت شود. اجرای مقدماتی یک آزمون نشان می دهد که چقدر باید وقت داده شود. ساده ترین راه برای تعیین وقت به این صورت است که به آزمودنیها اعلام می کنند که اجرای آزمون محدودیت زمانی دارد و گاه بیگاه نیز محدودیت زمانی را یادآوری می کنند. زمانی را در نظر می گیرند که تقریباً 75 درصد آزمودنیها توانسته اند به همة سؤالات برسند. البته در آزمونهای سرعت، زمان را طوری انتخاب می کنند که هیچ یک از آزمودنیها نتواند در پایان آن به همة سؤالات برسد. در غیر این صورت تفاوتهای آزمودنیها مشخص نخواهد شد.
عوامل مؤثر بر عملکرد در جریان آزمون :
در جریان اجرای آزمون باید هم به شرایط فیزیکی و هم به چگونگی ارتباط گیری با آزمون شونده توجه داشت. اجرا و نمره گذاری آزمون تا جایی که ممکن است باید بی طرفانه انجام شود. توجه دقیق به دستورالعمل آزمون در تهیة گزارش مناسب از عملکرد فرد، تأثیر عوامل مخرب در اجرای آزمون را کاهش می دهد. جریان هر آزمون حالت پویا دارد و ممکن است عوامل گوناگونی که خارج از کنترل آزمون کننده است بر آن تأثیر بگذارد.
ویژگیهای آزمون شونده:
تأثیر ویژگیهای آزمون شونده بر آزمون، یک عامل آشکار است. مثلاً کودکان خردسال نمی توانند به برخی از آزمونها پاسخ بدهند؛ افرادی که خواندن نمی دانند قادر نیستند به آزمونهایی پاسخ دهند که مستلزم این مهارت اساسی است. جریان آزمون باید با توجه به محدودیتها صورت گیرد. به همین دلیل آزمونهای ویژه ای برای کودکان خردسال تهیه شده است.
در بسیاری از موارد آزمون شوندگان نمرات آزمون را دارای نقش مهمی در آیندة خود می بینند. صرف نظر از اینکه جنین دریافتی حقیقت داشته باشد یا نه، در رفتار آزمون شونده بسیار مؤثر است. پروفسور آناستازی در مورد داوطلبان دانشکده های طبّ که «آزمون پذیرش کالجهای پزشکی» (MCAT) را امتحان می دهند و شرکتهای تجاری نیز فوت و فن پاسخگویی به این آزمون را به آنان یاد می دهند، چنین توضیح می دهد: درسهای خصوصی کنکور، اگر باعث بالا رفتن نمرة داوطلبان باشد بی آنکه باعث بهبودی واقعی در رفتارهایی شود که آزمون برای پیش بینی آنها تهیه شده است، نتیجه ای جز از بین بردن روایی آزمون به بار نخواهد آورد.
اجرای مکرر آزمون در مورد یک فرد نیز معمولاً به عنوان یک عامل مؤثر بر عملکرد به حساب می آید. در این گونه موارد بهتر آن است که با توجه به میزان بهبود عملکرد در فاصلة اجرای دوبارة آزمون، تعبیر و تفسیر ما از نتایج حاصل از اجرای دوم یا سوم یا بیشتر با توجه به تفاوتهای ناشی از یادگیریی فوت و فن تست زنی باشد و این تفاوتها را از تفاوتهای ناشی از یادگیری واقعی محتوای آزمون متمایز سازد. یک عامل مخرب دیگر در عملکرد آزمون شونده «اضطراب امتحان» است.
اصطلاح اضطراب امتحان اولین بار دردهة 1950 توسط ماندلر و ساراسون (ماندلر و ساراسون، 1952 و 1953) مطرح شد و بعدها نیز موضوع تحقیقات زیادی شد. یک مقیاس سنجش اضطراب امتحان نیز که دارای 37 سؤال بود توسط ساراسون (1972) تهیه شد که در مورد دانشجویان دانشگاه به کار می رفت.
ساراسون (1975) می گوید دانشجویانی که اضطراب امتحان دارند دچار نوعی ترس روانی می شوند و این ترس آنان را چنان گرفتار می کند که عملکرد آنها را در آزمون ضعیف می کند. اضطراب امتحان باعث دو نوع واکنش می شود، یکی واکنش عاطفی (مثلاً عرق ریختن) و دیگری واکنش شناختی (مثلاً نگرانی از ناتوانی در پاسخگویی به سؤالات).
طبیعی است که کوشش در جهت کاهش یا حذف اضطراب امتحان در میان دانش آموزان و دانشجویان باعث لذت بخش شدن و کارآیی جریان آموزش می شود. روشهای بهبودبخشی رفتاری، نظیر حساسیت زدایی به منظور اصلاح یا از بین بردن واکنش عاطفی، نتایج مطلوبی به بار آورده است. گزارش اشپیلبرگر (1976) برای کاهش اضطراب امتحان، نشان می دهد که روشهای رفتارگرایانة حساسیت زدایی نتوانسته است به بهبود پیشرفت آکادمیک و اصلاح عملکردهای شناختی بیانجامد بلکه حساسیت زدایی همراه با استفاده از روشهای مشاوره ای برای بهبود مهارتهای مطالعه، نتایج مثبتی را به دنبال داشته است.
یکی دیگر از عواملی که بر نتایج آزمون اثر می گذارد عامل حدس و گمان در سؤالات چند گزینه ای است. مثلاً در سؤالات چهار گزینه ای اگر فردی که هیچ دانشی راجع به این سؤالات ندارد هر گاه براساس حدس و گمان یا تصادف به سؤالات پاسخ دهد احتمالاً به یک سؤال از هر چهار سؤال آزمون پاسخ صحیح خواهد داد.
برای حلی این مشکل، پیشنهاد شده است که، چون احتمال پاسخ صحیح دادن به یک سؤال K گزینه ای براساس حدس و گمان معادل k/1 می باشد و احتمال پاسخ غلط دادن به آن مساوی /// می شود، برآورد ما از پاسخهای صحیح واقعی در یک آزمون چند گزینه ای با فرمول زیر قابل محاسبه است.
///فرمول
که در این فرمول، R تعداد پاسخهای صحیح، W تعداد پاسخهای غلط، و K تعداد گزینه های هر سؤال است. استفاده از این فرمول توسط برخی از محققان، از جمله پروفسور راولی و پروفسور تراوب از دانشگاه تورنتو، مورد انتقاد قرار گرفته است. اینان معتقدند وقتی که زمان کافی برای پاسخگویی به همة سؤالات به دانشجویان می دهیم اهمیت استفاده از حدس و گمان، به عنوان یک عامل مخرب در نتایج آزمون، بسیار کمتر می شود.
تأثیرات آزمون کننده :
در بسیاری از موارد تأثیر آزمون کننده بر تهیه یا اجرای آزمون و بر نمره گذاری و تفسیر و تعبیر نتایج امری بدیهی است. این تأثیر در مورد آزمونهای فردی بیشتر از آزمونهای گروهی است. همچنین کودکان بیش از بزرگسالان تحت تأثیر آزمون کنندگان قرار می گیرند. هم آزمونهای عملکرد حداکثر (نظیر آزمونهای هوش) و هم آزمونهای عملکرد نمونه وار (مثل آزمونهای شخصیت) از خصوصیات آزمون کننده تأثیر می پذیرند. گراهام ولیلی عوامل نژادی، جنسیت، و انتظارات آزمون کنندگان را بر جریان و نتایج آزمونها مؤثر می دانند.
یِنسن نتایج سی مورد تحقیق را که در فاصلة سالهای 1936 تا 1977 منتشر شده مورد بررسی قرار داده و نتیجه گرفته است که در مواردی که آزمون کنندگان با آزمون شوندگان از یک نژاد بوده اند، افراد مورد آزمون نتایج بهتری در عملکرد خود بروز داده اند. اگرچه نمی توان نژاد آزمون کننده را متغیر مهمی در تعیین عملکرد افراد در مورد آزمونهای توانایی ذهنی به حساب آورد. سایر محققان نیز که به بررسی نتایج کلیة پژوهشهای مربوط به این موضوع پرداخته اند (مثلاً گرازیانو و همکاران، 1982؛ ساتل و گوین، 1982) به نتایج مشابهی دست یافته اند.
آزمون شوندگانی که توسط آزمون کنندگان همجنس خود مورد آزمون قرار می گیرند عملکرد بهتری از آزمون شوندگانی داشته که توسط افراد غیرهمجنس خود آزمون شده اند. البته در این مورد نیز تحقیقات موجود شواهد محکمی در تأیید این فرضیه ارائه نکرده اند. در برخی از پژوهشهایی که به دقت طراحی شده (مثلاً تحقیقات ساموئلز، 1977)، عامل جنسیت به عنوان یک تأثیر گذارندة جزئی در آزمونها شناخته شده است. بررسیهای رومِنیک و همکاران از تحقیقات روان شناسی در این موضوع حاکی از آن است که تأثیر جنسیت آزمون کنندگان بر عملکرد آزمون شوندگان، بخصوص در مورد سؤالاتی که ماهیت جنسیتی دارند، مؤثر است اما شواهد روشنی مبنی بر تأثیر جنسیت آزمون کننده بر نتایج حاصل از آزمونهای هوشی به دست نیامده است.
مهارت آزمون کنندگان، صرف نظر از این که چه نژاد یا جنسیتی داشته باشند، با یکدیگر متفاوت است و به همین دلیل تحقیقاتی هم که در مورد تأثیر عامل نژادی و جنسیتی آزمون کننده بر نتایج آزمونها به انجام رسیده به یافته های متفاوتی رسیده است.
فرضیة دیگر در مورد عوامل مربوط به تأثیر آزمون کننده بر جریان و نتایج آزمون، اطلاعات و طرز فکر و قضاوت قبلی آزمون کننده در مورد آزمون شونده است. یعنی به جای عملکرد واقعی آزمون شونده، انتظارات آزمون کننده است که بر آزمون تأثیر می گذارد. از جمله محققانی که بر اهمیت این عامل تأکید کرده اند رُزنتال و یاکوبسون (1968) هستند که می گویند انتظارات می تواند بر نتایج تجربی در تحقیقات مختلف روان شناسی تأثیر بگذارد. آنان اظهار می دارند که انتظارات بر نمره های هوشبهر دانش آموزان دبستانی تأثیر دارد. در تحقیق آنان، اسامی تعدادی دانش آموز به معلم کلاس داده و گفته شد که از این دانش آموزان آزمون به عمل آمده و انتظار می رود که پیشرفت مهمی در تواناییهای شناختی خود در طول سال نشان دهند.
انتظار معلم آن بود که اینان دانش آموزانی با توانایی شناختی بالا هستند که باید پیشرفت قابل توجهی داشته باشند و چنین هم شد. نتایج این آزمون در بسیاری از منابع علمی نقل شد و اشاعه یافت اما در معرض انتقادات جدی واقع شد. از نظر روش شناختی نیز انتقادات مهمی بر این تحقیق وارد شد و از جمله کرانباخ (1975) نشان داد که نمی توان این مطالعه را یک تحقیق علمی نامید بخصوص که انتظار معلمان موجبی برای افزایش نمرة هوشبهر دانش آموزان نشده بود. مطالعات یِنسن (1980) نیز نشان داد که انتظارات نمی تواند تأثیری بر نمرات هوشبهر داشته باشد. در عین حال، نمی توان ادعا کرد که انتظارات بر پیشرفت فرد اثر نمی گذارد.
علاوه بر عواملی که گفته شد، متغیرهای دیگری در خصوصیات آزمون کننده (نظیر تجربه، شخصیت، خصوصیات، سبک برخورد، و آشنایی قبلی با آزمون شونده) نیز هست که بر جریان و نتایج آزمون اثر می گذارد. شواهد گوناگون نشان می دهد که این متغیرها حائز اهمیت هستند ولی فوق العاده دشوار است که بگوییم مشخصاً چه وقت بر نتایج آزمون تأثیر دارند. در عین حال، با توجه کافی به جزئیات اجرای آزمون و پس از آموزشهایی که آزمون کننده برای اجرای آزمون خواهد دید، این تأثیرات به حداقل خود خواهد رسید.
زمینه های کاربرد آزمونها :
ما در عصر تکنیک علمی به سر می بریم. مخصوصاً آنچه انسان امروزی می خواهد عبارت است از دانایی برای توانایی بیشتر. در روان شناسی نیز وضع به همین منوال است: قوانی روان شناسی را اساساً برای نیل به هدفهای مفید به کار می برند.
آنچه روان سنجها یا پسیکوتکنیسین ها ادعا می کنند، این است که انسان را در شناختن تواناییهای خود و سازگاری هر چه بهتر با محیط زندگی یاری رسانند. کاربردهای روان شناسی معمولاً به دو صورت انجام می گیرد: کاربردهای مستقیم و غیرمستقیم. کاربردهای مستقیم یعنی ایجاد مساعدترین موقعیت کار، انطباق ابزار با کارگر، کاربردهای غیرمستقیم یعنی استفاده از مفاهیم روان شناسی تفاوتهای فردی در سازماندهی اجتماعی (راهنمایی، انتخاب، روابط انسانی).
اهداف عملی آزمونها بسیار زیاد است. هر وقت لازم باشد که یک تشخیص سریع و عینی از تواناییهای فرد، به منظور راهنمایی او، به عمل آید اجرای آزمونها ضرورت می یابد. اگر امروزه می بینیم که انواع مختلف آزمونها بی وقفه و بطور گسترده افزایش می یابد به علت کثرت تعداد کسانی است که از آنها استفاده می کنند: مربیان، روان شناسان، روان پزشکان، راهنمایان شغلی، صنعتی، نظامی،
1ـ زمینة تحصیلی :
می توان گفت که اجرای اولیة آزمونها و کاربرد مفید آنها در زمینة آموزش و پرورش بوده است. مقیاس بینه ـ سیمون به تقاضای وزیر آموزش و پرورش فرانسه، به منظور مجهز کردن مربیان و پزشکان با یک وسیلة عملی و مطمئن، جهت شناسایی عقب مانده های تحصیلی و جایگزینی آنها در کلاسهای اختصاصی، به وجود آمد. یکی از اولین کتابهایی که به زبان فرانسه و دربارة روش آزمونها نگارش یافته، کتابی است که کلاپارد، تحت عنوان علمی «چگونه باید استعدادهای دانش آموزان را تشخیص داد» به رشتة تحریر در آورده است. آخرین اثر بینه «نظرات جدید دربارة کودکان» ، نیز کاملاً در جهت تعلیم و تربیت بوده است. در حال حاضر انواع مختلف آزمونها را می توان در مدارس به کار برد. هدف از اجرای آزمونها در مدارس این است که می خواهد دانش آموزان با استعداد را انتخاب نمایند. از آزمونها برای انفرادی کردن آموزش، راهنمایی دانشجویان، تشخیص علل عقب ماندگیهای عمومی یا اختصاصی نیز بهره می گیرند. امروزه آزمونها به همراه امتحانات سنتی، به عنوان یک روش عینی برای بررسی پیشرفت تحصیلی دانش آموزان به کار می رود. به کمک آزمونها می توان آموزشی را که واقعاً با قابلیت عقب افتاده ها سازگار باشد به وجود آورد. در زمینة تحقیقات آموزش و پرورش تجربی نیز از آزمونها به عنوان یک وسیلة غیرقابل جانشین استفاده می شود. آزمونهایی که به بلوغ آموزشی معروف است، اطلاعاتی دربارة ظهور مکانیسمهای روانی لازم جهت شروع بعضی یادگیریها، مخصوصاً خواندن، نوشتن و حساب کردن را فراهم می آورد.
در پرتو استعمال روزافزون آزمونها، سازماندهی تحصیلی بسیار علمی تری امکان پذیر شده است. تعداد موقعیتهایی که استعمال آزمونها را در مدارس /// می سازد بقدری افزایش یافته که در اکثر کشورها موجب پیدایش متخصص دیگری به نام روان شناس تحصیلی شده است. این فرد در واقع نقش مربی و نقش روان شناس را با هم انجام می دهد.
خدمات روان شناسی تحصیلی، به رغم سازماندهیهای مختلفی که برحسب کشورها به وجود آمده، هدفهای یکسانی را دنبال می کند. این هدفها عبارت است از: پیدا کردن راه حل دشواریهای عمومی و اختصاصی دانش آموزان در جریان تحصیل آنها، راهنمایی تحصیلی، مطالعة عینی و تحلیلی، روان شناسی تربیتی مواد برنامه، تلاش برای پیدا کردن روشها و شیوه های انفرادی کردن آموزش،
خدمات روان شناسی تحصیلی در جریان سی ساله گذشته بطور قابل ملاحظه ای گسترش یافته و انواع مختلف مقاطع تحصیلی، از ابتدایی تا دانشگاه، را در بر گرفته است. هر چند روش آزمونها تنها وسیلة مشاهده در این مؤسسات به حساب نمی آید، مقام بسیار مهمی را اشغال می کند.
2ـ زمینة شغلی :
کاربردهای روان شناسی در زمینة سازماندهی کار بقدری متعدد و متنوع شده که امروزه استعمال عبارت پسیکوتکنیک تقریباً به زمینة شغلی اختصاص یافته است. این حرکت توسط یک مهندس آمریکایی به نام تیلور شروع شده کاربرد روان شناسی تجربی برای مطالعة عامل انسانی در کارخانه ها، تجزیة فعالیتهای شغلی، تحلیل و اندازه گیری زمان حرکات، حذف اعمال بی فایده، که همه برای ازدیاد تولید است، از ویژگیهای تیلوریسم به شمار می آید. البته در این مورد نمی توان از آزمونهای شغلی صحبت کرد بلکه باید از کنترل بازده حرف زد. توجه اصلی بر روی کارگر، به عنوان یک انسان، نیست بلکه بیشتر تولید صنعتی مورد نظر است. تیلوریسم به مرور زمان تغییر شکل یافته و انسانی شده است؛ توجه به نیازها و آرزوهای شخصی کارگر به تمایل تجربی اضافه گردیده است.
مسائلی که در حال حاضر برای پسیکوتکنیک مطرح می باشد بسیار زیاد است. اما تنها چیزی که اهمیت دارد و در آن آزمایش مستقیم فرد با روش آزمونها وارد عمل می شود عبارت است از: راهنمایی، انتخاب، انطباق و تربیت شغلی. سازماندهی عقلایی کار قبل از هر چیز بر تنوع تفاوتهای فردی استوار است. آنچه امروز به اثبات رسیده این است که هر فرد نمی تواند در هر زمان و در همه جا آن طور که می خواهد باشد و آنچه می خواهد انجام دهد.
هر شغلی به تعدادی از استعدادهای عمومی و اختصاصی نیاز دارد و هر اندازه این شغل تخصصی تر باشد به همان اندازه تعداد استعدادهای اختصاصی لازم افزایش می یابد یا لااقل این استعدادها محدودتر می گردد. بنابراین، شناختِ صحیح نیازهای هر فرد، مخصوصاً نیازهای روان شناختی او، شناسایی مشاغل، تهیة فهرست ویژگیها و ظرفیتهای کارگان آینده به منظور تطبیق آن با شغل نما، کمک به افراد در انتخاب شغلی که با استعدادهای او سازگاری بیشتری دارد، طرح هر نوع راهنمایی شغلی را تشکیل می دهد.
تعداد آزمونهایی که تشخیص و پیش بینی را توأم انجام می دهد و امروزه در مراکز راهنمایی شغلی مورد استفاده قرار می گیرد بسیار زیاد است. اما انتخاب شغلی فقط براساس نتایج حاصله از آزمونها انجام نمی گیرد. عناصر دیگری نیز باید در این فهرست گنجانده شود: وضع بازارکار، موقعیت خانواده، موقعیت اقتصادی، مقتضیات جغرافیایی.
در واقع، انتخاب همیشه باید تا اندازه ای گسترده انجام گیرد. چیزی که باید از آن اجتناب کرد این است که جوانان، بدون اندیشه و تفکر، شغلی را انتخاب کنند که استعداد لازم را برای آن ندارند. این افراد در این مشاغل، جزء ناسازگاران دایمی به حساب خواهند آمد و برای خود و دیگران مایة دردسر و بدبختی خواهند بود. گسترش مراکز راهنمایی، افزایش دایمی والدینی که فرزندان خود را به این مراکز می فرستند، فوایدی که صاحبان کارخانه ها شخصاً برای آنها قایلند، همه سودمندی غیرقابل انکار روان شناسی کاربردی (کاربرد آزمونها را به اثبات می رساند.
راهنمایی شغلی معمولاً در دوران نوجوانی، قبل از ممارست واقعی با شغل، انجام می گیرد، بنابراین مسألة انتخاب، افرادی را در بر می گیرد که قبلاً در مسیر شغل معینی قرار گرفته اند. در این جا مخصوصاً سود کارخانه در نظر گرفته می شود و دخالت یک پسیکوتکنیسین را توجیه می کند. هدف این است که، با حذف کارگرانی که نتوانسته اند بطور کامل با حرفة خود سازگار شوند و امید سازگاری هم وجود ندارد، بازده را بالا ببرند. در اکثر موارد، انتخاب افراد در واقع به صورت راهنمایی مجدد در می آید و این کار نیز، با توجه به سن افراد، با دشواریهایی روبرو می شود. گاهی اتفاق می افتد که مسألة انتخاب در داخل یک کارخانة بزرگ به توزیع مجدد کارکنان در میان خدمات متعددی که وجود دارد محدود می شود. بنابراین، سازماندهی و جایگزینی در بین خواهد بود که در اصطلاح فنی چنین گفته می شود: در چهارچوب یک کارخانه هر کس باید در جایی قرار گیرد که شایستة آن است. ارتقاء اجتماعی و طبقه بندی مجدد کارگران، مسائل تازه ای است که می تواند از آزمونها کمک بگیرد.
3ـ زمینة نظامی :
سازماندهی علمی ارتشهای مدرن نیز بایستی از کشفیات روان شناسی و روش آزمونها بهره بگیرد. از آن جا که در زمینة نظامی نیز، مثل سایر زمینه های فعالیت اجتماعی، عامل انسانی مورد نظر است، ما به همان مسائل بنیادی، منتها با نیازهای نظامی، برخورد خواهیم کرد: انتخاب، راهنمایی، تربیت شغلی، موارد بالینی، تبلیغ، بازپروری، فرماندهی و
اولین اجرای منظم آزمونها در زمینة نظامی عبارت بود از آزمایش رواین سربازان ارتش آمریکا در جریان جنگ بین الملل اول. براساس نتایج آزمونها، سربازان به پنج طبقة هوشی تقسیم شده بودند و این امر اجازه می داد تا راهنمایی و آموزش آنها برحسب تواناییهای فردی امکان پذیر گردد. امروزه، به علت دگرگونیهای عمیقی که در یازماندهی ارتشهای مدرن و در هنر جنگ به وجود آمده، روان شناسی نظامی توانسته است از پیشرفتهای بزرگی برخوردار شود. از سال 1927 به بعد، آزمونها رسماً وارد ارتش آلمان شده بود. هر واحد نظامی دارای یک آزمایشگاه روان شناسی بود که مستقیماً زیر نظر آزمایشگاه مرکزی وزارت جنگ اداره می شد.
بخشهای اصلی مورد مطالعه عبارت بود از: تحلیل کار و انطباق ماشینها و تجهیزات با تواناییهای افراد، مطالعة ویژگیهای افراد و انتخاب کارکنان، تبلیغ و روان شناسی ملتهای بیگانه، هدایت جنگ.
در سال 1937، شغل روان شناس نظامی توسط قانون به رسمیت شناخته شد و کسانی توانستند به آن اشتغال ورزند که مدرک دانشگاهی داشته باشند. انتخاب افسران، انتخاب افراد برای خدمات اختصاصی، از قبیل خلبانی، حمل و نقل، هدایت تانکها، مخابرات، ارتباطات رادیویی،
براساس اصول خاصی صورت می گرفت که آزمونها سهم مهمی در آن داشت. سایر کشورها، مخصوصاً آمریکا و انگلستان، از کشور آلمان عقب نمانده اند. در واقع اولین وظیفة یک فرمانده عبارت است از شناختن ویژگیهای افرادی که در اختیار دارد: تواناییهای جسمی، استعدادهای ذهنی و خصوصیات اخلاقی. سابق بر این حوزه های سربازگیری فقط به انجام یک آزمایش جسمی و یک آزمایش پزشکی قناعت می کرد. امروزه، آزمایش فردی سربازان بسیار کاملتر و دقیقتر شده است.
استعدادهای اختصاصی و ویژگیهای اخلاقی هر یک از افراد را نیز ارزشیابی می کنند. تشکیل واحدها و کادرهای نظامی نمی تواند به روشهای غیرتجربی متوسل شود بلکه باید از آزمایشهایی که بطور علمی ساخته شده است بهره بگیرد. امروزه تقریباً در همة کشورها مراکز روان شناسی نظامی، شبیه مراکز راهنمایی شغلی به وجود آمده که وظیفة آنها انجام کارهایی است که در بالا ذکر کردیم. تعداد زیادی از آزمونهایی که طی سالهای اخیر تهیه شده انحصاراً در اختیار ارتش قرار گرفته است. این آزمونها در سازماندهی نظامی سودمندی غیرقابل انکاری را نشان داده است: آزمونهایی که برای انتخاب خلبانان در آلمان فدرال به کار رفته، آزمونهای ارتش آمریکا و مراکز پسیکوتکنیک نظامی کشورهای مختلف، هر یک سهم بسیار مهمی را به عهده دارد.
4ـ کودکان نابهنجار و بزهکار :
روش آزمونها بطور گسترده برای تشخیص و درمان کودکانی که از نظر هوش و رفتار بی نظمیهایی نشان می دهند به کار رفته است. این نوع کاربردها را منحصراً می توان در اختیار تعلیم و تربیت و روان پزشکی قرار داد. علت این که آنها را بطور جداگانه و خارج از حوزة تحصیل و روان پزشکی مورد بحث قرار می دهند این است که امروزه، خدماتی که کودکان نابهنجار و جوانان بزهکار را در بر می گیرد بقدری زیاد است که بخش مستقلی را در مددکاری اجتماعی به وجود آورده است. در شهرهای بزرگ، اکثر کشورها، کلینیکهای اختصاصی به منظور کمک به کودکان و جوانانی که دشواریهایی دارند، تأسیس شده است. در این مؤسسات، پزشکان متخصص، روان پزشکان و روان شناسان، افرادی را که توسط والدین، مددکاران اجتماعی یا دادگاهها ارجاع داده می شوند بطور دقیق و عمیق مورد آزمایش قرار می دهند. اجرای آزمونها، به همراه تحلیل بالینی، مقام بسیار مهمی را در میان سایر فنون تشخیص احراز می کند.
5ـ آزمونها و کلینیک پزشکی :
از مدتها پیش انواع متعدد شیوه های تشخیص، شیوه هایی که می توان تحت عنوان آزمونهای کنشی و حسی از آنها نام برد، در اختیار هنر پزشکی بود. علت گسترش قابل ملاحظة آزمونهای شخصیت در این سی سال اخیر، به سبب استعمال آنها توسط روان پزشکان بوده است. در حال حاضر کاربردی که این گروه آزمونها در مطالعة علایم امراض روانی دارد حقیقتاً خارج از توصیف است. برای اثبات این ادعا، کافی است کمی به آزمون لکه های جوهر رورشاخ فکر کنیم. این آزمون به تنهایی موجب شده تا هزاران نشریه در سراسر جهان انتشار یابد، مؤسساتی که منحصراً به کاربرد آن اختصاص دارد به وجود آید و کنفرانسهای بین المللی، که موضوع آنها همین آزمون است، تشکیل شود. یکی از مقیاسهایی که امروزه کاربرد زیادی در اکثر کشورها دارد مقیاس وکسلر است که توسط یک روان پزشک تهیه شده است. هدف اولیة این روان پزشک حل مسائل بالینی بوده است.
بنابراین، مطالعة سازمان شخصیت، اختلالات آن و آثار این اختلالات بر سایر جنبه های زندگی ، چیزی را در اختیار دارد که اصطلاحاً «کلینیک مسلّح» نامیده می شود. این کلینیک اجازه می دهد تا با سرعت بیشتر و بطور مؤثرتر کار شود.
6ـ سایر زمینه های کاربردی :
اگرچه مسائل تحصیلی، سازماندهی علمی کار، فعالیت نظامی، پزشکی، حمایت دوران کودکی و کلینیک روان پزشکی بخشهایی را تشکیل می دهد که روش آزمونها کاربردهای متعدد و مشروعی را پیدا کرده است، زمینه های متعدد دیگری نیز وجود دارد که استفاده از آزمونها ضرورت پیدا می کند. مثلاً بررسیهای جنایی و اعمال قضایی مواردی است که از آزمونها بهره می گیرد. آزمایشهای کشف دروغ، آزمونهای زمان واکنش، آزمونهای حافظه، اندازه گیری تلقین پذیری، روشهای سنجش شخصیت، وسایلی است که می تواند بعضی دشواریهای پلیس قضایی و دادگاه را روشن سازد. بدون تردید نباید تصور کرد که این روشها راه حلهای قاطعی برای تمام مسائل پیدا خواهد کرد. این روشها، به همراه روشهای سنتی، مسلماً امکان اخذ نتایج رضایت بخش تر و مطمئن تری را خواهد داشت.
ورزش و مسابقات ورزشی زمینة دیگری است که آزمونهای روانی کاربرد پیدا می کند. لزوم انتخاب و کنترل افراد در این جا نیز موجب می شود که انواع آزمونهای جسمی، روانی و شخصیت به کار رود تا سازماندهی عقلایی تر و مؤثرتر از این فعالیتها به عمل آید.
ارزشیابی نتایج یک مبارزة تبلیغاتی، بررسی عقاید، برآورد تمایلات اجتماعی فعلی، زمینه های دیگری است که اندازه گیری عینی می تواند به کمک آزمونها یا فنون دیگری از همان نوع انجام گیرد و این اندازه گیری با قضاوتهای مبهم و ذهنی، که فراوان دیده می شود، جایگزین گردد.
می توان نتیجه گرفت که همیشه اندیشة تفاوتهای فردی، انفرادی کردن کارها و نتایج عملی حاصله از آنها پایة استعمال آزمونها بوده است. هر وقت صحبت از بازده بیشتر، سلامتی بیشتر، اقتصاد بیشتر و عدالت بیشتر باشد سعی می کنند فرد یا بهتر بگوییم، شخص را به عنوان مرجع اصلی در نظر بگیرند و از این طریق به هدفهای فوق برسند.
بنابراین، این فکر بقدر کافی قابل تحسین و انسانی است. برای تحقق بخشیدن آن لازم است که روشها طوری طرح ریزی و تهیه شود که شایستة آن باشد. پیشرفتهای آینده، به تکامل تکنیک و هداف پسیکوتکنیسین ها بستگی دارد.
انتقادهای عادی :
در اصل می توان پذیرفت که تهیة روشهای عینی برای تشخیص تفاوتهای فردی امکان پذیر است. با وجود این، انتقادهای متعددی بطور دایم علیه آزمونها ابراز می شود. نقد آزمونها یعنی شناخت صحیح نارساییهای آنها و ضمناً تأیید امتیازات واقعی آنها.
در میان انتقادهایی که علیه روان سنجی ابراز می شود، می توان انتقادهای کسانی را نام برد که با روان سنجی آشنایی بسیار سطحی دارند. هر کسی این اجازه را دارد که نظرات خود را دربارة یک موضوع معین ابراز کند و تعداد کسانی که نظر بسیار قطعی در مورد آزمونها دارند زیاد است. اینها در واقع مخالفان هستند که هیچ نظر صحیحی دربارة ماهیت و هدف آزمونها ندارند.
یکی از فیلسوفان فرانسه، به نام لوسن، که در سال 1951 وفات یافته، انتقادهای زیر راب ه آزمونها نسبت داده است. بنا به گفتة او آزمون عبارت است از یک موقعیت ساختگی که آزمودنی در برابر آن حالت دفاعی به خود می گیرد.
فعالیتهایی که در پاسخگویی به آزمونها به کار می رود، نمی تواند با حالت عادی و دایمی فرد انطباق داشته باشد و نتیجة عددی نمی تواند روشنگر خود اعمال ذهنی باشد.
چگونه باید به این انتقادها پاسخ داد؟ شیوة برآورد عینی استعدادهای یک فرد هرچه باشد، مسائل مورد حل همیشه نوعی حالت ساختگی و تصنعی به وجود خواهد آورد. همة آزمایشها از این ضعف رنج می برد. رنج پرسشنامه های منش شناسی کمتر از سایر آزمونها نیست. فعالیتهای زندگی نیز از این تصنع معاف نیست و تازه آنها گاهی وقتها از خارج تحمیل می شود، مثل فعالیتهای تحصیلی. با وجود این، آزمونهایی که خوب تهیه شده است، سعی می کند تا حالت ساختگی بودن آزمایش را حتل الامکان کاهش دهد. اگر آزمودنی هدف آزمایش را از قبل بطور دقیق بداند، خطر تصنعی بودن عکس العملهای او بیشتر خواهد بود، مخصوصاً اگر آزمون از نوع آزمونهای شخصیت باشد.
بنابراین، خصوصیت غیرعادی و ساختگی بودن موقعیت یک آزمایش نه تنها عیبی به حساب نمی آید بلکه در بعضی موارد امتیاز شمرده می شود. وانگهی تنوع آزمونهایی که در حال حاضر وجود دارد و دقتی که در تهیة آنها به کار رفته است، بهتر از دلایل تئوری می تواند پاسخگوی انتقادهای نوع بالا باشد.
اما انتقاد دیگر، یعنی این که نتیجة آزمون فقط یک عدد است، به نظر نمی رسد که درست باشد. اگر تنها شناسایی سطح کارآیی مطرح باشد، ارائه یک عدد کافی خواهد بود، زیرا آناً درک خواهد شد و از آن جا که نمرة خام به تنهایی هیچ معنایی ندارد، پس از مقایسه با نورمها مفهوم آن روشن خواهد گشت. آزمونهایی نیز وجود دارد که قبل از هر چیز شیوة حل یک مسأله توسط یک فرد را آشکار می سازد. در این آزمونها بازده آزمودنی در نفس خود اهمیت ندارد بلکه بیشتر مکانیسمهای دست اندرکار اهمیت دارد (آزمونهای تحلیلی، کیفی) .
انتقادهای لوسن این است که آنها در واقع تمام ایراداتی را که از ابتدای پسیکوتکنیک بطور دایمعلیه روش آزمونها ابراز شده است خلاصه می کند. غالباً آزمونها را به خاطر بیگانگی آنها مورد انتقاد قرار داده اند که به معنایی موجب نتایج ناشناخته می شود. آزمایشگر با تجربه همیشه در تماس نزدیک با آزمودنی است که نتیجة آن برآورد دقیق از شخصیت او و تفسیر انسانی از ارزش او خواهد بود. مخصوصاً این که آزمونهای فعلی اجازة چنین تماسی را فراهم می آورد و حتی بعضی از آنها طوری طرح ریزی شده که به خلق یک تماس شخصی کمک می کند. با وجود این، حتی اگر بپذیریم که این قریحة استثنایی (تماس شخصی با آزمودنی) برای کسی که جهت قضاوت دربارة هم نوعان خود دعوت شده است وجود دارد، باید با پیرون هم عقیده شویم که تعداد این نوع آزمایشگران بسیار کم است و در هر حال، «تعداد افرادی که این تواناییهای استثنایی را دارند، نمی تواند جوابگوی نیازهای امتحانات و کنکورها که هر روز در حال گسترش است، باشد».
بنابراین، باید به تربیت آزمایشگران ماهر، آزمایشگرانی که می توانند تماس روحی و عاطفی با آزمودنی برقرار کنند، همت گماشت.
انتقادهای سیاسی :
انتقادهای پیش بینی نشده ای علیه آزمونها عنوان شده است. مثلاً در اتحاد جماهیر شوروی آزمونها را وسیله ای می شناسند که دارای حاکمیت سرمایه داری است. در واقع از سال 1936 به بعد، کاربرد آزمونها در این کشور، هم در زمینة تعلیم و تربیت و هم در زمینة راهنمایی شغلی ممنوع شده است. به نظر سردمداران شوروی، آزمونهای روانی نمی تواند به عنوان یک روش علمی مورد استفاده قرار گیرد، زیرا نتایجی که فراهم می آورد تواناییهای واقعی فرد را اندازه نمی گیرد بلکه بیشتر منعکس کنندة“ یک موقعیت ساختگی است. این نتایج نمونه هایی است که از نظر آزمایش شونده فاقد ارزش است. به علاوه، آزمونهای روانی ویژگی ضد اجتماعی دارد، زیرا روشنفکران را برتر نشان می دهد و در نتیجه آنها را از کارگران متمایز می سازد، بنابراین جزء آلات شکنجه به حساب می آید. محکومیت آزمونها از طرف مقامات شوروی، در مجموع به این صورت توجیه می شد که آنها در انتخاب افراد بر وجود تواناییهایی تکیه می کنند که اصولاً در خانواده های بورژوا یافت می شود؛ در صورتی که بنا به عقیدة کمونیستهای شوروی، استعدادها در اثر محیط تغییر می یابد، حتی بعضی از آنها می تواند به وجود آید یا بطور کلی از بین برود. از طرف دیگر جنبه های شخصیت، که توسط آزمونها آشکار می شود، تا اندازه ای محدود بوده، فقط به بعضی طبقات اجتماعی تعلق دارد. تعلیم و تربیت سرمایه داری، که در سال 1931 کمیتة کنفرانس بین المللی پسیکوتکنیک تأیید می کرد، هدفی جز تقویت طبقات حاکمه، حفظ برتری آنها، کمک به استثمار مردم و نداشت. اگر بعضی آزمونها واقعاً کودکان طبقات مرفه را برتر نشان می دهد ـ مثلاً مقیاس بینه ـ به این خاطر است که محتوای آنها برای همة محیطها روایی ندارد. بنابراین، لازم است که با آزمونهای دیگری که ماهیت جداگانه ای دارد تکمیل شود. اما آزمونهای دیگری نیز وجود دارد که کودکان محیطهای فقیر را بهتر نشان می دهد، این آزمونها آنهایی است که شناسایی ملموس محیط و سازگاریهای عملی را ایجاب می کند. در حال حاضر، تعداد و تنوع آزمونها بقدری زیاد است که می توان برای نیل به انواع هدفها از آنها بهره گرفت.
لازم به یادآوری است که تعداد زیادی از انتقادها خود آزمونها را در برنمی گیرد بلکه بعضی آزمونهای خاص یا کاربرد ناشیانة آنها را در برمی گیرد. در واقع بعضی از نمایندگان روان سنجی به جای این که پیشرفت آزمونها را فراهم آورند موجب رکود آنها شده اند. موارد متعددی را می توان نام برد که از این وسیله استفاده های کاملاً نابجایی به عمل آمده، مخصوصاً مبنع درآمد بعضی سودجویان شده است. این امر موجب شده تا روان سنجی در نظر کسانی که از این جنبه ها به آزمونها نگاه می کنند، اعتبار خود را از دست بدهد.
افشای آزمونها :
بهترین آزمون اگر یکبار روی تعداد زیادی از افراد اجرا شود، دیگر نمی تواند نتایج اطمینان بخشی فراهم آورد. مثلاً در بعضی از مناطق فرانسه دیده شده است که سؤالات مقیاس بینه بر روی کارتهای تحصیلی دانش آموزان چاپ شده است! بدیهی است که این دانش آموزان امکان آمادگی برای آزمایشهای روانی را خواهند داشت و والدین آنها نیز خواهند توانست به کودکان خود کمک کنند. مراکزی وجود دارد که با دادن تمرینهای منظم، داوطلبان را برای ورود به دانشگاهها یا سایر مؤسسات آماده می کند. این مراکز برای نیل به هدف خود، انواع متعدد آزمونها را جمع آوری و تکثیر می کند. بدیهی است که این قبیل اعمال ارزش آزمون را به عنوان یک وسیلة تشخیصی، بی اعتبار می سازد و در واقع نوعی تقلب و قاچاق محسوب می شود.
برای جلوگیری از این خطر لازم است که اجرای آزمونها جنبة قانونی پیدا کند. همان طور که اشتغال به کار طبابت را قانون اجازه می دهد، کاربرد آزمونهای روانی نیز باید بدون داشتن مدرک لازم، منبع شود. یعنی کسانی که مدرک دانشگاهی ندارند و با مسائل نظری و عملی آزمونها نیز آشنایی سطحی دارند نباید اجازة استفاده از روش آزمونها را داشته باشند. البته در این خصوص پیشرفتهایی حاصل شده است. بطور کلی ناشران آزمونها آنها را فقط در اختیار روان شناسانی قرار می دهند که صلاحیت شغلی دارند و این امر موجب می شود تا در حفظ و کاربرد اصولی آزمونها دقت بیشتری به عمل آید.
                                                                                                         
 1- پیسکوتکنیک، شاخه ای از روان شناسی است که کاربرد اطلاعات حاصله از روان شناسی فیزیولوژی و روان شناسی تجربی در حل مسائل انسانی را مورد مطالعه قرار می دهد، اما امروزه فقط کاربرد آزمونهها در انتخاب مشاغل را شامل   می شود.
 1- روان توصیفی : اصطلاحی است که برای اولین بار توسط کلاپارد به کار برده شد. روان توصیفی یعنی به کار بردن روشهایی که جنبة کیفی فرآیندهای روانی را تعیین می کنند. روان توصیفی در مقابل روان سنجی قرار می گیرد.
منبع : سایت تکثیرسازان dociran
امید حیدری فر
سلام،این وبلاگ برای راهنمایی بیشتردانشجویان کارشناسی مدیریت وبرنامه ریزی آموزشی دانشگاه آزادکرمانشاه طراحی شده است. امیدوارم مطالب این وبلاگ برای شما دوستان عزیز مفید واقع شود. مدیر وبلاگ:امیدحیدری فر ارتباط با ما : Email://modiriat21@yahoo.com Email://omidheydarifar@gmail.com http://facebook.com/omidheydarifar منتظر نظرات شما عزیزان هستیم. مارا در facebook با نام کارشناسان تربیتی 88 جستجو کنید . برای مشاهده بهتر مطالب لطفاً از مرورگر Firefox استفاده کنید .
نویسندگان وبلاگ:
مطالب اخیر:
دوستان من:
کدهای اضافی کاربر :


.

.




در اين وبلاگ
در كل اينترنت
تماس با ما