با توجه به منابع موجود مقامات چینی قریب 4000 سال پیش برای انتخاب پرسنل اداری خود از امتحان استفاده می کردند .مدارک زیادی وجود دارد که در ایران باستان،یونان و روم نیز از امتحان استفاده می شده است.
بر پایه منابع تاریخی در زمان شاپور،پادشاه ساسانی،در جندی شاپور برای دانشجویان پزشکی مجالس امتحان و آزمایش برگزار می شد و به شرکت کنندگان در امتحان به شرط موفقیت اجازه نامۀ پزشکی داده می شد.
در قرن هفتم هجری چون تعداد داوطلبان ورود به مدرسه مستنصریه بغداد از ظرفیت مدرسه بیشتر بوده هنگام ورود به مدرسه امتحان می گرفتند و از میان آنان تعداد لازم را انتخاب می کردند.
اولین تعریف رسمی از ارزشیابی به نام رالف تایلر ثبت شده است.وی ارزشیابی را وسیله ای جهت تعیین میزان موفقیت برنامه در رسیدن به هدفهای آموزشی مطلوب مورد نظر می داند.در این تعریف هدفهای آموزشی به تغییرات مطلوبی اشاره می کنند که انتظار می رود در اثر اجرای برنامه آموزشی در رفتار فراگیران حاصل آیند.
کرانباخ به نقل از کتاب ارزشیابی آموزشی ارزشیابی را جمع آوری و استفاده از اطلاعات جهت تصمیم گیری در مورد یک برنامه آموزشی می داند.به عقیدۀ کرانباخ تعیین موفقیت یا عدم موفقیت برنامه های آموزشی فقط از طریق جمع آوری اطلاعات در موقعیت های واقعی یاددهی –یادگیری امکان پذیر می باشد.و هرگونه تصمیم گیری در مورد برنامۀ آموزشی باید بر اساس اطلاعات جمع آوری شده صورت گیرد.
یکی از متداولترین الگوها مبتنی بر ملاکهای درونی ،الگوی اعتبار بخشی است.در این الگو ،از طرف مؤسسه یا سازمان های ارزشیابی ،با فاصله های زمانی از مؤسسه ،دانشکده،یا مدرسه مورد ارزشیابی بازدید به عمل می آید،و مؤسسه با توجه به معیارهای کمی از قبل تعیین شده و با توجه به آنچه که در حال حاضر وجود دارد مورد قضاوت و ارزشیابی قرار می گیرد.این روش،یک مطالعه همه جانبه است که تمام ابعاد یک مؤسسه آموزشی را در بر می گیرد.
اسکریون در بخشی از الگوی ارزشیابی مصرف کننده مدار خویش ارزشیابی هدف آزاد را در مقابل ارزشیابی هدف مدار تایلر مطرح کرده است.اسکریون معتقد است که یک برنامۀ آموزشی علاوه بر بازده های مورد انتظار و پیش بینی شده در برنامه،می تواند تأثیرات جانبی دیگری نیز به همراه داشته باشد،که وی آنها را بازده های پیش بینی نشده یا ناخواسته می نامد.
پایایی یک آزمون بیانگر ثبات در اندازه گیری چیزی است که آزمون اندازه می گیرد. در آزمونهای هنجاری مفهوم پایایی با پراکندگی در نمره آزمون ارتباط دارد.
ضریب پایایی معمولا ً با استفاده از روشهای همبستگی یا روشهای کودر و ریچاردسون محاسبه می شود.
در نظریه های کلاسیک آزمونهای روانی ، پایایی عبارت است از نسبت واریانس واقعی( S) به واریانس مشاهده شده( S)و روایی عبارت است از همبستگی بین نمره دانش آموزان در آزمون مورد نظر و آزمون ملاک.به عبارت دیگر روایی عبارت است از واریانس مشترک بین دو آزمون
انتخاب نمونه یکی از گامهای مهم در ارزشیابی آموزشی بشمار می آید.نمونه مناسب نمونه ای است که اعضای آن معرف یا نماینده اعضای جامعه ای باشند که از آن انتخاب شده اند.در نمونه گیری تصادفی تمام اعضای جامعه مورد نظر شانس مساوی و یکسان برای انتخاب شدن در گروه نمونه را دارا هستند.هرچه حجم نمونه انتخاب شده بیشتر باشد امکان معرف بودن نمونه بیشتر می شود.
با استفاده از دو عمل نمونه گیری یعنی نمونه گیری پرسشها و نمونه گیری فراگیران به طور همزمان می توان نسبتا ً کوتاه حداکثر اطلاعات ممکن در زمینه عملکرد آزمودنی ها در پاسخگویی به سؤالات تدوین شده را فراهم آورد. استفاده همزمان از دو عمل نمونه گیری را نمونه گیری چند ماتریسی می نامند.
امتیازات نمونه گیری چند ماتریسی:
از طریق ارائه تعداد محدودی پرسش به هر فرد آزمودنی در مجموع می توان در زمانی کوتاه تمام پرسشهای تهیه شده را مورد آزمایش قرار داد و در زمینۀ عملکردافراد در
هدفهای آموزشی اطلاعات کامل و جامعی کسب نمود.
- پاسخهای یک گروه نسبتا ً زیاد از آزمودنی ها به چند پرسش محدود را می توان سریعتر و کم هزینه تر از پاسخهای یک گروه نمونه به تعداد زیادی پرسش تصحیح و نمونه گذاری نمود.
- نمونه گیری از پرسش ها و ارائه چند پرسش به هر فرد آزمودنی،زمان لازم برای شرکت هر فرد در جلسه آزمون را کاهش می دهد.
- میزان خطای معیار میانگین حاصل از نمونه گیری چند ماتریسی از انحراف معیار حاصل از یک گروه نمونه کوچکتر است.
دانلود پاورپوینت روشهای ارزشیابی آموزشی دکتر علیرضا کیامنش - 241 اسلاید