Koefisien korelasi intra-kelas (intraclass correlation coefficient, ICC) digunakan untuk menilai reliabilitas antar dua atau lebih pengamat, maupun test-retest reliability. Intinya, ICC adalah rasio antar varians antar kelompok dan varians total. Varians total berasal dari 3 sumber: (1) pasien; (2) pengamat; dan (3) random error (residual error).
Cohen's kappa coefficient (κ) is a statistic that is used to measure inter-rater reliability (and also intra-rater reliability) for qualitative (categorical) items. It is generally thought to be a more robust measure than simple percent agreement calculation, as κ takes into account the possibility of the agreement occurring by chance. There is controversy surrounding Cohen's kappa due to the difficulty in interpreting indices of agreement. Some researchers have suggested that it is conceptually simpler to evaluate disagreement between items.
Cohen's kappa coefficient (κ) is a statistic that is used to measure inter-rater reliability (and also intra-rater reliability) for qualitative (categorical) items. It is generally thought to be a more robust measure than simple percent agreement calculation, as κ takes into account the possibility of the agreement occurring by chance. There is controversy surrounding Cohen's kappa due to the difficulty in interpreting indices of agreement. Some researchers have suggested that it is conceptually simpler to evaluate disagreement between items.
Content Validity Index (CVI) adalah salah satu formula yang paling sesuai untuk digunakan dalam menguji validitas konten media pembelajaran interaktif berorientasi model Creative Problem Solving karena judges/validator yang dilibatkan dalam pengujian validasi ini lebih dari satu orang, terkait dengan evaluasi ahli media, ahli isi dan ahli design pembelajaran. Aiken (1985) merumuskan formula Aiken's V untuk menghitung content-validity coefficient yang didasarkan pada hasil penilaian dari panel ahli sebanyak n orang terhadap suatu item dari segi sejauh mana item tersebut mewakili konstrak yang diukur.
Penilaian Acuan Norma (PAN) adalah penilaian yang dilakukan dengan mengacu pada norma kelompok atau nilai-nilai yang diperoleh siswa dibandingkan dengan nilai-nilai siswa lain dalam kelompok tersebut.
Penilaian Acuan Patokan (PAP) adalah model pendekatan penilaian yang mengacu kepada suatu kriteria pencapaian tujuan (TKP) yang telah ditetapkan sebelumnya. PAP merupakan suatu cara menentukan kelulusan siswa dengan menggunakan sejumlah patokan.
ITEM AND TEST ANALYSIS (ITEMAN) merupakan perangkat lunak (software) yang dibuat melalui bahasa pemrograman komputer dan dibuat khusus untuk analisis butir soal dan tes. Hasil analisis meliputi: tingkat kesukaran butir soal, daya pembeda soal, statistik sebaran jawaban, kehandalan/reliabilitas tes, kesalahan pengukuran (standar error), dan distribusi skor serta skor setiap peserta tes.
Uji daya beda item dilakukan untuk melihat sejauh mana item mampu membedakan antara individu atau kelompok individu yang memiliki atribut dengan yang tidak memiliki atribut yang akan diukur (Azwar, 2000).
Analisis tingkat kesukaran dimaksudkan untuk mengetahui apakah soal tersebut tergolong mudah atau sukar. Tingkat kesukaran adalah bilangan yang menunjukan sukar atau mudahnya sesuatu soal (Arikunto, 1999: 207).
Menurut Sugiono (2005), reliabilitas adalah serangkaian pengukuran atau serangkaian alat ukur yang memiliki konsistensi bila pengukuran yang dilakukan dengan alat ukur itu dilakukan secara berulang.
Uji validitas adalah uji yang digunakan untuk menunjukkan sejauh mana alat ukur yang digunakan dalam suatu mengukur apa yang diukur. Ghozali (2009) menyatakan bahwa uji validitas digunakan untuk mengukur sah, atau valid tidaknya suatu kuesioner atau soal.