Krisis Evaluasi: Mengapa Ujian Tertulis Tak Lagi Relevan di Era AI?
s2dikdas.fip.unesa.ac.id, Surabaya — Revolusi AI generatif telah meruntuhkan efektivitas metode evaluasi tradisional berbasis tugas rumah dan esai tertulis yang selama ini menjadi tulang punggung penilaian di perguruan tinggi. Sejak ChatGPT mampu menyusun argumen filosofis hingga pemecahan kode pemrograman dalam hitungan detik, dosen di berbagai universitas kini menghadapi krisis kepercayaan terhadap orisinalitas karya mahasiswa. Masalah utama muncul ketika nilai "A" tidak lagi mencerminkan penguasaan materi oleh mahasiswa, melainkan kemampuan mereka dalam memberikan instruksi (prompting) kepada mesin. Hal ini memaksa institusi pendidikan untuk melakukan perombakan besar-besaran terhadap cara mereka mengukur kecerdasan dan kompetensi individu di era digital.
Kelemahan sistem evaluasi saat ini terletak pada ketergantungannya pada produk akhir teks, yang secara teknis sangat mudah diproduksi oleh Large Language Models (LLM). Banyak dosen melaporkan peningkatan drastis pada kualitas gaya bahasa tugas mahasiswa, namun seringkali ditemukan ketidaksesuaian saat dilakukan diskusi di dalam kelas. Ketimpangan ini menunjukkan bahwa mahasiswa mungkin memahami hasil akhir yang diberikan AI, namun kehilangan proses kognitif "berdarah-darah" yang diperlukan untuk membangun pemahaman yang kokoh. Jika penilaian hanya terpaku pada apa yang tertulis, maka pendidikan tinggi berisiko meluluskan generasi yang hanya ahli dalam hasil instan tanpa memiliki kedalaman fondasi keilmuan.
Menghadapi tantangan ini, banyak fakultas mulai mengalihkan bobot nilai pada presentasi lisan, ujian di laboratorium, dan diskusi kelompok yang dilakukan secara tatap muka tanpa bantuan gawai. Strategi "kembali ke kelas" ini dianggap sebagai langkah paling efektif untuk memvalidasi apakah seorang mahasiswa benar-benar memiliki kapasitas intelektual yang ia klaim dalam tugas-tugasnya. Namun, transisi ini bukan tanpa hambatan, karena memerlukan rasio dosen dan mahasiswa yang lebih ideal serta waktu pertemuan yang lebih panjang. Dosen kini terbebani secara fisik dan mental untuk melakukan observasi langsung terhadap setiap individu guna memastikan keadilan penilaian tetap terjaga.
Dilema lain muncul dalam mata kuliah yang justru membutuhkan kreativitas penulisan, di mana batas antara inspirasi dari AI dan plagiarisme menjadi sangat kabur. Beberapa akademisi berpendapat bahwa melarang AI sama saja dengan melarang penggunaan mesin tik di masa lalu, namun membiarkannya tanpa kontrol akan membunuh kemampuan refleksi kritis manusia. Dosen dituntut untuk menciptakan rubrik penilaian baru yang tidak hanya menilai konten, tetapi juga menilai proses berpikir orisinal, penggunaan sumber primer yang autentik, dan kemampuan mahasiswa dalam mengkritik balik jawaban yang dihasilkan oleh AI. Ini adalah standar baru yang jauh lebih kompleks bagi para pendidik.
Data menunjukkan bahwa penggunaan alat deteksi AI seringkali memberikan hasil false positive yang merugikan mahasiswa jujur, sehingga dosen tidak bisa mengandalkan teknologi sepenuhnya untuk menangkap kecurangan. Hal ini menciptakan suasana kelas yang penuh kecurigaan, di mana integritas mahasiswa selalu dipertanyakan. Untuk memitigasi hal ini, komunikasi transparan mengenai etika penggunaan AI harus dibangun sejak awal semester. Dosen harus menjelaskan secara eksplisit kapan AI boleh digunakan sebagai asisten riset dan kapan ia harus ditinggalkan untuk melatih otot intelektual mandiri mahasiswa.
Pihak universitas juga perlu mendukung para dosen dengan menyediakan pelatihan literasi AI yang berkelanjutan, bukan sekadar instruksi administratif untuk "memperketat pengawasan". Kualitas pendidikan terjamin bukan melalui ancaman hukuman, melainkan melalui desain kurikulum yang menantang mahasiswa untuk berpikir di level yang lebih tinggi daripada apa yang bisa dilakukan oleh algoritma. Evaluasi harus berevolusi menjadi proses dialogis, di mana nilai diberikan berdasarkan kemampuan mahasiswa dalam mensintesis pengetahuan, berempati, dan mengambil keputusan etis—tiga hal yang hingga kini belum bisa direplikasi dengan sempurna oleh AI.
Sebagai penutup, tantangan dosen dalam menjaga kualitas pendidikan di tengah gempuran AI adalah momentum untuk mengembalikan esensi belajar pada proses, bukan sekadar nilai. Universitas harus berani meninggalkan metode evaluasi yang sudah usang dan beralih pada pendekatan yang lebih humanis dan interaktif. Jika kita tetap bertahan pada pola penilaian lama, maka kita secara tidak sadar sedang merayakan kemenangan mesin atas nalar manusia. Mari kita jadikan krisis ini sebagai titik balik untuk memperkuat kualitas lulusan yang tidak hanya cerdas secara teknis, tetapi juga memiliki integritas dan kedalaman berpikir yang autentik.
###
Penulis: Nur Santika Rokhmah