ANALISIS KOMPARATIF KUALITAS UMPAN BALIK CHATGPT DAN DEEPSEEK TERHADAP JAWABAN KONTEKSTUAL SISWA PADA KONSEP OPTIK FISIKA

Penulis

  • Siti Faitul Hidayah Universitas Tadulako
  • Miftah Miftah Universitas Tadulako
  • I Komang Werdhiana Universitas Tadulako
  • Gustina Gustina Universitas Tadulako

DOI:

https://doi.org/10.58917/ijpe.v5i2.839

Kata Kunci:

ChatGPT, DeepSeek, Jawaban Kontekstual, Optik Fisika, Umpan Balik AI

Abstrak

Penelitian ini bertujuan menganalisis dan membandingkan kualitas umpan balik ChatGPT 5.5 dan DeepSeek V4 terhadap jawaban kontekstual siswa pada konsep optik fisika. Penelitian menggunakan pendekatan campuran dengan desain explanatory sequential. Data diperoleh dari 20 siswa yang mengerjakan enam soal kontekstual optik fisika. Setiap jawaban siswa diberi umpan balik oleh ChatGPT 5.5 dan DeepSeek V4 sehingga diperoleh 240 unit umpan balik AI. Kualitas umpan balik dinilai berdasarkan empat indikator, yaitu akurasi ilmiah, kedalaman penjelasan, relevansi terhadap konteks jawaban siswa, dan kejelasan bahasa. Data kuantitatif dianalisis menggunakan statistik deskriptif, uji normalitas, dan Wilcoxon Signed-Rank Test, sedangkan data kualitatif dianalisis melalui telaah isi umpan balik. Hasil penelitian menunjukkan bahwa ChatGPT 5.5 memperoleh mean total 15,31 atau 95,68%, sedangkan DeepSeek V4 memperoleh mean total 14,68 atau 91,77%. Keduanya berada pada kategori sangat baik. Uji Wilcoxon menunjukkan perbedaan signifikan pada akurasi ilmiah, kedalaman penjelasan, relevansi terhadap konteks jawaban siswa, dan total skor, sedangkan kejelasan bahasa tidak berbeda signifikan. Analisis kualitatif menunjukkan bahwa ChatGPT 5.5 lebih stabil dalam memberikan koreksi konseptual yang akurat, mendalam, dan relevan, sedangkan DeepSeek V4 tetap kuat pada kejelasan bahasa tetapi lebih bervariasi pada substansi isi. Dengan demikian, perbedaan utama kedua model terletak pada kualitas isi umpan balik, bukan pada aspek kebahasaan. Temuan ini memberikan bukti empiris bahwa ChatGPT 5.5 lebih unggul dalam menghasilkan umpan balik yang akurat, mendalam, dan sesuai dengan konteks jawaban siswa, sedangkan DeepSeek V4 menunjukkan performa yang kompetitif terutama pada aspek kejelasan bahasa. Hasil penelitian ini dapat menjadi pertimbangan bagi pendidik dalam memilih dan memanfaatkan AI generatif sebagai pendukung asesmen formatif pada pembelajaran fisika.

Referensi

Boggs, J. A., & Manchón, R. M. (2023). Feedback literacy in writing research and teaching: Advancing L2 WCF research agendas. Assessing Writing, 58. https://doi.org/10.1016/j.asw.2023.100786

Carless, D. (2022). Feedback for student learning in higher education. International Encyclopedia of Education: Fourth Edition, 623-629. https://doi.org/10.1016/B978-0-12-818630-5.14066-7

Creswell, J. W., & Plano Clark, V. L. (2018). Designing and Conducting Mixed Methods Research (3rd ed.). SAGE Publications.

Etaiwi, W., & Alhijawi, B. (2025). Comparative evaluation of ChatGPT and DeepSeek across key NLP tasks: Strengths, weaknesses, and domain-specific performance. Array, 27. https://doi.org/10.1016/j.array.2025.100478

Guo, D., Yang, D., Zhang, H., Song, J., Zhang, R., Xu, R., Zhu, Q., Ma, S., Wang, P., Bi, X., Zhang, X., Yu, X.,

Wu, Y., Wu, Z. F., Gou, Z., Shao, Z., Li, Z., Gao, Z., Liu, A., et al. (2025). DeepSeek-R1: Incentivizing reasoning capability in LLMs via reinforcement learning.

Jin, I., Tangsrivimol, J. A., Darzi, E., Hassan Virk, H. U., Wang, Z., Egger, J., Hacking, S., Glicksberg, B. S., Strauss, M., & Krittanawong, C. (2025). DeepSeek vs. ChatGPT: Prospects and challenges. Frontiers in Artificial Intelligence, 8, 1-12. https://doi.org/10.3389/frai.2025.1576992

Kaltakci-Gurel, D. (2023). Exploring pre-service teachers' conceptual understanding and confidence in geometrical optics: A focus on gender and prior course achievement. Education Sciences, 13(5). https://doi.org/10.3390/educsci13050452

Kortemeyer, G. (2023). Could an artificial-intelligence agent pass an introductory physics course? Physical Review Physics Education Research, 19(1). https://doi.org/10.1103/PhysRevPhysEducRes.19.010132

Kunaedi, J., Samsudin, A., Hasanah, L., Hidiana Aminudin, A., Herliyana Dewi, F., Alfionita Umar, F., Rona Wahyu Astuti, I., & Nurul Mufida, S. (2024). Developing diagnostic test on geometrical optics (DT-GO) concept. KnE Social Sciences. https://doi.org/10.18502/kss.v9i8.15637

Lo, C. K. (2023). What is the impact of ChatGPT on education? A rapid review of the literature. Education Sciences, 13(4). https://doi.org/10.3390/educsci13040410

Panadero, E., & Lipnevich, A. A. (2022). A review of feedback models and typologies: Towards an integrative model of feedback elements. Educational Research Review, 35, 100416. https://doi.org/10.1016/j.edurev.2021.100416

Perera, P., & Lankathilaka, M. (2023). AI in higher education: A literature review of ChatGPT and guidelines for responsible implementation. International Journal of Research and Innovation in Social Science, VII(VI), 306-314. https://doi.org/10.47772/ijriss.2023.7623

Polverini, G., & Gregorcic, B. (2024). How understanding large language models can inform the use of ChatGPT in physics education. European Journal of Physics, 45(2), 1-33. https://doi.org/10.1088/1361- 6404/ad1420

Wisniewski, B., Zierer, K., & Hattie, J. (2020). The power of feedback revisited: A meta-analysis of educational feedback research. Frontiers in Psychology, 10, 1-14. https://doi.org/10.3389/fpsyg.2019.03087

Unduhan

Diterbitkan

2026-06-25

Cara Mengutip

Hidayah, S. F., Miftah, M., Werdhiana, I. K., & Gustina, G. (2026). ANALISIS KOMPARATIF KUALITAS UMPAN BALIK CHATGPT DAN DEEPSEEK TERHADAP JAWABAN KONTEKSTUAL SISWA PADA KONSEP OPTIK FISIKA . Al-Irsyad Journal of Physics Education, 5(2), 168–177. https://doi.org/10.58917/ijpe.v5i2.839

Terbitan

Bagian

Artikel