Evaluating GPT-4V’s performance in the Japanese national dental examination: A challenge explored

Masaki Morishita; Hikaru Fukuda; Kosuke Muraoka; Taiji Nakamura; Masanari Hayashi; Izumi Yoshioka; Kentaro Ono; Shuji Awano

Journal of Dental Sciences (Jul 2024)

Evaluating GPT-4V’s performance in the Japanese national dental examination: A challenge explored

Masaki Morishita,
Hikaru Fukuda,
Kosuke Muraoka,
Taiji Nakamura,
Masanari Hayashi,
Izumi Yoshioka,
Kentaro Ono,
Shuji Awano

Affiliations

Masaki Morishita: Division of Clinical Education Development and Research, Department of Oral Function, Kyushu Dental University, Kitakyushu, Japan; Health Information Management Office, Kyushu Dental University Hospital, Kitakyushu, Japan; Corresponding author. Kyushu Dental University, Division of Clinical Education Development and Research, Department of Oral Function, 2-6-1 Manazuru, Kokurakita, Kitakyushu, 803-8580, Japan.
Hikaru Fukuda: Division of Maxillofacial Surgery, Department of Physical Function, Kyushu Dental University, Kitakyushu, Japan
Kosuke Muraoka: Division of Clinical Education Development and Research, Department of Oral Function, Kyushu Dental University, Kitakyushu, Japan
Taiji Nakamura: Division of Periodontology, Department of Oral Function, Kyushu Dental University, Kitakyushu, Japan
Masanari Hayashi: Administration Department, Kyushu Dental University Hospital, Kitakyushu, Japan
Izumi Yoshioka: Division of Oral Medicine, Department of Physical Function, Kitakyushu, Japan
Kentaro Ono: Division of Physiology, Department of Health Promotion, Kyushu Dental University, Kitakyushu, Japan
Shuji Awano: Division of Clinical Education Development and Research, Department of Oral Function, Kyushu Dental University, Kitakyushu, Japan

Journal volume & issue: Vol. 19, no. 3
pp. 1595 – 1600

Abstract

Read online

Background/purpose: Rapid advancements in AI technology have led to significant interest in its application across various fields, including medicine and dentistry. This study aimed to assess the capabilities of ChatGPT-4V with image recognition in answering image-based questions from the Japanese National Dental Examination (JNDE) to explore its potential as an educational support tool for dental students. Materials and methods: The dataset used questions from the JNDE, which was conducted in January 2023, with a focus on image-related queries. ChatGPT-4V was utilized, and standardized prompts, question texts, and images were input. Data and statistical analyses were conducted using Qlik Sense® and GraphPad Prism. Results: The overall correct response rate of ChatGPT-4V for image-based JNDE questions was 35.0 %. The correct response rates were 57.1 % for compulsory questions, 43.6 % for general questions, and 28.6 % for clinical practical questions. In specialties like Dental Anesthesiology and Endodontics, ChatGPT-4V achieved correct response rates above 70 %, while response rates for Orthodontics and Oral Surgery were lower. A higher number of images in questions was correlated with lower accuracy, suggesting an impact of the number of images on correct and incorrect responses. Conclusion: While innovative, ChatGPT-4V’s image recognition feature exhibited limitations, especially in handling image-intensive and complex clinical practical questions, and is not yet fully suitable as an educational support tool for dental students at its current stage. Further technological refinement and re-evaluation with a broader dataset are recommended.

Published in Journal of Dental Sciences

ISSN: 1991-7902 (Print)
Publisher: Elsevier
Country of publisher: Taiwan, Province of China
LCC subjects: Medicine: Dentistry
Website: http://www.journals.elsevier.com/journal-of-dental-sciences/

About the journal

Abstract

Keywords