Investigation of Pre-Trained Bidirectional Encoder Representations from Transformers Checkpoints for Indonesian Abstractive Text Summarization

Henry Lucky; Derwin Suhartono

doi:10.32890/jict2022.21.1.4

Journal of ICT (Nov 2021)

Investigation of Pre-Trained Bidirectional Encoder Representations from Transformers Checkpoints for Indonesian Abstractive Text Summarization

Henry Lucky,
Derwin Suhartono

Affiliations

Henry Lucky: Computer Science Department, Bina Nusantara University, Indonesia
Derwin Suhartono: Computer Science Department, Bina Nusantara University, Indonesia

DOI: https://doi.org/10.32890/jict2022.21.1.4
Journal volume & issue: Vol. 21, no. 1
pp. 71 – 94

Abstract

Read online

Text summarization aims to reduce text by removing less useful information to obtain information quickly and precisely. In Indonesian abstractive text summarization, the research mostly focuses on multi-document summarization which methods will not work optimally in single-document summarization. As the public summarization datasets and works in English are focusing on single-document summarization, this study emphasized on Indonesian single-document summarization. Abstractive text summarization studies in English frequently use Bidirectional Encoder Representations from Transformers (BERT), and since Indonesian BERT checkpoint is available, it was employed in this study. This study investigated the use of Indonesian BERT in abstractive text summarization on the IndoSum dataset using the BERTSum model. The investigation proceeded by using various combinations of model encoders, model embedding sizes, and model decoders. Evaluation results showed that models with more embedding size and used Generative Pre-Training (GPT)-like decoder could improve the Recall-Oriented Understudy for Gisting Evaluation (ROUGE) score and BERTScore of the model results.

Published in Journal of ICT

ISSN: 1675-414X (Print); 2180-3862 (Online)
Publisher: UUM Press
Country of publisher: Malaysia
LCC subjects: Technology: Technology (General): Industrial engineering. Management engineering: Information technology
Website: http://jict.uum.edu.my/

About the journal

Abstract

Keywords