Прогнозування пунктуації тексту на основі моделі BERT

C.В. Знахур; Л.В. Знахур

doi:10.30748/soi.2020.160.12

Системи обробки інформації (Mar 2020)

Прогнозування пунктуації тексту на основі моделі BERT

C.В. Знахур,
Л.В. Знахур

Affiliations

C.В. Знахур: Харківський національний економічний університет ім. С. Кузнеця, Харків, Україна
Л.В. Знахур: Харківський національний економічний університет ім. С. Кузнеця, Харків, Україна

DOI: https://doi.org/10.30748/soi.2020.160.12
Journal volume & issue: no. 1(160),
pp. 94 – 99

Abstract

Read online

Багато актуальних NLP завдань, включаючи задачу авто пунктуації, залежать від ефективного вирішення завдання прогнозування – визначення того, який саме токен повинен бути наступним. У даній роботі розглянута підзадача прогнозування наступного токену на основі попередніх. Основною проблемою існуючих підходів є те, що вони не однаково ефективні. З метою вирішення цієї проблеми у даній роботі розглядається використання двонаправлених кодерів моделі BERT з даними, які були токенізовані.

bert, nlp, модель, пунктуація, прогнозування, токен.

Published in Системи обробки інформації

ISSN: 1681-7710 (Print); 2518-1696 (Online)
Publisher: Ivan Kozhedub Kharkiv National Air Force University
Country of publisher: Ukraine
LCC subjects: Technology: Technology (General): Industrial engineering. Management engineering: Information technology
Website: http://www.hups.mil.gov.ua/periodic-app/journal/soi/eng

About the journal

Abstract

Keywords