Системи обробки інформації (Mar 2020)

Прогнозування пунктуації тексту на основі моделі BERT

  • C.В. Знахур,
  • Л.В. Знахур

DOI
https://doi.org/10.30748/soi.2020.160.12
Journal volume & issue
no. 1(160),
pp. 94 – 99

Abstract

Read online

Багато актуальних NLP завдань, включаючи задачу авто пунктуації, залежать від ефективного вирішення завдання прогнозування – визначення того, який саме токен повинен бути наступним. У даній роботі розглянута підзадача прогнозування наступного токену на основі попередніх. Основною проблемою існуючих підходів є те, що вони не однаково ефективні. З метою вирішення цієї проблеми у даній роботі розглядається використання двонаправлених кодерів моделі BERT з даними, які були токенізовані.

Keywords