KPI Science News (Aug 2021)
МЕТОД СИСТЕМНОЇ ІНЖЕНЕРІЇ СИСТЕМ НЕЙРОННОГО МАШИННОГО ПЕРЕКЛАДУ
Abstract
Проблематика. На ринку існує не так багато компаній-розробників систем машинного перекладу (СМП), продукти яких користуються попитом. Це, наприклад, “GoogleTranslate”, “DeepLTranslator”, “ModernMT”, “Apertium”, “Trident” тощо. Існує потреба в упорядкованих і систематизованих методів розроблення СМП, а також потрібні науково обґрунтовані методи інженерії систем нейронного машинного перекладу (СНМП), щоб якнайшвидше отримати якісний і конкурентоспроможний продукт. Мета дослідження. Застосувати бізнес-профіль Еріксона-Пенкера для розроблення та формалізації методу системної інженерії СНМП. Методика реалізації. Методологія системної інженерії і бізнес-профіль Еріксона-Пенкера для формалізації впорядкованого способу розроблення СНМП. Результати дослідження. Метод розроблення СНМП на основі застосування технік системної інженерії складається з трьох основних етапів. На першому етапі структуру СНМП моделюють як бізнес-профіль Еріксона-Пенкера, на другому – визначають множину процесів, характерну для класу систем Data Science та міжнародного стандарту CRISP-DM, а на третьому проводять верифікацію та валідацію розробленої СНМП. Висновки. Запропоновано метод системної інженерії СНМП, що базується на модифікованому бізнес-профілі Еріксона-Пенкера представлення системи на метарівні, а також міжнародних стандартів процесів DataScience та DataMining. Досліджено ефективність застосування методу на прикладі розроблення системи двоспрямованого англійсько-українського нейронного машинного перекладу EUMT (English-Ukrainian Machine Translator) і встановлено, що система EUMT щонайменше не поступається за якістю англійсько-українського перекладу популярному перекладачеві “GoogleTranslate”. Повний код версії системи EUMT опублікований на платформі GitHub та доступний за посиланням: https://github.com/EugeneSel/EUMT
Keywords