Сучасні інформаційні системи (May 2018)
МЕТОД АВТОМАТИЗАЦІЇ ВИЯВЛЕННЯ ЗАСТАРІЛОЇ ІНФОРМАЦІЇ НА ОСНОВІ ІНФОРМАЦІЙНО-АНАЛІТИЧНОГО АНАЛІЗУ ДАНИХ САЙТУ
Abstract
Предметом вивчення в статті являються процеси обробки даних, що розміщені на сайті для вирішення прикладного завдання автоматичного виявлення застарілої інформації. Метою являється підвищення ефективності роботи системного адміністратора сайту шляхом надання йому такого інструментарію, який би автоматично дозволяв виявляти застарілу інформацію на сайті та приймати рішення щодо її подальшої долі (видаляти, архівувати, переміщувати у спеціальні розділи тощо). Завдання: розробка методу автоматичного виявлення застарілої інформації на основі інформаційно-аналітичного аналізу даних сайту, який би надав системному адміністратору можливість подальшого автоматичного опрацювання даних сайту. Використовуваним методом є: інформаційно-аналітичний метод аналізу даних сайту, що представлений у вигляді моделі табличного представлення логічної структури алгоритму Янова. Отримані такі результати. Згідно табличної моделі процесу обробки інформації сформульовано завдання автоматичного виявлення застарілої інформації. В основу процедури автоматичного виявлення застарілої інформації покладено логічну структуру алгоритму Янова. Дана структура дозволяє наочно зберігати цілісність алгоритму при додаванні (розширенні) певних процедур. Індивідуальність об’єкта враховується за рахунок наявності або відсутності певних умов, що дозволяє уникнути рекурсій. В результаті отримано еталонні моделі (шаблони), які перетворюють текстові дані до єдиного уніфікованого представлення. Дані моделі розроблено для форматів, що характерні для інформаційних листів-повідомлень та новин. Висновки. Наукова новизна отриманих результатів полягає в наступному: ми розробили метод автоматичного виявлення застарілої інформації на основі інформаційно-аналітичного аналізу даних сайту, який відрізняється від існуючих тим, що для виявлення застарілої інформації аналізуються не лише часові показники часу створення/оновлення сторінок сайту, а безпосередньо зміст текстової сторінки. Для аналізу текстової інформації побудовані шаблони, які дозволяють автоматизувати процес виявлення застарілої інформації та оновлення сторінок сайту.
Keywords