Tạp chí Khoa học Đại học Cần Thơ (Oct 2017)

Giải thuật ước lượng số cụm dữ liệu cải tiến cho tập dữ liệu lớn

  • Dương Văn Hiếu,
  • Trần Huy Long,
  • Phạm Ngọc Giàu

DOI
https://doi.org/10.22144/ctu.jsi.2017.006
Journal volume & issue
no. CĐ Công nghệ TT

Abstract

Read online

Bài báo này trình bày một giải thuật ước lượng số cụm dữ liệu cải tiến dùng để ước lượng số cụm dữ liệu của tập dữ liệu lớn. Giải thuật được thiết kế chạy trên máy tính cá nhân có cấu hình cơ bản. Đây là một sự cải tiến của giải thuật ước lượng số cụm Cell-MST-Based bằng cách áp dụng khoảng cách có trọng số thay cho khoảng cách Euclid. Thuật toán cải tiến được đặt tên là Weighted-Cell-MST-based cluster number estimation algorithm. Thuật toán cải tiến cho kết quả ổn định hơn so với thuật toán ban đầu khi xét trên cùng các tập dữ liệu và trong cùng một điều kiện thực nghiệm.

Keywords