Tạp chí Khoa học Đại học Cần Thơ (Dec 2015)
QUY TRÌNH LẮP RÁP BỘ GIEN CHLOROPLAST
Abstract
Công nghệ xác lập trình tự gien thế hệ mới có khả năng tạo ra lượng dữ liệu khổng lồ, hàng giga bp trong một lần chạy, với chi phí ngày càng thấp. Bước tiến này cho phép thực hiện nhiều dự án giải trình tự ở các loài chưa được giải hệ gien và cả ở các loài đã giải mã trình tự nhằm thực hiện các ứng dụng sinh học phân tử khác nhau như dữ liệu đa hình đơn SNP, đánh giá sự đa dạng sinh học. Trong đó, Meta barcoding là một dự án cho phép xác định loài thực vật từ những kho dữ liệu trình tự khổng lồ. Trong nghiên cứu sinh học thực vật bộ gien chloroplast (Cp) là cơ sở quan trọng để xây dựng mã vạch sinh học dùng để định danh loài, phân loại và phân tích phát sinh loài. Tuy nhiên, phương pháp xây dựng bộ gien Cp truyền thống có hạn chế phải sử dụng mẫu gien tham chiếu. Phương pháp này không giải quyết được được yêu cầu mẫu dữ liệu đầu vào là dữ liệu thô của dự án Metabarcoding. Trong bài viết này, chúng tôi đề xuất quy trình lắp ráp bộ gien Cp cải tiến để lập trình tự bộ gien Cp từ các dữ liệu thô và không cần sử dụng gien mẫu để tham chiếu. Để đánh giá quy trình, trong thực nghiệm chúng tôi xây dựng bộ gien Cp từ bốn tập dữ liệu gien và so sánh kết quả thực nghiệm với các mẫu gien Cp đã được các nhà sinh học xây dựng.