Jurnal Teknologi Informasi dan Ilmu Komputer (Jul 2023)

Prediksi Interaksi Drug Target pada Gen Kanker Menggunakan Metode Lasso-XGBoost

  • Muh Fadhil Al-Haaq Ginoga,
  • Wisnu Ananta Kusuma,
  • Mushthofa Mushthofa

DOI
https://doi.org/10.25126/jtiik.20231036603
Journal volume & issue
Vol. 10, no. 3

Abstract

Read online

Pengobatan kanker saat ini sering dilakukan dengan kemoterapi menggunakan obat kimia dan dapat menyebabkan efek samping. Alternatif pengobatan dapat menggunakan senyawa herbal yang diketahui memiliki efek samping lebih sedikit. Analisis Drug Target Interaction (DTI) dapat dilakukan untuk mengetahui interaksi senyawa herbal terhadap protein kanker. Pada penelitian ini dilakukan perancangan model prediksi DTI dengan melakukan seleksi fitur pada dataset menggunakan Least Absolute Shrinkage and Selection Operator (LASSO) lalu dilakukan penyeimbangan data dengan Synthetic Minority Oversampling Technique (SMOTE) dan diprediksi menggunakan Extreme Gradient Boosting (XGBoost). Data protein terkait kanker didapatkan dari daftar Cancer Gene Census, dari daftar tersebut dilakukan penelusuran pada database GDSC, DrugCentral, dan DrugBank untuk menghasilkan daftar senyawa obat yang berinteraksi dengan protein tersebut. Selain itu, senyawa herbal dihasilkan dari database HerbalDB dan Knapsack. Pengujian dilakukan pada beberapa jenis ekstraksi fitur seperti CTD, DC, PseAAC, dan PSSM. Hasil prediksi menunjukkan beberapa senyawa herbal seperti andrographolide, ursolic acid dan oleanolic acid memiliki interaksi pada protein terkait kanker. Selain itu, LASSO-XGBoost dapat memprediksi DTI pada kanker dengan skor F1 0,861; AUROC 0,927; recall 0,85; precision 0,866; dan accuracy 0,897. Abstract Currently, cancer treatment is usually done with chemotherapy using chemical drugs that can cause side effects. An alternative treatment can use herbal compounds that known have fewer side effects. Drug Target Interaction analysis (DTI) can be performed to determine the interaction of herbal compounds with cancer proteins. In this study, a DTI prediction model is built by selecting features on the data set using Least Absolute Shrinkage and Selection Operator (LASSO) then data balancing performed with Synthetic Minority Oversampling Technique (SMOTE) and Extreme Gradient Boosting (XGBoost) performed to predict the interaction. The cancer-associated protein data were obtained from the Cancer Gene Census list, then the list used to search on the GDSC, DrugCentral and DrugBank databases to generate a list of drug compounds that interact with these proteins. In addition, plant compounds to be generated from the HerbalDB and Knapsack databases. Tests were performed on several types of feature extraction such as CTD, DC, PseAAC and PSSM. Predictive results suggest that several herbal compounds such as andrographolide, ursolic acid and oleanolic acid interact with cancer-associated proteins. In addition, LASSO-XGBoost was able to predict DTI in cancer with score of F1 0,861; AUROC 0,927; recall 0,857, precision 0,866; and accuracy 0,897.