Perbandingan Algoritma Klasifikasi dalam Memprediksi Mutasi Gen pada Data Sekuensing Menggunakan Metode Encoding

ARDIANSYAH, REZA (2025) Perbandingan Algoritma Klasifikasi dalam Memprediksi Mutasi Gen pada Data Sekuensing Menggunakan Metode Encoding. Other thesis, UNIVERSITAS BINA DARMA.

	Text (BAB 0) 0.pdf Download (1MB)
	Text (BAB 1) 1.pdf Download (753kB)
	Text (DAFTAR PUSTAKA) D.pdf Download (639kB)
	Text (FULLBAB SKRIPSI) F.pdf Restricted to Repository staff only Download (4MB)
	Text (LAMPIRAN) L.pdf Download (696kB)

Abstract

Klasifikasi sekuens merupakan tugas krusial dalam bioinformatika dan biologi komputasional, yang mendasari aplikasi seperti prediksi fungsi protein, klasifikasi penyakit, dan anotasi gen. Meskipun teknik deep learning telah berhasil di domain ini, kinerja model sangat bergantung pada cara sekuens dikodekan sebelum dimasukkan ke jaringan saraf tiruan. Studi yang ada telah mengeksplorasi berbagai skema pengkodean seperti One-Hot Encoding, k-mer, embedding, dan Position Specific Scoring Matrics (PSSM), tetapi evaluasi komparatif yang komprehensif antar model masih terbatas. Studi ini bertujuan untuk mengatasi kesenjangan ini dengan mengevaluasi secara sistematis dampak empat strategi pengkodean terhadap kinerja dua model deep learning yang banyak digunakan: Convolutional Neural Networks (CNN) dan jaringan Bidirectional Long Short-Term Memory (BiLSTM). Dataset yang digunakan terdiri dari sekuens biologis berlabel (misalnya, protein atau DNA), yang telah diproses sebelumnya dan ditransformasikan menggunakan setiap metode pengkodean untuk evaluasi yang adil. Setiap model dilatih dan diuji dalam pengaturan yang konsisten untuk memastikan perbandingan yang andal. Hasil eksperimen menunjukkan bahwa pengkodean k-mer mengungguli semua metode lain, mencapai akurasi tertinggi dengan CNN (90%) dan BiLSTM (90%). Representasi berbasis embedding juga memberikan hasil yang kuat, terutama dengan BiLSTM, yang memanfaatkan kemampuannya untuk menangkap dependensi jarak jauh dalam data sekuensial, untuk One-Hot Encoding juga menunjukan hasil yang baik. Sebaliknya, PSSM menunjukkan akurasi yang jauh lebih rendah di kedua model, menunjukkan keterbatasan daya representasionalnya untuk tugas deep learning. Tujuan penelitian ini adalah untuk memandu praktisi dalam memilih strategi pengkodean yang optimal untuk model deep learning dalam tugas klasifikasi sekuens. Dengan mengidentifikasi kombinasi model-pengodean yang paling efektif, studi ini berkontribusi pada peningkatan akurasi prediktif dan efisiensi komputasi dalam aplikasi bioinformatika.

Item Type:	Thesis (Other)
Uncontrolled Keywords:	Deep-Learning,CNN, BiLSTM, Sequence Classification, K-mer
Subjects:	Z Bibliography. Library Science. Information Resources > ZA Information resources
Divisions:	Faculty of Engineering, Science and Mathematics > School of Electronics and Computer Science
Depositing User:	Miss Marina Ina
Date Deposited:	26 Jun 2026 09:49
Last Modified:	26 Jun 2026 09:49
URI:	http://repository.binadarma.ac.id/id/eprint/9748

Actions (login required)

View Item