Jurnal Teknologi Informasi dan Ilmu Komputer (Oct 2023)
Penerapan Deep Convolutional Generative Adversarial Network Untuk Menciptakan Data Sintesis Perilaku Pengemudi Dalam Berkendara
Abstract
Kecelakaan kendaraan adalah salah satu penyebab kematian tertinggi di Indonesia. Salah satu solusi untuk mencegah kecelakaan adalah dengan menggunakan sensor eksternal untuk mendeteksi kondisi jalan. Namun, penyebab utama kecelakaan adalah kelalaian pengemudi ketika mengemudi yang tidak dapat terdeteksi oleh sensor eksternal. Sensor visual dapat mendeteksi perilaku pengemudi di dalam kendaraan. Penggunaan sensor visual memiliki performa yang lebih baik ketika menggunakan metode deep learning. Salah satu metode untuk meningkatkan performa metode deep learning adalah dengan menggunakan data sintesis hasil model generatif sebagai tambahan data. Deep Convolutional Generative Adversarial Network (DCGAN) adalah salah satu model generatif yang menggunakan lapisan konvolusi. DCGAN terdiri dari dua neural network bernama generator dan discriminator yang membentuk hubungan zero-sum game. Generator menerima masukan berupa gambar asli dengan tambahan noise sebagai input proses latih secara unsupervised, menghasilkan gambar sintesis, sedangkan discriminator menerima gambar asli dan gambar sintesis sebagai input dan menghitung keaslian gambar yang selanjutnya digunakan sebagai nilai loss dengan fungsi loss Binary Cross Entropy. Arsitektur DCGAN terdiri dari beberapa transposed convolutional layer dengan batch normalization dan fungsi aktivasi ReLU dan fungsi aktivasi Tanh sebagai output layer pada generator dan beberapa convolutional layer dengan batch normalization dan fungsi aktivasi Leaky ReLU dan fungsi aktivasi Sigmoid sebagai output layer pada discriminator. Dataset yang digunakan pada penelitian ini adalah dataset ISDDS perilaku umum pengemudi yang dikumpulan pada skenario simulasi dengan jumlah dua ribu gambar. Hasil pengujian menemukan bahwa nilai hyperparameter dapat menghasilkan gambar sintesis perilaku pengemudi di dalam kendaraan yang baik dengan nilai FID sebesar 274,16 pada learning rate discriminator pada 0,0001, β1 discriminator pada 0,8005, learning rate generator pada 0,0017, β1 generator pada 0,1138 selama 43 epoch dengan menggunakan optimizer Adam pada generator dan discriminator. Abstract Vehicle crash is one of the leading causes of death in Indonesia. One of the solutions to prevent vehicle crash is by using external sensor to detect road condition. Yet, most crash happened because of driver distraction, which is hard to detect using external sensor. Visual sensor can be used to detect driver activity inside vehicle. Visual sensor that uses deep learning method performs well. One way to increase deep learning method performance is by using additional synthesis data made by generative model. Deep Convolutional Generative Adversarial Network (DCGAN) is a generative model that uses convolution layer. DCGAN consists of two neural networks titled generator and discriminator which create zero-sum game relationship. Generator will receive real image with added noise as input of unsupervised training process, creating synthetic image, while discriminator will receive real image and synthetic image as input and calculate the realness of those image which will be used as loss value with Binary Cross Entropy loss function. The Architecture of DCGAN is composed of multiple transposed convolutional layers with batch normalization and activation function ReLU and activation function Tanh as output layer in generator and multiple convolutional layers with batch normalization and activation function Leaky ReLU and activation function Sigmoid as output layer in discriminator. Dataset used in this research is primary dataset of common driver activity collected in simulation scenario with the size of two thousand images. Experiment result shows that DCGAN is able to create good image synthesis of driver activity inside vehicle with FID of 274,16 using hyperparameter consisting of learning rate discriminator at 0,0001, β1 discriminator at 0,8005, learning rate generator at 0,0017, β1 generator at 0,1138 for 43 epochs by using Adam optimizer on generator dan discriminator.