Optimasi Parameter Random Forest Menggunakan Grid Search Untuk Analisis Time Series

Authors

  • dzikri iskandar Universitas Adhirajasa Reswara Sanjaya

Abstract

Abstrak Dalam membeli dan menjual di bursa saham, prediksi harga saham memainkan peran penting bagi para investor. Namun, prediksi harga saham merupakan tantangan karena dipengaruhi oleh faktor-faktor yang sulit diprediksi, seperti kondisi pasar, kinerja perusahaan, dan berita ekonomi. Oleh karena itu, penelitian ini bertujuan untuk menganalisis deret waktu harga penutupan saham Microsoft Corporation menggunakan algoritma Random Forest (RF) dan mengoptimalkan parameter algoritma dengan menggunakan metode optimisasi grid parameter. Data yang digunakan meliputi rentang waktu dari 1 Maret 1986 hingga 25 Mei 2023 dengan total 9378 catatan dan 6 atribut. Setelah pengumpulan dan pemrosesan data, termasuk verifikasi nilai yang hilang, data dibagi menjadi data pelatihan dan pengujian menggunakan validasi pemisahan. Selain itu, validasi silang digunakan untuk membandingkan algoritma-algoritma dan memilih algoritma RF sebagai model terbaik berdasarkan nilai RMSE terendah. Tingkat optimalisasi parameter dicapai dengan mengoptimalkan parameter grid, dengan Jumlah pohon dan Kedalaman maksimal sebagai parameter yang dioptimalkan. Analisis Paired Two Sample T-Test juga mengungkapkan perbedaan yang signifikan antara RMSE sebelum dan setelah optimisasi. Kesimpulannya, penelitian ini memberikan kontribusi yang signifikan dalam penggunaan algoritma RF dan metode optimisasi parameter grid dalam analisis deret waktu harga penutupan, dengan potensi aplikasi yang signifikan dalam pengambilan keputusan investasi di pasar saham   Kata kunci: Microsoft Corporation, Optimize Parameter Grid, Prediksi, Random Forest, Time Series.   Abstract [Random Forest Parameter Optimization Using Grid Search for Time Series Analysis]. This study focuses on analyzing the Time Series of Microsoft Corporation stock closing prices and predicting future stock prices using the Random Forest (RF) algorithm. The research aims to address the challenges of stock price prediction due to unpredictable factors like market conditions, company performance, and economic news. The dataset used covers a period from March 1, 1986, to May 25, 2023, comprising 9378 records and 6 attributes. Data preprocessing involved handling missing values and splitting the data into training and testing sets using split validation. Cross-validation was employed to compare different algorithms, with the RF algorithm selected as the best model based on the lowest Root Mean Square Error (RMSE) value. The study further optimized the RF algorithm's parameters, specifically the number of trees and max depth, using the Optimize Parameter Grid method. The optimization process successfully demonstrated a significant improvement in RMSE through a Paired two-sample T-test analysis. Overall, this research contributes to the effective use of the RF algorithm and parameter optimization techniques for analyzing Time Series data, with potential applications in supporting investment decisions in the stock market.

Downloads

Submitted

2023-08-02

Accepted

2024-03-25

Published

2024-10-05

Issue

Section

Articles