A comparative analysis and a proposed ARIMA–LSTM hybrid arima lstm model for VN-Index forecasting: empirical evidence from the Vietnamese stock market
Nguyễn Thị Dự và Đặng Thị Hồng Hà
Trường Kinh tế, Trường Đại học Công nghiệp Hà Nội
(Quanlynhanuoc.vn) – Việc dự báo chính xác chỉ số giá chứng khoán có ý nghĩa quan trọng đối với các nhà đầu tư, doanh nghiệp niêm yết và cơ quan quản lý, đặc biệt tại các thị trường mới nổi như Việt Nam, nơi tính biến động và mức độ kém hiệu quả của thông tin còn lớn. Bài viết phân tích so sánh hiệu năng của ba mô hình dự báo chuỗi thời gian – ARIMA, mạng nơ-ron hồi quy đơn giản (Simple RNN) và mạng bộ nhớ dài – ngắn (LSTM) đối với chỉ số VN-Index trong giai đoạn 12/01/2015 – 09/5/2025 (với 2.576 quan sát hằng ngày), đồng thời đề xuất một khung mô hình lai ARIMA – LSTM tích hợp đặc trưng kỹ thuật phù hợp với đặc thù dữ liệu thị trường Việt Nam. Bài viết đề xuất khung lai ARIMA – LSTM, trong đó ARIMA mô hình hóa thành phần tuyến tính và LSTM học phần dư phi tuyến, hứa hẹn cải thiện đáng kể độ chính xác dự báo khi mở rộng sang dữ liệu đa biến. Các hàm ý chính sách được thảo luận đối với nhà đầu tư, doanh nghiệp niêm yết và cơ quan quản lý thị trường.
Từ khóa: ARIMA; LSTM; RNN; mô hình lai; dự báo chuỗi thời gian; VN–Index; học máy; thị trường mới nổi.
Abstract:Accurately forecasting stock price indices is of great importance to investors, listed companies, and regulatory authorities, particularly in emerging markets such as Vietnam, where volatility and information asymmetry remain high. This paper compares the performance of three time-series forecasting models, ARIMA, Simple Recurrent Neural Network (Simple RNN), and Long Short-Term Memory (LSTM) for the VN-Index during the period from January 12, 2015, to May 9, 2025 (with 2,576 daily observations), while proposing a hybrid ARIMA-LSTM framework that incorporates technical features tailored to the specific characteristics of Vietnam’s market data. The paper proposes a hybrid ARIMA-LSTM framework, in which ARIMA models the linear component, and LSTM learns the nonlinear residual component, promising to improve forecasting accuracy when extended to multivariate data significantly. Policy implications are discussed for investors, listed companies, and market regulators.
Keywords: ARIMA; LSTM; RNN; hybrid model; time-series forecasting; VN-Index; machine learning; emerging market.
1. Đặt vấn đề
Trong hơn hai thập kỷ phát triển, thị trường chứng khoán Việt Nam đã chuyển mình từ một sàn giao dịch sơ khai với 2 mã niêm yết vào năm 2000 thành một kênh huy động vốn trung và dài hạn quan trọng đối với nền kinh tế. Tuy vậy, so với các thị trường phát triển, mức vốn hóa thị trường của Việt Nam chỉ đạt khoảng 60% GDP, mức độ tham gia của nhà đầu tư tổ chức còn thấp và tính minh bạch thông tin chưa cao, dẫn đến biến động giá ngắn hạn lớn, các cú sốc bất thường thường xuyên và mức độ kém hiệu quả thông tin (informational inefficiency) đáng kể (Bustos và cộng sự, 2025)1. Trong bối cảnh đó, chỉ số VN-Index – chỉ số gốc của Sở Giao dịch Chứng khoán TP. Hồ Chí Minh (HOSE) – không chỉ phản ánh xu hướng thị trường mà còn được sử dụng làm chỉ số tham chiếu để nghiên cứu định giá, quản trị danh mục và hoạch định chính sách kinh tế vĩ mô.
Việc dự báo chính xác diễn biến của VN-Index có ý nghĩa thực tiễn đặc biệt đối với 3 nhóm chủ thể chính. Đối với các nhà đầu tư cá nhân – nhóm chiếm hơn 80% tổng số tài khoản giao dịch tại Việt Nam – dự báo tốt giúp giảm thiểu rủi ro và tối ưu hóa các quyết định mua, bán hoặc nắm giữ chứng khoán. Đối với các định chế tài chính, dự báo chính xác là cơ sở để xây dựng chiến lược phân bổ tài sản, định lượng rủi ro thị trường và thiết lập mô hình stress test. Đối với cơ quan quản lý, các tín hiệu dự báo cảnh báo sớm có thể giúp nhận diện những biến động bất thường, ngăn ngừa rủi ro đối với hệ thống và đưa ra phản ứng chính sách kịp thời.
Trên thế giới, hai trường phái phương pháp luận chính đã được phát triển nhằm giải quyết bài toán dự báo chuỗi thời gian tài chính. Trường phái thống kê truyền thống – đại diện tiêu biểu là mô hình ARIMA (Autoregressive Integrated Moving Average) do Box và Jenkins đề xuất từ thập niên 1970 – có lý thuyết chặt chẽ, dễ giải thích và tỏ ra hiệu quả đối với các chuỗi tuyến tính có xu hướng rõ ràng (Box và cộng sự, 2015)2. Trường phái thứ hai dựa trên các kỹ thuật học máy và học sâu, trong đó các mạng nơ-ron hồi quy (RNN) và đặc biệt là LSTM (Hochreiter và Schmidhuber, 1997)3 được kỳ vọng sẽ vượt trội nhờ khả năng học các mối quan hệ phi tuyến và dài hạn trong dữ liệu chuỗi thời gian. Nhiều nghiên cứu gần đây (Heednacram và cộng sự, 2024)4 khẳng định rằng LSTM thường vượt trội so với ARIMA trên các thị trường phát triển có dữ liệu lớn và đa dạng về đặc trưng đầu vào.
Tuy vậy, vẫn tồn tại 2 khoảng trống nghiên cứu lớn trong bối cảnh thị trường chứng khoán Việt Nam. Thứ nhất, hầu hết các nghiên cứu trong nước hoặc chỉ sử dụng một mô hình duy nhất (Trần, 2024)5, hoặc sử dụng bộ dữ liệu ngắn dưới 5 năm, khiến kết quả so sánh thiếu tính đại diện giữa các chu kỳ thị trường khác nhau. Thứ hai, chưa có nghiên cứu nào đánh giá đồng thời ba mô hình ARIMA, RNN và LSTM trên cùng một bộ dữ liệu dài, đồng thời đề xuất một khung mô hình lai (hybrid) có tính đến đặc thù của thị trường Việt Nam – nơi mà các biến vĩ mô có tần suất thấp, dữ liệu cảm xúc nhà đầu tư còn hạn chế và các cú sốc chính sách thường tạo ra điểm gãy cấu trúc.
2. Tổng quan tài liệu
2.1. Dự báo chuỗi thời gian tài chính bằng mô hình ARIMA
Mô hình ARIMA của Box và Jenkins (1976)6 là khung dự báo chuỗi thời gian được sử dụng rộng rãi nhất trong gần năm thập kỷ qua nhờ ba ưu điểm: cơ sở thống kê chặt chẽ, quy trình lựa chọn mô hình có hệ thống thông qua kiểm định ACF/PACF và các tiêu chí thông tin AIC/BIC và khả năng diễn giải các thành phần tự hồi quy (AR), tích phân (I) và trung bình trượt (MA). Nguyễn và Nguyễn (2014)7 là một trong những nghiên cứu sớm ứng dụng ARIMA cho VN-Index, kết luận rằng ARIMA (1,1,1) cho sai số dưới 1% trong dự báo ngắn hạn. Trong dự báo lạm phát Việt Nam, Tạp chí Ngân hàng (2023)8 cho thấy ARIMA (1,1,12) đạt MAPE khoảng 1%, đủ tin cậy để hỗ trợ điều hành chính sách tiền tệ.
Ở phạm vi quốc tế, các nghiên cứu so sánh ARIMA với các mô hình thay thế cho thấy kết quả đa dạng. Kobiela và cộng sự (2022)9 so sánh ARIMA và LSTM trên dữ liệu NASDAQ giai đoạn 2008–2021, kết luận rằng LSTM tỏ ra ưu việt hơn trong dự báo dài hạn, trong khi ARIMA vẫn cạnh tranh trong dự báo ngắn hạn. Ma (2020)10 tiến hành so sánh ARIMA, ANN và LSTM, ghi nhận LSTM có khả năng dự đoán tốt nhất nhưng cũng nhấn mạnh rằng hiệu năng của LSTM phụ thuộc nhiều vào chất lượng tiền xử lý dữ liệu. Một dòng nghiên cứu khác đề cập đến tính giới hạn của ARIMA khi xử lý các mối quan hệ phi tuyến và các cú sốc cấu trúc — những đặc tính phổ biến trong dữ liệu của thị trường tài chính.
2.2. Mô hình học sâu trong dự báo thị trường chứng khoán
Mạng nơ-ron hồi quy (RNN) được thiết kế để xử lý dữ liệu tuần tự nhờ cơ chế chia sẻ tham số giữa các bước thời gian. Tuy nhiên, các phiên bản RNN cơ bản (Simple RNN) gặp vấn đề tiêu biến gradient (vanishing gradient) khi chuỗi dài, làm giảm khả năng học các phụ thuộc ở khoảng cách xa. Hochreiter và Schmidhuber (1997)11 đã giải quyết vấn đề này bằng kiến trúc LSTM, trong đó các cổng quên, cổng vào và cổng ra điều phối dòng thông tin qua trạng thái tế bào, cho phép mô hình ghi nhớ thông tin trong hàng trăm bước thời gian.
Trên thị trường chứng khoán Đài Loan, Su và cộng sự (2022)12 đề xuất khung stacking dựa trên Light Gradient Boosting Machine (LGBM), kết hợp với lựa chọn đặc trưng, để dự báo chỉ số TAIEX, đạt độ chính xác phân loại cao trong giai đoạn 10 năm. Heednacram và cộng sự (2024)13 so sánh bốn thuật toán – hồi quy tuyến tính, k-NN, SVM và Bi-LSTM – cho dự báo giá thấp và giá cao của cổ phiếu Thái Lan, ghi nhận Bi-LSTM đạt RMSE = 0,018, vượt SVM tới 58%. Song và cộng sự (2022)14 đề xuất mô hình lai GARCH–MIDAS với học sâu để tích hợp các biến vĩ mô tần suất thấp vào dự báo biến động cổ phiếu, cho thấy sự kết hợp này cải thiện đáng kể độ chính xác dự báo trong trung hạn.
Bustos, Pomares-Quimbaya và Stellian (2025)15 thực hiện một nghiên cứu quy mô lớn, so sánh bảy thuật toán học máy phổ biến (SVM, ANN, gradient boosted trees, Naive Bayes, random forest, hồi quy logistic và LSTM) trên 55 chỉ số thị trường và 65 giai đoạn, đồng thời xem xét mối quan hệ giữa hiệu năng dự báo và mức độ hiệu quả của thị trường. Kết quả cho thấy, không tồn tại một thuật toán vượt trội tuyệt đối; thay vào đó, hiệu năng phụ thuộc rõ rệt vào mức độ hiệu quả của từng thị trường và đặc thù của chuỗi thời gian. Phát hiện này đặt nền móng cho luận điểm rằng đối với các thị trường mới nổi như Việt Nam – nơi mức độ kém hiệu quả thông tin tương đối cao – việc kiểm chứng thực nghiệm trên dữ liệu nội địa là hết sức cần thiết.
2.3. Mô hình lai trong dự báo chuỗi thời gian
Zhang (2003)16 đề xuất một khung lai cổ điển ARIMA–ANN dựa trên giả định rằng chuỗi thời gian tài chính có thể được phân rã thành thành phần tuyến tính và phần dư phi tuyến: ARIMA mô hình hóa thành phần tuyến tính, sau đó mạng nơ-ron học phần dư còn lại. Sự kết hợp này tận dụng được điểm mạnh của cả hai trường phái và đã được mở rộng theo nhiều hướng. Choi (2018)17 đề xuất mô hình ARIMA–LSTM để dự đoán hệ số tương quan giá cổ phiếu trong rổ S&P 500, cho thấy mô hình lai vượt trội đáng kể so với từng mô hình thành phần. Temür, Akgün và Temür (2019)18 áp dụng ARIMA, LSTM và ARIMA–LSTM cho dữ liệu doanh thu bán nhà ở Thổ Nhĩ Kỳ, kết luận rằng mô hình lai có MAPE và MSE thấp nhất trong số 3 mô hình.
Trong bối cảnh Việt Nam, Loan, Hung và Van (2024)19 ứng dụng đồng thời ARIMA và các mô hình học sâu để dự báo giá cổ phiếu trên HOSE, gợi ý rằng phương pháp lai cho kết quả ổn định hơn ở các thị trường có cú sốc cấu trúc. Tuy nhiên, các nghiên cứu về VN-Index vẫn còn rất hạn chế cả về số lượng lẫn quy mô dữ liệu. Đỗ Trung Hiếu và cộng sự (2022)20 tiếp cận theo hướng AutoTS Pipeline kết hợp Prophet, TCN, LSTM và Seq2Seq trên nền tảng BigDL, nhưng phạm vi vẫn dừng ở các cổ phiếu riêng lẻ thay vì chỉ số tổng hợp.
3. Cơ sở lý thuyết và phương pháp nghiên cứu
3.1. Mô hình ARIMA (p, d, q)
Mô hình ARIMA tổng hợp 3 thành phần: tự hồi quy bậc p, tích phân bậc d và trung bình trượt bậc q. Đối với một chuỗi thời gian dừng Y_t, dạng tổng quát ARIMA(p, d, q) sau khi lấy sai phân bậc d được biểu diễn như sau:
Δ^d Y_t = c + Σ φ_i Δ^d Y_{t-i} + Σ θ_j ε_{t-j} + ε_t, (1)
Trong đó Δ là toán tử sai phân bậc nhất, c là hằng số, φ_i là các hệ số tự hồi quy, θ_j là các hệ số trung bình trượt và ε_t là nhiễu trắng. Quy trình Box–Jenkins gồm bốn bước: nhận dạng – xác định p, d, q dựa trên kiểm định tính dừng ADF và đồ thị tự tương quan ACF, PACF; ước lượng – sử dụng phương pháp ước lượng hợp lý cực đại (MLE); chẩn đoán – kiểm tra phần dư bằng kiểm định Ljung–Box và kiểm tra phân phối chuẩn; dự báo. Để lựa chọn cấu hình tối ưu, nghiên cứu sử dụng đồng thời 3 tiêu chí: AIC = -2 ln L + 2k; BIC = -2 ln L + k ln n; HQIC = -2 ln L + 2k ln (ln n), trong đó L là hàm hợp lý cực đại, k là số tham số và n là cỡ mẫu. Mô hình có giá trị AIC, BIC, HQIC thấp nhất được lựa chọn.
3.2. Mạng nơ-ron hồi quy đơn giản (Simple RNN)
Mạng RNN xử lý chuỗi đầu vào x_1, x_2, …, x_T thông qua trạng thái ẩn h_t được cập nhật đệ quy:
h_t = f (U x_t + W h_{t-1} + b), (2)
Trong đó, U và W là ma trận trọng số đầu vào và trạng thái, b là vector lệch, và f thường là hàm phi tuyến tanh hoặc ReLU. Đầu ra tại bước t được tính bằng o_t = softmax(V h_t + c). Mặc dù có thể nắm bắt phụ thuộc trong chuỗi, RNN cơ bản gặp khó khăn với chuỗi dài do vấn đề tiêu biến/bùng nổ gradient khi lan truyền ngược (backpropagation through time, BPTT).
3.3. Mạng bộ nhớ dài–ngắn (LSTM)
LSTM bổ sung 3 cổng và một trạng thái tế bào C_t vào RNN cơ bản, qua đó kiểm soát có chọn lọc lượng thông tin được giữ lại, được cập nhật và được xuất ra. Các phương trình chính của LSTM được biểu diễn như sau:
f_t = σ (W_f · [h_{t-1}, x_t] + b_f), (3)
i_t = σ (W_i · [h_{t-1}, x_t] + b_i), (4)
C̃_t = tanh (W_C · [h_{t-1}, x_t] + b_C), (5)
C_t = f_t ⊙ C_{t-1} + i_t ⊙ C̃_t, (6)
o_t = σ (W_o · [h_{t-1}, x_t] + b_o), (7)
h_t = o_t ⊙ tanh(C_t), (8)
Trong đó σ là hàm sigmoid, ⊙ là phép nhân Hadamard; f_t, i_t, o_t lần lượt là cổng quên, cổng vào và cổng ra; C̃_t là trạng thái ứng viên. Cấu trúc cổng này giúp LSTM duy trì gradient ổn định qua hàng trăm bước thời gian, khiến nó trở thành công cụ chuẩn cho các bài toán dự báo chuỗi thời gian tài chính có phụ thuộc dài hạn.
3.4. Khung mô hình lai ARIMA–LSTM đề xuất
Dựa trên ý tưởng phân rã của Zhang (2003)21, nhóm tác giả đề xuất khung lai ARIMA–LSTM, gồm 3 bước phù hợp với đặc thù dữ liệu tại Việt Nam. Giả định rằng, giá trị quan sát y_t có thể được phân rã thành hai thành phần:
y_t = L_t + N_t, (9)
Trong đó, L_t là thành phần tuyến tính được mô hình hóa bằng ARIMA và N_t là thành phần phi tuyến được mô hình hóa bằng LSTM. Quy trình lai gồm các bước cụ thể như sau.
Bước 1 – Mô hình hóa tuyến tính. Sử dụng quy trình Box–Jenkins để ước lượng ARIMA (p̂, d̂, q̂) tối ưu trên chuỗi y_t, thu được dự báo L̂_t và phần dư e_t = y_t − L̂_t.
Bước 2 – Mô hình hóa phi tuyến của phần dư. Phần dư e_t được đưa vào mô hình LSTM dưới dạng cửa sổ trượt có độ dài m phiên (m = 60 trong nghiên cứu này). LSTM học hàm phi tuyến N̂_t = g(e_{t-1}, e_{t-2}, …, e_{t-m}; θ), trong đó θ là tập tham số được tối ưu bằng thuật toán Adam với hàm mất mát MSE. Đầu vào của LSTM còn có thể được mở rộng để bao gồm các đặc trưng kỹ thuật như đường trung bình động (SMA), chỉ số sức mạnh tương đối (RSI), độ biến động ngắn hạn và khối lượng giao dịch nhằm tăng cường khả năng nắm bắt các yếu tố phi tuyến.
Bước 3 – Tổng hợp dự báo. Dự báo cuối cùng được tính bằng ŷ_t = L̂_t + N̂_t. Cách tiếp cận này có 3 ưu điểm so với việc chỉ dùng một mô hình đơn lẻ. Thứ nhất, ARIMA bắt được xu hướng tuyến tính và các dao động ngắn hạn rõ ràng, đồng thời cung cấp đường dự báo cơ sở ổn định. Thứ hai, LSTM khai thác các mối phụ thuộc phi tuyến trong phần dư – nơi thông tin về cú sốc, hiệu ứng đám đông và các biến động bất thường tập trung. Thứ ba, sai số dự báo của khung lai thường thấp hơn tổng sai số của từng thành phần vì hai nguồn sai số không có mối tương quan mạnh.
3.5. Chỉ số đánh giá mô hình
Nghiên cứu sử dụng ba chỉ số đánh giá phổ biến trong các bài toán hồi quy chuỗi thời gian (Hyndman và Athanasopoulos, 2018):
MAE = (1/n) Σ |y_i − ŷ_i|; MSE = (1/n) Σ (y_i − ŷ_i)²; R² = 1 − SSR/SST, (10)
Trong đó, n là số quan sát kiểm tra; y_i là giá trị thực tế; ŷ_i là giá trị dự báo; SSR là tổng bình phương phần dư; và SST là tổng bình phương toàn phần. MAE đo lường sai số tuyệt đối trung bình theo cùng đơn vị với biến mục tiêu, MSE phạt nặng các sai số lớn (phù hợp khi quan ngại các điểm dự báo lệch nhiều), trong khi R² phản ánh tỷ lệ phương sai của dữ liệu thực tế được mô hình giải thích. Mô hình tối ưu là mô hình có MAE và MSE thấp nhất, đồng thời có R² cao nhất.
3.6. Quy trình thực nghiệm
Quy trình thực nghiệm tổng thể gồm 4 bước. Bước 1 – Tiền xử lý dữ liệu: làm sạch dữ liệu, xử lý giá trị thiếu, chuyển định dạng ngày và chuẩn hóa Min-Max về khoảng [0, 1] để các mô hình học sâu hội tụ nhanh hơn. Bước 2 – Phân tách dữ liệu: chia chuỗi theo tỷ lệ 80% huấn luyện và 20% kiểm tra, đảm bảo thứ tự thời gian không bị xáo trộn (shuffle = False) để phản ánh đúng tính chất của chuỗi thời gian. Bước 3 – Huấn luyện mô hình: lựa chọn ARIMA tối ưu thông qua AIC/BIC/HQIC; xây dựng và huấn luyện LSTM với 2 lớp gồm 50 đơn vị ẩn, dropout 0,2, optimizer Adam, loss MSE, batch size 512, 20 epochs; xây dựng RNN với cấu hình tương ứng để đảm bảo so sánh công bằng. Bước 4 – Đánh giá và lựa chọn mô hình: so sánh MAE, MSE, R² trên tập kiểm tra và sử dụng mô hình tối ưu để dự báo VN-Index trong 30 phiên tiếp theo (06/5/2025–09/6/2025).
4. Dữ liệu và bối cảnh thực nghiệm
4.1. Nguồn dữ liệu và phạm vi
Dữ liệu nghiên cứu là giá đóng cửa hằng ngày của chỉ số VN-Index trong giai đoạn 12/01/2015 – 09/5/2025, thu thập từ trang vn.investing.com – nguồn dữ liệu tài chính chuyên sâu được sử dụng rộng rãi trong các nghiên cứu định lượng tại Việt Nam. Sau khi loại bỏ các phiên không giao dịch và các giá trị thiếu, bộ dữ liệu gồm 2.576 quan sát hằng ngày, bao gồm 7 thuộc tính: ngày giao dịch, giá mở cửa, giá cao nhất, giá thấp nhất, giá đóng cửa, khối lượng giao dịch và biến động phần trăm. Trong các phân tích thực nghiệm chính, biến giá đóng cửa (Close) được sử dụng làm biến mục tiêu, đảm bảo so sánh trực tiếp với các nghiên cứu quốc tế tương đương.
Khoảng thời gian 10 năm được chọn vì 2 lý do. Một là, độ dài này đủ để bao quát nhiều chu kỳ thị trường khác biệt – chu kỳ tăng trưởng ổn định 2016–2018, đợt điều chỉnh 2018–2019, cú sốc Covid-19 đầu năm 2020, giai đoạn bùng nổ thanh khoản 2020–2021 với mức đỉnh lịch sử trên 1.500 điểm, pha điều chỉnh sâu 2022 và giai đoạn hồi phục dần 2023–2025. Hai là, dung lượng dữ liệu trên 2.500 quan sát đáp ứng yêu cầu tối thiểu để các mô hình học sâu có thể học được các đặc trưng phức tạp mà không bị giới hạn bởi cỡ mẫu nhỏ – một hạn chế thường gặp trong các nghiên cứu trước đây tại Việt Nam (Nguyễn và Nguyễn, 2014; Trần, 2024)22.
4.2. Mô tả thống kê và đặc điểm chuỗi dữ liệu
Bảng 1 trình bày các thống kê mô tả cơ bản. Trong giai đoạn nghiên cứu, VN-Index có giá trị trung bình 1.034,52 điểm, độ lệch chuẩn 258,71 điểm và biên độ dao động từ 521,80 (đáy Covid tháng 3/2020) đến 1.535,40 (đỉnh tháng 1/2022). Tỷ suất sinh lời hằng ngày có giá trị trung bình dương rất nhỏ (0,038%) cùng độ lệch chuẩn 1,176%, hệ số nhọn cao (kurtosis = 7,463) và bất đối xứng âm (skewness = −0,892), phản ánh đặc trưng kinh điển của dữ liệu tài chính – đuôi dày và tần suất xuất hiện các cú sốc giảm lớn hơn các cú sốc tăng tương đương.
Bảng 1. Mô tả thống kê dữ liệu VN-Index (12/01/2015 – 09/5/2025)
| Thống kê | Giá đóng cửa (điểm) | Lợi suất ngày (%) | Khối lượng (triệu CP) |
| Số quan sát | 2.576 | 2.575 | 2.576 |
| Trung bình | 1.034,52 | 0,038 | 564,8 |
| Độ lệch chuẩn | 258,71 | 1,176 | 325,4 |
| Giá trị nhỏ nhất | 521,80 | -6,675 | 72,1 |
| Giá trị lớn nhất | 1.535,40 | 4,978 | 1.852,3 |
| Hệ số bất đối xứng (Skewness) | 0,127 | -0,892 | 1,234 |
| Hệ số nhọn (Kurtosis) | -0,915 | 7,463 | 4,058 |
Kiểm định Augmented Dickey–Fuller (ADF) trên chuỗi giá đóng cửa gốc cho giá trị p-value = 0,538 (lớn hơn ngưỡng ý nghĩa 5%), tức không đủ cơ sở để bác bỏ giả thuyết không tồn tại nghiệm đơn vị – chuỗi giá đóng cửa VN-Index là chuỗi không dừng. Sau khi lấy sai phân bậc nhất, kiểm định ADF cho p-value < 0,001, xác nhận chuỗi sai phân bậc 1 là chuỗi dừng. Kết quả này xác định bậc tích phân d = 1 trong mô hình ARIMA.
4.3. Lựa chọn cấu hình mô hình
Đối với ARIMA, dựa trên đồ thị tự tương quan ACF và tự tương quan riêng phần PACF của chuỗi sai phân bậc nhất, các giá trị p và q ứng viên được khoanh vùng trong khoảng [1, 5]. Bốn cấu hình ARIMA (1,1,1), ARIMA (5,1,1), ARIMA (1,1,5), ARIMA (5,1,5) được ước lượng và so sánh theo 3 tiêu chí AIC, BIC, HQIC (Bảng 2).
Đối với LSTM và Simple RNN, kiến trúc gồm hai lớp hồi quy với 50 đơn vị ẩn mỗi lớp, sau mỗi lớp có một lớp Dropout 0,2 để giảm thiểu hiện tượng quá khớp, tiếp theo là hai lớp Dense (25 đơn vị và 1 đơn vị). Cửa sổ trượt đầu vào là 60 phiên giao dịch, được lựa chọn dựa trên hai cơ sở: khoảng thời gian này tương ứng với khoảng một quý dương lịch — đơn vị thời gian phổ biến trong phân tích kỹ thuật chứng khoán — và cửa sổ này đủ dài để bao gồm các chu kỳ ngắn hạn của thị trường mà không gây bùng nổ kích thước mẫu. Cả hai mô hình được huấn luyện 20 epoch với batch size 512, sử dụng optimizer Adam và hàm mất mát MSE; tỷ lệ chia train/test là 80/20 không xáo trộn.
5. Kết quả nghiên cứu và thảo luận
5.1. Lựa chọn cấu hình ARIMA tối ưu
Bảng 2 trình bày các tiêu chí thông tin của 4 cấu hình ứng viên ARIMA. Cấu hình ARIMA (1,1,1) đạt giá trị thấp nhất ở cả 3 tiêu chí AIC, BIC và HQIC, thấp hơn lần lượt 8,75; 7,44; 20,87 đơn vị so với các cấu hình thay thế. Chênh lệch BIC trên 6 đơn vị thường được xem là bằng chứng mạnh ủng hộ mô hình có BIC thấp hơn (Hyndman và Athanasopoulos, 2018)23. Như vậy, ARIMA (1,1,1) được lựa chọn làm cấu hình tối ưu cho dự báo VN-Index. Điều này phù hợp với phát hiện của Nguyễn và Nguyễn (2014)24 trên dữ liệu VN-Index giai đoạn trước và phản ánh tính bám chặt của VN-Index theo mô hình bước ngẫu nhiên có hiệu chỉnh.
Bảng 2. So sánh các tiêu chí thông tin của các cấu hình ARIMA ứng viên
| Cấu hình ARIMA | AIC | BIC | HQIC |
| ARIMA(1,1,1) | 21.683,42 | 21.701,02 | 21.689,82 |
| ARIMA(5,1,1) | 21.692,17 | 21.733,23 | 21.707,09 |
| ARIMA(1,1,5) | 21.690,86 | 21.731,91 | 21.705,77 |
| ARIMA(5,1,5) | 21.704,29 | 21.768,73 | 21.727,75 |
5.2. Hiệu năng dự báo của ba mô hình
Bảng 3 báo cáo kết quả đánh giá hiệu năng của 3 mô hình trên tập kiểm tra (20% dữ liệu cuối cùng, tương đương 504 phiên giao dịch). Kết quả cho thấy, ARIMA (1,1,1) vượt trội hai mô hình học sâu trên cả 3 chỉ số: MAE thấp hơn LSTM tới 59,5% (8,43 so với 20,83) và thấp hơn Simple RNN tới 71,6% (8,43 so với 29,64); MSE chỉ bằng khoảng 21,3% so với LSTM và 10,8% so với Simple RNN. R² của ARIMA đạt 0,97, cho thấy mô hình giải thích được 97% phương sai của dữ liệu thực tế, trong khi LSTM và RNN lần lượt đạt 0,84 và 0,69.
Bảng 3. Hiệu năng dự báo của ba mô hình trên tập kiểm tra
| Mô hình | MAE | MSE | R² |
| ARIMA(1,1,1) | 8,43 | 174,55 | 0,97 |
| LSTM (60 phiên, 2 lớp) | 20,83 | 821,22 | 0,84 |
| Simple RNN (60 phiên, 2 lớp) | 29,64 | 1.622,40 | 0,69 |
5.3. Phân tích phần dư và hành vi của các mô hình
Phân tích đường dự báo cho thấy ARIMA (1,1,1) bám rất sát giá trị thực tế trong toàn bộ giai đoạn kiểm tra, đặc biệt trong các pha thị trường có xu hướng rõ rệt. Mô hình LSTM tuy không vượt trội so với ARIMA về sai số tổng quát, nhưng ổn định và không có dấu hiệu quá khớp – giá trị mất mát huấn luyện và mất mát kiểm tra hội tụ về mức ≈0,0008 sau 10 epoch và duy trì ở mức đó cho đến hết quá trình huấn luyện. Tuy nhiên, LSTM có xu hướng phản ứng chậm hơn trong các giai đoạn thị trường đảo chiều mạnh (chẳng hạn, quý 2/2022 khi VN-Index lao dốc từ 1.500 xuống dưới 1.100 điểm), dẫn đến sai số tăng đột biến trong những giai đoạn này. Simple RNN có biểu hiện kém nhất do gặp vấn đề tiêu biến gradient, không nắm bắt tốt các phụ thuộc dài hạn trong chuỗi 60 phiên đầu vào.
ARIMA vượt trội so với học sâu, khá phổ biến trong các nghiên cứu so sánh có cấu hình tương tự nghiên cứu này, và có thể được giải thích thông qua bốn cơ chế chính.
Thứ nhất, bài toán được xây dựng theo kịch bản đơn biến – chỉ sử dụng giá đóng cửa làm đầu vào duy nhất. ARIMA là mô hình được thiết kế chuẩn cho chuỗi đơn biến với cơ sở thống kê chặt chẽ, trong khi sức mạnh của LSTM lại nằm ở khả năng học các tương tác phi tuyến giữa nhiều biến đầu vào. Khi chỉ có một biến và tín hiệu tuyến tính chiếm ưu thế, ARIMA có lợi thế về mặt cấu trúc. Phát hiện này nhất quán với Bustos và cộng sự (2025) – không có thuật toán vượt trội tuyệt đối; hiệu năng phụ thuộc vào đặc thù của chuỗi và mức độ hiệu quả của từng thị trường.
Thứ hai, VN-Index có mức độ tự tương quan tuyến tính cao ở các độ trễ ngắn – kết quả kiểm định cho thấy hệ số tương quan tại độ trễ 1 lớn hơn 0,99 trên chuỗi gốc. Điều này phản ánh tính kém hiệu quả thông tin của thị trường mới nổi: giá hôm nay vẫn chứa nhiều thông tin có thể dự báo từ giá hôm qua, đúng theo cấu trúc mà ARIMA (1,1,1) khai thác tối ưu. Trên các thị trường phát triển hiệu quả hơn, hiệu ứng này yếu hơn và sai số ARIMA tăng nhanh.
Thứ ba, dữ liệu huấn luyện cho LSTM vẫn còn tương đối hạn chế so với các tiêu chuẩn của các bài toán học sâu. Mặc dù 2.576 quan sát là tương đối dài đối với thị trường Việt Nam, con số này vẫn nhỏ so với hàng chục nghìn quan sát giờ/phút trong các nghiên cứu LSTM thành công trên các thị trường phát triển. Khi không có dữ liệu đa biến và đặc trưng kỹ thuật phong phú, LSTM dễ rơi vào trạng thái ‘học vẹt’ xu hướng tuyến tính, từ đó mất đi lợi thế phi tuyến.
Thứ tư, cấu hình LSTM trong nghiên cứu này được giữ ở mức cơ sở (2 lớp, 50 đơn vị, dropout 0,2) để đảm bảo tính so sánh với các nghiên cứu trước. Một cấu hình LSTM tinh chỉnh sâu hơn, chẳng hạn LSTM hai chiều (Bi-LSTM) như Heednacram và cộng sự (2024)26, hoặc LSTM tích hợp cơ chế chú ý (attention) – có thể đạt hiệu năng cạnh tranh hơn. Tuy nhiên, sự đánh đổi giữa mức độ phức tạp của mô hình và chi phí huấn luyện cần được cân nhắc trong các bài toán ứng dụng thực tế.
5.4. Dự báo VN-Index 30 phiên tiếp theo bằng mô hình tối ưu
Sử dụng mô hình ARIMA (1,1,1) làm mô hình tối ưu, nghiên cứu tiến hành dự báo VN-Index trong 30 phiên giao dịch tiếp theo từ 06/05/2025 đến 09/06/2025. Kịch bản dự báo cho thấy có 2 pha rõ rệt. Trong 3–4 phiên đầu tháng 5/2025, mô hình dự báo VN-Index giảm từ 1.264 xuống 1.256 điểm, với độ dốc gần như thẳng đứng – phản ánh phản ứng nhanh trước các tín hiệu tiêu cực trong ngắn hạn. Tiếp đó, đường dự báo cho thấy một đợt hồi phục hình chữ V kinh điển, đưa chỉ số quay lại vùng 1.260–1.261 điểm chỉ sau khoảng 1 tuần. Từ ngày 20/5/2025 trở đi, đường dự báo trở nên ổn định trong biên độ hẹp 1.260–1.261 điểm. Hành vi này phản ánh đặc tính hội tụ về giá trị trung bình dài hạn của các mô hình ARIMA – một hạn chế cố hữu khi dự báo các sự kiện đột biến hoặc thay đổi cấu trúc lớn không có trong dữ liệu lịch sử.
5.5. So sánh với các nghiên cứu trước
Kết quả của nghiên cứu này có 2 điểm khác biệt đáng chú ý so với các nghiên cứu quốc tế.
Thứ nhất, trong khi Ma (2020) và Kobiela và cộng sự (2022) ghi nhận LSTM vượt trội so với ARIMA trên dữ liệu thị trường phát triển, nghiên cứu này cho kết quả ngược lại đối với VN-Index. Sự khác biệt này không có nghĩa là LSTM ‘thua’ hoàn toàn ARIMA mà phản ánh rằng tính ưu việt của một mô hình phụ thuộc vào 3 yếu tố: đặc thù thị trường (mức độ hiệu quả thông tin), cấu trúc đầu vào (đơn biến hay đa biến), và độ dài/chất lượng dữ liệu huấn luyện. Điều này tương đồng với kết luận tổng quát của Bustos và cộng sự (2025) sau khi phân tích 55 thị trường.
Thứ hai, so với các nghiên cứu trong nước, kết quả ARIMA(1,1,1) với R² = 0,97 nằm trong vùng đỉnh của các nghiên cứu về VN-Index trước đây. So với Nguyễn và Nguyễn (2014) (sai số dự báo dưới 1%, R² không báo cáo) và Trần (2024) (LSTM-GRU Hybrid trên dữ liệu 100 ngày), kết quả này được củng cố thêm bởi dung lượng dữ liệu lớn hơn và phạm vi thời gian dài hơn, gợi ý rằng ARIMA (1,1,1) là mô hình tham chiếu vững chắc cho các nghiên cứu thực nghiệm tiếp theo trên VN-Index.
6. Hàm ý chính sách và ứng dụng thực tiễn
6.1. Đối với nhà đầu tư cá nhân và tổ chức
Một là, trong các giai đoạn thị trường có xu hướng ổn định và tuyến tính, mô hình ARIMA cung cấp dự báo có độ chính xác cao với chi phí tính toán thấp, dễ giải thích và dễ triển khai trong các ứng dụng thực tế. Nhà đầu tư cá nhân và các quỹ quy mô vừa có thể sử dụng ARIMA (1,1,1) làm cơ sở để xác định các vùng giá tham chiếu ngắn hạn và thiết lập các điểm vào/ra theo chiến lược định lượng đơn giản.
Hai là, trong các giai đoạn thị trường biến động mạnh hoặc có khả năng xảy ra cú sốc cấu trúc (ví dụ thay đổi chính sách lớn, khủng hoảng tài chính toàn cầu), nhà đầu tư cần thận trọng với các dự báo từ một mô hình đơn lẻ. Khung mô hình lai ARIMA–LSTM được đề xuất trong nghiên cứu cho phép kết hợp tính ổn định của ARIMA với khả năng học phi tuyến của LSTM, tạo nên một công cụ dự báo mạnh mẽ hơn cho các định chế tài chính lớn. Việc bổ sung các đặc trưng kỹ thuật (SMA, RSI, ATR, độ biến động cuộn) và các biến vĩ mô tần suất cao (lãi suất liên ngân hàng, tỷ giá USD/VND, giá vàng) sẽ giúp khai thác tối đa tiềm năng của khung lai này.
Ba là, các nhà đầu tư cần kết hợp dự báo định lượng với các phân tích định tính – đặc biệt là tin tức chính sách, kết quả kinh doanh quý và các sự kiện địa chính trị – do bản chất hội tụ về giá trị trung bình của các mô hình chuỗi thời gian khiến chúng kém nhạy với các điểm gãy cấu trúc. Một quy trình ra quyết định tối ưu nên kết hợp 3 lớp: dự báo định lượng làm cơ sở, sàng lọc rủi ro dựa trên các chỉ báo kỹ thuật, và đánh giá các yếu tố ngoại sinh dựa trên phân tích cơ bản.
6.2. Đối với doanh nghiệp niêm yết
Đối với doanh nghiệp niêm yết, dự báo VN-Index không chỉ là công cụ tham khảo mà còn ảnh hưởng trực tiếp đến các quyết định tài chính chiến lược. Trong các giai đoạn thị trường được dự báo tăng ổn định, doanh nghiệp có thể đẩy nhanh các kế hoạch phát hành cổ phiếu, niêm yết bổ sung hoặc M&A để tận dụng định giá thị trường thuận lợi. Ngược lại, trong các giai đoạn dự báo điều chỉnh, doanh nghiệp nên trì hoãn các đợt phát hành mới và ưu tiên các kênh huy động vốn thay thế như phát hành trái phiếu doanh nghiệp hoặc vay ngân hàng. Doanh nghiệp cũng nên tích hợp dự báo VN-Index vào các mô hình lập kế hoạch tài chính dài hạn (FP&A), đặc biệt trong các ngành nhạy cảm với chu kỳ thị trường như bất động sản, chứng khoán và ngân hàng.
6.3. Đối với cơ quan quản lý
Đối với Ủy ban Chứng khoán Nhà nước và Ngân hàng Nhà nước, các kết quả dự báo có thể đóng vai trò là tín hiệu cảnh báo sớm. Khi mô hình dự báo cho thấy khả năng VN-Index giảm sâu trong ngắn hạn (ví dụ giảm trên 5% trong 5 phiên kế tiếp), cơ quan quản lý có thể chủ động chuẩn bị các phương án can thiệp như: tăng cường giám sát các tài khoản giao dịch ký quỹ có rủi ro cao; phối hợp với các công ty chứng khoán để hạn chế bán giải chấp đồng loạt; nâng cấp các kịch bản stress-test cho hệ thống ngân hàng. Bên cạnh đó, việc triển khai một hệ thống dashboard công khai dựa trên các mô hình dự báo định lượng cũng có thể nâng cao tính minh bạch của thị trường và giúp nhà đầu tư đưa ra quyết định dựa trên thông tin tốt hơn.
Về dài hạn, cơ quan quản lý nên thúc đẩy 3 định hướng chính sách. (1) Đẩy mạnh số hóa và chuẩn hóa dữ liệu tài chính, đặc biệt là dữ liệu vi cấu trúc thị trường (order book), dữ liệu giao dịch cao tần và dữ liệu cảm xúc của nhà đầu tư từ mạng xã hội. (2) Hỗ trợ các chương trình nghiên cứu liên ngành giữa các trường đại học, viện nghiên cứu và các định chế tài chính nhằm ứng dụng AI/ML trong giám sát thị trường. (3) Ban hành các tiêu chuẩn nghề nghiệp đối với việc sử dụng mô hình định lượng tại các công ty chứng khoán và quỹ đầu tư nhằm bảo đảm sự cân bằng giữa đổi mới sáng tạo và việc bảo vệ nhà đầu tư.
7. Kết luận
Kết quả thực nghiệm cho thấy, ARIMA (1,1,1) đạt hiệu năng tốt nhất với MAE = 8,43; MSE = 174,55 và R² = 0,97, vượt trội đáng kể so với LSTM (MAE = 20,83; R² = 0,84) và Simple RNN (MAE = 29,64; R² = 0,69) trong kịch bản dự báo đơn biến. Phát hiện này thách thức quan điểm phổ biến rằng, các mô hình học sâu luôn vượt trội so với các mô hình thống kê truyền thống và cung cấp bằng chứng thực nghiệm cho luận điểm của Bustos và cộng sự (2025) rằng hiệu năng dự báo phụ thuộc rõ rệt vào đặc thù thị trường, cấu trúc đầu vào và độ dài dữ liệu.
Bốn đóng góp chính của bài viết gồm: xây dựng bộ dữ liệu so sánh dài 10 năm – một trong những bộ dữ liệu dài nhất được sử dụng cho VN-Index – bao trùm nhiều chu kỳ thị trường khác nhau; cung cấp bằng chứng thực nghiệm có tính nhân rộng về ưu thế của ARIMA trong kịch bản đơn biến tại thị trường mới nổi; đề xuất khung mô hình lai ARIMA–LSTM ba bước có cấu trúc rõ ràng và sẵn sàng cho mở rộng đa biến; phát triển bộ khuyến nghị quản trị có hệ thống cho nhà đầu tư, doanh nghiệp niêm yết và cơ quan quản lý.
Chú thích:
1, 15. Bustos, O., Pomares-Quimbaya, A., & Stellian, R. (2025). Machine learning, stock market forecasting, and market efficiency: A comparative study. International Journal of Data Science and Analytics, 20, 6815–6839. https://doi.org/10.1007/s41060-025-00854-4
2. Box, G. E. P., Jenkins, G. M., Reinsel, G. C., & Ljung, G. M. (2015). Time series analysis: Forecasting and control (5th ed.). Wiley.
3. Hochreiter, S., & Schmidhuber, J. (1997). Long short-term memory. Neural Computation, 9(8), 1735–1780. https://doi.org/10.1162/neco.1997.9.8.1735
4, 13, 25. Heednacram, A., Kliangsuwan, T., & Werapun, W. (2024). Implementation of four machine learning algorithms for forecasting the stock’s low and high prices. Neural Computing and Applications, 36, 23789–23805. https://doi.org/10.1007/s00521-024-10247-6
5, 22. Trần, Đ. T. (2024). Dự báo chỉ số chứng khoán bằng học máy: Bằng chứng thực nghiệm từ thị trường chứng khoán Việt Nam. Tạp chí Kinh tế và Dự báo – Bộ Kế hoạch và Đầu tư, 6(872), 47–51.
6. Box, G. E. P., & Jenkins, G. M. (1976). Time Series Analysis: Forecasting and Control (Revised ed.). Holden-Day.
7, 24. Nguyễn, H. D. U., & Nguyễn, T. T. H. (2014). The application of the ARIMA model to the VN-Index forecasting. Tạp chí Khoa học và Công nghệ – Đại học Đà Nẵng, 11(84), 90–94.
8. Tạp chí Ngân hàng (2023). Ứng dụng mô hình ARIMA để dự báo lạm phát tại Việt Nam và một số khuyến nghị. Tạp chí Ngân hàng, 5/2023, 28–34.
9. Kobiela, D., Krefta, D., Król, W., & Weichbroth, P. (2022). ARIMA vs LSTM on NASDAQ stock exchange data. Procedia Computer Science, 207, 3836–3845. https://doi.org/10.1016/j.procs.2022.09.443
10. Ma, Q. (2020). Comparison of ARIMA, ANN, and LSTM for stock price prediction. E3S Web of Conferences, 218, 01026. https://doi.org/10.1051/e3sconf/202021801026
11. Hochreiter, S., & Schmidhuber, J. (1997). Long short-term memory. Neural Computation, 9 (8), 1735–1780. https://doi.org/10.1162/neco.1997.9.8.1735
12. Su, I.-F., Lin, P. L., Chung, Y.-C., & Lee, C. (2022). Forecasting of Taiwan’s weighted stock price index based on machine learning. Computational Intelligence, 38(6), 1976–2007. https://doi.org/10.1111/coin.12546
14. Song, Y., Tang, X., Wang, H., & Ma, Z. (2022). Volatility forecasting for the stock market incorporating macroeconomic variables based on GARCH-MIDAS and deep learning models. Journal of Forecasting, 42(1), 51–69. https://doi.org/10.1002/for.2899
16, 21. Zhang, G. P. (2003). Time series forecasting using a hybrid ARIMA and neural network model. Neurocomputing, 50, 159–175. https://doi.org/10.1016/S0925-2312(01)00702-0
17. Choi, H. K. (2018). Stock price correlation coefficient prediction with ARIMA-LSTM hybrid model. arXiv preprint arXiv:1808.01560.
18. Temür, A. S., Akgün, M., & Temür, G. (2019). Predicting housing sales in Turkey using ARIMA, LSTM, and hybrid models. Journal of Business Economics and Management, 20(5), 920–938. https://doi.org/10.3846/jbem.2019.10190
19. Loan, N. T. T., Hung, D. N., & Van, V. T. T. (2024). Application of the ARIMA model and deep learning for forecasting stock prices in Vietnam. Salud, Ciencia y Tecnología – Serie de Conferencias, 4, 1320. https://doi.org/10.56294/sctconf20241320
20. Đỗ, T. H., Nguyễn, V. M., Lê, T. H., & Phạm, Q. N. (2022). Dự đoán giá cổ phiếu bằng mô hình chuỗi thời gian với BigDL. Kỷ yếu Hội nghị Khoa học Quốc gia về Công nghệ Thông tin và Truyền thông.
23. Hyndman, R. J., & Athanasopoulos, G. (2018). Forecasting: Principles and practice (2nd ed.). OTexts.



