Digital Transformation in Public Governance: Integrating Big Data and Applying AI to Enhance Constructive Capacity
ThS. Trần Tiến Vượng
Học viện Hành chính và Quản trị công
(Quanlynhanuoc.vn) – Trong kỷ nguyên số, nền hành chính nhà nước đang chuyển dịch mạnh mẽ từ mô hình quản lý thụ động sang chính phủ kiến tạo phát triển. Tuy nhiên, thực trạng quản trị hiện nay vẫn đối mặt với tình trạng giàu dữ liệu nhưng nghèo thông tin do hệ thống dữ liệu bị phân tán, cô lập và kiến trúc công nghệ cũ kỹ. Bài viết đề xuất một khung kiến trúc tổng thể tích hợp dữ liệu lớn (Big Data) và trí tuệ nhân tạo (AI) để tháo gỡ các điểm nghẽn, nâng cao năng lực kiến tạo của bộ máy nhà nước. Trong tiến trình đó, sự cộng hưởng giữa Big Data và AI chính là hạt nhân chuyển đổi giúp bộ máy hành chính công rũ bỏ lề lối quản trị dựa trên kinh nghiệm để vươn tới mô hình thực thi dựa trên hệ thống luận cứ dữ liệu.
Từ khóa: Chuyển đổi số; quản trị công; dữ liệu lớn; trí tuệ nhân tạo; Chính phủ kiến tạo; năng lực kiến tạo; cá nhân hóa dịch vụ công.
Abstract: In the digital era, public administration is undergoing a profound shift from a passive management model to a developmental enabling government. However, current governance practices still grapple with the paradox of being ‘data-rich but information-poor,’ a consequence of fragmented, isolated data systems and obsolete technological architectures. This paper proposes a comprehensive architectural framework that integrates Big Data and Artificial Intelligence (AI) to dismantle these bottlenecks and enhance the enabling capacity of the state apparatus. In this trajectory, the synergy between Big Data and AI serves as the transformational nucleus, empowering the public administration to shed traditional, experience-based governance and advance toward an execution model anchored in data-driven evidence.
Keywords: Digital Transformation, Public Governance, Big Data, Artificial Intelligence (AI), Constructive Government, Constructive Capacity, Personalization of Public Services
1. Đặt vấn đề
Trong kỷ nguyên số, nền hành chính nhà nước đang chứng kiến một sự chuyển dịch mô hình sâu sắc từ “Chính phủ quản lý” mang tính thụ động, mệnh lệnh hành chính sang “Chính phủ kiến tạo” mang tính chủ động, phục vụ và định hướng phát triển. Cốt lõi của mô hình kiến tạo này không chỉ nằm ở việc tinh gọn bộ máy hay giảm thiểu thủ tục hành chính, mà còn ở năng lực thấu hiểu nhu cầu của người dân, doanh nghiệp và các nhóm xã hội để thiết kế các chính sách công có tính dự báo cao. Trong bối cảnh đó, quá trình chuyển đổi số không đơn thuần là việc số hóa các quy trình, hồ sơ, giấy tờ theo lối cơ học mà phải là một cuộc cách mạng về phương thức vận hành, nơi dữ liệu lớn (Big Data) trở thành nguồn tài nguyên chiến lược để kiến tạo giá trị quốc gia.
Trong thực tế, khối lượng dữ liệu được sinh ra từ các cơ quan hành chính công, như: dữ liệu về dân cư, kinh tế, y tế, giáo dục là rất lớn nhưng thực tiễn triển khai chính phủ điện tử hiện nay vẫn đang đối mặt với những điểm nghẽn nghiêm trọng về mặt kiến trúc hệ thống. Các cơ sở dữ liệu hiện hành phần lớn tồn tại dưới dạng phân tán, thiếu tiêu chuẩn liên thông và bị cô lập, thường được sử dụng nội bộ trong từng bộ, ban, ngành. Sự thiếu hụt cấu trúc tích hợp đồng bộ cùng với sự vắng bóng của các công cụ phân tích dữ liệu chuyên sâu đang khiến bộ máy quản lý nhà nước rơi vào tình trạng giàu dữ liệu nhưng nghèo thông tin. Khả năng khai thác dữ liệu hiện mới dừng lại ở mức độ lưu trữ và tra cứu cơ bản, chưa tạo ra được những tri thức mang tính đột phá để hỗ trợ giải quyết các bài toán quản trị phức tạp. Đây chính là rào cản lớn nhất làm suy giảm tốc độ phản hồi và năng lực kiến tạo của các cơ quan hành chính công.
Việc nghiên cứu và đề xuất một khung kiến trúc tổng thể nhằm tích hợp công nghệ Big Data và AI vào hệ thống thông tin quản lý nhà nước là nhiệm vụ mang tính chiến lược và trở thành một đòi hỏi tất yếu trong tiến trình xây dựng chính phủ số hiện đại. Thông qua việc thiết lập một hạ tầng dữ liệu tập trung và ứng dụng các thuật toán để phân tích chuyên sâu, mục tiêu của nghiên cứu là xây dựng nền tảng vững chắc cho mô hình quản trị ra quyết định dựa trên dữ liệu. Việc thiết lập các cơ sở khoa học và giải pháp công nghệ khả thi sẽ góp phần thiết thực giúp bộ máy hành chính nhà nước xóa bỏ mô hình quản lý thụ động, từng bước định hình năng lực chủ động kiến tạo và điều hành chính sách trong bối cảnh chuyển đổi số.
2. Cơ sở lý luận
Trong bối cảnh chuyển đổi số và hội nhập toàn cầu, mô hình chính phủ kiến tạo phát triển vươn lên trở thành mô hình quản trị điển hình, đại diện cho bước tiến cao nhất của nền hành chính công hiện đại. Theo đó, năng lực kiến tạo trong quản trị công được định hình là khả năng của bộ máy nhà nước vượt ra khỏi vai trò duy trì trật tự và cung cấp dịch vụ đơn thuần, chuyển sang thế chủ động thiết kế chính sách, kiến tạo môi trường thể chế thuận lợi nhằm khơi thông nguồn lực và thúc đẩy phát triển kinh tế – xã hội. Bản chất của năng lực này nằm ở việc nhà nước đóng vai trò nền tảng, định hướng và tạo động lực, thay vì can thiệp trực tiếp hay làm thay các chủ thể khác.
Trong kỷ nguyên số, năng lực kiến tạo phụ thuộc mật thiết vào khả năng thu thập, xử lý và phân tích dữ liệu để ra quyết định một cách chính xác và khoa học.
Thứ nhất, tính dự báo. Nền tảng của chính phủ kiến tạo là khả năng đi trước một bước so với thực tiễn. Tính dự báo thể hiện ở năng lực nhận diện sớm các xu hướng kinh tế, rủi ro xã hội, biến đổi dân số hay các điểm nghẽn về hạ tầng. Khác với tư duy quản lý thụ động, năng lực dự báo cho phép các cơ quan hành chính công hoạch định được các kịch bản ứng phó từ sớm.
Thứ hai, tính cá nhân hóa dịch vụ công. Đây là thước đo đánh giá sự dịch chuyển từ phương thức phục vụ theo khuôn mẫu cũ sang việc lấy người dân làm trung tâm. Năng lực kiến tạo đòi hỏi nhà nước phải thấu hiểu nhu cầu đặc thù của từng nhóm đối tượng để cung cấp dịch vụ công một cách chính xác và phù hợp với thực tiễn. Tính cá nhân hóa không chỉ giúp giảm thiểu chi phí tuân thủ, tiết kiệm thời gian mà còn nâng cao mức độ hài lòng của công dân đối với bộ máy hành chính công.
Thứ ba, tính minh bạch. Trong mô hình kiến tạo, minh bạch không chỉ dừng lại ở việc công khai thủ tục hành chính, mà còn là sự công khai dữ liệu và minh bạch hóa toàn bộ quy trình ra quyết định. Tiêu chí này đánh giá mức độ mà người dân có thể tiếp cận, giám sát và phản biện các chính sách công. Một nền quản trị minh bạch sẽ hạn chế khoảng trống thông tin, củng cố niềm tin của xã hội và tạo không gian cho sự tham gia của các nguồn lực ngoài nhà nước.
Thứ tư, tính linh hoạt. Tốc độ phản hồi phản ánh độ trễ từ khi một vấn đề xã hội phát sinh đến khi cơ quan quản lý đưa ra giải pháp xử lý. Năng lực kiến tạo thể hiện ở bộ máy hành chính tinh gọn, luồng dữ liệu liên thông không bị cản trở bởi các điểm nghẽn cục bộ, từ đó cho phép hệ thống đưa ra các quyết sách nhanh chóng và linh hoạt thích ứng với các biến động liên tục của môi trường số.
Trong nền quản trị công hiện đại, Big Data không chỉ được định hình bởi các đặc tính về quy mô, tốc độ và sự đa dạng, mà giá trị cốt lõi còn nằm ở khả năng trích xuất tri thức phục vụ quá trình ra quyết định. Đóng vai trò là hạ tầng thông tin thiết yếu, cơ sở Big Data tạo ra chất xúc tác cho sự chuyển dịch từ phương thức quản trị dựa trên kinh nghiệm thực nghiệm sang mô hình quản trị dựa trên chứng cứ và dữ liệu. Năng lực kiến tạo của bộ máy nhà nước được thể hiện rõ nét thông qua hiệu quả khai thác và liên thông các lớp dữ liệu.
Sự hội tụ và khai thác liên thông các hệ sinh thái dữ liệu tạo lập một nền tảng tri thức toàn diện, định hình phương thức quản trị quốc gia dựa trên chứng cứ. Bằng cách vượt qua các giới hạn của phương pháp thống kê tĩnh truyền thống, nền tảng Big Data cho phép bộ máy nhà nước tiến hành phân tích chéo, mô hình hóa rủi ro theo thời gian thực và thiết lập hệ thống cảnh báo sớm đối với các biến động kinh tế – xã hội. Luồng dữ liệu đa chiều cung cấp các tham số đầu vào và luận cứ khoa học vững chắc, giúp cơ quan quản lý mô phỏng chính xác tác động của các quyết sách, từ đó tối ưu hóa việc phân bổ ngân sách và tạo ra không gian phát triển bền vững.
Việc trích xuất giá trị từ Big Data hỗ trợ bộ máy nhà nước loại bỏ tình trạng quản lý dàn trải, thiếu tính phân tầng đối tượng, thay vào đó là năng lực kiến tạo chủ động thông qua việc cá nhân hóa chính sách phúc lợi, thiết kế môi trường thể chế thuận lợi và điều tiết vĩ mô với độ chính xác cao. Khi các rào cản về phân mảnh dữ liệu được gỡ bỏ, sự dung hợp của các luồng dữ liệu nêu trên sẽ tạo ra một bản sao số của đời sống kinh tế – xã hội. Đây chính là hệ quy chiếu tối thiểu để hệ thống hành chính công nâng cao tính dự báo, gia tăng tốc độ phản hồi và củng cố năng lực kiến tạo chính sách trong bối cảnh chuyển đổi số.
Nếu Big Data đóng vai trò là nguồn tài nguyên thông tin cơ sở, thì AI chính là động cơ phân tích cốt lõi nhằm chuyển hóa khối dữ liệu thô thành tri thức phục vụ quản trị. Sự giao thoa giữa AI và hoạt động quản lý nhà nước đánh dấu bước chuyển dịch chiến lược từ quá trình số hóa thông thường sang mô hình ra quyết định dựa trên thuật toán. Động lực kiến tạo này được hiện thực hóa thông qua hai trụ cột công nghệ chính là học máy (Machine Learning) và trí tuệ nhân tạo tạo sinh (Generative AI).
Khác với các hệ thống phần mềm dựa trên quy tắc tĩnh truyền thống, các thuật toán machine learning có khả năng tự động học hỏi, trích xuất đặc trưng và nhận diện các mẫu hình ẩn sâu bên trong hệ sinh thái dữ liệu phức tạp. Việc triển khai các mô hình phân tích dự báo giúp các cơ quan quản lý chuyển hóa những dự đoán định tính thành các chỉ số đo lường cụ thể. Nhờ đó, bộ máy nhà nước có khả năng tính toán chính xác quy mô, mức độ và thời điểm xảy ra các biến động kinh tế – xã hội trong tương lai. Thay vì thụ động xử lý sự cố, hệ thống machine learning thiết lập các cơ chế cảnh báo sớm đối với các rủi ro vĩ mô như tắc nghẽn hạ tầng giao thông, gian lận tài chính hoặc sự thiếu hụt nguồn nhân lực. Các mô hình này trực tiếp cung cấp luận cứ khoa học để cơ quan hành chính công mô phỏng các kịch bản chính sách, từ đó tối ưu hóa việc phân bổ nguồn lực một cách chủ động và chính xác.
Trong mô hình quản trị công hiện đại, Big Data và AI không vận hành như những công cụ công nghệ độc lập mà thiết lập một mối quan hệ biện chứng, cộng sinh. Mối liên kết chiến lược này không chỉ giải quyết các bài toán kỹ thuật đơn thuần mà còn đóng vai trò là hạt nhân cốt lõi để hiện thực hóa triết lý chính phủ kiến tạo. Nếu năng lực kiến tạo được đo lường bằng khả năng của bộ máy nhà nước trong việc chủ động dẫn dắt, thiết kế chính sách và phục vụ xã hội một cách linh hoạt, thì sự giao thoa giữa Big Data và AI chính là hệ động lực cung cấp đủ sức mạnh để bộ máy hành chính công vươn tới các chuẩn mực đó.
Sự cộng hưởng sâu sắc giữa tài nguyên dữ liệu và thuật toán thông minh đã tạo ra bước nhảy vọt, trực tiếp nâng tầm năng lực kiến tạo của nền hành chính trên hai phương diện trọng yếu. Thứ nhất, phá vỡ lề lối quản lý thụ động, chạy theo sự vụ truyền thống để chuyển sang mô hình quản trị dự báo, cho phép nhà nước chủ động nhận diện sớm các rủi ro, dự tính các kịch bản vĩ mô và đi trước một bước trong việc thiết kế chính sách ứng phó. Thứ hai, sự thấu hiểu chi tiết được trích xuất từ dữ liệu giúp cơ quan quản lý xóa bỏ tình trạng ban hành chính sách chung chung, thay vào đó là năng lực cá nhân hóa dịch vụ công và tinh chỉnh các rào cản thể chế cho từng nhóm đối tượng chuyên biệt, giúp kiến tạo một nền hành chính minh bạch, tinh gọn, đủ sức dẫn dắt và bảo đảm sự phát triển bền vững của toàn xã hội.
3. Thực trạng hạ tầng thông tin và dữ liệu công hiện nay
Kế hoạch Chuyển đổi số quốc gia đến năm 2025, định hướng đến năm 2030 đã tạo ra những bước tiến lớn trong việc xây dựng Chính phủ điện tử. Tuy nhiên, hạ tầng thông tin cốt lõi tại Việt Nam hiện nay vẫn đối mặt với những điểm nghẽn mang tính cấu trúc. Theo báo cáo của Bộ Thông tin và Truyền thông (năm 2025)1 cùng các đánh giá từ Ban Chỉ đạo Quốc gia về chuyển đổi số đã nhiều lần chỉ rõ việc cát cứ dữ liệu là một trong những rào cản lớn nhất đối với nền hành chính số. Các cơ sở dữ liệu chuyên ngành ở nhiều bộ, ngành, địa phương trong giai đoạn trước thường được phát triển độc lập, phục vụ riêng cho nghiệp vụ nội bộ mà thiếu vắng cơ chế chia sẻ. Tại các phiên họp chỉ đạo triển khai Đề án 06, Thủ tướng Chính phủ đã liên tục nhấn mạnh yêu cầu phải tháo gỡ điểm nghẽn về thể chế, kiên quyết xóa bỏ tư duy cát cứ dữ liệu nhằm hướng tới nguyên tắc dữ liệu phải “đúng, đủ, sạch, sống”. Thực trạng phân mảnh này khiến bộ máy nhà nước lãng phí nguồn lực đầu tư; đồng thời, làm đứt gãy luồng thông tin cần thiết để phân tích và hoạch định chính sách đa chiều.
Theo báo cáo của Văn phòng Chính phủ, tính đến cuối năm 2024, Đề án 06 đã cung cấp 23/25 dịch vụ công thiết yếu trên môi trường toàn trình, giúp tiết kiệm cho nhà nước và xã hội gần 3.500 tỷ đồng mỗi năm; đồng thời, kích hoạt thành công hơn 57,9 triệu tài khoản định danh điện tử (VNeID). Bên cạnh đó, Nền tảng tích hợp, chia sẻ dữ liệu quốc gia (NDXP) đã được thiết lập và vận hành như một trục giao thông huyết mạch. Theo số liệu thống kê từ Bộ Thông tin và Truyền thông, nền tảng NDXP đã thiết lập gần 400 điểm kết nối giữa các hệ thống, cơ sở dữ liệu của hơn 100 cơ quan, đơn vị; xử lý trung bình 2,8 triệu giao dịch mỗi ngày và lũy kế đã vượt mức 2,2 tỷ giao dịch định tuyến2. Sự hình thành của các cấu phần này đã tạo ra những viên gạch nền móng đầu tiên cho một nền quản trị dựa trên dữ liệu.
Tuy nhiên, khi đối chiếu với các chuẩn mực của một nền quản trị dựa trên hệ sinh thái Big Data và năng lực tính toán của AI, bức tranh hạ tầng hiện tại vẫn bộc lộ những điểm nghẽn mang tính cấu trúc. Một tỷ trọng lớn các ứng dụng công nghệ thông tin trong khu vực công hiện nay vẫn đang chạy trên nền tảng kiến trúc cũ, chủ yếu là kiến trúc nguyên khối và hệ thống máy chủ vật lý đặt tại chỗ. Các hệ thống này được thiết kế để xử lý dữ liệu có cấu trúc với khối lượng nhỏ, hoàn toàn thiếu khả năng mở rộng linh hoạt để đáp ứng yêu cầu xử lý dữ liệu cực lớn.
Hơn nữa, việc duy trì các công nghệ đã lỗi thời khiến chi phí bảo trì hệ thống ngày càng đắt đỏ, đồng thời tạo ra độ chênh lệch rất lớn về mặt kỹ thuật, khiến việc tích hợp các mô hình AI hiện đại vào hệ thống cũ trở nên bất khả thi nếu không có sự tái cấu trúc toàn diện. Mặc dù trục liên thông NDXP đã hình thành, luồng dữ liệu luân chuyển trên hệ thống hiện mới chỉ đáp ứng yêu cầu trao đổi thông tin tác nghiệp cơ bản, chưa vươn tới cấp độ liên thông ngữ nghĩa để phục vụ công tác phân tích và dự báo vĩ mô.
Điểm nghẽn cốt lõi của tình trạng này xuất phát từ sự thiếu hụt một khung tiêu chuẩn kỹ thuật quốc gia đồng bộ. Chính sự vắng bóng của các quy chuẩn thống nhất về siêu dữ liệu, định dạng lưu trữ và giao thức kết nối đang dựng lên những rào cản kỹ thuật kiên cố, kìm hãm nỗ lực hợp nhất hệ thống và khai thác dữ liệu liên ngành. Do thiếu các phương thức giao tiếp ứng dụng mở và chuẩn hóa giữa các cơ quan, việc trao đổi dữ liệu thường phải thực hiện qua các phương thức thủ công hoặc bán thủ công, dẫn đến độ trễ cao và rủi ro sai lệch thông tin lớn. Bất cập trong đồng bộ hóa khiến bộ máy nhà nước không thể thiết lập được một kho dữ liệu trung tâm hoàn chỉnh.
Song song với những điểm nghẽn về hạ tầng hệ thống, năng lực khai thác dữ liệu của bộ máy hành chính hiện nay đang vướng phải một nghịch lý lớn, đó là khối lượng dữ liệu được số hóa và thu thập ngày càng khổng lồ nhưng giá trị tri thức trích xuất được lại cực kỳ hạn chế. Dữ liệu công chủ yếu mới chỉ hoàn thành sứ mệnh lưu trữ thụ động thay vì được phân tích chủ động. Phần lớn các cơ sở dữ liệu chuyên ngành tại các cơ quan nhà nước chỉ được sử dụng để trích xuất, phục vụ thống kê mô tả, tổng hợp chỉ tiêu và lập các báo cáo thống kê định kỳ. Vì thế, các cơ quan quản lý có được các báo cáo trong quá khứ nhưng hoàn toàn bất lực trước yêu cầu phân tích xu hướng trong tương lai. Việc thiếu vắng các công cụ phân tích dữ liệu chuyên sâu và các thuật toán AI khiến dữ liệu bị đóng băng, không thể tham gia vào quá trình mô phỏng chính sách hay cảnh báo sớm các rủi ro kinh tế – xã hội.
Trong mục tiêu của Chiến lược Dữ liệu quốc gia đến năm 2030, dữ liệu phải được coi là một loại tài sản số. Tuy nhiên, thực tiễn cho thấy vòng đời dữ liệu công thường kết thúc ngay sau khi hoàn thành một thủ tục hành chính cụ thể. Theo đánh giá từ các báo cáo chuyên đề về Chính phủ số, quá trình thu thập dữ liệu mang nặng tính tuân thủ quy trình cơ học hơn là tư duy khai thác giá trị thặng dư. Khi dữ liệu được đổ về các kho lưu trữ mà không được gán nhãn, làm sạch và thiếu các bộ công cụ khai phá dữ liệu, các hồ dữ liệu được kỳ vọng sẽ nhanh chóng biến thành các đầm lầy dữ liệu bị đóng băng và mất giá trị sử dụng. Một hệ quả tất yếu của việc chỉ dùng dữ liệu để lưu trữ là phương thức ra quyết định của nhiều cấp quản lý vẫn phải dựa nhiều vào kinh nghiệm thực tiễn hoặc báo cáo giấy truyền thống. Sự thiếu vắng các hệ thống bảng điều khiển thông minh cập nhật theo thời gian thực và năng lực trực quan hóa dữ liệu khiến việc đánh giá hiệu quả tức thời của một chính sách công gặp nhiều rào cản.
Theo mô hình truyền thống, phần lớn các cơ quan nhà nước tự đầu tư và vận hành các trung tâm dữ liệu riêng lẻ. Tuy nhiên, đặc thù của các bài toán phân tích Big Data và huấn luyện mô hình AI đòi hỏi tài nguyên tính toán khổng lồ với khả năng co giãn linh hoạt. Hạ tầng lưu trữ nội bộ bộc lộ rõ sự bất cập khi yêu cầu chi phí đầu tư ban đầu rất lớn, nhưng lại thiếu tính linh hoạt để mở rộng đột xuất khi lưu lượng truy cập tăng vọt. Đặc biệt, sự vắng bóng của các cụm máy chủ xử lý đồ họa và máy học chuyên dụng tại các trung tâm dữ liệu địa phương khiến việc triển khai trực tiếp trên hạ tầng cũ trở nên bất khả thi. Quá trình chuyển hóa hàng petabyte dữ liệu thô thành tri thức không thể dựa vào các hệ quản trị cơ sở dữ liệu quan hệ truyền thống. Khối khu vực công hiện nay vẫn đang thiếu vắng các nền tảng xử lý dữ liệu phân tán và các cấu trúc dữ liệu hiện đại như hồ dữ liệu (Data Lake) hay lưới dữ liệu (Data Mesh) để xử lý đồng thời dữ liệu có cấu trúc, bán cấu trúc và phi cấu trúc.
4. Mô hình kiến trúc Big Data và AI ứng dụng trong quản trị công
Nhằm giải quyết triệt để những điểm nghẽn về cấu trúc phân mảnh dữ liệu và nâng cao năng lực hoạch định chính sách, việc nghiên cứu và thiết lập một mô hình kiến trúc tổng thể tích hợp Big Data và AI trong quản trị công là yêu cầu mang tính chiến lược. Kiến trúc được thiết kế dựa trên nguyên tắc hội tụ nguồn lực số và phân lớp chức năng đồng bộ, bao gồm bốn phân hệ cơ bản, bao gồm: thu thập – tích hợp dữ liệu, lưu trữ – xử lý dữ liệu, phân tích thông minh và AI, quản trị, bảo mật và tuân thủ số, xuyên suốt từ khâu tiếp nhận, xử lý đến giai đoạn kết xuất tri thức, hiện thực hóa năng lực kiến tạo phục vụ xã hội.
Tại phân hệ cơ sở, lớp thu thập và tích hợp dữ liệu đóng vai trò là hạ tầng kết nối trọng yếu, chịu trách nhiệm thu gom, chuẩn hóa và luân chuyển thông tin từ các hệ thống phân tán về kho lưu trữ trung tâm. Luồng dữ liệu giữa các bộ, ngành được điều phối qua một cổng kết nối API tập trung, tiêu biểu là nền tảng tích hợp, chia sẻ dữ liệu quốc gia thay vì kết nối điểm-điểm trực tiếp gây ra rủi ro bảo mật và tắc nghẽn hệ thống. Cơ chế này thiết lập các chuẩn giao tiếp chung, cho phép các cơ sở dữ liệu quốc gia trọng điểm liên thông với nhau một cách an toàn. Cổng giao tiếp dữ liệu (API Gateway) cũng đồng thời thực thi các chính sách xác thực, phân quyền truy cập và giới hạn lưu lượng nhằm đảm bảo an toàn thông tin mạng. Lớp tích hợp hỗ trợ đồng thời hai luồng xử lý, với các dữ liệu có tính chu kỳ, hệ thống sử dụng cơ chế xử lý theo lô thông qua các quy trình trích xuất – biến đổi – tải.
Đối với các dữ liệu đòi hỏi tốc độ phản hồi tức thời, hệ thống ứng dụng các kiến trúc hướng sự kiện và công nghệ luân chuyển thông điệp để xử lý luồng dữ liệu thời gian thực. Trước khi dữ liệu được đẩy vào không gian lưu trữ đám mây, các thuật toán đối soát tự động sẽ được kích hoạt, chịu trách nhiệm kiểm tra tính toàn vẹn của cấu trúc, loại bỏ các bản ghi trùng lặp, gán nhãn siêu dữ liệu và chuẩn hóa định dạng theo bộ tiêu chuẩn dữ liệu quốc gia. Đây là bước sàng lọc bắt buộc nhằm bảo đảm dữ liệu đưa vào kho lưu trữ trung tâm đạt chuẩn.
Trên cơ sở nguồn dữ liệu đã được chuẩn hóa, lớp lưu trữ và xử lý thiết lập một không gian hội tụ tài nguyên số toàn diện. Trong bối cảnh quy mô dữ liệu công phình to theo cấp số nhân, việc duy trì kiến trúc máy chủ vật lý cục bộ không còn khả thi về mặt chi phí lẫn hiệu năng. Do đó, mô hình lưu trữ đề xuất sự dịch chuyển chiến lược lên nền tảng điện toán đám mây, kết hợp kiến trúc lưu trữ hiện đại nhằm giải quyết triệt để bài toán đa dạng dữ liệu. Bước chuyển này tạo điều kiện để nâng cao khả năng mở rộng, tối ưu hiệu năng truy vấn và thiết lập cơ sở vững chắc cho các hệ thống báo cáo quản trị thông minh. Đặc biệt, để ứng phó với đặc thù ngày càng gia tăng của dữ liệu phi cấu trúc, cấu trúc data lake cho phép lưu trữ khối lượng khổng lồ các tệp dữ liệu thô và dữ liệu đa phương tiện với chi phí thấp mà không bị gò bó bởi các yêu cầu thiết kế định dạng ban đầu.
Đóng vai trò là bộ não của toàn bộ kiến trúc hệ thống, lớp AI khai thác nguồn tài nguyên khổng lồ từ hồ dữ liệu (Data Lake) và kho dữ liệu (Data Warehouse) để biến dữ liệu thô thành các quyết sách quản trị. Khắc phục những hạn chế của cơ chế thiết lập quy tắc tĩnh truyền thống, kiến trúc ứng dụng trực tiếp nền tảng machine learning vào tiến trình vận hành hệ thống, tập trung tháo gỡ những điểm nghẽn cốt lõi, kiến tạo động lực chuyển đổi phương thức quản lý nhà nước. Kiến trúc không vận hành như một khối nguyên khối mà được cấu trúc thành các module chức năng độc lập, liên kết chặt chẽ thông qua hệ thống luân chuyển vi dịch vụ. Thành phần hạt nhân đầu tiên là nền tảng quản trị vòng đời machine learning. Nền tảng này chịu trách nhiệm tự động hóa toàn bộ quy trình từ khâu trích xuất đặc trưng, huấn luyện mô hình, kiểm thử đến triển khai thực tế, bảo đảm các thuật toán liên tục được tái huấn luyện và cập nhật dựa trên luồng dữ liệu mới nhất.
Kế tiếp, để xử lý các luồng thông tin đa định dạng, hệ thống thiết lập các lớp suy luận. Các lớp suy luận sẽ được thiết kế chuyên biệt để tính toán các khối dữ liệu định lượng, mô hình hóa các biến số vĩ mô phục vụ hoạch định kịch bản ứng phó rủi ro. Trong đó, mô hình xử lý ngôn ngữ tự nhiên (NLP) tích hợp các mô hình ngôn ngữ lớn (LLMs) để bóc tách ngữ nghĩa, tự động hóa phân loại và rà soát hệ thống văn bản. Đặc biệt, nhằm đáp ứng các yêu cầu khắt khe về tính minh bạch trong quản trị công, kiến trúc này bắt buộc phải tích hợp lớp quản trị và giải trình. Việc thiết lập phân lớp này đóng vai trò như một màng lọc rủi ro, giúp hệ thống kiểm soát được các sai số, nhận diện thiên kiến và minh bạch hóa toàn bộ logic ra quyết định của thuật toán, bảo đảm mọi kết xuất dữ liệu đều tuân thủ nghiêm ngặt các chuẩn mực đạo đức và khung pháp lý hiện hành.
5. Các điều kiện triển khai và chính sách
Một là, để hiện thực hóa mô hình kiến trúc tích hợp Big Data và AI vào hệ thống quản trị công, bộ máy nhà nước không chỉ trang bị nền tảng công nghệ hiện đại mà còn cần thiết lập đồng bộ các điều kiện tiên quyết về thể chế, nhân lực và an toàn thông tin. Việc kiến tạo một hành lang pháp lý vững chắc đóng vai trò là bệ phóng định hướng cho toàn bộ tiến trình.
Hai là, cần tiếp tục làm sâu sắc và thực thi nghiêm ngặt Nghị định số 13/2023/NĐ-CP ngày 17/4/2023 của Chính phủ về bảo vệ dữ liệu cá nhân, bảo đảm sự cân bằng chiến lược giữa mục tiêu khai thác tài nguyên dữ liệu phục vụ quản trị và yêu cầu tôn trọng quyền riêng tư của công dân. Đặc biệt, đối với việc ứng dụng hệ thống thuật toán vào khu vực công, cần bám sát định hướng của chiến lược quốc gia về nghiên cứu, phát triển và ứng dụng trí tuệ nhân tạo; đồng thời, nhanh chóng thể chế hóa các bộ quy tắc đạo đức về AI. Việc thiết lập các cơ chế thử nghiệm có kiểm soát đối với các giải pháp AI theo đúng tinh thần của Nghị quyết số 52-NQ/TW ngày 27/9/2019 của Bộ Chính trị là yêu cầu cấp thiết nhằm đánh giá khách quan các rủi ro về thuật toán trước khi đưa vào ứng dụng thực tiễn trên quy mô lớn.
Ba là, các yếu tố thể chế và chuẩn hóa nguồn nhân lực số được xác định là động lực cốt lõi quyết định sự thành bại của tiến trình chuyển đổi. Việc dịch chuyển sang mô hình chính phủ kiến tạo đòi hỏi một cuộc cách mạng về nhận thức và tư duy số trong toàn bộ hệ thống. Yêu cầu đặt ra đối với công tác phát triển nguồn nhân lực không chỉ dừng ở việc chuẩn hóa kỹ năng số tác nghiệp, mà phải tập trung thiết lập hệ tư duy quản trị mới, sự chuyển biến sâu sắc về nhận thức chuyển đổi số, đưa năng lực hoạch định chính sách và ra quyết định dựa trên cơ sở dữ liệu thực chứng trở thành tiêu chuẩn cốt lõi.
Bốn là, bảo mật và an toàn thông tin là điều kiện sống còn để bảo vệ nền tảng của hệ thống chính phủ số. Khi tài nguyên dữ liệu quốc gia được hội tụ về nền tảng điện toán đám mây, bộ máy quản lý phải áp dụng hệ thống tiêu chuẩn an ninh mạng với cấp độ kiểm soát nghiêm ngặt. Việc triển khai đồng bộ các giải pháp bảo mật theo mô hình kiến trúc không tín nhiệm, kết hợp với cơ chế mã hóa dữ liệu đa tầng và hệ thống giám sát an toàn thông tin theo thời gian thực là nhiệm vụ bắt buộc.
Năm là, cần có các cơ chế thiết lập quy trình kiểm định độc lập đối với các mô hình AI trước khi triển khai, nhằm ngăn chặn nguy cơ xâm nhập mã độc vào luồng dữ liệu huấn luyện hoặc các lỗ hổng rò rỉ thông tin nhạy cảm, qua đó thiết lập một lớp khiên vững chắc bảo vệ toàn vẹn chủ quyền không gian mạng.
6. Kết luận
Việc nghiên cứu và thiết lập mô hình kiến trúc tổng thể tích hợp Big Data và AI không chỉ là một giải pháp công nghệ mang tính thời điểm, mà còn là luận cứ khoa học then chốt nhằm giải quyết những điểm nghẽn cốt lõi của nền hành chính công hiện đại. Bằng cách tái cấu trúc toàn diện luồng thông tin từ thu thập, lưu trữ đồng bộ trên nền tảng điện toán đám mây, cho đến việc ứng dụng các thuật toán machine learning và NLP, nghiên cứu đã phác họa một hệ sinh thái quản trị thông minh, liên thông và liền mạch. Cấu trúc này tháo gỡ triệt để rào cản phân mảnh, cát cứ dữ liệu, đồng thời trang bị cho bộ máy hành chính công năng lực phân tích dự báo vượt trội. Qua đó, các cơ quan quản lý có đủ cơ sở thực chứng để chuyển hóa khối nguyên liệu số thô thành tri thức chiến lược, tối ưu hóa các quy trình nghiệp vụ và nâng cao tính chính xác, kịp thời trong công tác hoạch định chính sách.
Từ những nền tảng kiến trúc và hệ tiêu chí đã được phân tích, khẳng định sâu sắc một nguyên lý cốt lõi: chuyển đổi số trong quản trị quốc gia tuyệt đối không dừng lại ở việc số hóa cơ học các thủ tục hành chính. Bản chất của tiến trình này là một cuộc cách mạng về tư duy quản trị, là quá trình kiến tạo và tái định hình toàn bộ luồng dữ liệu quốc gia thông qua sức mạnh hội tụ của Big Data và AI. Chính sự cộng hưởng công nghệ này đã tạo ra xung lực mạnh mẽ giúp hệ thống hành chính rũ bỏ phương thức quản lý sự vụ thụ động, từng bước vươn tới mô hình chính phủ kiến tạo chủ động, minh bạch và linh hoạt. Trong mô hình đó, dữ liệu được giải phóng để trở thành nguồn tài nguyên chiến lược, giúp thấu hiểu nhu cầu của công dân, tháo gỡ hiệu quả các rào cản thể chế và cung cấp những dịch vụ công mang tính cá nhân hóa cao, qua đó thực hiện xuất sắc sứ mệnh phục vụ xã hội và kiến tạo sự phát triển bền vững.
Chú thích:
1. Bộ Thông tin và Truyền thông (2025). Báo cáo tổng kết công tác chuyển đổi số quốc gia và định hướng phát triển Chính phủ số.
Tài liệu tham khảo:
1. Ban Chỉ đạo Quốc gia triển khai Đề án 06 (2022 – 2026). Kết luận của Thủ tướng Chính phủ tại các phiên họp về Đề án phát triển ứng dụng dữ liệu về dân cư, định danh và xác thực điện tử phục vụ chuyển đổi số quốc gia giai đoạn 2022-2025, tầm nhìn đến năm 2030.
2. Thủ tướng Chính phủ (2024). Quyết định số 36/QĐ-TTg ngày 11/01/2024 phê duyệt Quy hoạch hạ tầng thông tin và truyền thông thời kỳ 2021 – 2030, tầm nhìn đến năm 2050.
3. Thủ tướng Chính phủ (2024). Quyết định số 142/QĐ-TTg ngày 02/02/2024 phê duyệt Chiến lược dữ liệu quốc gia đến năm 2030.
4. Mergel, I., Edelmann, N., & Haug, N (2019). Defining digital transformation: Results from expert interviews. Government Information Quarterly, 36(4), 101385.
5. OECD (2019). The Path to Becoming a Data-Driven Public Sector. OECD Digital Government Studies, OECD Publishing, Paris.
6. OECD (2024). OECD Digital Government Index (DGI): 2023 Results. OECD Publishing, Paris.



