Tại Tọa đàm “Khai mở tiềm năng dữ liệu số - Từ tầm nhìn đến thực thi” diễn ra ngày 7/10/2023 ở Hà Nội, ông Nguyễn Trọng Khánh, Trưởng phòng Hạ tầng và Dữ liệu số, Cục Chuyển đổi số (CĐS) quốc gia - Bộ Thông tin và Truyền thông (TT&TT), nhấn mạnh dữ liệu số luôn là một thành phần quan trọng và cốt yếu được chú trọng xây dựng và phát triển.
Tham luận về quá trình phát triển dữ liệu trong CPĐT và những thay đổi cách tiếp cận về dữ liệu trong CĐS, ông Nguyễn Trọng Khánh cho biết Việt Nam đã triển khai phát triển CPĐT được đánh dấu bởi Đề án 112 từ năm 2000. Đúng sau 20 năm, đến năm 2020, Việt Nam bắt đầu chuyển sang giai đoạn CĐS đánh dấu với Chương trình CĐS quốc gia, xây dựng chính phủ số, kinh tế số, xã hội số (CPS, KTS, XHS).
Tọa đàm “Khai mở tiềm năng dữ liệu số - Từ tầm nhìn đến thực thi”
“Trải qua 23 năm phát triển với nhiều thay đổi, dữ liệu số luôn là một thành phần quan trọng và cốt yếu được chú trọng xây dựng và phát triển. Trong CĐS, dữ liệu số ngày càng được nhìn nhận về vai trò rõ nét hơn, quan trọng. Điều này thể hiện ở việc chúng ta đã chọn chuyên đề CĐS của năm 2023 là năm dữ liệu số quốc gia - ngay sau năm tổng tiến công thúc đẩy mạnh mẽ CĐS ở mọi ngành, mọi cấp, trên phạm vi toàn quốc, toàn dân và toàn diện về CĐS”, ông Nguyễn Trọng Khánh nói.
4 giai đoạn trưởng thành của dữ liệu qua các thời kỳ
Để có một bức tranh toàn cảnh về quá trình phát triển dữ liệu, ông Khánh đã trình bày về các mức độ trưởng thành của dữ liệu, từ giai đoạn đầu của CPĐT cho tới hiện nay. Quan điểm về dữ liệu cũng như việc thực hiện triển khai xây dựng dữ liệu, CSDL đã có những biến đổi nhất định. Theo đại diện Cục CĐS quốc gia, có 4 giai đoạn gắn liền với mức độ trưởng thành phát triển dữ liệu làm nền tảng của các thời kỳ.
Giai đoạn CSDL xây dựng một lần
Nhóm này đặc trưng cho việc phát triển các CSDL ở thời kỳ đầu. Dữ liệu được thu thập một lần qua các đợt thu thập, số hoá, đo đạc, khảo sát… và đưa vào các CSDL lưu trữ, khai thác. Dữ liệu sử dụng chủ yếu cho việc thống kê, xuất bản ấn phẩm và gần như không được cập nhật hoặc chỉ cập nhật theo đợt với thời gian dài. Điển hình cho một số CSDL đã xây dựng là CSDL nền địa lý, CSDL đất trồng lúa hay CSDL chứa dữ liệu tổng điều tra dân số…
Giai đoạn CSDL trong các hệ thống thông tin (HTTT)
Khi ứng dụng CNTT từng bước được phát triển mạnh trong cơ quan nhà nước (CQNN), các HTTT từng bước hình thành và góp phần đắc lực phục vụ các hoạt động của các bộ, ngành, địa phương. Các hệ thống thông tin lớn được xây dựng kèm với các CSDL riêng đã thu thập, lưu trữ lượng lớn dữ liệu.
Tuy nhiên, dữ liệu chủ yếu luân chuyển trong nội bộ hệ thống, trong phạm vi nghiệp vụ, CQNN, của ngành. Việc kết nối, chia sẻ dữ liệu còn hạn chế, thiếu tính tương thích về tiêu chuẩn dữ liệu và sử dụng cho mục đích khai thác. Điển hình cho một số CSDL là CSDL đăng ký doanh nghiệp, CSDL ngành bảo hiểm, thuế…
Giai đoạn CSDL làm nền tảng phát triển CPĐT
Giai đoạn này chỉ hình thành rõ rệt khi CSDL quốc gia về dân cư được đưa vào vận hành. CSDL quốc gia về dân cư không được xây dựng riêng cho một hệ thống hoặc hoạt động nghiệp vụ cụ thể nào mà được xác định làm cơ sở để triển khai nhiều hoạt động, giải pháp phát triển CPĐT.
Vai trò nền tảng phát triển CPĐT đối với CSDL quốc gia về dân cư được thể hiện rõ từ Đề án tổng thể đơn giản hóa thủ tục hành chính, giấy tờ công dân và các CSDL liên quan đến quản lý dân cư giai đoạn 2013 - 2020 (Đề án 896 theo Quyết định số 896/QĐ-TTg của Thủ tướng Chính phủ ngày 08/06/2013) và tiếp đó là Đề án phát triển ứng dụng dữ liệu về dân cư, định danh và xác thực điện tử phục vụ CĐS quốc gia giai đoạn 2022 - 2025, tầm nhìn đến năm 2030 (Đề án 06 theo Quyết định số 06/QĐ-TTg ngày 06/01/2022). Vai trò làm nền tảng phát triển CPĐT vẫn đang được triển khai mạnh mẽ đối với các CSDL quốc gia hiện nay.
CSDL làm nền tảng phát triển CPĐT khác với các CSDL trong giai đoạn trước khi được xây dựng phục vụ đa mục đích, cung cấp dịch vụ chia sẻ dữ liệu được chuẩn hoá và cung cấp rộng rãi cho các bộ, ngành, địa phương, tổ chức, cá nhân có nhu cầu để phát triển các ứng dụng, dịch vụ. Dữ liệu được chia sẻ trực tuyến, thời gian thực và chuẩn hoá theo tiêu chuẩn về cấu trúc dữ liệu thống nhất, đồng bộ.
Giai đoạn dữ liệu làm nền tảng CĐS quản trị công và phát triển KTS, XHS
Giai đoạn này thực sự được biểu hiện rõ khi CĐS đã triển khai sâu, rộng vào đời sống xã hội; dữ liệu ngày càng được thu thập, dồi dào trong xã hội và có sự kết hợp với sự tiến bộ của khoa học công nghệ khi các công nghệ mới như trí tuệ nhân tạo (AI), dữ liệu lớn được sử dụng phổ biến.
Dữ liệu được thu thập nguyên trạng từ thực tế đời sống xã hội, được khai thác để giải quyết các vấn đề của xã hội, thúc đẩy sự sáng tạo trong xã hội. AI sẽ thông minh hơn nhờ có nhiều dữ liệu; quản trị công sẽ tốt hơn nhờ dữ liệu; định hướng kinh doanh sẽ tối ưu hơn nhờ dữ liệu; ngành nghề mới ra đời nhờ dữ liệu; đời sống con người sẽ tốt hơn nhờ dữ liệu. Xây dựng dữ liệu là xây dựng nền tảng để phát triển xã hội. Trong giai đoạn này, các Chiến lược về CĐS đã được ban hành.
Những thay đổi của dữ liệu khi chuyển từ giai đoạn tin học hóa sang CĐS
Thông tin tại tọa đàm, ông Nguyễn Trọng Khánh cho biết, hiện nay, chúng ta đã chuyển từ giai đoạn ứng dụng CNTT hay tin học hóa sang giai đoạn CĐS. Cùng với sự thay đổi chóng mặt của công nghệ, nhiều công nghệ số mới ra đời, những nhìn nhận, cách tiếp cận về dữ liệu trong CĐS cũng có sự thay đổi nhất định.
Chẳng hạn, dữ liệu trong thời kỳ tin học hóa chỉ là phương tiện, nhưng trong CĐS, dữ liệu là nguyên liệu, là sản phẩm, là hàng hóa. Trong tin học hoá, dữ liệu chỉ là một cấu phần của một hệ thống, là công cụ để thay đổi phương tiện làm việc, giúp con người làm nhanh hơn, đơn giản hơn. Trong CĐS, dữ liệu đóng vai trò vừa là đầu vào, vừa là đầu ra của các hoạt động KTS, XHS.
Theo ông Nguyễn Trọng Khánh, dữ liệu trong thời kỳ tin học hóa chỉ là phương tiện,
nhưng trong CĐS, dữ liệu là nguyên liệu, là sản phẩm, là hàng hóa.
Dữ liệu cũng đã chuyển từ vai trò lưu trữ, tìm kiếm sang thay đổi cách nghĩ cách làm việc, cách tạo ra giá trị. Cụ thể, trước kia, xây dựng dữ liệu nhằm mục đích chính là lưu trữ và tìm kiếm thông tin nhanh chóng. Nhưng CĐS đã nâng cao vai trò của dữ liệu, tác động, định hướng đến cách nghĩ, cách làm việc và tạo ra các giá trị mới.
Từ phục vụ kinh tế, dữ liệu được ứng dụng để phục vụ kinh tế dữ liệu. Bởi vì, trong tin học hoá, dữ liệu gián tiếp hỗ trợ phát triển kinh tế, nhưng trong CĐS, kinh tế dữ liệu được chú ý và trở thành một lĩnh vực kinh tế tạo ra nguồn thu. Điều này thể hiện rõ nhất ở chiến lược dữ liệu của châu Âu, của Vương quốc Anh.
Mục đích sử dụng dữ liệu cũng chuyển từ “một mục đích cụ thể” sang đa mục đích. Trước đây, khi cần tin học hoá một hoạt động, dữ liệu được xây dựng để phục vụ mục đích đó, trong phạm vi xác định trước. Nhưng CĐS đã thay đổi cách xây dựng và khai thác dữ liệu. Theo đó, dữ liệu được thu thập và sử dụng cho nhiều mục đích khác nhau, có thể chưa xác định trước.
Tương tự như vậy, thời kỳ tin học hóa, dữ liệu thường được xây dựng để phục vụ một nhóm người, một hệ thống thì khi CĐS, dữ liệu được xây dựng thành nền tảng, hướng tới dùng chung cho tất cả mọi người, mọi cơ quan, tổ chức. Dữ liệu là nền tảng để phát triển các ứng dụng khác nhau, ứng dụng mới. Các CSDL quốc gia tạo nền tảng phát triển CPĐT là một ví dụ.
Trước kia, thông thường để tin học hoá, chúng ta cần thu thập, hoàn thiện dữ liệu mới đưa vào sử dụng. Nhưng trong CĐS, quá trình thu thập, khai thác, sử dụng dữ liệu diễn ra đồng thời, liên tục và lặp lại. CĐS cũng mở rộng hoạt động từ tự thu thập dữ liệu, bổ sung thêm thuê dữ liệu, mua dữ liệu. Nghĩa là, thuê dữ liệu, mua dữ liệu thì cần dữ liệu gì sẽ đi thuê, đi mua dữ liệu đó. Nhiều người sử dụng thì chi phí xây dựng sẽ rẻ hơn, doanh nghiệp có nhiều cơ hội tham gia cung cấp dịch vụ cho CQNN hơn.
Đặc biệt, CĐS đã giúp chuyển việc chia sẻ dữ liệu theo cơ chế xin -cho sang cung cấp dữ liệu theo dịch vụ. Bởi vì, tin học hoá chưa chú ý nhiều đến chia sẻ dữ liệu, dữ liệu chỉ phục vụ mình là chính, muốn có dữ liệu của cơ quan khác thì phải “đi xin”. Nhưng CĐS sẽ quy trình hoá, chuyên nghiệp hoá việc chia sẻ dữ liệu, cung cấp và sử dụng dữ liệu. Việc yêu cầu và cung cấp dịch vụ chia sẻ dữ liệu cần theo cơ chế một cửa trên cổng dữ liệu.
Ngoài ra, theo ông Nguyễn Trọng Khánh, những thay đổi cơ bản của dữ liệu từ thời tin học hóa sang CĐS còn có việc chuyển từ số hóa sang dữ liệu hóa, từ dữ liệu đóng sang dữ liệu mở, từ tập trung vào dữ liệu nghiệp vụ sang dữ liệu nghiệp vụ cộng thêm dữ liệu hành vi, dữ liệu lớn, dữ liệu học máy để phục vụ các dự đoán, dự báo, hay sử dụng dữ liệu để phục vụ trí tuệ nhân tạo. Cán bộ quản trị dữ liệu cũng trở thành các cán bộ phân tích dữ liệu trong thời kỳ CĐS, phát huy vai trò của dữ liệu, khai thác các giá trị tiềm năng mới của dữ liệu./.