Ngày 21/6/2022, hội thảo “Dữ liệu nghiên cứu mở phục vụ chia sẻ, dùng chung trong kỷ nguyên số” đã diễn ra tại TP.HCM nhằm giới thiệu và lấy kiến chuyên gia về kiến trúc nền tảng quản trị dữ liệu nghiên cứu KH&CN.
Sự kiện do Cục Thông tin KH&CN quốc gia phối hợp với Viện Công nghệ thông tin, Viện Hàn Lâm khoa học và công nghệ Việt Nam, Viện Nghiên cứu dữ liệu lớn, Quỹ Đổi mới sáng tạo VinGroup đồng tổ chức.
Góc nhìn từ chuyên gia
Đây là một trong chuỗi hoạt động nhằm thúc đẩy việc tạo lập, sử dụng và khai thác dữ liệu khoa học và công nghệ mở cũng như khuyến khích sự quan tâm và tham gia của các nhà nghiên cứu trong việc chia sẻ dữ liệu khoa học và công nghệ dùng chung. Trên 50 đại biểu là các nhà khoa học từ các viện nghiên cứu, trường đại học trên cả nước đã tham dự và chia sẻ.
PSG.TS. Bùi Thu Lâm, Học viện Kỹ thuật Mật mã chia sẻ về tình trạng dùng chung dữ liệu nghiên cứu trong nước: “Việt Nam đã đạt được một số kết quả bước đầu về xây dựng hạ tầng dữ liệu, các cơ sở dữ liệu quốc gia đang được tạo lập rất mạnh mẽ. Tuy nhiên nhìn chung hạ tầng dữ liệu còn chưa đồng bộ, rời rạc, nguồn dữ liệu mở còn hạn chế. Chưa có hạ tầng dữ liệu quốc gia kết nối, liên thông, chia sẻ cho cộng đồng tổ chức, cá nhân, doanh nghiệp phục vụ nghiên cứu, phát triển. Hơn nữa, dữ liệu chưa đồng nhất, chưa đồng bộ, chất lượng dữ liệu chưa cao”.
PGS.TS. Thoại Nam, Đại học Quốc gia TP. Hồ Chí Minh cho rằng, chia sẻ dữ liệu là chìa khóa cho thành công. Ông giới thiệu một số ví dụ và các bài toán về chia sẻ dữ liệu nghiên cứu, cũng như Kinh nghiệm của HPC Lab trong Đại học Bách Khoa – ĐHQG-HCM trong việc triển khai Lab và dự án Làng Thông Minh (Smart Village).
Ông Đào Mạnh Thắng, Phó Cục trưởng Cục Thông tin KH&CN quốc gia, trình bày tham luận tại Hội thảo
Ông Đào Mạnh Thắng, Phó Cục trưởng Cục Thông tin KH&CN quốc gia có tham luận về hiện trạng chia sẻ, dùng chung dữ liệu nghiên cứu mở từ góc độ của cơ quan quản lý. “Hiện nay các dữ liệu thu thập được chỉ thể hiện dưới dạng thuyết minh nhiệm vụ, bài báo đăng tạp chí, tham luận tại các hội nghị, hội thảo, các báo cáo kết quả nghiên cứu đều chỉ ở dạng văn bản thông thường. Đó mới là thành quả cuối cùng được công bố trong quá trình nghiên cứu, còn lại tất cả dữ liệu trung gian bao gồm: số liệu điều tra, khảo sát, thu thập phát sinh trong quá trình nghiên cứu, các file ảnh, video, các thí nghiệm thực tế, các mô hình quan trắc, các mã nguồn, ứng dụng mẫu trong CNTT… hầu hết đều chưa được nhắc tới và chưa thu thập được”.
Vì vậy, ông Thắng đưa ra đề xuất phát triển các ứng dụng lưu trữ và khai phá dữ liệu phát sinh trong quá trình nghiên cứu, tạo cơ sở thiết lập hạng tầng chia sẻ dữ liệu mở nhằm cung cấp thông tin khoa học công nghệ một cách công khai, minh bạch, hiệu quả cho toàn xã hội.
Dữ liệu nghiên cứu mở cho dùng chung trên quy mô quốc gia
Chia sẻ về Nền tảng quản trị dữ liệu nghiên cứu khoa học và công nghệ mở phục vụ chia sẻ, dùng chung ở quy mô quốc gia, TS. Đinh Văn Dũng, Viện CNTT, ĐHQG HN cho rằng cách thức chia sẻ dữ liệu theo kiểu cũ chỉ thu hút được ít dữ liệu, từ đó đặt ra nhu cầu xây dựng nền tảng có tốc độ xử lý rất nhanh một luồng dữ liệu lớn, phát sinh liên tục.
Chia sẻ từ kinh nghiệm thực tiễn, TS. Võ Sỹ Nam đến từ Viện Nghiên cứu dữ liệu lớn (VinBigData) và công ty GeneStory giới thiệu hệ thống lưu trữ dữ liệu gen tại VinBigData và cách thức kết nối, chia sẻ dữ liệu gen với hệ thống chia sẻ dữ liệu nghiên cứu mở.
Trong phần thảo luận, các chuyên gia từ nhiều lĩnh vực đã đặt câu hỏi về cách thức chia sẻ và khai thác dữ liệu nghiên cứu đang thử nghiệm xây dựng, cũng như mong muốn tham gia để hỗ trợ cho hoạt động NCKH tại cơ sở. Đại diện Cục Thông tin KH&CN quốc gia và các diễn giả đã giải đáp thắc mắc về nền tảng và cách thức dùng chung dữ liệu nghiên cứu.
Nguồn: https://www.vista.gov.vn/news/khoa-hoc-ky-thuat-va-cong-nghe/du-lieu-nghien-cuu-mo-phuc-vu-chia-se-dung-chung-trong-ky-nguyen-so-5148.html