Nghiên cứu phát triển phần mềm dịch vụ nền tảng trên nền điện toán đám mây tính toán hiệu năng cao
Lam Vân
19/01/2019
KH&CN trong nước
Tác giả Trần Văn Hoài (trường Đại học Bách Khoa TP.HCM) và cộng sự thực hiện đề tài “Nghiên cứu phát triển phần mềm dịch vụ nền tảng trên nền điện toán đám mây tính toán hiệu năng cao để triển khai một cách hiệu quả cho các ứng dụng quan trọng” nhằm xây dựng phần mềm dịch vụ nền tảng trên nền điện toán đám mây (ĐTĐM); giúp triển khai một cách hiệu quả các ứng dụng tính toán lớn trên nền hệ thống đám mây tính toán; đào tạo nhân lực và xây dựng nhóm nghiên cứu mạnh về hướng tính toán hiệu năng cao.
Công nghệ ĐTĐM đang dần được áp dụng rộng rãi trong lĩnh vực tính toán hiệu năng cao, giúp giải quyết hiệu quả các ứng dụng liên quan đến dữ liệu lớn và khối lượng tính toán lớn trong khoa học lẫn công nghiệp. Hiện tại có nhiều đơn vị nghiên cứu tập trung khai thác công nghệ ĐTĐM, nhưng đa số các nhóm nghiên cứu đi theo hướng phát triển ứng dụng trên nền ĐTĐM hoặc phát triển hạ tầng cho hệ thống này mà chưa quan tâm đến việc làm sao để tối ưu hóa các ứng dụng chạy trên nền ĐTĐM, tiếp cận bằng phương pháp can thiệp vào việc điều khiển cơ sở hạ tầng, kết hợp với việc sử dụng các kỹ thuật học máy.
Đề tài nói trên tập trung vào các nội dung nghiên cứu triển khai môi trường ĐTĐM trên nền cơ sở hạ tầng phần cứng được trang bị tại trường Đại học Bách Khoa TP.HCM; khai thác môi trường ĐTĐM để giải quyết hai bài toán khó liên quan đến dữ liệu lớn và khối lượng tính toán lớn gồm phân loại trình tự sinh học (thuộc lớp bài toán tối ưu tổ hợp) và mô phỏng lũ trên sông Mekong (thuộc lớp bài toán mô phỏng tác động của biến đổi khí hậu).
Theo đó, nhóm nghiên cứu đã xây dựng thành công hệ thống ĐTĐM nhỏ, bao gồm 5 nút, có khả năng cung cấp các máy ảo, cho phép cung cấp các dịch vụ nền (PaaS) hỗ trợ cho việc giải quyết 2 bài toán về phân loại trình tự sinh học và mô phỏng lũ. Đồng thời xây dựng cổng thông tin (website) cho phép người dùng thực thi các ứng dụng (bài toán) được một cách tự động. Các giải thuật dự báo thời gian chạy (3 giải thuật), xếp lịch (2 giải thuật) được triển khai đầy đủ và kiểm tra khá chi tiết hiệu năng. Đây là cơ sở để nhóm định hướng xây dựng một mô hình dự báo theo phương pháp ensemble learning, là phương pháp tổng hợp từ nhiều phương pháp dự báo khác nhau nhằm cho ra kết quả dự báo tốt nhất.
Hệ thống đã chạy thử nghiệm hai bài toán phân loại trình tự sinh học và mô phỏng lũ bằng ứng dụng Telemac2D và cho những kết quả khả quan. Trong tương lai, nhóm sẽ đăng ký các ứng dụng mới bao gồm các ứng dụng liên quan học sâu (deep learning) để giải quyết các vấn đề thực tiễn như y tế, nông nghiệp,…