Tầm quan trọng của AIOPS trong quản trị cơ sở hạ tầng CNTT

Trong tương lai gần, việc quản trị hoạt động vận hành đóng vai trò là “mỏ neo” cho tất cả các quy trình của tổ chức liên quan đến hệ thống CNTT, và đồng thời nhằm đảm bảo việc cung cấp các dịch vụ hỗ trợ CNTT luôn đạt chất lượng, tối ưu hóa và cải thiện theo thời gian. Việc Tự động hóa ITOM mang lại khả năng giám sát các cảnh báo và khởi tạo các giao thức cần thiết khi những kẻ xấu xâm nhập trái phép mạng hoặc tắt máy chủ, trong khi AI thu thập dữ liệu hoạt động và giúp ngăn chặn các sự cố (có thể xảy ra) trong tương lai – được truyền tải từ các bảng điều khiển và báo cáo dự báo thân thiện với người dùng.

I. Tương lai của AIOps trong ITOM

Quản trị hoạt động vận hành CNTT (ITOM) đề cập đến việc quản trị các yêu cầu ứng dụng và công nghệ trong một tổ chức CNTT. Theo khuôn khổ ITIL, mục tiêu của ITOM là theo dõi, kiểm soát và thực hiện các tác vụ thông thường cần thiết để hỗ trợ cơ sở hạ tầng CNTT của tổ chức. Ngoài những điều trên, giải pháp ITOM đảm bảo cung cấp và quản lý hiệu quả năng lực, chi phí, hiệu suất và bảo mật của cơ sở hạ tầng CNTT trong tổ chức.
“Việc triển khai giải pháp ITOM hiệu quả giống như cách một tổ chức đặt nền tảng cho việc quản trị thành công về Cơ sở Hạ tầng CNTT, trong đó AI đóng vai trò quan trọng trong giám sát, tổ chức và quản lý một lượng lớn dữ liệu sự kiện và hoạt động CNTT (AIOPs)” – Chia sẻ từ ông Giang Nguyễn, Giám đốc Công nghệ và Giải pháp tại WeCloud, với hơn 15 năm kinh nghiệm về công nghệ và giải pháp CNTT
Thật thú vị khi xem cách mà công nghệ chủ đạo thâm nhập vào các mô hình quản lý khác nhau, chẳng hạn như AI hỗ trợ Quản trị Dịch vụ CNTT (ITSM) và Quản trị vận hành CNTT (ITOM). Điều thú vị hơn là khi các quy trình này truyền cảm hứng và lan truyền bên ngoài cơ sở hạ tầng CNTT đến các bộ phận còn lại của tổ chức, chẳng hạn như trong trường hợp Quản trị Dịch vụ Doanh nghiệp (ESM). Giai đoạn 2021-2022 chúng ta đã chứng kiến một sự thay đổi phi thường trong ITOM và mục tiêu của nó là cung cấp các dịch vụ có chất lượng, hiệu quả và tiết kiệm chi phí. Trong bài viết này, chúng tôi thảo luận về năm xu hướng ITOM sắp tới cần thiết để bảo mật và duy trì cơ sở hạ tầng CNTT của doanh nghiệp.

1 . Hoạt động CNTT dựa trên dữ liệu

Một nghiên cứu do Gartner thực hiện ước tính rằng đến năm 2022, 60% cơ sở hạ tầng CNTT của doanh nghiệp sẽ tập trung vào “trung tâm dữ liệu” vốn sẽ điều khiển phần lớn quy trình hoạt động CNTT và quá trình ra quyết định. Các hoạt động CNTT luôn phụ thuộc vào dữ liệu đến để đổi mới các giả định trước đó, cải thiện quy trình và tăng hiệu quả hoạt động. Và hơn bao giờ hết, chúng tôi sẽ cần dữ liệu từ nhiều nguồn thông tin như nhật ký, số liệu và dấu vết để theo kịp tốc độ.
Điều này có thể khó khăn hơn khi chúng ta biết rằng các công ty thuộc khu vực tư nhân hiện đang tìm kiếm chủ quyền dữ liệu, độ trễ hoặc sự tuân thủ thông qua các hệ thống đám mây riêng. Điều này sẽ cho phép các dịch vụ doanh nghiệp cần sự linh hoạt và nhanh nhẹn của đám mây nhưng yêu cầu cơ sở hạ tầng CNTT riêng biệt. Ngoài ra, Trí tuệ nhân tạo cho Hoạt động CNTT (AIOps) cũng sẽ đóng vai trò giám sát, tổ chức và quản lý một lượng lớn dữ liệu sự kiện và hoạt động CNTT.

2. Tăng cường áp dụng các giải pháp ESM

Trong bối cảnh kỹ thuật số luôn thay đổi, dữ liệu và kiến thức chuyên môn về hoạt động CNTT đang được sử dụng để cải thiện các lĩnh vực phi CNTT của tổ chức như nguồn nhân lực và tiếp thị. Tác động của dữ liệu này đối với phần còn lại của tổ chức đã dẫn đến việc tăng cường áp dụng các giải pháp Quản lý dịch vụ doanh nghiệp như một chiến lược dài hạn để phát triển kinh doanh. Tất cả các bộ phận trong tổ chức sẽ có thể áp dụng ESM nhưng nó phải tuân theo thứ tự ưu tiên và ban quản lý có trách nhiệm dẫn dắt tổ chức thông qua quá trình phát triển này. Việc áp dụng giải pháp ESM đảm bảo rằng cơ sở hạ tầng CNTT của bạn thành công ngay cả khi thị trường cạnh tranh khốc liệt, kỳ vọng của người tiêu dùng liên tục thay đổi và tỷ lệ sai sót là tối thiểu.

3. Vận hành cơ sở hạ tầng dựa trên tự động hóa

Gartner đã xác định xu hướng các công ty áp dụng chiến lược tự động hóa đang gia tăng nhằm nỗ lực tái sử dụng nhân viên CNTT để thực hiện các nhiệm vụ có giá trị cao hơn. Bằng cách tự động hóa các tác vụ lặp đi lặp lại trong quy trình thực thi, các giải pháp ITOM giúp giảm thiểu sự không nhất quán có thể xảy ra hoặc các vấn đề thường xảy ra khi quy trình được thực hiện thủ công. Bởi vì ITOM mở rộng khả năng hiển thị và tiếp cận với các quy trình Quản lý CNTT khác như ITAM, ITSM, v.v., các hoạt động cơ sở hạ tầng dựa trên tự động hóa thay thế chuyên môn và nỗ lực tốn kém của con người, do đó giải phóng thời gian cho các nhiệm vụ phức tạp hơn.

4. Giải pháp quản lý thống nhất cho tất cả cơ sở hạ tầng hỗn hợp

Một xu hướng mới nổi khác trong không gian ITOM là giải pháp quản lý thống nhất cho cơ sở hạ tầng lai, còn được gọi là Quản lý cơ sở hạ tầng kỹ thuật số lai (Hybrid Digital Infrastructure Management – HDIM). Công nghệ này tích hợp nhiều chức năng của các hoạt động CNTT thông thường như quản lý cơ sở hạ tầng, quản lý dữ liệu, quản lý đám mây, bảo mật và các chức năng ITSM khác vào một giải pháp thống nhất.
Bởi vì việc quản lý cơ sở hạ tầng CNTT lai là một thách thức, các công nghệ HDIM sẽ cung cấp một giải pháp khả thi giúp giải quyết các điểm khó khăn chính của quy trình vận hành và các công cụ cần thiết để quản lý.
Mặc dù các công nghệ HDIM vẫn đang trong giai đoạn phát triển ban đầu, Gartner dự đoán rằng 20% các tổ chức CNTT sẽ áp dụng các công nghệ HDIM để tối ưu hóa các hoạt động của cơ sở hạ tầng CNTT lai.

5. Chuyển đổi từ ITSM và ITOM truyền thống sang AIOps

Được quảng cáo là điều quan trọng tiếp theo trong quản lý CNTT, Trí tuệ nhân tạo cho Hoạt động CNTT hoặc AIOps là ứng dụng của các công nghệ tiên tiến như học máy và trí tuệ nhân tạo để tự động hóa các hoạt động CNTT trong tổ chức. Cơ sở hạ tầng CNTT hiện đại ngày càng trở nên phức tạp khi các doanh nghiệp tìm cách áp dụng các giải pháp mới hơn và hiệu quả hơn để đáp ứng các thách thức CNTT thời hiện đại. AIOps giúp nâng cao hoạt động ITSM và ITOM truyền thống bằng cách tự động hóa các thành phần chính của quy trình. Ví dụ: giải pháp AIOps có thể xác định sự cố mạng hoặc sự cố mất điện trong thời gian thực và sử dụng tự động hóa để xác định lỗi và khắc phục ngay cả trước khi khách hàng được thông báo. Ngoài ra, điều này giúp cải thiện thời gian phản hồi sự cố và tăng hiệu quả hoạt động, từ đó cải thiện trải nghiệm của khách hàng.

II. Tầm quan trọng của AIOps trong quản lý cơ sở hạ tầng CNTT

Trí tuệ nhân tạo cho hoạt động CNTT (AIOps) là một thuật ngữ chung cho việc sử dụng phân tích dữ liệu lớn, máy học (ML) và các công nghệ AI khác để tự động hóa việc xác định và giải quyết các sự cố CNTT phổ biến. Các hệ thống, dịch vụ và ứng dụng trong một doanh nghiệp lớn — đặc biệt là với những tiến bộ trong kiến trúc phân tán như bộ chứa, vi dịch vụ và môi trường nhiều đám mây — tạo ra khối lượng lớn dữ liệu hiệu suất và nhật ký có thể cản trở khả năng xác định và giải quyết sự cố của nhóm CNTT. AIOps sử dụng dữ liệu này để giám sát tài sản và có được khả năng hiển thị các phần phụ thuộc bên trong và bên ngoài hệ thống CNTT. Nền tảng AIOps sẽ cung cấp cho doanh nghiệp khả năng thực hiện những việc sau:

1. Tự động hóa các hoạt động thường ngày

Các hoạt động thông thường bao gồm các yêu cầu của người dùng cũng như các cảnh báo hệ thống CNTT không quan trọng. Ví dụ: AIOps có thể cho phép hệ thống bàn trợ giúp xử lý và đáp ứng yêu cầu của người dùng để cung cấp tài nguyên một cách tự động. Nền tảng AIOps cũng có thể đánh giá một cảnh báo và xác định rằng cảnh báo đó không yêu cầu hành động vì các chỉ số liên quan và dữ liệu hỗ trợ có sẵn nằm trong các thông số bình thường.  

2. Nhận biết các vấn đề nghiêm trọng nhanh hơn và chính xác hơn con người.

Các chuyên gia CNTT có thể giải quyết một sự kiện phần mềm độc hại đã biết trên một hệ thống không quan trọng, nhưng bỏ qua quá trình tải xuống hoặc xử lý bất thường bắt đầu trên một máy chủ quan trọng vì họ không theo dõi mối đe dọa này. AIOps giải quyết tình huống này theo cách khác: ưu tiên sự kiện trên hệ thống quan trọng như một cuộc tấn công hoặc lây nhiễm có thể xảy ra vì hành vi đó không bình thường và loại bỏ ưu tiên sự kiện phần mềm độc hại đã biết bằng cách chạy chức năng chống phần mềm độc hại.

3. Hợp lý hóa tương tác giữa các nhóm và nhóm trung tâm dữ liệu.

AIOps cung cấp cho từng nhóm chức năng CNTT dữ liệu và quan điểm phù hợp. Nếu không có các hoạt động hỗ trợ AI, chẳng hạn như giám sát, tự động hóa và bàn dịch vụ, các nhóm phải chia sẻ, phân tích cú pháp và xử lý thông tin bằng cách họp hoặc gửi dữ liệu theo cách thủ công. AIOps có thể tìm hiểu dữ liệu phân tích và giám sát nào phù hợp để hiển thị cho từng nhóm hoặc nhóm từ nhóm chỉ số tài nguyên lớn.  

III. AIOps hoạt động như thế nào?

AIOps sử dụng các công nghệ phân tích tiên tiến như máy học để tự động hóa và tối ưu hóa các quy trình vận hành CNTT. AIOps thường hoạt động theo các bước sau:

1. Thu thập dữ liệu.

Nền tảng AIOps thu thập thông tin từ nhiều nguồn khác nhau, bao gồm nhật ký ứng dụng, dữ liệu sự kiện, dữ liệu cấu hình, sự cố, chỉ số hiệu suất và lưu lượng mạng. Dữ liệu này có thể có cấu trúc, chẳng hạn như cơ sở dữ liệu hoặc không có cấu trúc, chẳng hạn như các bài đăng và tài liệu trên mạng xã hội.  

2. Phân tích dữ liệu.

Dữ liệu thu thập được phân tích bằng các thuật toán ML như phát hiện bất thường, phát hiện mẫu và phân tích dự đoán để tìm ra những bất thường có thể cần sự chú ý của nhân viên CNTT. Bước này đảm bảo các sự cố thực sự được tách biệt khỏi tiếng ồn hoặc cảnh báo sai.  

3. Suy luận và phân tích nguyên nhân gốc rễ.

AIOps thực hiện phân tích nguyên nhân gốc rễ để hỗ trợ xác định nguồn gốc của vấn đề. Các nhóm vận hành CNTT có thể cố gắng ngăn chặn sự cố tái diễn trong tương lai bằng cách xem xét nguyên nhân gốc rễ của các sự cố hiện tại.  

4. Hợp tác.

Khi quá trình phân tích nguyên nhân gốc hoàn tất, AIOps sẽ thông báo cho các nhóm và cá nhân thích hợp, cung cấp cho họ thông tin liên quan và thúc đẩy sự cộng tác hiệu quả bất chấp khoảng cách địa lý tiềm ẩn giữa họ. Ngoài ra, sự hợp tác này giúp lưu giữ dữ liệu sự kiện có thể cần thiết để xác định các vấn đề tương tự trong tương lai.  

5. Tự động khắc phục.

AIOps có thể tự động khắc phục sự cố, giảm đáng kể sự can thiệp thủ công và tăng tốc độ ứng phó sự cố. Đây có thể là các phản hồi tự động, chẳng hạn như thay đổi quy mô tài nguyên, khởi động lại dịch vụ hoặc thực thi các tập lệnh được xác định trước để giải quyết sự cố.
 

Nguồn: https://www.i3-vietnam.com/blogs/post/tam-quan-trong-aiops-trong-quan-tri-co-so-ha-tang-cntt