Học máy không giám sát giúp phát hiện điểm dữ liệu bất thường trong sản xuất mà không cần dữ liệu lỗi gán nhãn. Công nghệ này tự học hành vi “bình thường” để nhanh chóng nhận diện lỗi tiềm ẩn, duy trì hiệu suất và chất lượng ổn định. Bài viết giới thiệu vai trò, cơ chế và các thuật toán tiêu biểu như Isolation Forest và One-Class SVM, làm rõ lợi ích và thách thức khi ứng dụng U-ML trong phát hiện bất thường công nghiệp.
1. Giới thiệu: Nâng cấp Tự động hóa bằng khả năng “nhìn thấu” của AI
1.1. Bối cảnh Sản xuất 4.0 và Thách thức về chất lượng
Bối cảnh Sản xuất 4.0 đặt ra yêu cầu cao về việc sử dụng các hệ thống theo dõi và kiểm soát tức thời để đối phó với sự phức tạp ngày càng gia tăng của quy trình sản xuất. Quy trình sản xuất hiện đại thường bao gồm hàng ngàn cảm biến và thiết bị hoạt động đồng bộ, tạo ra một khối lượng dữ liệu khổng lồ (Big Data) mà các phương pháp phân tích thủ công hay dựa trên quy tắc cố định không thể xử lý kịp thời và hiệu quả.
Thách thức cốt lõi nằm ở bản chất của sự cố: Bất thường (lỗi sản phẩm hoặc hỏng hóc máy móc) có tính chất hiếm gặp (low-occurrence), đa chiều, và quan trọng nhất là không được dán nhãn (unlabeled data) một cách đầy đủ trong quá trình vận hành bình thường. Việc giới thiệu công nghệ Phát hiện bất thường tiên tiến trở thành chìa khóa chiến lược để các nhà máy giữ OEE (Overall Equipment Effectiveness) ở mức cao, đảm bảo chất lượng đầu ra đồng đều và tối ưu hóa chi phí vận hành.
1.2. Học máy không giám sát (U-ML) – Phương pháp sinh ra cho sự “bất thường”
Học máy không giám sát (U-ML) đóng vai trò như phương pháp tối ưu cho việc nhận diện sự cố trong các hệ thống sản xuất công nghiệp, bởi vì nó không yêu cầu dữ liệu lỗi có nhãn để bắt đầu học. Các thuật toán U-ML tập trung vào việc học hỏi và xây dựng một mô hình toán học đại diện cho trạng thái hoạt động bình thường của máy móc hoặc quy trình từ dữ liệu lịch sử không có lỗi.
Khả năng đặc trưng của U-ML cho phép hệ thống xác định bất kỳ sai lệch đáng kể nào so với mô hình “bình thường” đã được thiết lập, ngay cả khi sự sai lệch đó chưa từng xuất hiện trước đây. Chính vì lý do này, U-ML khẳng định vai trò thiết yếu trong việc tự động hóa quá trình Phát hiện bất thường, giảm thiểu đáng kể sự can thiệp của con người và cho phép phản ứng tức thì với các sự cố tiềm tàng.

2. Học máy không giám sát là gì và hoạt động như thế nào?
2.1. Định nghĩa và Cơ chế cốt lõi
Học máy không giám sát (Unsupervised Machine Learning) được định nghĩa là một nhánh của trí tuệ nhân tạo cho phép các mô hình tìm kiếm các cấu trúc ẩn (patterns) hoặc mối quan hệ tiềm tàng trong tập dữ liệu không có nhãn. Không giống như học có giám sát, U-ML không dựa vào bất kỳ biến mục tiêu (target variable) hay nhãn lỗi nào để học, thay vào đó, nó tự động phân loại hoặc nhóm các điểm dữ liệu (thông qua Mô hình Clustering hoặc các kỹ thuật khác) dựa trên sự tương đồng nội tại của chúng.
Cơ chế hoạt động cốt lõi trong bối cảnh Phát hiện bất thường bao gồm việc huấn luyện mô hình chỉ bằng cách sử dụng các điểm dữ liệu được xác nhận là bình thường (Normal). Sau khi mô hình đã học được “khuôn mẫu” của dữ liệu bình thường, bất cứ điểm dữ liệu mới nào rơi vào ngoài phạm vi của khuôn mẫu này, hoặc có xác suất thuộc về khuôn mẫu đó thấp hơn ngưỡng cho phép, đều bị đánh dấu là một sự kiện bất thường, kích hoạt cảnh báo cho người vận hành.
2.2. Sự khác biệt then chốt so với Học máy có giám sát
Sự khác biệt then chốt giữa Học máy không giám sát (U-ML) và Học máy có giám sát (S-ML) tập trung vào yêu cầu về dữ liệu đầu vào và mục tiêu của mô hình. Trong khi S-ML yêu cầu các mẫu lỗi (bất thường) phải được gán nhãn rõ ràng để học cách phân loại chúng, U-ML chỉ cần mẫu hoạt động bình thường, đại diện cho trạng thái lý tưởng của hệ thống.
Điều này giúp U-ML dễ dàng triển khai hơn nhiều trong môi trường sản xuất công nghiệp thực tế, nơi mà các sự cố thường hiếm, đa dạng và khó thu thập đủ dữ liệu để huấn luyện mô hình có giám sát một cách hiệu quả.

3. Các Thuật toán U-ML chính trong Phát hiện bất thường
Các thuật toán U-ML tạo ra xương sống cho mọi giải pháp Phát hiện bất thường hiện đại, mỗi thuật toán sử dụng một nguyên lý toán học riêng để định nghĩa và cô lập các điểm dữ liệu dị biệt. Việc lựa chọn thuật toán phù hợp phụ thuộc vào cấu trúc, kích thước và tính chất của dữ liệu thu thập được từ hệ thống tự động hóa công nghiệp.
3.1. Phương pháp dựa trên Mật độ (Density-based)
Phương pháp dựa trên Mật độ xác định các điểm bất thường dựa trên sự khác biệt về mật độ so với các điểm lân cận trong không gian dữ liệu. Local Outlier Factor (LOF) là thuật toán tiêu biểu nhất trong nhóm này, nổi bật với khả năng nhận diện các dị biệt cục bộ. Nguyên lý hoạt động của LOF bao gồm việc so sánh mật độ của một điểm dữ liệu với mật độ trung bình của điểm lân cận gần nhất của nó.
Một điểm được coi là bất thường nếu mật độ của nó thấp hơn đáng kể so với các điểm lân cận, điều này ngụ ý rằng nó nằm trong một vùng thưa thớt (sparse region). LOF tìm thấy ứng dụng rộng rãi trong việc phát hiện lỗi cảm biến, nơi mà một giá trị bất thường cục bộ có thể chỉ ra sự thay đổi trong hành vi máy móc tại một thời điểm cụ thể.
3.2. Phương pháp dựa trên Khoảng cách (Distance-based)
Các phương pháp dựa trên Khoảng cách đánh giá mức độ bất thường của một điểm dữ liệu thông qua khoảng cách của nó đến các điểm dữ liệu khác. K-Nearest Neighbors (k-NN), khi được áp dụng cho Phát hiện bất thường, không dùng để phân loại mà để đo lường độ xa lạ của một điểm. Nguyên lý của k-NN trong ngữ cảnh này là tính khoảng cách trung bình đến K điểm gần nhất trong tập dữ liệu bình thường.
Các điểm dữ liệu mới có khoảng cách trung bình lớn hơn ngưỡng cho phép được xác định là bất thường. Phương pháp này thích hợp cho việc phân tích dữ liệu có tính chất liên tục và định lượng, chẳng hạn như dữ liệu về áp suất, nhiệt độ hoặc lưu lượng dòng chảy, nơi mà các giá trị ngoại lệ về độ lớn là dấu hiệu rõ ràng của sự cố.

3.3. Phương pháp dựa trên Phân lập (Isolation/Tree-based)
Phương pháp dựa trên Phân lập sử dụng cấu trúc cây quyết định (Decision Tree) để cô lập hiệu quả các điểm bất thường trong không gian dữ liệu. Thuật toán Isolation Forest (iForest) là một trong những công cụ U-ML được ưa chuộng nhất hiện nay nhờ vào tốc độ xử lý vượt trội và hiệu suất cao trong việc xử lý dữ liệu lớn (Big Data).
Nguyên lý của iForest dựa trên giả định rằng các điểm bất thường có xu hướng bị cô lập (tách biệt) dễ dàng hơn so với các điểm bình thường. Điều này ngụ ý rằng các điểm bất thường sẽ nằm gần gốc hơn và yêu cầu ít lần chia cây hơn để bị tách ra. Quy trình hoạt động cơ bản của Thuật thuật Isolation Forest bao gồm:
- Xây dựng nhiều cây cách ly (Isolation Trees – iTrees) bằng cách chọn ngẫu nhiên một đặc trưng và một điểm chia ngẫu nhiên.
- Tiếp tục chia cho đến khi mỗi điểm dữ liệu được cô lập (nằm riêng lẻ trong một nút).
- Tính toán “Độ sâu đường dẫn” (Path Length) cho mỗi điểm dữ liệu. Điểm bất thường có độ sâu ngắn hơn.
iForest tìm thấy ứng dụng mạnh mẽ trong việc phân tích nhanh dữ liệu lớn (Big Data) thu thập được từ các hệ thống tự động hóa công nghiệp và phát hiện các sự cố bất ngờ, không có tiền lệ.
3.4. Phương pháp dựa trên Mô hình Ranh giới (One-Class Models)
Phương pháp dựa trên Mô hình Ranh giới xây dựng một mô hình học máy để định nghĩa chặt chẽ ranh giới của toàn bộ dữ liệu bình thường (tức là “một lớp” dữ liệu). One-Class SVM (Support Vector Machine) là thuật toán đại diện, một biến thể của SVM truyền thống, được thiết kế chuyên biệt cho các tác vụ Phát hiện bất thường (Novelty Detection).
Nguyên lý cốt lõi của One-Class SVM là tìm kiếm một siêu mặt phẳng (hyperplane) trong không gian đặc trưng, nhằm cô lập toàn bộ tập dữ liệu bình thường một cách tối ưu nhất về phía một bên. Bất cứ điểm dữ liệu mới nào nằm ngoài ranh giới siêu mặt phẳng đã học đều được gán nhãn là bất thường.
One-Class SVM rất thích hợp cho các hệ thống Kiểm soát chất lượng (Quality Control) nghiêm ngặt, nơi yêu cầu xác định chính xác và nghiêm ngặt tập dữ liệu “tốt” (good parts) để phân loại bất cứ thứ gì khác là lỗi.

4. Ứng dụng thực tiễn trong Tự động hóa Sản xuất Công nghiệp
Học máy không giám sát trong phát hiện bất thường biến thành một công cụ mạnh mẽ, được tích hợp sâu vào các giải pháp tự động hóa công nghiệp, mang lại khả năng giám sát và kiểm soát chất lượng chưa từng có. Ứng dụng của nó tập trung vào ba lĩnh vực cốt lõi để nâng cao OEE và giảm thiểu rủi ro vận hành.
4.1. Bảo trì Dự đoán (Predictive Maintenance)
Bảo trì Dự đoán (Predictive Maintenance) sử dụng U-ML như một bộ lọc thông minh, phân tích dữ liệu đa chiều (rung động, nhiệt độ, âm thanh, áp suất) từ máy móc để dự báo hỏng hóc trước khi chúng xảy ra. Các mô hình U-ML được huấn luyện chỉ trên dữ liệu hoạt động ổn định của máy móc. Khi mô hình phát hiện một sự sai lệch nhỏ trong mô hình rung động hoặc sự tăng bất thường của nhiệt độ, nó sẽ cảnh báo về sự mài mòn, lệch trục, hoặc hỏng hóc sắp xảy ra.
Việc này đảm bảo hành động bảo trì được thực hiện kịp thời, tránh được Downtime không mong muốn. Các lợi ích cụ thể mà U-ML mang lại cho Bảo trì Dự đoán bao gồm:
- Tối ưu hóa thời gian bảo trì: Chuyển từ bảo trì theo lịch trình cố định sang bảo trì theo trạng thái thực tế.
- Kéo dài tuổi thọ thiết bị: Phát hiện và khắc phục các vấn đề nhỏ trước khi chúng gây ra hư hại lớn.
- Cải thiện an toàn lao động: Giảm thiểu rủi ro tai nạn do hỏng hóc đột ngột của máy móc.
Ví dụ: Một công ty điện lực đã triển khai Thuật toán Isolation Forest để phân tích dữ liệu rung động từ các động cơ turbine. Mô hình đã thành công trong việc xác định một sự thay đổi tần số rung động nhỏ (một bất thường tinh vi) chỉ ra sự lỏng lẻo của một bu-lông bên trong, cho phép đội ngũ kỹ thuật thay thế bộ phận đó trong một đợt bảo trì có kế hoạch, từ đó tránh được sự cố Downtime tốn kém.
4.2. Kiểm tra Chất lượng Sản phẩm (Automated Quality Control)
Học máy không giám sát cung cấp giải pháp đột phá cho Kiểm tra Chất lượng Sản phẩm tự động (Automated Quality Control), đặc biệt là trong lĩnh vực thị giác máy tính (Computer Vision) hoặc phân tích dữ liệu cảm biến (Sensor Data). Trong các dây chuyền sản xuất tốc độ cao, hệ thống U-ML được sử dụng để học tập các đặc điểm của sản phẩm “chuẩn” (ví dụ: hình dạng, màu sắc, bề mặt hoàn thiện).
Khi một sản phẩm đi qua hệ thống kiểm tra, mô hình tự động xác định các sản phẩm lỗi (ví dụ: vết nứt nhỏ, sự khác biệt về hình học, sai lệch màu sắc) mà không cần lập trình các quy tắc hay mẫu lỗi cụ thể. One-Class SVM thường được ưu tiên sử dụng trong trường hợp này, vì nó xây dựng một ranh giới rõ ràng cho những gì là “chất lượng tốt”, đẩy mọi biến thể ra ngoài.

4.3. Giám sát và Tối ưu hóa Quy trình (Process Monitoring)
Việc Giám sát và Tối ưu hóa Quy trình yêu cầu khả năng phát hiện các hành vi bất thường trong toàn bộ chuỗi vận hành tự động, chứ không chỉ ở một máy móc đơn lẻ. Mô hình U-ML có thể phân tích sự tương quan giữa hàng chục thông số quy trình (ví dụ: nhiệt độ lò nung, tốc độ băng tải, lưu lượng hóa chất) để tìm kiếm các tổ hợp giá trị bất thường.
Ví dụ: hệ thống có thể nhận diện một tình huống trong đó tốc độ robot giảm nhẹ (một bất thường) kết hợp với sự tăng đột biến của nhiệt độ (một bất thường khác) để dự đoán tắc nghẽn. Việc này giúp đảm bảo rằng mọi thành phần của hệ thống tự động hóa công nghiệp hoạt động trong phạm vi hiệu suất tối ưu, từ đó giảm thiểu lãng phí và cải thiện chất lượng tổng thể.
5. Lợi ích vượt trội và Thách thức triển khai
Học máy không giám sát trong phát hiện bất thường mang lại nhiều lợi ích kinh tế và vận hành to lớn cho các nhà máy, nhưng việc triển khai thành công cũng kèm theo một số thách thức kỹ thuật và chiến lược cần được giải quyết.
5.1. Lợi ích then chốt
Việc tích hợp U-ML vào hệ thống AI trong sản xuất đem lại khả năng tự động hóa việc đưa ra quyết định ở cấp độ cao, điều mà các hệ thống điều khiển truyền thống không thể đạt được. Các lợi ích chiến lược chính bao gồm:
- Giảm chi phí vận hành: Việc sử dụng U-ML giúp tránh hỏng hóc lớn và loại bỏ nhu cầu bảo trì đột xuất, dẫn đến việc giảm chi phí bảo trì đến 20% và tối ưu hóa tồn kho phụ tùng.
- Tăng hiệu suất OEE: Bằng cách giảm thiểu thời gian chết (Downtime) ngoài kế hoạch, các hệ thống tự động hóa công nghiệp được trang bị U-ML có thể vận hành liên tục hơn, tối đa hóa sản lượng.
- Phát hiện sớm và nhạy bén: U-ML có khả năng tìm ra các vấn đề nhỏ, tinh vi (ví dụ: sự thay đổi mẫu rung động) mà con người hoặc các quy tắc ngưỡng lập trình truyền thống dễ dàng bỏ sót, do đó cải thiện chất lượng sản phẩm cuối cùng.

5.2. Thách thức trong triển khai U-ML
Việc triển khai các mô hình Học máy không giám sát đòi hỏi sự chú trọng đặc biệt đến chất lượng dữ liệu và kỹ thuật mô hình hóa. Dưới đây là các thách thức kỹ thuật chính:
| Thách thức Kỹ thuật | Mô tả và Hậu quả | Phương pháp Giải quyết |
| Xử lý Dữ liệu Nhiễu | Dữ liệu cảm biến thường chứa nhiễu (noise) hoặc lỗi đọc, làm sai lệch mô hình “bình thường”. | Áp dụng các kỹ thuật tiền xử lý mạnh mẽ như làm mịn (smoothing), loại bỏ outlier nhiễu, và kỹ thuật giảm chiều dữ liệu. |
| Lựa chọn Ngưỡng (Thresholding) | Việc xác định ngưỡng chính xác để phân biệt “bình thường” và “bất thường” là khó khăn, dẫn đến sai sót loại I (False Positives) hoặc sai sót loại II (False Negatives). | Sử dụng phương pháp thống kê nâng cao (như phân tích phân vị) và điều chỉnh dựa trên chi phí kinh tế của từng loại lỗi. |
| Tính toán Thời gian thực | Các mô hình phải có khả năng xử lý và phản hồi dữ liệu trong mili giây để phục vụ cho tự động hóa công nghiệp tốc độ cao. | Ưu tiên các thuật toán tốc độ cao như Isolation Forest và triển khai mô hình trên các nền tảng tính toán biên (Edge Computing). |
| Sự trôi dạt của mô hình (Model Drift) | Hành vi “bình thường” của máy móc thay đổi theo thời gian (do lão hóa hoặc thay đổi quy trình), làm mô hình U-ML trở nên lỗi thời. | Triển khai cơ chế tái huấn luyện tự động (Continuous Retraining) sử dụng các cửa sổ dữ liệu trượt. |
Các nhà phát triển cần tập trung vào việc giảm thiểu sai sót loại I (cảnh báo sai – False Positives) để tránh tình trạng “báo động giả” gây mất niềm tin vào hệ thống AI trong sản xuất.
6. Kết luận
Học máy không giám sát đang trở thành giải pháp cốt lõi giúp đạt tự động hóa và hiệu suất tối đa trong kỷ nguyên Công nghiệp 4.0. Các thuật toán như Isolation Forest và One-Class SVM biến phát hiện bất thường thành chức năng tự động, chủ động, xử lý hiệu quả dữ liệu không nhãn trong Bảo trì Dự đoán và Kiểm soát Chất lượng. Tương lai, việc tích hợp U-ML với Học sâu (như Autoencoders) sẽ giúp AI trở thành “tai mắt” thông minh của nhà máy hiện đại.

