異常検知
異常検知とは、システムや製造工程、インフラなどで想定された「正常状態」からの逸脱を早期に見つける技術である。品質不良の未然防止、設備の予知保全、セキュリティ侵害の検出など、幅広い分野で用いられる。鍵となるのは「正常の記述」であり、統計モデルや機械学習モデルで正常挙動を学習し、距離・尤度・再構成誤差などの指標が閾値を超えた事象を異常検知として扱う。データは時系列信号、画像、ログ、振動・音響など多様で、現場要求(リアルタイム性、誤報コスト、可用性)に応じて方法を選ぶ。
基本概念
異常検知では、正常・異常・外れ値・欠陥・変化点の語を区別する。外れ値は統計的に稀な点、欠陥は工程基準に照らして不合格な状態、変化点は確率構造が切り替わる瞬間である。入力にはノイズ、欠損、センサずれが含まれるため前処理が不可欠である。学習はラベルの有無で教師あり・教師なし・半教師ありに分かれ、運用では概念ドリフト(正常の定義自体の変化)に注意する。
手法の分類
手法は大別して、(1)閾値型・統計型、(2)機械学習・深層学習型に分かれる。さらに、単変量/多変量、バッチ/オンライン、時系列/静的データ、モデル駆動/データ駆動などの観点で整理する。現実の異常検知では、ルールと学習を併用するハイブリッド構成が堅牢である。
統計的アプローチ
統計的方法は可搬性と説明性に優れ、工程管理の基盤となる。代表例を挙げる。
- Zスコア、IQR、箱ひげによる外れ値検出、3σ管理やEWMAでの工程監視
- PCAによる次元削減とHotelling’s T2/マハラノビス距離での多変量管理
- CUSUM、PELT、Bayesian法などの変化点検出で分布の切替を捕捉
- 尤度比・残差解析に基づくモデル適合度の監視
機械学習・深層学習
機械学習ではOne-Class SVM、Isolation Forest、LOFが広く使われる。深層学習ではAutoencoder/VAEの再構成誤差、時系列にはLSTM/GRUの予測誤差、画像ではCNNの埋め込み距離が指標となる。最近は自己教師あり表現学習やGANを用いた異常検知も普及している。長所は高精度・柔軟性だが、学習データの偏りや過学習、推論資源など運用制約に留意する。
特徴量設計と前処理
スケーリング、正規化、欠損補完、外れ値のロバスト処理、時刻同期は必須である。時系列では窓関数、移動統計量、ラグ特徴、周波数特性(STFT、小波)が有効である。振動・音響はスペクトルピークやエンベロープ、画像はCNN埋め込みやテクスチャ記述子を活用する。センサフュージョンにより多視点の正常モデリングを強化し、異常検知の再現性を高める。
しきい値設定と評価
閾値は統計理論(有意水準、分位点)と事業コストで同時に決める。評価はROC/PR曲線、AUROC/AUPRC、適合率・再現率・F1を用い、クラス不均衡ではPRが有用である。検出遅延、平均時刻間アラーム、誤報/見逃しコスト、アラート抑制率など運用KPIを併記し、異常検知導入の事業価値を定量化する。
運用・MLOps設計
アラートはヒステリシスやデバウンスで安定化し、相関イベントの重複通知を抑制する。モデル・特徴量・閾値のバージョン管理、監査ログ、説明可能性(SHAP/LIME)を整える。データドリフト・概念ドリフトを監視し、再学習のトリガ条件を定義する。エッジ推論とクラウド集計を分担し、停止時のフォールバックも設計する。
産業応用の要点
製造では予知保全(軸受・モータの振動/温度)、工具摩耗、工程パラメータ逸脱、AI外観検査の微小欠陥検出が典型である。社会インフラは配電・配管の漏れや劣化、交通の異常挙動、ITではログ・ネットワークの侵入検知、金融の不正取引、医療の生体信号異常などに展開する。各領域でデータ特性と誤報コストが異なるため、異常検知の閾値設計と説明責任が成否を分ける。
実務上の設計指針
まずKPI(検出率、誤報率、遅延、稼働率影響)を明確化し、最小限の可用データでパイロットを回す。FMEAやフォールトツリー分析で重大故障モードを優先し、ルールと学習の役割分担を決める。標準作業手順、データ品質基準、トレーサビリティを整備し、運用者教育と可視化ダッシュボードで現場適合性を高める。これにより異常検知が一過性のPoCで終わらず、持続的な改善サイクルに組み込まれる。
補足:変化点検出とドリフト
変化点は確率構造が切り替わる「瞬間」を捉える技術で、CUSUMやPELT、Bayesian Online Change Point Detectionが代表である。一方ドリフトは緩やかな分布移動で、統計距離やPSI、監督付きの性能低下監視で検出する。両者を区別し監視設計に反映させることで、異常検知の誤報と見逃しを抑える。
補足:データガバナンス
センサ校正、ID管理、時刻同期、アクセス権限、個人情報や機密の取り扱い、モデル更新の承認フローを整える。ログ保存・可観測性・再現実験の仕組みを持つことが、信頼できる異常検知の前提条件である。