Translated ['src/AI/AI-Assisted-Fuzzing-and-Vulnerability-Discovery.md',

2025-10-10 18:36:50 +00:00 · 2025-08-13 14:40:35 +00:00 · 2025-08-13 14:40:35 +00:00 · 4bb0d7d654
commit 4bb0d7d654
parent 11bef5e598
3 changed files with 157 additions and 3 deletions
--- a/src/AI/AI-Assisted-Fuzzing-and-Vulnerability-Discovery.md
+++ b/src/AI/AI-Assisted-Fuzzing-and-Vulnerability-Discovery.md
@ -0,0 +1,147 @@
 # AI-Assisted Fuzzing & Automated Vulnerability Discovery
 {{#include ../banners/hacktricks-training.md}}
 ## Overview
 Modele językowe (LLM) mogą znacznie zwiększyć efektywność tradycyjnych procesów badania podatności, generując semantycznie bogate dane wejściowe, rozwijając gramatyki, analizując dane o awariach, a nawet proponując poprawki wielobugowe. Ta strona zbiera najskuteczniejsze wzorce zaobserwowane podczas finałów AI Cyber Challenge (AIxCC) organizowanych przez DARPA oraz innych publicznych badań.
 To, co następuje, nie jest opisem jednego konkretnego systemu konkursowego, lecz abstrakcją technik, abyś mógł je odtworzyć w swoich własnych procesach.
 ---
 ## 1. LLM-Generated Seed Inputs
 Tradycyjne fuzzery oparte na pokryciu (AFL++, libFuzzer, Honggfuzz…) zaczynają od małego zbioru nasion i mutują bajty w sposób losowy. Gdy format danych wejściowych jest złożony (SQL, URL, niestandardowe protokoły binarne), losowe mutacje zazwyczaj łamią składnię, zanim zostaną osiągnięte interesujące gałęzie.
 LLM mogą rozwiązać ten problem początkowy, emitując *generatory nasion* – krótkie skrypty, które generują **poprawne składniowo, ale istotne z punktu widzenia bezpieczeństwa dane wejściowe**. Na przykład:
 ```prompt
 SYSTEM: You are a helpful security engineer.
 USER:
 Write a Python3 program that prints 200 unique SQL injection strings targeting common anti-pattern mistakes (missing quotes, numeric context, stacked queries).  Ensure length ≤ 256 bytes / string so they survive common length limits.
 ```
 ```python
 # gen_sqli_seeds.py (truncated)
 PAYLOADS = [
 "1 OR 1=1 -- ",
 "' UNION SELECT NULL,NULL--",
 "0; DROP TABLE users;--",
 ...
 ]
 for p in PAYLOADS:
 print(p)
 ```
 Uruchom raz i wprowadź wynik bezpośrednio do początkowego korpusu fuzzera:
 ```bash
 python3 gen_sqli_seeds.py > seeds.txt
 afl-fuzz -i seeds.txt -o findings/ -- ./target @@
 ```
 Korzyści:
 1. Ważność semantyczna → głębsze pokrycie na wczesnym etapie.
 2. Możliwość regeneracji: dostosuj prompt, aby skupić się na XSS, przejściu ścieżek, binarnych blobach itp.
 3. Tanie (< 1 ¢ z GPT-3.5).
 ### Wskazówki
 * Poleć modelowi, aby *dywersyfikował* długość i kodowanie ładunków (UTF-8, URL-encoded, UTF-16-LE), aby obejść powierzchowne filtry.
 * Poproś o *pojedynczy samodzielny skrypt* – unika problemów z formatowaniem JSON.
 ---
 ## 2. Fuzzing z ewolucją gramatyki
 Bardziej zaawansowaną odmianą jest pozwolenie LLM na **ewolucję gramatyki** zamiast konkretnych nasion. Przepływ pracy (wzorzec „Grammar Guy”) to:
 1. Wygeneruj początkową gramatykę ANTLR/Peach/LibFuzzer za pomocą promptu.
 2. Fuzzuj przez N minut i zbierz metryki pokrycia (krawędzie / bloki trafione).
 3. Podsumuj nieodkryte obszary programu i przekaż podsumowanie z powrotem do modelu:
 ```prompt
 Poprzednia gramatyka wyzwoliła 12 % krawędzi programu. Funkcje, które nie zostały osiągnięte: parse_auth, handle_upload. Dodaj / zmodyfikuj zasady, aby pokryć te.
 ```
 4. Scal nowe zasady, ponownie fuzzuj, powtarzaj.
 Szkielet pseudo-kodu:
 ```python
 for epoch in range(MAX_EPOCHS):
 grammar = llm.refine(grammar, feedback=coverage_stats)
 save(grammar, f"grammar_{epoch}.txt")
 coverage_stats = run_fuzzer(grammar)
 ```
 Kluczowe punkty:
 * Utrzymuj *budżet* – każde udoskonalenie wykorzystuje tokeny.
 * Użyj instrukcji `diff` + `patch`, aby model edytował, a nie przepisywał.
 * Zatrzymaj się, gdy Δcoverage < ε.
 ---
 ## 3. Generowanie PoV (Eksploatacja) oparte na agentach
 Po znalezieniu awarii nadal potrzebujesz **dowodu na podatność (PoV)**, który deterministycznie ją wyzwala.
 Skalowalne podejście polega na uruchomieniu *tysięcy* lekkich agentów (<process/thread/container/prisoner>), z których każdy działa na innym LLM (GPT-4, Claude, Mixtral) lub ustawieniu temperatury.
 Pipeline:
 1. Analiza statyczna/dynamiczna produkuje *kandydatów na błędy* (struktura z PC awarii, fragmentem wejściowym, komunikatem sanitarno).
 2. Orkiestrator rozdziela kandydatów do agentów.
 3. Kroki rozumowania agenta:
 a. Powtórz błąd lokalnie za pomocą `gdb` + wejście.
 b. Sugeruj minimalny ładunek eksploatacyjny.
 c. Waliduj eksploatację w piaskownicy. Jeśli sukces → zgłoś.
 4. Nieudane próby są **ponownie kolejkowane jako nowe ziarna** do fuzzingu pokrycia (pętla sprzężenia zwrotnego).
 Zalety:
 * Równoległość ukrywa niestabilność pojedynczego agenta.
 * Automatyczne dostosowywanie temperatury / rozmiaru modelu na podstawie zaobserwowanej stopy sukcesu.
 ---
 ## 4. Ukierunkowany Fuzzing z Dostosowanymi Modelami Kodów
 Dostosuj model o otwartych wagach (np. Llama-7B) na źródłach C/C++ oznaczonych wzorcami podatności (przepełnienie całkowite, kopiowanie bufora, formatowanie ciągu). Następnie:
 1. Uruchom analizę statyczną, aby uzyskać listę funkcji + AST.
 2. Zadaj modelowi pytanie: *„Podaj wpisy słownika mutacji, które prawdopodobnie złamią bezpieczeństwo pamięci w funkcji X”*.
 3. Wstaw te tokeny do niestandardowego `AFL_CUSTOM_MUTATOR`.
 Przykładowy wynik dla opakowania `sprintf`:
 ```
 {"pattern":"%99999999s"}
 {"pattern":"AAAAAAAA....<1024>....%n"}
 ```
 Empirycznie skraca to czas do awarii o >2× na rzeczywistych celach.
 ---
 ## 5. AI-Guided Patching Strategies
 ### 5.1 Super Patches
 Poproś model o *grupowanie* sygnatur awarii i zaproponowanie **jednej łatki**, która usuwa wspólną przyczynę. Zgłoś raz, napraw kilka błędów → mniej kar za dokładność w środowiskach, gdzie każda błędna łatka kosztuje punkty.
 Zarys podpowiedzi:
 ```
 Here are 10 stack traces + file snippets.  Identify the shared mistake and generate a unified diff fixing all occurrences.
 ```
 ### 5.2 Współczynnik spekulacyjnych poprawek
 Zaimplementuj kolejkę, w której potwierdzone poprawki zweryfikowane przez PoV i *spekulacyjne* poprawki (bez PoV) są przeplatane w stosunku 1:N dostosowanym do zasad punktacji (np. 2 spekulacyjne : 1 potwierdzona). Model kosztów monitoruje kary w porównaniu do punktów i samodzielnie dostosowuje N.
 ---
 ## Złożenie wszystkiego w całość
 System CRS (Cyber Reasoning System) end-to-end może połączyć komponenty w ten sposób:
 ```mermaid
 graph TD
 subgraph Discovery
 A[LLM Seed/Grammar Gen] --> B[Fuzzer]
 C[Fine-Tuned Model Dicts] --> B
 end
 B --> D[Crash DB]
 D --> E[Agent PoV Gen]
 E -->|valid PoV| PatchQueue
 D -->|cluster| F[LLM Super-Patch]
 PatchQueue --> G[Patch Submitter]
 ```
 ---
 ## Odniesienia
 * [Trail of Bits – AIxCC finały: Historia taśmy](https://blog.trailofbits.com/2025/08/07/aixcc-finals-tale-of-the-tape/)
 * [CTF Radiooo wywiady z finalistami AIxCC](https://www.youtube.com/@ctfradiooo)
 {{#include ../banners/hacktricks-training.md}}
--- a/src/AI/README.md
+++ b/src/AI/README.md
@ -4,7 +4,7 @@
 ## Główne Algorytmy Uczenia Maszynowego
-Najlepszym punktem wyjścia do nauki o AI jest zrozumienie, jak działają główne algorytmy uczenia maszynowego. Pomoże to zrozumieć, jak działa AI, jak go używać i jak je atakować:
+Najlepszym punktem wyjścia do nauki o AI jest zrozumienie, jak działają główne algorytmy uczenia maszynowego. Pomoże to zrozumieć, jak działa AI, jak go używać i jak go atakować:
 {{#ref}}
 ./AI-Supervised-Learning-Algorithms.md
@ -42,7 +42,7 @@ AI-Risk-Frameworks.md
 ### Bezpieczeństwo Podpowiedzi AI
-LLM sprawiły, że użycie AI eksplodowało w ostatnich latach, ale nie są one doskonałe i mogą być oszukiwane przez wrogie podpowiedzi. To bardzo ważny temat, aby zrozumieć, jak używać AI bezpiecznie i jak je atakować:
+LLM-y spowodowały eksplozję użycia AI w ostatnich latach, ale nie są doskonałe i mogą być oszukiwane przez wrogie podpowiedzi. To bardzo ważny temat, aby zrozumieć, jak używać AI bezpiecznie i jak go atakować:
 {{#ref}}
 AI-Prompts.md
@ -50,7 +50,7 @@ AI-Prompts.md
 ### RCE Modeli AI
-Bardzo powszechne jest, że deweloperzy i firmy uruchamiają modele pobrane z Internetu, jednak samo załadowanie modelu może być wystarczające do wykonania dowolnego kodu w systemie. To bardzo ważny temat, aby zrozumieć, jak używać AI bezpiecznie i jak je atakować:
+Bardzo powszechne jest, że deweloperzy i firmy uruchamiają modele pobrane z Internetu, jednak samo załadowanie modelu może być wystarczające do wykonania dowolnego kodu w systemie. To bardzo ważny temat, aby zrozumieć, jak używać AI bezpiecznie i jak go atakować:
 {{#ref}}
 AI-Models-RCE.md
@ -64,4 +64,10 @@ MCP (Model Context Protocol) to protokół, który pozwala klientom agentów AI
 AI-MCP-Servers.md
 {{#endref}}
 ### Fuzzing Wspomagany AI i Zautomatyzowane Odkrywanie Wrażliwości
 {{#ref}}
 AI-Assisted-Fuzzing-and-Vulnerability-Discovery.md
 {{#endref}}
 {{#include ../banners/hacktricks-training.md}}
--- a/src/SUMMARY.md
+++ b/src/SUMMARY.md
@ -825,6 +825,7 @@
 # 🤖 AI
 - [AI Security](AI/README.md)
  - [Ai Assisted Fuzzing And Vulnerability Discovery](AI/AI-Assisted-Fuzzing-and-Vulnerability-Discovery.md)
  - [AI Security Methodology](AI/AI-Deep-Learning.md)
  - [AI MCP Security](AI/AI-MCP-Servers.md)
  - [AI Model Data Preparation](AI/AI-Model-Data-Preparation-and-Evaluation.md)