Herramienta para limpiar Comprobantes Fiscales Digitales por Internet mexicanos.
🇺🇸 The documentation of this project is in spanish as this is the natural language for the intended audience.
Los archivos XML de Comprobantes Fiscales Digitales por Internet (CFDI) suelen contener errores. Esta librería se encarga de reparar los errores (reparables) conocidos/comunes para poder trabajar con ellos.
Todas las operaciones que realiza esta librería con sobre partes del CFDI que no influyen en la generación de la cadena de origen ni del sello.
Usa composer
composer require phpcfdi/cfdi-cleaner
La clase de trabajo es \PhpCfdi\CfdiCleaner\Cleaner
y ofrece los siguientes métodos de limpieza:
Realiza la limpieza de texto y del documento xml a partir de una cadena de caracteres y entrega la representación limpia también en texto.
Este método es estático, por lo que no se necesita crear una instancia del objeto Cleaner
.
<?php
use PhpCfdi\CfdiCleaner\Cleaner;
$xml = file_get_contents('cfdi.xml');
echo Cleaner::staticClean($xml);
Realiza la limpieza de texto y del documento xml a partir de una cadena de caracteres y entrega la representación limpia también en texto.
<?php
use PhpCfdi\CfdiCleaner\Cleaner;
$xml = file_get_contents('cfdi.xml');
$cleaner = new Cleaner();
echo $cleaner->cleanStringToString($xml);
Realiza la limpieza de texto y del documento xml a partir de una cadena de caracteres y entrega el documento XML limpio.
Este método es útil si se necesita utilizar inmediatamente el objeto documento XML.
<?php
use PhpCfdi\CfdiCleaner\Cleaner;
$xml = file_get_contents('cfdi.xml');
$cleaner = new Cleaner();
$document = $cleaner->cleanStringToDocument($xml);
echo $document->saveXML();
Hay dos tipos de limpiezas que se pueden hacer, una sobre el texto XML antes de que se intente cargar como objetos DOM, y la otra una vez que se pudo cargar el contenido como objetos DOM.
Estos limpiadores deben ejecutarse antes de intentar leer el contenido XML y están hechos para prevenir que el objeto documento XML no se pueda crear.
Elimina todo contenido antes del primer caracter <
y posterior al último >
.
Separa por un LF
("\n"
) la declaración XML <?xml version="1.0"?>
del cuerpo XML.
Agrega <?xml version="1.0"?>
al inicio del archivo si no existe, es muy útil porque
las herramientas de detección de MIME
no reconocen un archivo XML si no trae la cabecera.
Elimina un error frecuentemente encontrado en los CFDI emitidos por el SAT donde dice xmlns:schemaLocation
en lugar de xsi:schemaLocation
. En caso de que existan ambos, el único que se mantiene es xsi:schemaLocation
.
Estas limpiezas se realizan sobre el documento XML.
Remueve cualquier nodo de tipo Addenda
en el espacio de nombres http://www.sat.gob.mx/cfd/3
.
Actúa sobre cada uno de los xsi:schemaLocations
.
Lee el contenido e intenta interpretar el espacio de nombres y la ubicación del esquema de validación.
Para considerar que es un esquema de validación verifica que termine con .xsd
(insensible a mayúsculas o minusculas).
Si encuentra un espacio de nombres sin esquema lo omite.
Si encuentra un esquema sin espacio de nombres lo omite.
Verifica todas las definiciones de espacios de nombres y si no pertenece a un espacio de nombres con la URI
http://www.sat.gob.mx/**
entonces elimina los nodos y atributos relacionados.
Actúa sobre cada uno de los xsi:schemaLocations
.
Verifica las definiciones de espacios de nombres y elimina todos los pares donde el espacio de nombres que no
correspondan a la URI http://www.sat.gob.mx/**
.
Remueve todas las declaraciones de espacios de nombres (junto con su prefijo) que no estén en uso.
Agrega el prefijo al nodo que no lo tiene por estar utilizando la definición simple xmlns
.
Además, elimina los namespace superfluos y las definiciones xmlns
redundantes.
Ejemplo de CFDI sucio:
<cfdi:Comprobante xmlns="http://www.sat.gob.mx/cfd/4" xmlns:cfdi="http://www.sat.gob.mx/cfd/4">
<Emisor xmlns="http://www.sat.gob.mx/cfd/4" />
<cfdi:Receptor xmlns:cfdi="http://www.sat.gob.mx/cfd/4" />
</cfdi:Comprobante>
Ejemplo de CFDI limpio:
<cfdi:Comprobante xmlns:cfdi="http://www.sat.gob.mx/cfd/4">
<cfdi:Emisor />
<cfdi:Receptor />
</cfdi:Comprobante>
Mueve todas las declaraciones de espacios de nombres al nodo raíz.
Por lo regular el SAT pide en la documentación técnica que los espacios de nombres se definan en el nodo raíz, sin embargo, es frecuente que se definan en el nodo que los implementa.
Hay casos extremos de CFDI que siguen las reglas de XML, pero que no siguen las reglas de CFDI y generan prefijos que se superponen. En este caso, se moverán solamente los espacios de nombres que no se superponen, por ejemplo:
<?xml version="1.0" encoding="utf-8" ?>
<cfdi:Comprobante xmlns:cfdi="http://www.sat.gob.mx/cfd/3">
<cfdi:Complemento>
<cfdi:Otro xmlns:cfdi="http://www.sat.gob.mx/otro" />
<tfd:TimbreFiscalDigital xmlns:tfd="http://www.sat.gob.mx/TimbreFiscalDigital" />
</cfdi:Complemento>
</cfdi:Comprobante>
Genera el siguiente resultado:
<?xml version="1.0" encoding="utf-8" ?>
<cfdi:Comprobante xmlns:cfdi="http://www.sat.gob.mx/cfd/3" xmlns:tfd="http://www.sat.gob.mx/TimbreFiscalDigital">
<cfdi:Complemento>
<cfdi:Otro xmlns:cfdi="http://www.sat.gob.mx/otro" />
<tfd:TimbreFiscalDigital />
</cfdi:Complemento>
</cfdi:Comprobante>
Ante un caso como el anterior, no se están siguiendo las reglas establecidas en el Anexo 20 y en el complemento. Es mejor que siempre considere ese caso como un CFDI inválido, aun cuando se haya firmado, y solicite la sustitución por un CFDI que sí contenga los prefijos de los espacios de nombres correctos.
Mueve todas las declaraciones de ubicaciones de archivos de esquema al nodo principal.
Por lo regular el SAT pide en la documentación técnica que las ubicaciones de archivos de esquema se definan en el nodo principal, sin embargo, es frecuente que se definan en el nodo que los implementa.
Verifica que las ubicaciones de los esquemas de espacios de nombres conocidos sean exactamente las direcciones conocidas, en caso de no serlo las modifican.
Anteriormente, el SAT permitía que las ubicaciones de los esquemas de espacios de nombres estuvieran escritos sin sensibilidad a mayúsculas o minúsculas, incluso tenía varias ubicaciones para obtener estos archivos. Sin embargo, recientemente ha eliminado la tolerancia a estas ubicaciones y solo permite las definiciones oficiales.
Este limpiador tiene la información de espacio de nombres, versión a la que aplica y ubicación conocida con base en el proyecto phpcfdi/sat-ns-registry.
En caso de que no se encuentre la ruta conocida para un espacio de nombres entonces no aplicará ninguna corrección y dejará el valor tal como estaba.
Este limpiador se crea para solventar la inconsistencia en la documentación del SAT.
Por un lado, en el Anexo 20 de CFDI 3.3, el SAT exige que exista uno y solamente un nodo cfdi:Complemento
.
Sin embargo, en el archivo de validación XSD permite que existan más de uno.
Con esta limpieza, se deja un solo cfdi:Complemento
con todos los complementos en él.
Para no tener que modificar la creación del objeto limpiador y permitir la exclusión de limpiadores específicos, y de esta forma ser compatibles con nuevas actualizaciones de la librería, se puede crear el limpiador estándar y luego aplicar exclusiones.
El siguiente ejemplo muestra cómo excluir los limpiadores que afectan a una Addenda.
<?php
use PhpCfdi\CfdiCleaner\Cleaner;
use PhpCfdi\CfdiCleaner\ExcludeList;
use PhpCfdi\CfdiCleaner\XmlDocumentCleaners\RemoveAddenda,
use PhpCfdi\CfdiCleaner\XmlDocumentCleaners\RemoveNonSatNamespacesNodes,
use PhpCfdi\CfdiCleaner\XmlDocumentCleaners\RemoveNonSatSchemaLocations,
/**
* @var string $contents El contenido XML sucio.
*/
$exclude = new ExcludeList(
RemoveAddenda::class,
RemoveNonSatNamespacesNodes::class,
RemoveNonSatSchemaLocations::class,
);
$cleaner = new Cleaner();
$cleaner->exclude($exclude);
$contents = $cleaner->cleanStringToString($contents);
Puedes obtener soporte abriendo un ticket en Github.
Adicionalmente, esta librería pertenece a la comunidad PhpCfdi, así que puedes usar los mismos canales de comunicación para obtener ayuda de algún miembro de la comunidad.
Esta librería se mantendrá compatible con al menos la versión con soporte activo de PHP más reciente.
También utilizamos Versionado Semántico 2.0.0 por lo que puedes usar esta librería sin temor a romper tu aplicación.
Las contribuciones con bienvenidas. Por favor lee CONTRIBUTING para más detalles y recuerda revisar el archivo de tareas pendientes TODO y el archivo CHANGELOG.
The phpcfdi/cfdi-cleaner
library is copyright © PhpCfdi
and licensed for use under the MIT License (MIT). Please see LICENSE for more information.