Logo de islavisual
Isotipo de islavisual IslaVisual
imagen de sección

Ultima revisión 26/12/2012

Convertir un XML en Array con PHP

xml2Array es una función que permite convertir un XML en un array asociativo. Es un poco complicada de entender pero es rápida y sencilla de usar.

$data es una cadena que contiene el XML bien formado. $get_attributes puede tomar valores 0 o 1. Si es 1 la función recibirá los atributos así como los valores de variables - Esto se traduce en una estructura de matriz diferente en el valor de retorno. $priority puede ser 'tag' o 'atribute'. Esto va a cambiar la aestructura del array resultante. Para 'tag', las etiquetas se les da más importancia.

/**
 * Function to convert an XML file into an associative array readable for the application.
 * @param string $data The source XML.
 * @param string $get_attributes Can take values - 1 or 0. If this is 1 the function will get the attributes as well as the tag values - this results in a different array structure in the return value.
 * @param string $priority - Can be 'tag' or 'attribute'. This will change the way the resulting array structure. For 'tag', the tags are given more importance. 
 * @return array Returns an associative array readable.
 */    
 function XML2Array($data, $get_attributes=1, $priority = 'tag') {
    if(!$data) return array();

    if(!function_exists('xml_parser_create')){
        //print "'xml_parser_create()' function not found!";
        return array();
    }

    //Get the XML parser of PHP - PHP must have this module for the parser to work
    $parser = xml_parser_create('');
    xml_parser_set_option($parser, XML_OPTION_TARGET_ENCODING, "UTF-8"); # http://minutillo.com/steve/weblog/2004/6/17/php-xml-and-character-encodings-a-tale-of-sadness-rage-and-data-loss
    xml_parser_set_option($parser, XML_OPTION_CASE_FOLDING, 0);
    xml_parser_set_option($parser, XML_OPTION_SKIP_WHITE, 1);
    xml_parse_into_struct($parser, trim($data), $xml_values);
    xml_parser_free($parser);

    if(!$xml_values) return;

    // Inicializamos
    $xml_array = array();
    $parents = array();
    $opened_tags = array();
    $arr = array();

    $current = &$xml_array; // Asignamos a variable.

    // Recorrer a través de las etiquetas o Tags.
    $repeated_tag_index = array();    // Las variables con el mismo nombre se introducirán en un array.
    foreach($xml_values as $data){
        unset($attributes,$value);    // Eliminamos los valores existentes para evitar problemas.

        // Importa todas las variables a la tabla de símbolos actual desde el array $data.
        // Con el recuperamos la etiqueta o tag, el tipo o type, nivel o level y sus atributos o attributtes.
        // El tipo valdrá open si es de la forma "<tag>" o close si es de la forma "</tag> o complete si tiene la forma "<tag/>
        extract($data);

        $result = array();
        $attributes_data = array();
        
        if(isset($value)){
            if($priority == 'tag') $result = $value;
            else $result['value'] = $value;    // Ponemos el valor en un array asociativo si estamos en el "atributo" mode.
        }

        // Establecemos los atributos en un array llamado 'attr'.
        if(isset($attributes) and $get_attributes){
            foreach($attributes as $attr => $val){
                if($priority == 'tag') $attributes_data[$attr] = $val;
                else $result['attr'][$attr] = $val;
            }
        }

        // Consultamos el estado de la etiqueta.
        if($type == "open"){    
            $parent[$level-1] = &$current;
            if(!is_array($current) or (!in_array($tag, array_keys($current)))){ //Insert New tag
                $current[$tag] = $result;
                if($attributes_data) $current[$tag. '_attr'] = $attributes_data;
                $repeated_tag_index[$tag.'_'.$level] = 1;

                $current = &$current[$tag];

            } else { 
                // Si hay otro elemento con el mismo nombre de etiqueta
                if(isset($current[$tag][0])){    // Si hay un elemento de orden 0 es ya una matriz.
                    $current[$tag][$repeated_tag_index[$tag.'_'.$level]] = $result;
                    $repeated_tag_index[$tag.'_'.$level]++;
                } else {
                    // Si encontramos varias etiquetas con el mismo nombre las mentemos en el array de repeticiones.
                    $current[$tag] = array($current[$tag],$result);    // Creamos un array con el elemento existente y el nuevo elemento.
                    $repeated_tag_index[$tag.'_'.$level] = 2;
                    
                    if(isset($current[$tag.'_attr'])){ 
                        $current[$tag]['0_attr'] = $current[$tag.'_attr'];
                        unset($current[$tag.'_attr']);
                    }

                }
                $last_item_index = $repeated_tag_index[$tag.'_'.$level]-1;
                $current = &$current[$tag][$last_item_index];
            }

        } elseif($type == "complete"){
            // Comprobamos si la clave ya está tratada.
            if(!isset($current[$tag])){
                $current[$tag] = $result;
                $repeated_tag_index[$tag.'_'.$level] = 1;
                if($priority == 'tag' and $attributes_data) $current[$tag. '_attr'] = $attributes_data;

            } else { 
                if(isset($current[$tag][0]) and is_array($current[$tag])){

                    $current[$tag][$repeated_tag_index[$tag.'_'.$level]] = $result;
                    
                    if($priority == 'tag' and $get_attributes and $attributes_data){
                        $current[$tag][$repeated_tag_index[$tag.'_'.$level] . '_attr'] = $attributes_data;
                    }
                    $repeated_tag_index[$tag.'_'.$level]++;

                } else {
                    $current[$tag] = array($current[$tag],$result); 
                    $repeated_tag_index[$tag.'_'.$level] = 1;
                    if($priority == 'tag' and $get_attributes){
                        if(isset($current[$tag.'_attr'])){ 
                            
                            $current[$tag]['0_attr'] = $current[$tag.'_attr'];
                            unset($current[$tag.'_attr']);
                        }
                        
                        if($attributes_data){
                            $current[$tag][$repeated_tag_index[$tag.'_'.$level] . '_attr'] = $attributes_data;
                        }
                    }
                    $repeated_tag_index[$tag.'_'.$level]++; 
                }
            }

        } elseif($type == 'close'){
            $current = &$parent[$level-1];
        }
    }

    return($xml_array);
}

$str = "<request>
    <query>Convertir</query>
    <lenguaje>español</lenguaje>
    <user> 
        <username>root</username>
        <password>toor</password>
    </user>
    <origen>xml</origen>
    <destino>array</destino>
</request>";
$arr = XML2Array($str);
header('Content-Type: text/html; charset=utf-8');
echo var_dump($arr);

Espero que os sea útil alguna vez.

Sobre el autor

Imagen de Pablo Enrique Fernández Casado
Pablo Enrique Fernández Casado

CEO de IslaVisual, Manager, Full Stack Analyst Developer y formador por cuenta ajena con más de 25 años de experiencia en el campo de la programación y más de 10 en el campo del diseño, UX, usabilidad web y accesibilidad web. También es escritor y compositor de música, además de presentar múltiples soft kills como la escucha activa, el trabajo en equipo, la creatividad, la resiliencia o la capacidad de aprendizaje, entre otras.

Especializado en proveer soluciones integrales de bajo coste y actividades de consultoría de Usabilidad, Accesibilidad y Experiencia de Usuario (UX), además de ofrecer asesoramiento en SEO, optimización de sistemas y páginas web, entre otras habilidades.