Encontré esta página http://www.rubular.com/ donde probar las expresiones regulares, su diseño y usabilidad me gustaron, tanto que me puse a diseñar una expresión regular hasta que conseguí que me cogiese todos los valores que quería.
La expresión regular
Código PHP:
Ver original
<(\w+)(?:.*?)class=[\'|"](\w+)[\'|"](?:.*?)>
Fragmento de codigo html probado
Código HTML:
Ver original
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" lang="es" xml:lang="es"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <meta name="robots" content="noindex,nofollow"/> <link rel="stylesheet" href="/css/entrada_login.css" type="text/css" media="all" /> <!-- Favicon --> <link rel="shortcut icon" href="/imagenes/favicon.ico"/> </head> <body class="login"> <!-- Formulario Entrada --> <div id="login"> <form id="loginform" action="includes/login.php" method="post"> <p> </p> <p> </p> <p class="submit"> <input type="submit" name="wp-submit" id="wp-submit" value="Iniciar Sesión" tabindex="100" /> </p> </form> <p id="nav"> </p> </div> </body> </html>
En la web me muestra el resultado que quiero. Todas valores de los elementos CLASS y el tag HTML que le precede.
Código:
Sin embargo, cuando ejecuto esa misma expresión en una pagina php, el resultado es bien distinto. Result 1 1. body 2. login Result 2 1. p 2. enlace_top Result 3 1. input 2. input Result 4 1. input 2. input Result 5 1. p 2. forgetmenot Result 6 1. p 2. submit Result 7 1. a 2. footer
Código:
A pesar que los valores de los CLASS son correctos, los atributos HTML no coinciden con los mostrados haciendo la prueba en la web.<pre>Array
(
[0] => Array
(
[0] => <html xmlns="http://www.w3.org/1999/xhtml" lang="es" xml:lang="es">
<head>
<title>Área restringida | Panel de Administración</title>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<meta name="robots" content="noindex,nofollow"/>
<link rel="stylesheet" href="/css/entrada_login.css" type="text/css" media="all" />
<!-- Favicon -->
<link rel="shortcut icon" href="/imagenes/favicon.ico"/>
</head>
<body class="login">
[1] => <p id="borde-top"><a class="enlace_top" href="entrada_login.php" title="Panel de Administración">
[2] => <div id="login">
<h1 id="titulo" title="Panel de Administración"></h1>
<form id="loginform" action="includes/login.php" method="post">
<p>
<label>Nombre de usuario<br />
<input type="text" name="user" id="user_login" class="input" value="" size="20" tabindex="1" accesskey="1"/>
[3] => <p>
<label>Contraseña<br />
<input type="password" name="password" id="user_pass" class="input" value="" size="20" tabindex="2" accesskey="2" />
[4] => <p class="forgetmenot">
[5] => <label><input name="rememberme" type="checkbox" id="rememberme" value="forever" tabindex="90" /> Recordarme</label></p>
<p class="submit">
[6] => <input type="submit" name="wp-submit" id="wp-submit" value="Iniciar Sesión" tabindex="100" />
</p>
</form>
<p id="nav">
<a class="footer" href="#">
)
[1] => Array
(
[0] => html
[1] => p
[2] => div
[3] => p
[4] => p
[5] => label
[6] => input
)
[2] => Array
(
[0] => login
[1] => enlace_top
[2] => input
[3] => input
[4] => forgetmenot
[5] => submit
[6] => footer
)
)
</pre>
body
p
input
input
p
p
a
¿Sabéis porque puede ser?
Muchas gracias de antemano!





