Ver Mensaje Individual
  #1 (permalink)  
Antiguo 03/01/2010, 07:19
Avatar de neodani
neodani
 
Fecha de Ingreso: marzo-2007
Mensajes: 1.811
Antigüedad: 17 años, 2 meses
Puntos: 20
Buenas compis,

Tengo un problema con una expresión regular, se que no debe ser dificil pero no lo consigo. Os explico.

Leo el contenido de una web html y me interesa sacar el numero identificador de estas 5 lineas

<a id="BetSlip1_Repeater1_ctl00_remove" title="Cancelar" href="javascript:RemoveBetSlipInfo(58520028)">
<a id="BetSlip1_Repeater1_ctl02_remove" title="Cancelar" href="javascript:RemoveBetSlipInfo(58763912)">
<a id="BetSlip1_Repeater1_ctl04_remove" title="Cancelar" href="javascript:RemoveBetSlipInfo(58519994)">
<a id="BetSlip1_Repeater1_ctl06_remove" title="Cancelar" href="javascript:RemoveBetSlipInfo(58763747)">
<a id="BetSlip1_Repeater1_ctl08_remove" title="Cancelar" href="javascript:RemoveBetSlipInfo(58486239)">


PARSER
Código PHP:
Ver original
  1. function get_match($regex,$content)
  2. {
  3.     preg_match($regex,$content,$matches);
  4.     return $matches[1];
  5. }
  6.  
  7. //obtengo el contenido de la web
  8. $web_content = @file_get_contents('https://www.bwin.com/es/betSlip.aspx');
  9.  
  10. //Obtengo el titulo de la web
  11. $titulo = get_match('/<title[^>]*>(.*)<\/title>/is',$web_content);
  12. echo "Titulo: $titulo";
  13. echo "<br/>";
  14.  
  15. //Obtengo los identificadores
  16. $codigo= get_match('/RemoveBetSlipInfo(.*?)">/is',$web_content);
  17. echo "Partido: $codigo";
  18. echo "<br/>";

Pero solo me muestra el titulo, los identificadores no los coge.

Me podéis echar una mano?

Muchas gracias de antemano!

He conseguido sacar la expresión regular

Código PHP:
Ver original
  1. preg_match_all("/RemoveBetSlipInfo(.*)\">/", $web_content, $coincidencias, PREG_SET_ORDER);
  2.  
  3. foreach ($coincidencias as $val) {
  4.     //echo "coincidencia: " . $val[0] . "<br/>";
  5.     echo "Identificador: " . $val[1] . "<br/>";
  6. }

Sin embargo, me he dado cuenta que solo funciona si me bajo la web y la analizo en local. El enlace que os he pasado antes no funciona si lo llamas directamente https://www.bwin.com/es/betSlip.aspx

Lo cual es una gran putada...

El objetivo es sacar los 5 partidos "top" que pone bwin.es en su página (parte derecha tablón de apuestas "Las 5 apuestas más populares entre nuestros usuarios. ") y guardar su identificador.

¿Alguien sabría de que manera se podría hacer? si os fijáis la parte donde está el tablón es un frame, de ahí que pensaba que si cogía su url directamente podría parsear esa zona...

Muchas gracias de antemano!

Buenas,

No he conseguido leer el apartado derecho de la web, el que indicaba en el post anterior. ¿Alguien puede decirme de que manera puedo leerlo y extraer los identificadores con la expresión regular anterior?

Imagino que la cosa va de cookies y/o sesiones, ¿es imposible leer ese frame por separado?

Muchas gracias de antemano!

Última edición por GatorV; 04/01/2010 a las 10:55