Foros del Web » Programando para Internet » ASPX (.net) »

Scraping HTML C#

Estas en el tema de Scraping HTML C# en el foro de ASPX (.net) en Foros del Web. Que tal... toy progrmando una palicacion para recuperar info de forma automatica mediante regex a sitios web, el sistema funciona, pero tiene una pequenha incidencia. ...
  #1 (permalink)  
Antiguo 11/05/2010, 04:14
Avatar de jahman  
Fecha de Ingreso: noviembre-2003
Ubicación: Oslo
Mensajes: 230
Antigüedad: 20 años, 5 meses
Puntos: 0
Scraping HTML C#

Que tal...
toy progrmando una palicacion para recuperar info de forma automatica mediante regex a sitios web, el sistema funciona, pero tiene una pequenha incidencia.

al colocar el sgte regex, deberia mostrarme solo lo q esta en medio de (), lo q deberia ser url y texto,
Código:
<a href="([^"]+)"><span>\d+</span>([^<]+)</a>\s*</li>
el problema es que cuando hago el debug me retorna todo la linea, sin diferencia q no deseo obtener \d+ q seria lo q esta en rojo
Código:
[0] = {<a href="restaurantList.c?drill=fxcitypart%3A%5EAlna%24%7C&amp;offset=0"><span>1</span>Alna</a>
                </li>}
Adjunto imagen de winForm, Gracias.


Etiquetas: html, aspx
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 22:04.