Ver Mensaje Individual
  #1 (permalink)  
Antiguo 11/05/2010, 04:14
Avatar de jahman
jahman
 
Fecha de Ingreso: noviembre-2003
Ubicación: Oslo
Mensajes: 230
Antigüedad: 20 años, 5 meses
Puntos: 0
Scraping HTML C#

Que tal...
toy progrmando una palicacion para recuperar info de forma automatica mediante regex a sitios web, el sistema funciona, pero tiene una pequenha incidencia.

al colocar el sgte regex, deberia mostrarme solo lo q esta en medio de (), lo q deberia ser url y texto,
Código:
<a href="([^"]+)"><span>\d+</span>([^<]+)</a>\s*</li>
el problema es que cuando hago el debug me retorna todo la linea, sin diferencia q no deseo obtener \d+ q seria lo q esta en rojo
Código:
[0] = {<a href="restaurantList.c?drill=fxcitypart%3A%5EAlna%24%7C&amp;offset=0"><span>1</span>Alna</a>
                </li>}
Adjunto imagen de winForm, Gracias.