Foros del Web » Programando para Internet » ASPX (.net) »

Scraping HTML no muestra Tags C#

Estas en el tema de Scraping HTML no muestra Tags C# en el foro de ASPX (.net) en Foros del Web. Hola a todos tengo un funcion para hacer un Scraping HTML en C# con regex, lo q hace es apartir de un string[] de direccion ...
  #1 (permalink)  
Antiguo 03/05/2010, 08:01
Avatar de jahman  
Fecha de Ingreso: noviembre-2003
Ubicación: Oslo
Mensajes: 230
Antigüedad: 20 años, 5 meses
Puntos: 0
Scraping HTML no muestra Tags C#

Hola a todos tengo un funcion para hacer un Scraping HTML en C# con regex, lo q hace es apartir de un string[] de direccion y un string[] Regex voy buscando la data q especifico....

en general funciona, cuando hago .*?( (\\d+)?(?: ?\\d){8,10}) para obtener el tlf pero en el regex <title>([^<]+)</title> para obtener el titulo de la pagina no muestra nada se q lo agarra ya que al hacer el debug lo puedo ver pero no lo imprime.


lo q esta en rojo en el codigo es donde recibo y debo mostrar pare cuando vienen envueltos en html tag <> no muestra nada unauqe lo haya encontrado...
espero qme puedan ayuda. Gracias.
Código:
    public string[] GetUrl = new string[] { "http://www.cafesor.no/kontakt/","http://www.asylet.no/","http://www.cafekaos.no/info.html","http://jekylls.no/html/kontakt.html" };
    public string[] RegexString = new string[] { ".*?( (\\d+)?(?: ?\\d){8,10})","<title>([^<]+)</title>" };



public void regex_Click(object sender, EventArgs e)
    {
        ResultRegex.Text = "";
        for (int i = 0; i < GetUrl.Length; i++)
        {
            string pagesource = getHtml(GetUrl[i]);
            ResultRegex.Text += GetUrl[i].ToString() + " <br />";
            for(int j = 0; j< RegexString.Length; j++) 
            {
            Regex objNotNaturalPattern = new Regex(@RegexString[j]);
            MatchCollection matches = objNotNaturalPattern.Matches(pagesource);
            
            foreach (Match match in matches)
                ResultRegex.Text += "-"+match.Value.ToString() + "<br />";
            }
        }

Etiquetas: html, muestra, tags, aspx
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 22:01.