Foros del Web » Programación para mayores de 30 ;) » Java »

Como sacar el dominio de una url

Estas en el tema de Como sacar el dominio de una url en el foro de Java en Foros del Web. Saludos. Sucede que saco una url de una bd y la guardo en un String. Quisiera saber como puedo obtener el dominio de esta. Por ...
  #1 (permalink)  
Antiguo 22/06/2010, 17:22
 
Fecha de Ingreso: junio-2007
Mensajes: 56
Antigüedad: 16 años, 10 meses
Puntos: 0
Como sacar el dominio de una url

Saludos.
Sucede que saco una url de una bd y la guardo en un String.
Quisiera saber como puedo obtener el dominio de esta.
Por ejemplo si tengo:
Código:
http://www.forosdelweb.com/newthread.php?do=newthread&f=45
y aplico el código:
Código:
         String img1 = "http://www.forosdelweb.com/newthread.php?do=newthread&f=45";
         String img2 = img1.replaceAll("^(ftp|http|file)://", "");
         String img3 = img2.replaceAll("www.", "");
         String img4 = img3.replaceAll("(.com)*", "");
         int punto = img4.lastIndexOf(".");
         System.out.println(punto);
         System.out.println(img4);
         if(punto!=-1) {
             String img5 = img4.substring(0, punto);
             System.out.println(img5);
         }
Obtengo como resultado: forosdelweb/newthread

El chiste es que si tengo http://www.dominio.com.lo que sea
o http://www.dominio.com/lo que sea
Al final solo quede: dominio
Alguien sabe como puedo lograr lo anterio?????????
  #2 (permalink)  
Antiguo 23/06/2010, 17:01
Avatar de Xerelo  
Fecha de Ingreso: mayo-2009
Mensajes: 2.175
Antigüedad: 15 años
Puntos: 306
Respuesta: Como sacar el dominio de una url

Yo lo que haría sería una vez eliminado el http://

url = url.split("/")[0]

De esta forma te quedas sólo con el texto hasta la primera /, y como el dominio no puede llevarlas, la primera siempre será la que separe el dominio del resto de la url.

Después si ya has eliminado el "www." haría lo mismo usando el punto como separador o un replace(".com")

Pero ojo, el tema de la separación de dominios es muy complicado, de hecho no existe ningún algoritmo 100% seguro para obtener sólo el "dominio propio" de cualquier página, si es lo que pretendes.

El problema está en los CTLD

http://en.wikipedia.org/wiki/Country_code_top-level_domain

Etiquetas: url, dominios
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 05:08.