Ver Mensaje Individual
  #1 (permalink)  
Antiguo 19/03/2015, 06:23
Kritik
(Desactivado)
 
Fecha de Ingreso: marzo-2012
Mensajes: 366
Antigüedad: 12 años, 1 mes
Puntos: 31
Extracción de información de web que ejecuta script antes de mostrarse

De la página:

http://lema.rae.es/drae/?val=perro

Quiero extraer el siguiente código:

Código:
<div>
	<a name="55351"></a>
	<p class="p">
		<span class="f">
			<b>perro</b>
		</span>
		<span class="f">
			<b>
				<sup>1</sup>
			</b>
		</span>
		<span class="f">
			<b>, rra</b>
		</span>
		<span class="f">
			<b>.</b>
		</span>
		</p>
		<p></p>
		<p></p>
		<p class="q">
			<a name="1_1"></a>
			<span class="d">
				<b> 1.</b>
			</span>
			<span title="adjetivo" class="d">adj.</span>
			<span class="d">
				<span title="coloquial" class="d">coloq.</span>
			</span>
			<span class="b"> Muy malo, indigno.</span>
		</p>
		<p class="q">
			<a name="1_2"></a>
		<span class="d">
			<b> 2.</b>
		</span>
		<span class="g">
			<span title="adjetivo" class="g">adj.</span>
		</span>
		<span class="d">
			<i>
				<span title="El Salvador" class="d">El Salv.</span>
			</i>
		</span>
		<span class="b"> Dicho de una persona: Enojada, de mal genio.</span>
	</p>
</div>
También quiero extraer más texto de la misma página. Ya que esto se refiere a 2 resultados de búsqueda. El código anterior se refiere al contenido del primer resultado. Y quiero poder extraer los 2 resultados. Lo único identificativo de cada resultado es que justo al acabar cada resultado, termina con la etiqueta </div> y justo después viene el siguiente código en cada uno de los resultados:

Código:
<p class="o">Real Academia Española © Todos los derechos reservados</p>
Y no se como hacerlo. A alguien se le ocurre alguna manera sencilla?

PD: El método propuesto no puede ser exclusivo para esta URL, tiene que valer para cualquier valor puesto después de "http://lema.rae.es/drae/?val="

Última edición por Kritik; 19/03/2015 a las 06:31