Hola Ronruby, puse el codigo que me dejaste, pero no funciona, puede ser que yo lo este usando mal, asi que aqui te dejo lo que tengo del codigo para que me des una mano
Código PHP:
<html>
<body>
<form id="form1" method="post" action="dir.php">
<input name="direc" type="text" id="direc" size="35" />
<input type="submit" value="buscar" />
</form>
</body>
</html>
<?php
$direc = $_POST['direc'];
//carga el archivo con file()
$file = file('direcciones.txt');
$direcciones = $file;
$fopen = fopen( "direcciones.txt", "a+" );
//suponemos que asi insertas las direcciones en el archivo de texto:
foreach($direcciones as $direccion) {
//revisa que este en el array que te devuelve file() usando la funcion in_array()
if(!in_array($direccion, $file)) {
//sino esta en el array la escribo:
fwrite($fopen, $direccion."\n");
}
//echo "$direccion";
}
/////////////////////////////////////////////////////////////////////////////
// cambia las direcciones del html, que se guardan en el archivo txt, a *****
/////////////////////////////////////////////////////////////////////////////
function epm($cadena){
$palabra =$direccion;
$palabras = count($palabra);
$base = 0;
while($base<$palabras){
$cadena = str_ireplace($palabra[$base],'***',$cadena);
$base++;
}
return $cadena;
}
$cadena = file_get_contents($direc);
$cadena = epm($cadena);
////////////////////////////////////////////////////////////////////////////
/////////////// Busca las direciones http de la pagina////////////////////////
////////////////////////////////////////////////////////////////////////////
$regExp1="/href=\"(.*?)\"/is" ;
$regExp2="/<a.*?>(.*?)<\/a>/is";
$file = ('$cadena');
preg_match_all($regExp1,$cadena,$a);
$count = count($a[1]);
echo "<b>Numero de links</b> = " .$count."<p>";
for ($row = 0; $row < $count ; $row++) {
echo $a[1]["$row"]."<br>";
}
?>
.
y el archivo txt lo tengo asi:
lo que si yo hago manualmente la copia de los archivos desde la pagina de internet al archivo txt, no uso por el momento ninguna funcion.
O aqui les mando mi programa original con el que hacgo filtrador, pero solo reconoce las ultima direccion de la lista de archivos de text para que lo modifiquen y hacerlo trabajar con todas las direcciones de la lista de text
Cita: <html>
<body>
<form id="form1" method="post" action="dir.php">
<input name="direc" type="text" id="direc" size="35" />
<input type="submit" value="buscar" />
</form>
</body>
</html>
<?php
$direc = $_POST['direc'];
function epm($cadena){
$lineas = file("direcciones.txt");
$palabra =$lineas;
$palabras = count($palabra);
$base = 0;
while($base<$palabras){
$cadena = str_ireplace($palabra[$base],'***',$cadena);
$base++;
}
return $cadena;
}
$cadena = file_get_contents($direc);
$cadena = epm($cadena);
//echo $cadena;
$regExp1="/href=\"(.*?)\"/is" ;
$regExp2="/<a.*?>(.*?)<\/a>/is";
$file = ('$cadena');
preg_match_all($regExp1,$cadena,$a);
$count = count($a[1]);
echo "<b>Numero de links</b> = " .$count."<p>";
for ($row = 0; $row < $count ; $row++) {
echo $a[1]["$row"]."<br>";
}
?>