Pues entonces .. te hace falta usar las funciones del manejo del buffer de PHP.
Código PHP:
<?php
ob_start();
include("cabecera.html");
?>
resto de tu HTML comun ...
<?
include ("pie.html");
$html = ob_get_contents();
ob_end_clean();
// Y por aquí haces tu proceso a la variable $html .. donde tendrás todo tu HTML en esa variable.
?>
Con la gestión del buffer de salida de PHP (funciones ob_xxx()) .. ya tendrás tu variable disponible para que la trabajes ..
Como es "HTML" lo que tienes en esa variable ..te combien como primer paso aplicar funciones tipo:
strip_tags()
Para quedarte -sólo- con con el "real" contenido de tu pagina (sin todo lo que esté entre < ... > que vendría a ser tus códigos-tag HTML ..)
Con esa variable ya mas "límpia" ahí puedes aplicar el resto de funciones de tratamiento de cadenas para hacer tus busquedas en esa variable (cadena, string).
Un saludo,