El proceso que mencionas sería "indexación" .. de igual forma dicho proceso sería lento hacerlo con PHP aunque tuvieses todo el algorítmo de interpretación de un .pdf (con su própio formato binario) o un MS Word u otros tipos.
Usando google .. salió esta classe que dice buscar en un PDF (sin más adicionales que intalar en el servidor?)
http://www.phpclasses.org/browse/package/702.html
Un saludo,