Ver Mensaje Individual
  #1 (permalink)  
Antiguo 08/09/2004, 11:41
KillerBKS
 
Fecha de Ingreso: julio-2002
Ubicación: Rancagua - Chile
Mensajes: 494
Antigüedad: 21 años, 8 meses
Puntos: 0
Ayuda Urgente

Hola :
Necesito de si valioza ayuda nuevamente
Tengo el siguiente problema:
El problema consiste en hacer un programa de búsqueda.
El algoritmo consiste en dar un peso a la cantidad de veces que una palabra aparece en el
string de búsqueda y en el documento a buscar.
Se entregará un string de búsqueda seguido de un set de documentos. Tendrás que
calcular el puntaje para cada documento y guardarlo en el archivo de salida, en el mismo
orden en que aparece en el archivo de entrada.
Para calcular el puntaje de un documento tienes que calcular primero el puntaje de una
palabra para cada palabra que aparece en el string de búsqueda. El puntaje de una palabra
es la cantidad de veces que aparece ese palabra en el string de búsqueda multiplicado por
la cantidad de veces que aparece en el documento. El puntaje del documento es la suma
de las raíces cuadradas de cada puntaje de la palabra.
El programa debe estar escrito en PHP.
Formato de entrada
El archive de entrada se llamará “input.txt” y consiste en un set de documentos separados
por una línea que contiene sólo 10 guiones, “----------“. Ninguna línea tendrá más de 250
caracteres. Ningún documento tendrá más de 100 líneas. El primer documento es el string
de búsqueda. El archivo termina con dos líneas seguidas con diez guiones cada una.
Los documentos pueden usar cualquier carácter ASCII. Tienes que parsear cada
documento en un set de palabras.
Las palabras están separadas por espacio en el documento de entrada. Las comparaciones
entre palabras son case-insensitive. Las puntuaciones deben ser removidas antes de la
comparación, por ejemplo “O’higgins” queda “Ohiggins”. Las palabras resultantes sólo
deben contener los caracteres {[a-z],[0-9]}. Una palabra que consista sólo de
puntuaciones debe ser ignorada. Puedes asumir que el string de búsqueda y cada
documento contienen al menos una palabra válida.
Formato de salida
La salida consiste en una serie de puntajes, uno por línea, con dos decimales. Los
puntajes son impresos en el orden en que vienen los documentos en la entrada. Ningún
otro carácter puede aparecer en la salida. El archivo debe llamarse “output.txt”. No debe
mostrarse nada en pantalla.
Los archivos de entrada y salida deben estar en el mismo directorio donde se ejecute el
script.

Mi problema mas grande es que no he trabajo con archivos, entonces no se como manejarlos, digamos linea por linea o registro por registro (BD).
El segundo gran problema es que, dado que estoy sin trabajo, me lo pidieron en una entrevista de trabajo y tengo que hacerlo lo mas pronto posible.

Ojala me puedan ayudar y tal vez poder conseguir el trabajo.

Gracias.

Salu2 !!!
__________________
AK.T.I.V.E.tm Live, Never DIE