Ver Mensaje Individual
  #2 (permalink)  
Antiguo 28/08/2011, 16:24
Avatar de razpeitia
razpeitia
Moderador
 
Fecha de Ingreso: marzo-2005
Ubicación: Monterrey, México
Mensajes: 7.321
Antigüedad: 19 años, 1 mes
Puntos: 1360
Respuesta: ejercicios python

Cita:
Iniciado por en
1. Define a function find_language() that takes a string as its argument, and returns a list of languages that have that string as a word. Use the udhr corpus and limit your searches to files in the Latin-1 encoding.
Cita:
Iniciado por es
1. Defina una función find_language() que tome como argumento una cadena y retorne una lista de lenguajes que tienen esa cadena como palabra. Usa el udhr corpus y limita tus busquedas a archivos con el encoding Latin-1

Cita:
Iniciado por en
2. Obtain some raw text, in the form of a single, long string. Use Python's textwrap module to break it up into multiple lines. Now write code to add extra spaces between words, in order to justify the output. Each line must have the same width, and spaces must be approximately evenly distributed across each lines. No line can begin or end with a space.
Cita:
Iniciado por es
2. Obten algo de texto en crudo, en forma de un sola y larga cadena. Usa el modulo de Python textwrap para dividirlo en multiples lineas. Ahora escribe código para que añada espacio extra entre cada palabra para justificar la salida. Cada linea debe tener la misma longitud, y los espacios deben de estar uniformemente distribuidas a través de cada linea. Ninguna linea debe empezar o terminar con espacios.
Cita:
Iniciado por en
3. Develop a simple extractive summarization tool, that prints the sentences of a document which contain the highest total word frequency. Use FreqDist() to count word frequencies, and use sum to sum the frequencies of the words in each sentence. Rank the sentences according to their score. Finally, print the n highest-scoring sentences in document order. Carefully review the design of your program, especially your approach to this double sorting. Make sure the program is written as clearly as possible.
Cita:
Iniciado por es
3. Desarrolla una simple herramienta de extracción y resumen, que imprima las oraciones de un documento que contengan el mayor total de frecuencias de palabras. Usa FreqDist() para contar las frecuencias de palabras y usa sum() para sumar las de las palabras en cada oración. Clasifica las oraciones de acuerdo con su puntuación. Finalmente, imprime las primeras n oraciones en tener la puntuación mas alta ordenas según vayan apareciendo en el documento. Cuidadosamente revisa el diseño de tu programa, especialmente si tu enfoque es ordenar 2 veces. Asegúrate que tu programa este escrito lo mas claro posible.
Si eres mala al escribir código nosotros te podemos ayudar (si proporcionas código), pero si eres al pensar también la solución al problema entonces no podemos hacer mucho por ti (y de hecho si estas en esta situación la única persona que puede ayudarte eres tu misma.)

Por ahora lo único en lo que podemos ayudar es en la traducción, si tienes alguna(s) duda(s) en especifico las podemos contestar pero dejar la explicación en otro idioma y pedir que hagan el trabajo no es muy justo que digamos.