Cuando el alcance de tus tareas diarias incluye mucha edición de documentos, sabes que cada formato de archivo requiere su propio enfoque y a veces software particular. Manejar un archivo LWP que parece simple puede a menudo detener todo el proceso, especialmente si intentas editar con software inadecuado. Para evitar tales dificultades, consigue un editor que cubra tus necesidades sin importar el formato del archivo y pega código en LWP sin obstáculos.
Con DocHub, vas a trabajar con una herramienta de edición multifuncional para casi cualquier ocasión o tipo de archivo. Minimiza el tiempo que solías gastar navegando por la funcionalidad de tu antiguo software y aprende de nuestro diseño de interfaz intuitivo mientras realizas el trabajo. DocHub es una plataforma de edición en línea optimizada que maneja todas tus necesidades de procesamiento de archivos para cualquier archivo, como LWP. Ábrelo y ve directamente a la eficiencia; no se necesita capacitación previa ni leer manuales para disfrutar de los beneficios que DocHub aporta al procesamiento de gestión de documentos. Comienza dedicando un par de minutos a crear tu cuenta ahora.
Observa mejoras en el procesamiento de tu documento justo después de abrir tu cuenta de DocHub. Ahorra tiempo en la edición con nuestra única solución que puede ayudarte a ser más eficiente con cualquier formato de documento con el que necesites trabajar.
En la clase de hoy, escribiremos un rastreador web usando Perl. El código descargará HTML en bruto de un sitio web, iterará a través de él para encontrar URLs, recuperará esas URLs y las almacenará como archivos. Inicialmente, trabajaremos con alrededor de 10 sitios web para mantener las cosas simples. Sin embargo, puedes descargar tantos sitios web como tu espacio en disco permita. El programa creará una serie de archivos HTML con nombres numerados y un archivo de mapa que contiene el número y la URL original. Comencemos escribiendo un programa Perl llamado web crawler dot pl.