Cuando el alcance de tus tareas diarias incluye mucha edición de documentos, ya sabes que cada formato de documento necesita su propio enfoque y, en algunos casos, aplicaciones particulares. Manejar un archivo LWP que parece simple puede a menudo detener todo el proceso, especialmente si intentas editar con un software inadecuado. Para evitar este tipo de problemas, encuentra un editor que pueda cubrir todas tus necesidades sin importar el formato del archivo y trabaja en detalle en LWP sin obstáculos.
Con DocHub, trabajarás con una herramienta de edición multifuncional para casi cualquier situación o tipo de documento. Minimiza el tiempo que solías dedicar a navegar por las características de tu antiguo software y aprende de nuestra interfaz intuitiva mientras realizas el trabajo. DocHub es una plataforma de edición en línea optimizada que maneja todas tus necesidades de procesamiento de documentos para cualquier archivo, incluyendo LWP. Ábrelo y ve directamente a la productividad; no se necesita capacitación previa ni leer instrucciones para aprovechar los beneficios que DocHub aporta a la gestión de documentos. Comienza dedicando un par de minutos a registrar tu cuenta ahora.
Observa mejoras en el procesamiento de tus documentos justo después de abrir tu cuenta de DocHub. Ahorra tiempo en la edición con nuestra única plataforma que puede ayudarte a ser más productivo con cualquier formato de documento con el que necesites trabajar.
En la clase de hoy, estaremos viendo un ejemplo de código Perl para crear un rastreador web. El código descargará HTML en bruto de un sitio web, iterará a través de él para encontrar URLs y las almacenará como archivos. Inicialmente, trabajaremos con 10 sitios web para evitar descargar todo. Puedes descargar tantos sitios web como espacio en disco tengas. El programa creará archivos HTML y un archivo de mapa con las URLs originales. El código Perl estará en un programa llamado web crawler dot pl. Comencemos con la configuración del código.