Cuando tu trabajo diario incluye mucha edición de documentos, te das cuenta de que cada formato de documento necesita su propio enfoque y a veces aplicaciones específicas. Manejar un archivo LWP que parece simple puede detener todo el proceso, especialmente si intentas editar con herramientas insuficientes. Para evitar este tipo de problemas, consigue un editor que cubra todos tus requisitos sin importar el formato del archivo y edita en LWP sin obstáculos.
Con DocHub, vas a trabajar con una herramienta de edición multifuncional para casi cualquier ocasión o tipo de documento. Minimiza el tiempo que solías dedicar a navegar por las características de tu antiguo software y aprende de nuestra interfaz de usuario intuitiva mientras realizas el trabajo. DocHub es una plataforma de edición en línea elegante que maneja todos tus requisitos de procesamiento de documentos para prácticamente cualquier archivo, como LWP. Ábrelo y ve directamente a la productividad; no se necesita capacitación previa ni leer manuales para aprovechar los beneficios que DocHub aporta al procesamiento de la gestión de documentos. Comienza dedicando unos momentos a crear tu cuenta ahora.
Ve las mejoras en tu procesamiento de documentos inmediatamente después de abrir tu perfil de DocHub. Ahorra tiempo en la edición con nuestra única plataforma que te ayudará a ser más productivo con cualquier formato de archivo con el que tengas que trabajar.
En la clase de hoy, aprenderemos cómo crear un rastreador web utilizando Perl. El programa descargará HTML en bruto de un sitio web, encontrará URLs dentro del HTML y las almacenará en archivos. Inicialmente, trabajaremos con 10 sitios web para evitar descargar todo. Puedes descargar más sitios web si tienes suficiente espacio en disco. El programa creará archivos HTML numerados secuencialmente y un archivo de mapa que vincula números a URLs originales. Comencemos escribiendo un programa Perl llamado web_crawler.pl.