Cuando tu trabajo diario incluye mucha edición de documentos, te das cuenta de que cada formato de documento requiere su propio enfoque y a veces aplicaciones específicas. Manejar un archivo LWP que parece simple puede a menudo detener todo el proceso, especialmente si estás tratando de editar con herramientas insuficientes. Para prevenir este tipo de dificultades, consigue un editor que cubra todos tus requisitos sin importar la extensión del archivo y establece el tipo en LWP sin obstáculos.
Con DocHub, vas a trabajar con una herramienta de edición multifuncional para cualquier ocasión o tipo de documento. Minimiza el tiempo que solías dedicar a navegar por las características de tu antiguo software y aprende de nuestro diseño de interfaz intuitivo mientras realizas el trabajo. DocHub es una plataforma de edición en línea eficiente que cubre todos tus requisitos de procesamiento de documentos para cualquier archivo, como LWP. Ábrelo y ve directamente a la productividad; no se requiere capacitación previa ni leer manuales para disfrutar de los beneficios que DocHub aporta al procesamiento de la gestión de documentos. Comienza dedicando un par de minutos a registrar tu cuenta ahora.
Ve mejoras en tu procesamiento de documentos inmediatamente después de abrir tu cuenta de DocHub. Ahorra tiempo en la edición con nuestra plataforma única que te ayudará a ser más productivo con cualquier formato de documento con el que necesites trabajar.
En la clase de hoy, escribiremos un rastreador web usando Perl. El código irá a un sitio web, descargará el HTML en bruto, encontrará URLs, las recuperará y las almacenará en archivos. Inicialmente, elegiremos alrededor de 10 sitios web para evitar descargar todo. Puedes descargar tantos sitios web como espacio en disco tengas. El código creará archivos HTML numerados 0.html, 1.html, etc., y un archivo de mapa con números y URLs originales. Comencemos con un programa Perl llamado web crawler dot pl.