Jump to content
Conéctate para seguir esto  
Melisa

Web scraping

Publicaciones recomendadas

(editado)

¿Qué es web scraping (web crawler)?

Hablando de rastreadores web (web crawlers), ¿qué te viene a la mente? ¿Una araña arrastrándose sobre telarañas? Eso es lo que realmente hace un rastreador web. Se arrastra por la web como una araña.

 

Para darle una definición precisa de web crawler, es un bot de Internet, también conocido como araña web, indexador automático, robot web, que escanea automáticamente la información a través de la web para crear un índice de los datos. Este proceso se llama rastreo web. Se llama "web crawler" porque "crawler" es un término para describir el comportamiento de acceder automáticamente a sitios web y adquirir datos a través de herramientas de scraping.

 

Web crawlers son operados frecuentemente por motores de búsqueda, como Google y Yahoo. El web crawler más famoso es Googlebot. ¿Alguna vez te has preguntado qué hace que los motores de búsqueda funcionen? Con los rastreadores web, los motores de búsqueda pueden presentar resultados relevantes de páginas web respondiendo a las entradas de búsqueda de los usuarios.

 

Potentes herramientas de web crawler

En un mundo de desarrollo tan rápido y basado en datos, las personas tienen una gran demanda de datos. Sin embargo, no todos tienen buenos conocimientos sobre el rastreo de un determinado sitio web para obtener los datos deseados. En esta sección, me gustaría presentar algunas herramientas útiles y poderosas de rastreo web para ayudarlo a superarlo.

Si usted es un programador o está familiarizado con el web crawler o el web scrapingopen-source web crawlers podrían ser más adecuados para que los manipule. Por ejemplo, Scrapy, uno de los rastreadores web de código abierto más famosos disponibles en la Web, es un marco de rastreo web gratuito escrito en Python.

 

12140750_899237880189040_4060465900558198906_n.png

Editado por Melisa
Tutoriales
  • Me gusta 2

Compartir este mensaje


Enlace al mensaje

Únete a la conversación

Participa ahora y únete más tarde. Si tienes cuenta, accede para participar con tu cuenta de usuario.

Invitado
Responder a este tema...

×   Pegar como texto enriquecido.   Restaurar formato

  Only 75 emoji are allowed.

×   Tu enlace se ha incrustado automáticamente..   Mostrar como un enlace en su lugar

×   Se ha restaurado el contenido anterior.   Limpiar editor

×   No se pueden pegar imágenes directamente. Carga o inserta imágenes desde la URL.

Conéctate para seguir esto  

×
×
  • Crear nuevo...

Información importante

Utilizamos cookies propias y de terceros para el correcto funcionamiento de la página y con fines analíticos. Más información en Términos de Uso y Política de privacidad.