Extraer datos de página web

  • Jhon
    Participante

      Hola comunidad, buen día!

      Estoy iniciando en este mundo y me he topado con la siguiente interrogante: se pueden extraer datos de una página web? en concreto, es la siguiente:

      http://www.aduanet.gob.pe/aduanas/informgest/ExpoDef.htm

      Agradecería si me pudieran dar un mayor alcance de cómo lograrlo, pues, sería de mucha ayuda.

      Saludos,

    • Roberto
      Participante

        Si manejas algo de Python busca algunos videos o libros sobre webscraping con la libreria Selenium. Yo no manejo gran cosa en Python y logré hacer un scraper para extraer datos de la página de Osinergmin. Selenium es buena porque te permite seleccionar las variables en esos menús desplegables.

        dlom
        Participante

          Hola Jhon! Lo que comenta Roberto es correcto, solo que requieres Python adicionalmente a Power BI.

           

          Si lo quieres hacer únicamente con Power BI, puedes usar el conector Web de Power BI para conectarte a la página. El tema aquí es que para obtener los datos necesitas que la página comprenda el uso de parámetros en la URL.

           

          Por ejemplo, si vemos la URL de nuestro portal de empleos https://www.empledata.com/index?country=Chile verás que los filtros se aplican con la URL. Esa URL la podrías poner en Power BI y obtener los datos.

           

          Pero por lo que veo de la página que compartes, esa página no lo hace de esta manera, si no que manda los parámetros por otro lugar sin que sean visibles. Tendrás que ver si la página los comprende como parte de la URL o si de plano necesitas una solución como lo que menciona Roberto.

        Viendo 2 respuestas - de la 1 a la 2 (de un total de 2)
        • El debate ‘Extraer datos de página web’ está cerrado y no admite más respuestas.