Has elegido la edición de . Verás las noticias de esta portada en el módulo de ediciones locales de la home de elDiario.es.

El INE rastrea las webs de Airbnb, Booking y Vrbo para saber cuántas viviendas turísticas hay en España

Imagen de los datos que publicará próximamente el INE

Analía Plaza

1

El Instituto Nacional de Estadística (INE) ha descargado durante el último año datos de las principales webs de viviendas turísticas para estimar cuántas hay en España. El trabajo forma parte de las llamadas 'estadísticas experimentales', proyectos innovadores en los que el organismo usa nuevas fuentes o métodos. Los resultados saldrán el próximo 17 de diciembre y constituirán un avance importante, pues no todas las comunidades disponen de directorios actualizados. Hasta ahora, los datos extraídos directamente de las webs estaban en manos privadas (empresas como AirDNA cobran por ellos) o en proyectos abiertos de terceros, que no siempre incluyen todas las ciudades. En elDiario.es hemos hecho análisis de viviendas turísticas con datos de DataHippo.

La técnica empleada por el INE es el 'web scraping', que consiste en 'rascar' el contenido de una web y extraer todos los datos posibles de forma masiva. El proyecto técnico, que ya es público, explica que la información sobre viviendas turísticas es necesaria para analizar su impacto y aplicar los reglamentos con más conocimiento. Además, Eurostat la reclama y es consciente de que todos los países tienen problemas para acceder a ella. Eurostat tiene un proyecto piloto con Airbnb, Booking, Expedia y Tripadvisor para que compartan esta información.

La primera idea del INE fue contactar con los responsables turísticos de cada comunidad pero el resultado no fue “del todo satisfactorio”, así que desarrollaron programas de 'scraping'. Una vez extraídos los datos, que incluyen apartamentos con y sin licencia, los pasan por un algoritmo para detectar duplicados. Las tres plataformas analizadas son Airbnb, Booking y Vrbo. El presidente del INE, Juan Manuel Rodríguez Poo, ha explicado que “la colaboración con el sector privado” es “fundamental” y que están explorando fórmulas. Desde el INE han aclarado a elDiario.es que la extracción se ha hecho con permiso de las empresas.

A Airbnb no le suele gustar compartir datos. En el folleto de su próxima salida a Bolsa, lo describió como un riesgo. “Si una nueva regulación nos obliga a compartir datos de anfitriones con una ciudad, los ingresos caerán porque habrá anfitriones que no quieran y se vayan de la plataforma”. Este diario ha contactado con la empresa para conocer su opinión sobre el 'scraping' del INE. Un portavoz de la empresa dice que esperan “continuar las conversaciones con el INE y el Ministerio de Turismo de España, ya que la extracción de datos del sitio web a través de 'scraping' da lugar a información inexacta y supone una metodología defectuosa”. Booking no ha respondido a una solicitud de información.

Esta no es la única estadística experimental relativa al turismo que el INE tiene en marcha. El presidente ha anunciado, en un acto organizado por el Ministerio de Industria, que hay dos nuevos productos más. Por un lado, el del gasto con tarjetas de visitantes extranjero, medido a través de los TPV y no de encuestas, como se hace mensualmente. Esta estadística se ha publicado este mismo miércoles. Durante la pandemia, el Gobierno también ha utilizado este tipo de información para analizar la evolución de la economía. Y varios bancos publican datos del consumo con tarjeta en los TPV de su red.

Por otro, la medición del turismo nacional y extranjero con datos de posición de teléfonos móviles. Existían proyectos previos con este tipo de información, como el que hizo el propio INE durante el confinamiento o el elaborado por el Ministerio de Transporte sobre la evolución de la movilidad. La medición de visitantes complementará la información de la encuesta de movimientos turísticos en fronteras (FRONTUR) y se publicará durante el primer semestre de 2021.

En ambos casos, ha señalado Rodríguez, se trata de acceder a información “más granular” (con más detalle) y “mayor frecuencia” (la foto no será fija, sino que estará actualizada). “La utilización de estas fuentes de datos masivos va a suponer una gran ventaja para ámbitos institucionales y académicos”, ha concluido.

Etiquetas
stats