结论和未来工作
Posted: Sat Jan 25, 2025 8:52 am
然而,在解释结果时需要小心谨慎。与专门为满足目的而设计的调查不同,社交媒体数据本质上是主观的,洞察力通常是从并非为回答特定问题而设计的数据中推断出来的。仍需要进行更多研究才能充分了解可能的偏见并克服它。
图 2 – 热图显示了 2015 年 6 月至 8 月期间在伦敦上传到 Flickr 的照片的地理位置。我们可以观察到英国居民和海外游客的行为差异。虽然英国居民的存在似乎更加分散,但游客被地标所吸引,因为我们可以清楚地观察到热点。然而,我们需要谨慎对待任何解释,因为英国居民上传的照片数量远远多于游客。例如,与 Facebook 或 Instagram 相比,Flickr 的受欢迎程度也低得多,因此这种行为可能不具代表性。
到目前为止,我们的研究已经表明,使用社交媒体数据来得出分析见解具有潜力,因为通过调查收集信息的成本太高或速度太慢。与此同时,研究也凸显了使用社交媒体数据来制作官方统计数据(尤其是旅游统计数据)所面临的许多挑战。当然,我们不应该在未来关闭使用如此丰富的数据源的大门。然而,在我们为公众利益制作可信统计数据的使命中,我们需要确保我们的官方输出达到适当的质量水平,并让公众了解我们所做的事情。如果我们要在官方统计数据中使用社交媒体数据,我们需要回答本文提出的具有 房主数据 挑战性的问题,更重要的是,为了建立信任,我们需要对我们所做的工作和做法保持透明。
为此,我们与学术界、其他政府部门以及世界各地的国家统计机构密切合作,探索新的数据源并研究最先进的数据科学方法。例如,在衡量旅游和移民的具体情况下,我们正在向在此领域取得进展的其他国家学习,例如荷兰中央统计局(荷兰统计局)正在研究使用手机数据来估计跨境旅行模式。此外,为了确保我们正在进行的研究符合道德规范,我们以 NSDEC道德原则为基准,也以其他标准为基准,例如政府数字服务局(GDS)发布的《数据科学道德框架》。
ONS 的官方统计数据策略优先利用议会批准的新数据共享权力探索已提供给政府机构的信息,例如行政数据。ONS 最近发布了一份关于此类举措的报告,探讨了如何使用行政数据来改变人口和移民统计数据。话虽如此,我们仍致力于探索新型大数据源的潜力,同时开发方法来克服其局限性。当然,我们仍面临挑战,但这是一个激动人心的时刻!
如果您想了解更多有关数据科学园区正在开展的工作、使用数据科学和探索新数据源的信息,请访问我们的项目页面。
图 2 – 热图显示了 2015 年 6 月至 8 月期间在伦敦上传到 Flickr 的照片的地理位置。我们可以观察到英国居民和海外游客的行为差异。虽然英国居民的存在似乎更加分散,但游客被地标所吸引,因为我们可以清楚地观察到热点。然而,我们需要谨慎对待任何解释,因为英国居民上传的照片数量远远多于游客。例如,与 Facebook 或 Instagram 相比,Flickr 的受欢迎程度也低得多,因此这种行为可能不具代表性。
到目前为止,我们的研究已经表明,使用社交媒体数据来得出分析见解具有潜力,因为通过调查收集信息的成本太高或速度太慢。与此同时,研究也凸显了使用社交媒体数据来制作官方统计数据(尤其是旅游统计数据)所面临的许多挑战。当然,我们不应该在未来关闭使用如此丰富的数据源的大门。然而,在我们为公众利益制作可信统计数据的使命中,我们需要确保我们的官方输出达到适当的质量水平,并让公众了解我们所做的事情。如果我们要在官方统计数据中使用社交媒体数据,我们需要回答本文提出的具有 房主数据 挑战性的问题,更重要的是,为了建立信任,我们需要对我们所做的工作和做法保持透明。
为此,我们与学术界、其他政府部门以及世界各地的国家统计机构密切合作,探索新的数据源并研究最先进的数据科学方法。例如,在衡量旅游和移民的具体情况下,我们正在向在此领域取得进展的其他国家学习,例如荷兰中央统计局(荷兰统计局)正在研究使用手机数据来估计跨境旅行模式。此外,为了确保我们正在进行的研究符合道德规范,我们以 NSDEC道德原则为基准,也以其他标准为基准,例如政府数字服务局(GDS)发布的《数据科学道德框架》。
ONS 的官方统计数据策略优先利用议会批准的新数据共享权力探索已提供给政府机构的信息,例如行政数据。ONS 最近发布了一份关于此类举措的报告,探讨了如何使用行政数据来改变人口和移民统计数据。话虽如此,我们仍致力于探索新型大数据源的潜力,同时开发方法来克服其局限性。当然,我们仍面临挑战,但这是一个激动人心的时刻!
如果您想了解更多有关数据科学园区正在开展的工作、使用数据科学和探索新数据源的信息,请访问我们的项目页面。