当前位置:
X-MOL 学术
›
J. Econ. Geogr.
›
论文详情
Our official English website, www.x-mol.net, welcomes your
feedback! (Note: you will need to create a separate account there.)
Forecasting bilateral asylum seeker flows with high-dimensional data and machine learning techniques
Journal of Economic Geography ( IF 3.1 ) Pub Date : 2024-08-11 , DOI: 10.1093/jeg/lbae023 Konstantin Boss 1, 2 , Andre Groeger 1, 2, 3 , Tobias Heidland 4, 5, 6 , Finja Krueger 4 , Conghan Zheng 1, 2
Journal of Economic Geography ( IF 3.1 ) Pub Date : 2024-08-11 , DOI: 10.1093/jeg/lbae023 Konstantin Boss 1, 2 , Andre Groeger 1, 2, 3 , Tobias Heidland 4, 5, 6 , Finja Krueger 4 , Conghan Zheng 1, 2
Affiliation
We develop monthly asylum seeker flow forecasting models for 157 origin countries to the EU27, using machine learning and high-dimensional data, including digital trace data from Google Trends. Comparing different models and forecasting horizons and validating out-of-sample, we find that an ensemble forecast combining Random Forest and Extreme Gradient Boosting algorithms outperforms the random walk over horizons between 3 and 12 months. For large corridors, this holds in a parsimonious model exclusively based on Google Trends variables, which has the advantage of near real-time availability. We provide practical recommendations how our approach can enable ahead-of-period asylum seeker flow forecasting applications.
中文翻译:
利用高维数据和机器学习技术预测双边寻求庇护者流动
我们使用机器学习和高维数据(包括来自 Google Trends 的数字跟踪数据),为前往欧盟 27 国的 157 个来源国开发月度寻求庇护者流动预测模型。通过比较不同的模型和预测范围并验证样本外,我们发现结合随机森林和极端梯度提升算法的集成预测在 3 到 12 个月之间优于随机漫游。对于大型走廊,这在完全基于 Google Trends 变量的精简模型中成立,该模型具有近乎实时可用性的优势。我们提供实用的建议,说明我们的方法如何实现期前寻求庇护者流动预测应用程序。
更新日期:2024-08-11
中文翻译:

利用高维数据和机器学习技术预测双边寻求庇护者流动
我们使用机器学习和高维数据(包括来自 Google Trends 的数字跟踪数据),为前往欧盟 27 国的 157 个来源国开发月度寻求庇护者流动预测模型。通过比较不同的模型和预测范围并验证样本外,我们发现结合随机森林和极端梯度提升算法的集成预测在 3 到 12 个月之间优于随机漫游。对于大型走廊,这在完全基于 Google Trends 变量的精简模型中成立,该模型具有近乎实时可用性的优势。我们提供实用的建议,说明我们的方法如何实现期前寻求庇护者流动预测应用程序。