如需要完整文档点击下方 "点击下载文档" 按钮
历史客运量与客运需求存在差距,基于余票查询数据的起讫点( OD) 客流特征分析可以较为实时地反映客运需求。 对于一些客流特征的挖掘目前主要的方法是利用聚类算法进行群体划分,进而发现每个类别的特征。 针对余票查询数据维度高,直接使用聚类算法鲁棒性较差的问题,提出了一种基于随机距离预测的高层特征抽取模型 RDP 与 K-means结合的 OD 客流聚类分析方法。 以京沪高速铁路预售期内余票查询量数据为原始数据,将乘车日期作为预分类条件,运用RDP 算法提取预分类后数据的重构特征,然后通过 K-means 算法对重构特征进行聚类。 实验结果表明,RDP K-means 算法在 Calinski-Harabaz 指数、轮廓系数、戴维森堡丁指数三种内部聚类评价指标下效果均优于传统的 K-means、PCA K-means、层次聚类、DBSCAN 等算法,证明了 RDP K-means 算法在基于余票查询数据的 OD 客流特征分析研究中的有效性,能够更好地进行 OD 类别划分、客流出行特征分析、热门 OD 挖掘,为改善运力调整等相关业务提供一定的参考依据。