首先通过爬虫采集链家网上所有南京二手房的房源数据,并对采集到的数据进行清洗;然后,对清洗后的数据进行可视化分析,探索隐藏在大量数据背后的规律;最后,采用一个聚类算法对所有二手房数据进行聚类分析,并根据聚类分析的结果,将这些房源大致 ...
对通达信数据进行去重和清洗处理,并将数据存入MongoDB,方便往后研究. Contribute to DemonDamon/tdxfinder-futures-dataclearer development by creating an account on GitHub.