数据挖掘和数据驱动可视化

采用Oracle数据库编程运算分析,通过Django框架发布应用,并采用D3(Data-Driven)技术展示分析图表

图表展示 »

摘要

    随着医疗卫生的进步,老人将更加健康长寿,在社会人口中的占比也在增加。许多退休老人有更多的空余时间,也有更好的体力和精力,他们仍是社会群体中较活跃的一群人。 他们或者仍在家庭中承担重要责任,如负责照顾学龄前小孩,买菜煮饭,到学校接送小孩等; 或者活跃于自己的朋友圈,如到公园健身,走访亲友,参加各种兴趣组织等; 或者他们必须照顾自己的生活,到医院看病,到大超市购物。 而政府也为年满70周岁的老人提供出行福利,可以办理老人公交卡,享受免费乘坐公交车, 因此,年满70周岁的老人出行将以乘坐公交车为主。

    我们通过分析公交车刷卡数据中老人公交卡的刷卡记录,并关联刷卡时采集到的公交车GPS坐标,就可以了解到70周岁以上的老人在城市出行人群中的占比和活跃程度, 也可以了解到他们的出行规律和活动轨迹,从而了解城市老人的居住地点和活动密集地, 分析城市公交对老人出行的帮助,并分析一些城市基础服务设施(公园、医院、超市等)所能辐射到的老人活动范围, 最终我们可以知道如何通过改善出行交通条件,改善基础配套服务,更好地关爱城市中的老人。

概要设计

    我们分别从公交公司和GPS公司获取2014年5月份厦门E通卡刷卡数据和当月厦门所有公交线路的GPS采集数据。 在E通卡数据表中,我们可以获取E通卡的卡号,卡类型,刷卡时间,公交车牌号,公交车线路等信息,该表中包含43303661条刷卡记录; 而在GPS数据表中,我们可以获得GPS的设备信息,公交车牌号,GPS采集时间,GPS定位坐标等信息,该表中包含87679544条GPS采集记录。 然后,我们通过公交车牌号将两张表关联在一起,但刷卡记录与GPS采集信息是多对多的关系,无法精确匹配, 只能根据每张卡刷卡时间在一个允许的范围内(正负1分钟)进行模糊匹配到的GPS采集信息,来确定刷卡时所在的GPS坐标, 然后通过搜索每张E通卡刷卡时GPS坐标的附近1公里内最近的车站坐标,获取持有该E通卡的乘客的上车站点坐标,从而可以精确定位每位刷卡乘客的每天活动出行轨迹。 而我们通过卡类型,可以筛选出所有老人卡的刷卡记录,因此,我们也可以统计定位全市老人的出行规律和轨迹

总体步骤思维导图

厦门市老人服务设施分析