数据支持:黄浦数字商圈公司、TalkingData
今年的外滩,没有灯光,也没有焰火。
而魔都著名的南京路步行街——也就是南京东路——的许多商家,则趁机喊出了“元旦三天乐,新年不打烊”的口号。
那么,2016年,是谁在南京路上跨年狂欢?
我们抽取了南京东路公共WIFI在2015年12月31日-2016年1月3日(共88个小时,从12月31日早上8点开始)探测到的部分移动设备的数据,并通过第三方移动数据公司匹配个人标签特征(不涉及个人隐私),筛选后保留约5万个有效样本,来回答这个问题。
新年逛南京路的都是什么人呢?
可以看到,在这88个小时中,步行街出入口逐小时的出现人数变化如下图所示:
从时间和人数来看,南京路的游客在新年第一天的1月1日达到了顶峰,而随着游客兴趣逐日消减,1月3日的人数最少。
从具体时间上来看,除了12月31日的高峰出现在晚上8点(大约是下班以后去逛街的吧)以外,元旦3天的客流最高峰都非常精准地出现在下午2点。
我们首先回答一个问题:来逛南京东路的,都是哪里人呢?
看到这里,也许你会说,这个问题还用数据来看吗?当然都是外地游客啦,阿拉上海人哪里会在新年去南京路看人头呢?
呵呵,是吗?数据并不这么看。
我们将游客在过去半年夜间最高频出现的地点定义为游客的来源地。
当然外地游客也是有区别的。抛开数量,我们不妨来看看各省游客在南京路的跨年率。
我们将在2015年12月31日22:00 -2016年1月1日2:00这个时间段内在南京路上出现过的人界定为“跨年”,将跨年的人数除以该类人在新年4天中的总人数,得到跨年率。
结果显示,上海人的跨年率为6.6%,居全国第二位;宁夏以9.5%的大比分优势占据了第一名的宝座,吉林、北京、浙江和江西则分担了外地人南京路跨年率的第2~5名。
新年四天,南京东路游客中上海人总数占据六成。看来,南京东路对上海人还是有很强吸引力的嘛。
不仅如此,假如聚焦跨年夜(我们将这一概念定为2015年12月31日18:00-2016年1月1日5:59)的话,我们可以分小时看得更清楚一些:
因此,从数据上可以看到:虽然游客众多,但南京东路毫无疑问还是属于上海人的,并且而这一归属感在2016年的新年深夜中显得尤为稳定。
那么,在夜幕越来越深的步行街,外地游客已经大部分退散,仍在狂欢的那些人都是住在魔都哪里呢?看下图便知:
再确定了南京东路跨年逛街人的地域来源之后,我们不妨来回答第二个问题:
这些新年还坚持来逛南京路的,是男还是女呢?
看到这里,也许你又会说,这个问题还用大数据来看吗?逛街的当然都是女生啊。
呵呵,是吗?数据也并不这么看。
我们统计了游客的性别标签,得到下图:
这是不是意味着,逛街的都是情侣呢?这可识别不出来,男男、女女一起逛街不行吗?
我们还可以统计出他们的年龄分布,如下图:
那么,具体到跨年夜呢?
毫无疑问,男女生在逛街持久力方面呈现出了明显的差异,貌似女生的夜间战斗力还是有限啊。
那么在年龄上呢?是年轻人更能逛吗?
从之前的分析中我们已经清楚,南京东路是轻熟女(男)的天下,由于不同年龄人口基数差异较大,各个时段的游客年龄的横向分布是几乎没有区别度的。因此,我们采用了各个年龄段人口数量与自己比较的方法来衡量,例如:
26-35岁游客在22点的分布比例=26-35岁游客在22点出现的人数/26-35岁游客在跨年夜出现的总人数。
由此,我们计算出不同时段不同年龄的游客的『浓度』。可见下图:
55岁以下的游客(包括了学生组、轻熟组以及中年组)在时间上的分布规律是类似的,从晚上8、9点开始,其『浓度』随时间逐渐降低。
但55岁以上的游客(中老年组)的『浓度』则并不完全随着时间呈现线性规律,而是在0点时刻,出现了一个明显的高峰。
咦,跨年那一刻,中老年组逆袭了?
我们好奇地把这个组别的样本抽出单独统计了一下,发现了一个更有趣的现象:在0点的这一时刻,中老年组别的男女性别的比例仅为1:3。
女性数量远超男性数量!也就是说,新年零点不仅是老年人的逆袭时刻,更是大妈们的逆袭时刻!
做完本次研究的最后结论,我不得不承认这个研究的最大的价值是发现了这样一个似乎显而易见但的确颠扑不破的真理,那就是:
永远不要低估大妈们逛街的战斗力。尤其是上海大妈。
数据来源说明:
本文所使用的移动设备数据来自于城市数据团的合作伙伴黄浦数字商圈公司和TalkingData。黄浦数字商圈公司利用公共WIFI等相关智慧城市设施记录城市公共空间的移动设备流动情况,不记录任何个人隐私数据。TalkingData的数据收集依赖于设备使用者的授权,TalkingData不会收集姓名,手机号,通讯记录,居住或通信地址等跟人身份信息。TalkingData的数据服务也是匿名化和模糊化的。本文中所使用的数据,对设备ID做了匿名化处理,不仅无法对应到具体个人,也无法对应到具体设备。研究中,对地理位置数据也做了空间和时间两个维度上的模糊化,使用这些数据无法跟踪,定位具体个人 ,也不能用来确定个人身份。