大案牍术-2010_2013_SMS

2020武汉肺炎,延期复工在家办公。汇总统计了2010年2月26号到2013年4月7号的所有还健在的短信。

分析过程

通过合并、拆分、替换等方式将短信分为收到的和发送的,再基于短信内容、电话号码、通讯录给短信附上对应的姓名。排除重复UTC时间(精确到秒)后得到最终的内容。将最终数据导入Tableau中进行数据分析。

(大数据处理过程:收集数据——整理数据——分析数据——利用数据)

数据情况

数据共11366条;

含垃圾、服务短信共381个电话号码;

开始于2010年2月26日9点54分54秒收到短信“我醒了!”

结束于2013年4月7日19点38分04秒发送短信“搞定,回家”

数据分析

从三个维度进行分析(时间、姓名、数量),得到以下信息;

1.短信互动(收发)最多的一天是2010年3月2日,150条;

2.当天短信发送给不同人的最多的3天是2011年2月2日28人;2011年1月22日15人;2011年2月9日23人。这三天都是农历除夕夜,也就是互发拜年短信。

3.2011年6月29日到2011年9月4日之间的短信数据丢失了,因为图上为空白;

4.切换到周视图后,发现短信数量趋势为波浪性,存在波峰及波谷,也就是对你时冷时热;

5.按姓名计数排列;嗯嗯……,发现了个问题。数据呈严重阶梯状:

第一梯队1400+,一人;1407条。

第二梯队1000-950,3人;1027条、1018条、967条。

第三梯队650-600,4人;644条、631条、627条(中国移动)、618条

6.按姓名计数-时间(小时)排列;发现喜欢在中午及下午发短信:

7.按姓名计数-时间(日)排列;

8.按姓名计数-时间(月)排列;一直联系的才是爱啊;

9.按姓名计数-时间(年)排列;2013年只有3个月的数据。但即使*4倍也不如以前;数量从2010年开始基本都是在下降的,看来2011年微信的出现,对短信的冲击是巨大的。

其实还可以分析更多内容,可惜能力不够就先这样了。

(可想而知,拥有我们所有通信的公司是多么可怕,要是们不要脸起来,你就是赤裸的。)