我们理解世界的方式正被大数据改变着,特别是在思维方式方面,一场深刻转变已然发生,是从“为什么”到“是什么”的那种转变 。
大数据时代的全样思维
以前,鉴于技术受限,我们惯于借助抽样以剖析问题。举例来说,若要明晰全国消费者的偏好,市场调研公司一般会选取几千份问卷当作样本。在数据获取以及处理成本高昂的时期,这是一种能够行得通的折中办法。
只是,抽样所获结论存天然的不稳定状况,有个知名比喻这样讲,你没办法借由去尝一勺汤,进而判定整锅汤到底是咸还是淡,要是样本恰巧出现偏差,那结论便会跟事实相差很远,大数据技术让收集以及处理全部数据变成可行之事,如此一来就规避了抽样误差。
抽样的局限与风险
拥有风险就隐含在那抽样方法之中。在过去的上世纪三十年代时期,美国的《文学文摘》该本杂志,利用电话簿以及汽车登记册来展开抽样调查,藉此预测兰登会在那时的总统大抉择中夺得勝利,然而最终的结果却是遭受凄惨大败下场缘故在于其抽取的样本主要是源自富裕家庭范围之内,因这样子便根本不能够去代替、表示全体参与投票选举民众 。
处于商业范畴之中,凭借抽样得来的数据去进行决策,极有可能引发重大的失误情况发生。举例来讲,有这样一个服装品牌,仅仅依据少数几家门店所呈现出的销售数据,便决然做出砍掉一条生产线的决定,然而后续就发现这条被砍掉的产品线,在其它的区域有着相当不错的受欢迎程度,只是此时已然于事无补,为时太晚了。抽样所存在的“盲区”,通常会致使企业错过发展的机会,或者对当前的形势做出错误的判断。
从因果追求到相关发现
传统科学思维对因果关系极为推崇,觉得要理解现象就一定要找出确切的“原因”。这种思维在复杂系统里常常会失效。比如说,经济学家很难精准指出究竟是哪几个因素直接致使了某次股市波动。
和因果关系相比,大数据思维更注重相关关系,零售巨头沃尔玛,通过对全尺度销售数据予以剖析,察觉到在飓风到来之前,手电筒的销量会急剧上升,蛋挞的销量也会急剧上升,虽然手电筒的销量上升和蛋挞的销量上升之间,不存在直接的因果关联,然而依据这种情况,把手电筒和蛋挞捆绑在一起进行促销,销售额得到了显著的提高,相关关系能够直接对行动起到引导作用,进而创造出价值 。
容错思维接纳数据的不完美
处于小数据时代时,数据里的异常值以及缺失值堪称被视作“噪音”的存在,必定得予以清洗或者剔除,以此来保证模型的“纯净”。可是过度进行清洗很有可能滤掉现实世界的复杂性,致使模型变得脆弱 。
首先,大数据思维拥抱那种“不完美” 。其次,在利用机器学习预测设备故障之际 ,传感器传来的全量数据 ,涵盖了正常的磨损信号 ,还有偶然的误报再加上真实的故障前兆 。然后,算法于全部数据里学习模式 ,包纳那些“错误”数据 ,进而能够更早且更准地发出预警 ,原因在于其更贴近现实世界的运行状态 。
相关关系的商业实践
已随处可见相关关系的应用,流媒体平台Netflix,通过分析用户的全量观看记录,像暂停、回放、观看时长这些,发现喜欢看A类影片的用户,也很有可能喜欢B类影片,基于这种强相关,其推荐系统准确率很高,极大地提升了用户粘性 。
于城市治理范围之内,相关部门针对全城去剖析分析交通流量情况、社交媒体签到状况以及天气数据,从中发觉,当体育场举办大型赛事之际,周边快餐店的外卖订单数量便会急剧增多,依据此情况才提前作出调配,将外卖骑力资源予以提前安排,从而有效地缓解了局部区域出现的交通拥堵拥堵状况,而这正是因果分析在短时间内难以达成的那种洞察 。
思维转型的挑战与未来
进行从抽样到全样的思维转变,不容易,进行从因果到相关的思维转变,不容易,进行从精确到容错的思维转变,不容易,这种思维转变要求组织具备相应的技术设施,还需要决策者去改变根深蒂固的认知习惯,许多企业依旧被困在旧有的模式之中,难以将数据的全部潜力释放出来。
往后,伴随物联网以及5G技术的普遍应用,全样数据的收集会愈益广泛且实时。思维进化会变成个人与组织的关键竞争力。能不能借助全量数据发觉潜藏的相关性,并且迅速付诸实际行动,会判定其在数字经济里的地位 。
依你看来,于你的工作亦或是生活范畴之内,哪一个领域最为急切地需要自“因果思维”转变至“相关思维”以便获取突破呢?欢迎至评论区域分享你的观测,要是觉着有所启示,烦请点赞给予支持 。