二十一世纪,互联网新科技层出不穷。伴随着大数据、云技术以及整个算力的发展,人工智能技术的研究及应用也迅速壮大,在语音、图像和自然语言方面取得了卓越的成绩。更为重要的是,政府也在大力发展数字经济,包括党的十九届四中全会首次增列了“数据”作为生产要素,这也进一步反映了随着经济活动数字化转型的加快,数据对提高生产效率的乘数作用凸显,成为最具时代特征新生产要素的重要变化。个推作为专业的数据智能服务商,于2010年成立至今,在大数据技术的发展过程中,收获了一些成果,也得到了自己的经验和体会。
2019年3月,个推(每日互动,300766.SZ)在创业板上市,主打数据智能。公司在该领域积极布局,并在实践中探索总结了数据沉淀、数据挖掘和数据应用的“三步走”数据智能方法论。关于底层,个推提供了消息推送、用户画像、应用统计、一键认证四种开发者服务,同时沉淀了海量数据;中间层是个推引擎层,通过对数据脱敏、筛选、清洗、整理,并经深度挖掘后建模,自主构建“个推大数据平台”。最上层为数据应用层,提供品牌营销、风控服务、人口空间规划、公共服务等多种大数据服务,增能诸多垂直领域。
本文将结合个推实践,主要围绕三个方面进行展开:数据智能时代的特征、企业面临的实际挑战、数据智能体系建设思路。
数据智能时代的特征
数据智能时代已经来临,如同《大数据时代》中阐述的那样,我们发现并印证了大数据对我们思维、商业、管理等方面存在着巨大的影响。
思维变革
在思维变革方面,我们认为数据智能时代的特征可以归纳为三点:更多、更繁杂、更相关。更多,意味着人们不再依赖于一小部分数据,而是使用全部数据,并从第三范式向第四范式跃进。
那么,第三范式和第四范式的区别是什么呢?以“雾霾形成的原因”为例进行说明。第三范式的雾霾研究过程是:首先,提出问题。比如说,想了解雾霾是什么?怎么预防?其次,提出理论。根据已有的机理认识,雾霾天气的形成不仅与源头、大气化学成分相关,还与气象因素,包括地形、风向、温度、湿度等有关。而参数之多,超过了我们常规监测的能力范围。
为此,我们只能去除一些看起来不怎么重要的参数,保留一些简单的参数,提出一个理论。然后收集数据、模拟计算,并根据计算结果对理论进行修正。最后获取可信度比较高的结果,对雾霾天气进行预测。
相对应地,第四范式的研究方法是怎样的呢?它的第一个环节与最后一个环节跟第三范式相同,但在中间两个环节两者顺序是相反的,即在第四范式中,我们要先进行数据收集再形成理论。
在第一步问题提出后,我们首先去做的并不是创建一个理论模型,而是把所有可能有用的数据收集起来,然后在此基础上通过机器学习的方法,或者说人工智能的方法,找出对于雾霾形成影响较大的因素,进而提出有关理论。最后,进行预测,验证结果。得益于大数据的出现,第三范式才能向第四范式跃进,这也带来了整个思维方式和方法论的变革。
思维变革的第二个特点是更繁杂,即从精确性向概率性的转变。精确性作为信息缺乏时代和模拟时代的产物,要求数据保证质量、减小误差。而大数据时代,海量的数据使我们无法一一验证数据的准确性。更多情况是,我们通过整个数据的分布,找出数据背后的概率性,然后找到有用的数据,剔除没用的数据。
思维变革的第三个特点是更相关。数据之间不是因果关系,而是相关关系,核心是建立在相关关系分析法上的预测。
总结起来,大数据时代思维变革的特点可以归纳为:
改变操作方式,使用收集到的所有数据,而不是样本;
不把精确性作为重心;
接受混乱和错误的存在;
侧重于分析相关关系,而不是预测背后的原因。
商业变革
在商业变革方面,数据智能时代的特点主要有三:一切皆可量化、无限的创新可能、数据的选择价值。
“一切皆可量化”指的是随着数据智能时代的发展,我们会发现身边所有的东西都在产生数据,也就是说我们所处的现实世界,与信息世界存在着对应关系。未来,我们物理世界里的每一种事物都将与数字孪生世界里的一一对应。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。