用户登录

还没有账号?立即注册

注册免费试用

忘记密码

修改密码

大数据的涌现性

发布时间:2021-04-16

涌现性是网络数据有别于其它数据的关键特性。涌现性在度量、研判与预测上的困难使得网络数据难以被驾驭。网络数据的涌现性主要表现为模式的涌现性、行为的涌现性和智慧的涌现性。

(1)模式的涌现性。在多尺度、异质关系的网络数据中,由于不同的数据在属性、功能等方面既存在差异又相互关联,因此使网络大数据在结构、功能等方面涌现出了局部结构所不具备的特定模式特征。在结构方面,数据之间不同的关联程度使得数据构成的网络涌现出模块结构。在功能方面,网络在演化过程中会自发地形成相互分离的连通小块。这一涌现性结果对于研究更多的社会网络模型和理解网络瓦解失效的发生有着重要意义

(2)行为的涌现性。随着数据采集技术的不断发展,人们得到的很多数据都具有时序性,而社会网络中个体行为的涌现性则是基于数据时序分布的统计结果。在社会网络中有较大相似性的个体之间容易建立社会关系。通过研究Schelling给出的个体社会关系网络模型发现,网络在演化过程中会自发地形成相互分离的连通块,这一个体行为涌现的结果不依赖于初始网络的拓扑结构,对于研究更多的社会网络 模 型 和 理 解 行 为 涌 现 的 规 律 具 有 重 要 意义。著名网络科学家Barabasi研究发现,人们发邮件的数量在一天的某些时刻会出现“爆发”现象并发现每个人连发两封邮件之间的时间间隔涌现出幂率分布特征。此外,自然界和社会中个体之间不同的竞争模式会导致不同的同步状态的涌现性。

(3)智慧的涌现性。网络数据在没有全局控制和预先定义的情况下,通过对来自大量自发个体的

语义进行互相融合和连接而形成语义,整个过程随着数据的变化而持续演进,从而形成网络数据的涌现语义,也可以称之为智慧涌现。作为一种特殊的智慧涌现形式,众包正在通过互联网和社会网络快速发展,成为一种新的商业模式、新的数据产生模式和新的数据处理协作模式。

       总体而言,尽管与网络大数据研究密切相关的数据库、数据挖掘、机器学习和知识工程等领域近些年来都有很大的进展,甚至在许多不同的领域得到了深入的应用,但由于网络大数据规模海量、关系复杂等根本特性,使得相关领域的研究成果难以被直接借鉴于网络大数据的研究。因此,网络大数据的研究需要一套全新的理论和方法来进 行 方向性的指导。但到目前为止,甚至连大数据的精确定义还缺乏一个统一的标准。网络大数据科学与技术这门学科的内涵和外延还缺乏严格的限定和详实的论证;在大数据的环境下,传统“假设、模型、检验”的科学方法受到质疑,从“数据”到“数据”的第四范式还没有建立,需要一个完备的新的理论体系来指导该学科的发展和研究。


QQ客服

扫描二维码添加QQ

微信客服

扫描二维码添加微信

公司电话

公司电话

17316289114