创新大数据时代的社会计算

大数据的出现和计算机技术的发展带来了社会计算新研究方法的革命,使研究设计、分析方法和理论建立发生了新的变化。为了探索大数据研究的跨学科方法论,促进学科整合与创新,清华大学举办了由清华大学社会科学研究所主办、清华大学社会网络研究中心(csnr)和清华大学数据科学研究所(ids)主办的“2019国际社会计算大会”(2019国际社会计算大会),邀请全球学者在大数据分析方法和社会科学的交叉领域进行交流与沟通。

大数据和调查数据的结合从理论角度创造了一种新的研究范式。芝加哥大学社会学系詹姆斯·埃文斯(James a. evans)首先解释说,计算社会科学使用计算机生成数据,发现其中的模式和规律,或者生成和测试解释。他概述了社会计算的愿景,结合其研究内容和计算社会科学领域的最新研究,阐述了如何利用数据计算来理解社会,分析复杂、动态和适应性强的社会系统,以及如何在人机交互过程中形成更强大的智能。

在大数据时代,大量实时电子印记数据是基于网络、社交媒体、人工智能、传感器等产生的。从网络上的集体活动、社交媒体、即时通讯到在线交易、政府情报和数字图书馆,越来越多的社交生活仍然停留在电子文本中。研究人员可以发现现象,寻找解释因素,并进行社会计算,以前所未有的广度、深度和规模利用、收集和分析数据。对于各自的研究领域,参与者使用大数据,包括社交网络、维基百科、github网站数据分析、组织内员工的社交数据、微博数据、与社会经济相关的电子印记数据等。当这些大数据与传统的社会科学定性和定量调查相结合时,一种新的研究范式应运而生。采用传统的调查方法收集局部和及时的有根真理,将社会科学问题意识和有根真理与现有大数据相结合,形成预测模型,从而在相同的大数据维度下做出更容易获得的推论。基础事实和大数据的结合使得数据挖掘、理论建模和由预测算法构建的三角形之间的相互对话成为可能。一方面,理论不断完善,另一方面,预测算法更加准确,从而可以推断和解释更多的现象。这一研究范式的推理过程采用查尔斯·桑德斯·皮尔斯(charles sanders pierce)提出的溯因推理,不仅是归纳和演绎,也是从一组事实和想象出发,演绎出最佳解释的推理过程。它与计算社会科学研究中基于数据和理论双重驱动首先挖掘大数据中有趣现象,然后结合理论预测或模拟其解释的过程相吻合。采样方法也从原始的全样本随机采样转变为优化采样,即局部采样建立预测模型,不断使预测模型与理论沟通,使预测模型逼近最优,最后将相同的大数据预测因子输入预测模型进行推理。

目前,社会计算领域也致力于开发和改进一些解决社会计算问题的算法,包括机器学习、数据挖掘、网络分析、自然语言处理、深度学习等内容分析、数据挖掘和预测模型构建。

北京师范大学系统科学学院的张江和范颖分别分析了在复杂系统中使用简单规则建模和深度学习建模的优缺点,展示了他们团队对网络重构和动态学习的深度学习框架的研究。清华大学计算机系的刘致远改进了自然语言分析技术和图形神经网络算法,可应用于推荐和预测等许多领域。复旦大学计算机科学学院副教授陈阳利用深入学习来检测在线开发者社区中的恶意账户。其他学者也使用大数据集成机器学习算法进行预测。同时,结合回归模型进行理论验证和探索也不乏其人。模型和方法的改进可以更好地挖掘数据中的价值,提高社会预测的准确性,为一些社会现象提供更微观或中层的模式和规律的解释路径,从而构建和逐步完善社会科学理论。

在大数据与社会科学的结合中,社会科学研究在树立问题意识和提供根深蒂固的真理方面发挥了作用。理论为大数据开辟了许多新的课题,赋予构建的预测模型更多的推理价值,因为只有形成理论,才能在不同的领域、时间和空间进行推理。

根据上述方法论和技术创新,学者们在不同领域进行了研究,研究内容广泛多样。其中,清华大学社会学系的罗家德试图探索中国人的脉搏可以分为多少层。在对用户之间关系强度的根深蒂固的事实进行调查和收集后,找到这些用户在社交软件中留下的互动印记数据,并整理出指标。结合根深蒂固的真理训练,建立分类模型,不断寻找准确率最高的划分方法,从而获得合适的圆划分方法,使这一研究对象在一定的背景下具有可测性,体现了大数据与调查数据相互对话的价值。电子科技大学的周涛利用学生生活和学习活动的实时记录,对智能教育进行数据驱动的研究。清华大学的孟天光利用大数据密切关注入党问题。清华大学的苏玉松主要关注中国审查制度的垂直策略,即利用微博数据观察政府对舆论的审查等。

丰富的研究课题为社会计算的发展注入了活力。目前,无论是在研究问题、算法模型,还是理论与数据挖掘和预测模型相结合,都还在不断探索之中。理论、数据挖掘和预测模型之间的持续对话将促进更多的理论验证、修订或新理论的发现。同时,它将使研究动态的个人、个人之间的关系和相互作用、从小群体到宏观网络的结构变化成为可能,从而研究集体行动(如重大创新、社会运动、革命爆发等)是如何进行的。)和复杂社会系统的异常演变(如金融风暴、繁荣的突然变化和社会变化)出现。来自芝加哥大学、麻省理工学院、斯坦福大学、哥廷根大学、法兰克福大学、牛津大学、香港中文大学、清华大学、复旦大学、北京师范大学等10多所大学和学院的20多名不同学科背景的专家学者就会议主题做了学术发言和交流讨论。

(作者:清华大学社会学系)

资料来源:中国社会科学网-中国社会科学报作者:罗家德·高辛

欢迎关注中国社会科学网微信公众号cssn_cn,了解更多学术信息。

上海时时乐