大数据促进科学与人文融合

科技工作者之家  |   2018-09-17 00:00

  以数理化为代表的科学文化和以文史哲为代表的人文文化,是当前文化的两种主要形式,被称为“两种文化”。最早从学理上将文化分为科学文化和人文文化,并注意到它们之间分裂现象的是英国学者斯诺(C. P. Snow),他于1959年在剑桥大学发表《两种文化与科学革命》《再论两种文化》等演讲,并以《两种文化》为题结集出版后引发了科学文化与人文文化及其分裂现象的广泛讨论,并将两种文化及其分裂问题称为“斯诺问题”。随后,世界各国的诸多学者纷纷开出弥合两种文化的各种药方,其中包括斯诺本人提出的教育改革和科学普及的方案,但两种文化还是没有找到融合的根本途径。

  人文学科难以数字化

  两种文化之所以难以融合,主要是因为它们建立在不同的方法论平台之上。自然科学之所以能够一路高歌,主要由于其主体间性、可解释性、可预测性、可检验性等,而人文学科则通常缺少这些特征。自然科学的这些特征建立于经验化、数据化和逻辑化的基础上,不同自然科学学科之间虽然存在不同研究视角,但基本都建立在观察、实验的基础上,通过观察、实验获取数据,通过数据找出其因果性或相关性规律,即自然科学“用数据说话”。这些数据可观察、可检验、可解释、可预测,不因人而异。反观各人文学科,较为注重个人体验,其主要方法为体悟、思辨等,多建立于个人假设基础上,用思辨的方法建构具有个性化的思想理论体系。人文学科由于缺少具有客观性的数据,从而无法用数据说话,造成因人而异、各说一辞的局面,主体间很难取得共识。因为建立在不同的方法论平台上,科学文化与人文文化间分裂为两个对立的共同体,相互之间基本不可通约,各种融合方案多以失败告终。

  人文学科为什么不向自然科学学习,也通过数据化手段来“让数据说话”?这主要是自然科学与人文学科的研究对象不同而使用不同的方法,从而造成人文学科很难用自然科学的方法取得相关数据。

  自然科学研究的是自然的各种现象及其规律,自笛卡尔以来,作为主体的研究者与作为客体的研究对象间拉开了距离,人可以对研究对象进行孤立、静止的客观性观察,甚至按照研究目的对研究对象进行受控实验,通过观察和受控实验获取研究对象的输入—输出数据,并根据这些数据建构数学模型来刻画、模拟研究对象,由此发现研究对象的内在规律。

  大数据成为社会科学新工具

  虽然人文学科很难用数据说话,但以人类群体为研究对象的经济学、社会学、法学等社会科学,常模仿、借鉴自然科学的方法,试图用数据说话,这或许能够成为人文文化与科学文化间的纽带。

  不过,传统社会科学还难以担当纽带的重任,因为它依靠访谈、抽样等方法得到的数据有时很难反映对象的真实状态。自然科学的研究对象多呈线性或类线性关系,通过少量关键数据便能够刻画对象间的关系和规律,而社会科学的研究对象复杂多变,访谈、抽样所获的少量数据不足以刻画对象间复杂、多变的关系,因此很难通过少量数据反映人类及其社会规律。由此可见,数据采集技术的落后是限制社会科学走向客观化、科学化的主要因素,并导致了社会科学无法像自然科学一样“用数据说话”。社会科学正在等待像自然科学的“望远镜”“显微镜”那样的数据采集新工具。

  随着信息科学技术的发展,特别是计算机、互联网、云计算、人工智能等技术的快速发展,人类正逐渐走向大数据时代。随着大数据时代的来临,社会科学迎来了数据采集的革命性新工具,并进入了与自然科学共享方法论平台的新时代。大数据革命让社会科学的数据采集进入智能化、自动化时代,并带来了客观、精准、在线的海量数据,让社会科学与自然科学一样,能够实现“让数据说话”。

  1.大数据发展带来数据的海量化。大数据技术将万物数据化,不但能够把自然世界数据化,而且还能将人类行为以数据形式记录下来,形成数据轨迹。大数据技术还能将传统社会科学难以数据化的文档、语音、影像、图片、方位、心理、生理等研究对象都转化为可存储、可计算的数据,并通过网络汇聚到云端,形成与自然、社会相映射的数据世界。因此,社会科学在大数据的支持下变成了数据密集型的计算社会科学。

  2.大数据发展带来数据的客观化。在大数据时代,从数据采集者视角来看,数据主要依靠智能感知、网络存储等自动生成,不再依赖某个具体的采集者,因此大数据是无主体的数据,从而具有主体间性。从被采集者视角来看,大数据基本上是在人们不知不觉的情况下智能、自动生成的数据轨迹,因此不会被采集对象的情绪、态度等主观因素干扰。由此,常被人诟病的社会科学数据污染问题在大数据时代被数据的智能、自动采集所解决。

  3.大数据发展带来数据的精准化。传统的访谈、抽样所采集的少量数据很难刻画由人的主体性而带来的社会科学的复杂性,只能是“盲人摸象”式的以偏概全。但是,大数据技术所带来的海量数据则将人类的举止言谈一网打尽,每个细节都留下了数据轨迹,或者说大数据像“上帝之眼”一样全面记录每个人每时每刻的言行,用“高像素、高分辨率”的海量数据精准刻画人类的方方面面,这样每个人都有了详细的生活细节,数据精准刻画了每个人的一切。

  4.大数据发展带来数据的在线化。大数据时代的数据皆以分布参数的形式储存于网络、云端,随时能够被挖掘和计算,因此世界的历史成为了在线的活历史,历史事实随时可以被复原和解读。在数据世界里,数据打通了万物的在场与不在场、此在与彼在,也联通了过去、现在与未来,一切都以在线的形式存在。数据的在线化为社会科学的研究提供了丰富、鲜活的材料。

  但是,人文学科的研究对象是人类自己,而人具有自我意识和主体性,研究者和研究对象都是人本身,我们很难像研究自然现象一样对人进行观察、实验。这样,我们很难获取刻画人类的客观数据,因此人文学科也就很难用数据说话,只能通过猜想、假设和推理的方法进行思辨性的研究。

  社会科学数据化

  成为科学与人文融合纽带

  大数据技术对自然世界及人类思想、行为的数据化,将自然、社会和人类思维映射为一个由数据构成的数据世界,无论是自然科学还是社会科学,其实质都是对数据的挖掘、计算和预测。大数据精准刻画了人类行为,精细地记录了我们每一个历史瞬间,因此大数据将成为对人类行为科学描述的新工具,让社会科学能够像自然科学一样客观记录和描述人类行为。自然科学通过观察或受控实验所获取的数据寻找自然规律,而社会科学有了大数据同样可以获取客观、真实、精准的数据,并通过挖掘经验数据,发现数据间的相关关系,寻找蕴藏其中的社会规律,因此社会科学与自然科学一样可以用数据的形式表征其规律,并实现算法化。更为重要的是,数据化和算法化之后,可以通过数据计算的方式实现对人类行为进行精准预测,人的未来行为会像自然现象一样可分析、计算和预测。

  综上所述,社会科学与自然科学虽然研究对象、复杂程度不同,但在大数据时代皆可以被数据化,并通过大数据来进行精准描述、计算和认知。从科学方法论角度看,它们已经建立在统一的数据密集型方法论平台上,从而实现了社会科学的可表征、可计算和可检验,长期以来被人诟病的社会科学的不可计算性和不可检验性得以克服。一旦被数据化,那么社会科学也就可以建立数据模型,并进行计算、推理等数学和逻辑操作,满足逻辑实证主义的经验化、逻辑化、数学化的要求,从而也走向科学化,由此获得了与自然科学对话的基础。

  当然,并不是说社会科学要完全改变原来的研究路径,走向自然科学化道路,恰恰相反,社会科学仍然保持着自身特色。因为大数据技术能够对原来难以数据化的符号、声音、心理等参数进行数据化,传统社会科学也将自动纳入数据化的平台。由于大数据的兴起,社会科学可以作为人文文化和科学文化的纽带,通过大数据方法论平台使两种文化进行交流、融合。

  中国社会科学网-中国社会科学报 作者黄欣荣、沈秋莲