下载安卓APP箭头
箭头给我发消息

客服QQ:3315713922
论坛 >大数据 >大数据对人文社科有用么? | 社会科学报

大数据对人文社科有用么? | 社会科学报

虎牙小月半发布于 2015-08-28 22:02查看:2544回复:13

由于研究者偏爱用大数据来研究社会,而社会也是人文社科领域研究的重点,因此大数据为人文社科研究提供了新的思想和方法,可以在人文社科领域得到广泛的应用。

 

 

工业革命以后,以文字为载体的信息量大约每十年翻一番;1970年以后,信息量大约每三年就翻一番。到如今,全球信息总量每两年就可以翻一番。著名管理咨询公司麦肯锡称:“数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于大数据的挖掘和运用,预示着新一波生产力增长和消费盈余浪潮的到来。”大数据无时无刻都在影响着我们的日常生活、国民经济、社会发展,受到社会各界的关注,如何利用这些海量数据去解决社会生活中的问题,已经成为当前研究的热点。人文社科领域重在研究并阐述各种社会现象及其发展规律,随着现实社会中数据量的剧增,比如社会化媒体,包括微信、微博、网站等,已经渗透到人们生活的各个领域,开放的群体通信和群体互动已经成社会生活的重要组成部分。人文社科领域原有的研究方法已经无法有效地处理这些数据。在过去,人文社科领域的研究常常采取抽样问卷调查、座谈、访谈等方法采集数据。然而,再好、再合理的抽样方法,反映的总是对局部和部分人群、阶层的研究结果,随机偶然性较大,准确性欠佳。如今,大数据处理技术为其提供了新的思想和方法。通过各个平台或网站的并联进行进一步分析,开展思想动态研究、行为方式分析、生活方式探索,发展趋势预测,乃至可以替代传统意义上的问卷调查而进行大规模的数据分析。通过大数据的这些相关技术挖掘社会化数据中隐藏的信息,揭示社会现象并为社会问题提供可靠的解决方案,解决了人文社科领域传统方法无法有效处理的问题。

 

数据研究的特点

用传统算法和数据库系统可以处理的海量数据不算“大数据”。维基百科中大数据的定义是,大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。比较有影响力的Gartner公司也给出了大数据的定义:大数据是高容量、高生成速率、种类繁多的信息价值,同时需要新的处理形式去确保判断的作出、洞察力的发现和处理的优化。

 

对于大数据的特征有多种观点,普遍被认可的是大数据的4V特征,即海量的数据规模(Volume)、快速的数据流转(Velocity)、多样的数据类型(Variety)、巨大的数据价值(Value)。

 

海量的数据规模是指PB级以上的数据规模。之所以会有如此大规模的数据是因为社会的现象都会被数据化。医疗卫生、地理信息、电子商务、影视娱乐等无时无刻都在产生数据,并且都可以利用设备感知并存储;快速的数据流转是指大数据的产生速度很快,传统的系统已经无法及时处理;多样的数据类型指的是大数据不仅仅包含文本信息构成的结构化或者半结构化数据类型,而且包括图片、音频、视频等非结构化数据类型;巨大的数据价值是指大数据看上去价值密度较低,但经过挖掘方法可以发现其潜在的巨大价值,对国民经济和社会发展产生重大影响。

 

相对于传统研究方法,大数据研究有以下三个特点:

 

一是重发现非实证。传统的实证研究,强调在理论的前提下建立假设,收集数据,证伪理论的适用性,采用随机抽样的定量调查问卷获取数据,验证假设,你不问的问题被访者也不会回答。这是一种自上而下的决策和思维过程。大数据时代重在发现知识,预知未来,为探索未知的社会现象带来机遇。这种预见性是一种自下而上的知识发现过程,是在没有理论假设的前提下去预知社会和洞察商业的趋势、规律。

 

二是重关系非因果。大数据重关系而不关心因果,问是什么而不问为什么是另一个重要特征。因果关系并非来自统计,而是来自研究者的理论和假设。但是大数据分析更关注数据的相关性测量和商业应用价值。大数据是发现那些不能靠直觉发现的信息和知识,甚至是违背直觉的,有时候越是出乎意料可能越有商业价值。

 

三是重预测而应用偏重于社会。预测是大数据研究的重要特征。科学重在了解而非预测,但在大数据时代,任何行业预见未来的能力都是企业的杀手锏。它用逻辑和计算取代了依赖传统和直觉的生产方式,通过大数据分析制作原创内容,因为它能先于受众知道人们想要看什么。人们津津乐道的大数据应用都是在于预知社会问题,是数据背后的人的问题,所以说大数据应用更偏重社会科学领域。

 

由于研究者偏爱用大数据来研究社会,而社会也是人文社科领域研究的重点,因此大数据为人文社科研究提供了新的思想和方法,可以在人文社科领域得到广泛的应用。

 

文社会科学研究中大数据引用

人文社科包含人文科学和社会科学,是一个非常广泛的领域,大数据逐渐成为其研究热点,尤其是在农业、医疗、金融、社会管理等方面得到了很好的应用,为社会的发展提供了很大的帮助。

 

1大数据在农业中的应用

 

农业大数据是指以大数据分析为基础,运用大数据的理念、技术及方法来处理农业生产销售整个链条中所产生的大量的数据,从中得到有用信息以指导农业生产经营、农产品流通和消费的过程大数据。在农业中的一个具体应用是Climate公司帮助有需求的农场主预测未来农作物收成与市场。

 

2大数据在医疗行业的应用

 

大数据正在快速发展,医疗行业是数据增长最快的领域。麦肯锡公司在《医疗行业的大数据革命》报告中指出:大数据将为美国节省12%-17%的医疗成本,相当于节省3000-4500亿美元。一个较早的应用是2009年谷歌利用大数据进行流感预测。具体方法是Google通过分析5000万条美国人最频繁检索的词汇,将之和美国疾病中心在2003年到2008年间季节性流感传播时期的数据进行比较,并建立一个特定的数学模型。最终Google成功预测了2009年冬季流感的传播,甚至可以具体到特定的地区和州。

 

3大数据在金融行业的应用

 

随着互联网金融的快速发展,大数据技术对我国的金融生态和格局将产生巨大的影响。目前,大数据在金融行业已经有了广泛的应用。2008年初,阿里巴巴通过对其平台上整个买家询盘数急剧下滑现象分析,预测欧美对中国的采购将下滑,提前半年时间从询盘上推断出世界贸易发生变化了。

 

4大数据在社会管理中的应用

 

在大数据时代背景下,政府部门如何创新社会管理方式、模式,加强信息化建设以适应大数据时代的需求,是亟待解决的重要课题。大数据在社会管理中将会发挥非常重要的作用,具体应用有百度迁徙项目和腾讯大数据危机预测。

 

究并非易事

如前所述,大数据研究有一些基本的特征,具体到不同的领域大数据的研究会呈现出不同的特征,人文社会科学领域中对于大数据的研究主要有以下五种特征。

1440770516119511.jpg

一是所涉及资料均大大超过一般的阅读、分析和理解所能处理的范畴,是以往“不可研究”或“难以研究”的。大数据分析方法的出现为人文社会科学提供了新的研究空间,提供了新的研究可能。

 

二是一般引入计算分析方法,其结论并非通过观察、思索、领悟等传统方法获得,而是通过大量数据的汇集而“自动涌现”,其理论的获得方法不同于传统人文社会科学研究。

 

三是均构建了可持续完善和丰富的数据采集和分析工具,其可用性、共享性、重用性、协作性大大增强,提供了人文社会科学学者大规模协作的可能。

 

四是均具有跨学科特征。数字人文研究需要汇集专业领域技能、数据管理技能、数据分析技能和项目协作技能,因而这类项目往往由跨度较大的不同学科的专业学者共同完成。

 

五是决定研究质量的主要是数据集的质量、数量和利用方式。

 

然而,由于大数据所具有的特征,大数据研究并非易事,其难点主要体现在以下三个方面。

 

首先,传统的存储结构需要升级为扩展性的存储架构,否则无法适应现有的大数据存储,同时,对于分布式的文件系统,需要进行实时的流处理,而“传统的数据分析更多的是结构化,数据量是有限的,集中式处理、批量处理,也无法满足需要”。

 

其次,没有速度,再有价值的大数据也只能是一堆无法流通的钞票。凭藉传统的数据分析能力,无法处理这么大量的数据。

 

最后,由于分析手段的限制,取样时的样本数不够大,不能充分利用所有的数据,无形中破坏了信息的完整性;由于受限于分析能力而无法获取复杂问题的答案;由于受限于时间而不得不采用某项简单的建模技术,同样,也是由于没有足够的时间来执行多次迭代,不得不对模型净度进行妥协。

 

可见,大数据在人文社科领域的研究还在发展阶段,还需要继续研究新的处理方法和思想,为该学科的发展提供新的动力,并应用到现实以推动社会的发展。

 

收藏(0)0
查看评分情况

全部评分

此主贴暂时没有点赞评分

总计:0

回复分享

共有13条评论

  • 酸酸~甜甜
  • 课课家团队03
  • Real Madrid
  • 药师
  • 慧星的那一夜
  • Mr ken
  • YUI
  • cappuccino
  • mr jack
  • Mright
  • love洒脱留守
  • 课课家技术团队1
  • 选择版块:

  • 标题:

  • 内容

  • 验证码:

  • 标题:

  • 内容

  • 选择版块:

移动帖子x

移动到: