大数据助力政治学研究

helloworld_55440973
• 阅读 610

随着信息技术迅猛发展,新型信息分析技术被应用到政治学研究中来。许多政治学研究者采用当前比较成熟的大数据爬取、大数据文本分析等技术,获取新的研究素材并进行分析整理。同时,以亿万为量级单位的大数据本身就具有政治学研究价值。可以说,大数据为政治学带来研究方法上的创新,也进一步拓展了政治学研究领域。 大数据助力政治学研究 基于大数据对网络民意进行研究。网络上有许多现成数据可以用于对网络民意和政府部门回应进行研究。一些政治学研究者常把两类网络大数据用作分析素材:一类是政府网络问政平台上的群众留言及相关部门回复信息,另一类是主流媒体网站以及微博、微信等社交媒体平台上的网民发帖信息。这些数据都可通过数据爬取技术直接获取。第一类数据经过分析处理后,可以反映群众关注的议题类型分布、政府相关部门回应的特点和问题解决程度。还可以进一步分析特定类型群体在什么时期大致提出哪些类型的诉求。第二类数据主要用于分析网民对某一具体事件的看法和态度。对微博等社交媒体的数据分析,不仅关注具体话题,还将话题和情感、偏好等因素分析相结合,呈现网络民意对某个具体事件的态度演变过程及影响网络民意变化的具体因素。可以说,网络大数据的应用极大丰富了政治学对网络民意的研究方式。

对文本转换后的大数据进行分析。在网络大数据之后,研究者尝试挖掘其他非现成的、更具独特性的大数据信息。这类信息主要有两种,一种是从公开平台获取的大数据文本。这类数据通过数据爬取技术获得,但发布这些数据的平台并非人人皆知,需要研究者去搜寻。目前,政治学研究者较多关注并取得研究进展的大数据主要有:从裁判文书网获取的司法大数据,从人大代表的议案建议库和政协委员的提案库中获得的文本大数据等。随着政府信息公开力度加大,这类可供研究的信息资源会越来越丰富。另一种数据需要先进行文本转换才可使用,如对历史资料的研究。相当数量的历史资料是以图片形式而非文本形式存在的,这就需要通过识别技术将图片信息转换为文字文本,然后进行大数据分析。这类数据的获取难度较高,不过一旦形成数据库,对政治学研究则有较大帮助。

大数据为政治学提供新的研究素材和分析技术,但并未改变政治学研究的本质。面对层出不穷的新素材和新工具,政治学研究者需要保持清醒头脑,不能陷入对数据和方法的盲目追求中。同时,应结合政治学研究本身的特点,发挥大数据技术优势,推动信息技术在政治学研究应用中取得更多突破。一是开发更多样化的大数据类型。目前,政治学研究分析的大多是文本形式的大数据。文本信息只是浩瀚信息世界中的一种,还有图片、音频、视频等大量信息类型有待开发利用。这些类型的大数据有的在商业领域已有较成熟的应用,研究者可考虑以合适方式将其应用于政治学研究。二是探索更前沿的大数据分析技术。现有的分析技术还离不开人工标注,需要政治学研究者从大数据中抽出很小一部分,对这部分数据进行人工阅读和标注,然后利用机器学习的方法,让计算机基于人工标注的数据去分析剩下的大量数据,尝试得出相应结论。由于人工标注的数量不等,分析的效果也参差不齐。在文本挖掘上,需要进一步开发更先进的技术。三是实现更复杂的大数据分析目标。现有的大数据分析主要是对数据所体现的政治现象进行描述,尚未具备解释政治现象、发现运行规律以及进行预测的功能,这需要更进一步的技术支持和研究突破。从这个角度看,大数据的开发利用在政治学研究领域还有更为广阔的发展前景。 好买网/GoodMai(www。goodmai.com)IT技术交易平台

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
4个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Java修道之路,问鼎巅峰,我辈代码修仙法力齐天
<center<fontcolor00FF7Fsize5face"黑体"代码尽头谁为峰,一见秃头道成空。</font<center<fontcolor00FF00size5face"黑体"编程修真路破折,一步一劫渡飞升。</font众所周知,编程修真有八大境界:1.Javase练气筑基2.数据库结丹3.web前端元婴4.Jav
Stella981 Stella981
3年前
Python3:sqlalchemy对mysql数据库操作,非sql语句
Python3:sqlalchemy对mysql数据库操作,非sql语句python3authorlizmdatetime2018020110:00:00coding:utf8'''
Stella981 Stella981
3年前
JS 苹果手机日期显示NaN问题
问题描述newDate("2019122910:30:00")在IOS下显示为NaN原因分析带的日期IOS下存在兼容问题解决方法字符串替换letdateStr"2019122910:30:00";datedateStr.repl
Wesley13 Wesley13
3年前
oracle查询表数据并重新插入到本表
oracle查询表数据并重新插入到本表CreateTime2018年5月17日10:30:10Author:Marydon1.情景描述查询表中数据SELECTFROMat_aut
Vitess全局唯一ID生成的实现方案 | 京东云技术团队
为了标识一段数据,通常我们会为其指定一个唯一id,比如利用MySQL数据库中的自增主键。但是当数据量非常大时,仅靠数据库的自增主键是远远不够的,并且对于分布式数据库只依赖MySQL的自增id无法满足全局唯一的需求。因此,产生了多种解决方案,如UUID,Sn
Python进阶者 Python进阶者
9个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这