办公系统
首页  前沿聚焦   
【聚焦“互联网+”】研究生教育大数据信息资源体系构建的理念和原则
作者 : 李娟 张晓会
来源 : 中国高等教育
发布时间 : 2020-06-15
阅读次数 : 103

随着科学技术的迅猛发展,大数据作为一种以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,通过对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,能够发现新知识、创造新价值、提升新能力,进而成为新一代信息技术和服务业态,给人们认识和改造世界带来了全新的思维方式,也日益成为提高国家治理能力的重要工具。在教育领域,教育大数据也同样成为人们认识、理解和分析教育事业的工具,成为开展实时、全面、动态的教育质量常态监测的依据,有利于真实客观地表现教育质量,促进教育科学决策和综合治理能力的大幅提高。本文以研究生教育领域为例,对教育大数据采集及共享的现实情况进行分析,提出数据采集与共享的原则和思路,为进一步优化教育大数据信息资源平台建设,实现教育现代化提供参考。

教育信息化为研究生教育大数据采集与共享奠定了基础

自1978年恢复研究生招生后,我国研究生教育信息化开始启动。从单机运行起步,到1987年基于小型局域网的初级信息共享阶段,到1995年基于CER-NET(中国教育和科研计算机网)校园网的管理信息系统阶段,再到21世纪初基于互联网的管理信息系统阶段,从数据文件传递到基于C/S(客户端/服务器)和B/S(浏览器/服务器)结构的管理信息系统,实现了研究生培养单位的研究生教育管理部门(如研究生院/部/处)的内部业务数据共享(系统整合)、教育主管部门与学校之间的主要业务数据上传。教育信息化为研究生教育大数据采集奠定了良好的基层组织管理体系和技术基础及数据标准,也积累了大量宝贵的、不可再生的历史数据,后者已成为研究生教育大数据信息资源体系的重要部分。

为进一步加快教育现代化和教育强国建设,教育部于2018年印发《教育信息化2.0行动计划》,将教育信息化作为教育系统性变革的内生变量,推动教育理念更新、模式变革和体系重构。此项计划的重点任务之一就是“教育治理能力优化行动”,要求打破数据壁垒,实现一数一源和伴随式数据采集,完善数据采集标准规范,推进教育政务信息系统整合共享,实现“互联互通、信息共享、业务协同”的目标。该计划为教育大数据信息资源体系的建设提供了政策指南。

现阶段“云物移大智”(云计算、物联网、移动互联网、大数据、智能技术)为研究生教育大数据信息资源体系的建设提供了有力的客观条件和技术保障。一是“云计算”为海量数据提供了存储条件,延长了数据的生命周期,有利于提高数据使用效率;二是5G“物联网”技术使得万物互联成为了可能,为全数据的生产奠定了基础;三是“移动互联网”和“移动终端”设备的发展,为全数据的采集创造了可能;四是“大数据”技术为人们带来“全样本”理念和全新的管理模式;五是智能技术的发展使得大数据的分析处理更加智能化,将更加促进大数据的应用,提升合理预测、科学决策和精准治理的水平。但新技术也对研究生教育信息化建设,特别是数据的实时采集、安全存储、科学管理和合理利用等,提出了新的挑战。

目前,研究生教育大数据采集与共享还存在一些亟待解决的问题,如数据重复使用效率不高,数据之间缺乏共享,数据采集来源不规范,缺乏对非结构化数据的重视和采集,数据存储量有限,数据管理机制不够健全等。其中最核心的问题是数据的开放共享不足,使得数据使用者只得自行采集数据或重复采集数据。

为推动教育数据共享开放,保障公民、法人和其他组织依法获取高等学校信息,教育部依据《中华人民共和国高等教育法》和《中华人民共和国政府信息公开条例》制定了《高等学校信息公开办法》,并于2010年9月开始实施。《高等学校信息公开办法》要求高等学校依法公开“在开展办学活动和提供社会公共服务过程中产生、制作、获取的以一定形式记录、保存的信息”,从法律上对高校信息公开的内容、范围、类型予以了明确规定。

大数据时代呼唤研究生教育大数据信息资源体系建设树立新理念

当前我们处于知识经济和共享经济时代,并正在向以智能经济和数据经济为核心的大数据时代转型,富含数据的市场正在悄然兴起,数据将逐步发挥关键作用。数据共享的本质是数据资本价值的转移,而要让数据流转必须要将大数据资源的使用权和拥有权分离,在这一过程中,大数据该如何赋权、由谁赋权、以及如何创建一个有效的数据资本流通交易秩序等成为关键问题。要想解决这些问题必须转变传统观念、树立适应大数据时代全新思维模式的新理念。

一是分享理念。在传统观念下,人们倾向于构建一个“大而全”的数据中心以实现数据共享,即由数据中心统一采集数据、统一存储数据,数据中心独自掌握数据的所有权与使用权。其优点在于一家独大、什么都有,但也存在数据安全风险大、平台建设和管理的成本较高等缺陷。分享理念的核心要义是“使用比占有更加重要,分享比拥有更重要”。由此,研究生教育管理大数据资源平台建设模式可以建成一个数据连接平台,通过互联网把更多的研究生教育管理数据资源联系在一起。分享理念带来的不仅是大数据信息资源体系建设模式的改变,也构建了一种新型的大数据经营管理模式,即从“集中式”独家经营到“分散集中再分散”的共建共管式经营,反映出数据的生产、采集、与转移流动过程是从“分散”(各个参与者分别生产、采集、建设各自的数据资源)到“集中”(从各参与者自下而上汇聚到共同的数据连接平台)再到“分散”(各参与者从上述平台下载各自所需)的过程。在这种新型管理模式下,数据安全的风险从独立承担变为共担,降低了平台的建设成本和管理成本,凸显出共享经济时代的特征。

二是跟踪理念。研究生教育大数据贯穿研究生教育全过程,大数据的采集也必须跟踪研究生教育中的每一次活动、每一个人。教育大数据必须要着眼于未来,特别是涉及人才培养质量的评价,通常需要人们站在历史的角度,以五年、十年甚至更长的时间长度来反馈分析。这就要求大数据信息资源体系的建设必须考虑其他利用者潜在的需求,并利用大数据技术为每个学生“画像”,使得个性化教育如因材施教、因势利导、循序渐进等成为可能。

三是合作理念。“合作”体现在利用各种已有的资源,通过“云物移大智”等新技术,将原先难以共享的数据资源进行整合、连接成数据连接平台。这个过程不是对现有资源建设体系的“颠覆”,也不用新建一个专门的数据中心,而是在已有基础上的整合、升级,可以节约大量的建设成本,尽可能地发挥现有数据资源和历史数据的价值。更为重要的是,这种“合作”模式是基于参与各方的合同约定,能够有效化解现行政策下法律义务不尽完备的风险,为推动数据共享共建提供有益经验。

四是众筹理念。“众筹”是共享经济时代最为显著的特点。众筹的目的一是资金众筹,体现出“众人拾柴火焰高”;二是个性化定制,即顾客参与制造,从而改变设计、生产、销售全生产链。对于研究生教育大数据信息资源体系建设过程来说,众筹有利于筹措资金,需要把不同利益相关者的不同需求尽可能地融入到每一个数据的生产和采集过程中,故有必要对研究生各项业务流程根据数据利用者的需求进行重新梳理和再造。

研究生教育大数据信息资源体系建设应遵循的原则

依据“分享、跟踪、合作、众筹”的理念,在数据采集和共享的具体过程中需遵循以下原则:

一是“以我为主、兼顾利他”原则。所有数据的采集都不会是“漫无目的”的。研究生教育大数据信息资源体系建设的目的是要满足数据采集者自身的使用需求,同时要保证数据能够实时更新,因此,数据采集必须遵循“以我为主,谁生产、谁采集、谁维护”的原则。但利己同时必须兼顾利他,才能提高数据利用价值,这就要求尽可能一次性地采集较为齐全的信息,体现大数据的“全方位、全样本”的资源特性;同时必须建立跟踪反馈机制,以提高数据使用效率。

二是“数据结构完整性”原则。从信息科学来看,数据分为结构化数据和非结构化数据。研究生教育中的结构化数据有研究生的基本信息、课程成绩等,这些结构化数据便于统计分析。但结构化数据可以说明研究生教育当前状态,却无法解释这种状态是如何产生的。非结构化数据包括研究生培养全过程中的信息,涵盖文字、图片、音频、录音等多形式,如开题、答辩、实习甚至参加课外活动等关键环节的照片、音频、视频,以及学术论文、专家评阅意见等资料。这些非结构化数据能够全面地体现出学生的个性特征以及学习过程等内容,有利于较为准确地解释学习效果、培养质量的产生过程。可见,结构化数据可以“知其然”,主要用于定量研究;而非结构化数据可以“知其所以然”,更有利于开展质性研究,对于后续大数据分析、判断、预测和决策具有重要意义。因此,在教育大数据信息资源体系建设中应尽可能地收集非结构化数据和半结构化数据。但是,相对结构化数据来说,非结构化数据常常难以控制、更难以再现,必须有意识地在数据产生时进行采集。

三是数据标准规范“统一性”原则。统一的数据标准和采集规范是数据共享的前提,需要国家层面提前做好顶层设计。虽然目前各部门尚无统一的数据标准,且历史数据也不尽规范,但当下可以依据《中华人民共和国档案法》的要求,依托电子文件及档案的国家标准,从教育类电子档案的建设开始,逐步将分布于各部门的数据统一规范。

四是数据价值鉴定原则。数据作为一种资本,只有使用才具有价值;但只有有价值的数据才可以被使用,而且很多数据是一次性、不可再生的,因此有必要在数据采集前、共享前和清理前,对数据价值进行鉴定。由于多数情况下数据的使用者与利用者分离,因此必须建立科学和明确的价值鉴定制度,遵循利己也利他、完整性和统一性等原则,才能提高数据生命质量。

建设研究生教育大数据信息资源体系的方法

第一,要建立统一的数据标准和规范的数据交易体系。一是要将公共机构的数据标准和统计标准体系,特别是将一些具有共性的关键数据标准上升为国家标准,并由国家强制实施。二是要建立大数据市场交易规范,以统一标准来培育大数据交易市场、以基本规范来提升市场服务能力和大数据行业管理水平,从而支撑大数据行业发展。

第二,要加快法规制度建设,明确数据生产、管理、利用全链条上各个主体之间的关系并赋予其明确的权利、义务与责任。建议进一步修订《高等学校信息公开办法》,明确教育主管部门、高校及市场各个主体对于各类数据的各种权限范围,以充分调动和激发高校主体对于数据开放共享的内生动力;同时健全完善数据开放、保护等制度,确保在风险可控原则下最大程度开放。

第三,要完善组织实施机制,再造业务流程。国家要率先着手建立大数据发展、应用的统筹协调机制;高校则要从利他角度出发,加强精细化管理、梳理重构业务流程;共同推动形成大数据产业链职责明晰、协同推进的工作格局。

第四,要培育健全大数据市场发展机制,促进数据资源流通。国家应鼓励社会资本参与大数据信息资源体系建设,同时鼓励高校与高校之间、高校与第三方平台之间的数据交换和交易,试点探索建立健全数据资源交易的机制,引导、规范各市场主体的数据交易行为。

总之,国家层面要尽快制定标准规范和法律法规,以明确数据生产、流通过程中各个主体的责权利;学校层面则要发挥主动性,充分认识数据的价值,以及数据平台共享共建的重要性与发展趋势,树立新理念、遵循新规则,积极参与到研究生教育大数据信息资源体系的建设中来,实现共享、互惠、互利,开创教育现代化新局面。(中国高等教育2020年第2期 作者单位为北京工业大学)

责任编辑 : 范卫波

邮箱:lgwindow@163.com

xinwen@sdut.edu.cn

欢迎大家通过本网投稿系统,提供新闻线索和稿件。

网站管理:山东理工大学党委宣传部