大数据化管理 大数据背景下档案管理数据化转型探析( 二 )


●电子发票是践行数据思维的典型案例。电子发票采用类似关系数据库的文件结构。这种文件只需要定义它的关键元数据和打印布局。所有发票元数据信息都以数据库的形式存储和管理。用户购买商品的发票数据自动写入数据库,成为关系数据库表文件中的数据记录。当用户需要下载和打印发票时,数据库表中的这一数据记录可以转换成PDF或JPG发票文档。以JD.COM集团为例,消费者购物后填写公司名称、手机号码、电子邮箱等与电子发票相关的信息,收货后申请开具电子发票。电子发票服务平台经过一系列上传和审核程序后,根据电子发票机制和要求,生成带有开票方签名的电子发票及其格式文件,消费者可自行下载。数据时代,很多电子文档生命周期中的管理环节,如生成、存储、保存、利用等,已经不适合遵循数字时代的思维模式,必须在数据思维框架下进行重构。
数据的广泛应用不仅改变了人们的记录方式,也革新了人们对世界的思维和视角。未来传统的档案思维也需要改革,即在重新审视档案与数据关系的基础上,建立以数据为导向的档案思维,从数据管理的角度思考档案管理。思维先行是档案部门应对大数据挑战的首要准备。
发展导向、落后需求和现实瓶颈驱动着档案资源的数字化
●推动档案管理从数字化向数字化转型的原因,既是现代科技的迭代更新,也是信息时代档案信息资源利用的现实瓶颈,即现有的数字档案资源已不能满足档案用户多样化的现实需求。我国档案数字化方兴未艾。虽然摆脱了纸质档案远程在线利用的困境,但尚未实现计算机可读、可理解的数据粒度级的管理和开发,尤其是研究用户的综合、多样化利用需求仍无法满足。任玥等学者在深入调研黑龙江省地级综合档案馆的基础上,总结出档案信息资源开发利用中存在的数据处理深度不足、档案机构数据意识淡薄、档案数据相关性低等现实问题。青岛市档案馆副馆长杨来青也立足档案工作实际,提出了档案内容的精细化管理和开发,这是档案“再信息化”战略的重要内容之一。
●利用需求与现有数字档案发展成果的不匹配,推动档案发展向数据层面转移,使得档案管理数据成为大数据时代档案发展的新方向。档案数字化的主要任务是档案内容的数字化,即把档案内容智能地分片、分解成计算机可读、可处理的数据形式,通过分片的数据和数据集来构造和重组数据之间的关系,最后对档案数据进行语义处理和可视化展示。文件内容的数字化体现在文件管理的递进层次、文件开发粒度的细化和文件内容语义关联的加强。首先,档案管理从数字化向数字化转型带来的最显著的变化是档案管理水平的进步和档案管理对象的转变,即从传统的管理文件向数据管理转变,数据处理后的档案和原生数据中的电子档案对以“档案”为管理单位的传统档案管理系统形成了挑战。其次,相对于传统纸质档案和电子档案的发展,数字化之后,档案资源的开发单位将从文档细化到内容,从语义上将内容转化为数据,档案开发的粒度将不断细化。分散在海量档案中的档案数据,通过本体、语义分析等技术,可以在更大程度上实现档案价值的深度开发。最后,归档内容数据的最终目的是利用归档数据实现海量档案中跨文件、跨卷的相关内容的关联,有利于用户检索,最终提供更好、更完整的归档服务。碎片化的档案数据需要语义处理等技术,基于语义对零散的档案数据进行分类合并,旨在突出档案数据之间的语义关联,从而优化档案的检索结果,探索档案之间的深层联系。

推荐阅读