档案数字化管理的多种工作特点使得档案管理工作面临着种种问题,致使数字化档案管理的进程发展受到阻碍,数字化档案管理的实际效用的发挥不佳。要使数字化档案管理工作在组织中发挥作用,就必须从发现管理问题入手进行分析,笔者根据多年工作经验,总结目前数字化档案管理工作主要的问题包括以下三个方面。
(一)档案工作人员的职业能力与数字化管理需求不匹配
现代档案管理工作要求档案管理人员拥有较高的信息技术知识,---智慧档案馆,能够妥善处理一些常见的信息文件问题,如及时处理电脑突然死机、硬盘突然崩溃的情况、对与公司加密相关的文件进行多重加密、定期、有效的对档案文件进行检查和整理等。而目前大多数单位的档案管理工作人员都存在职业能力不足的问题,---智慧档案馆,很多档案管理工作人员年龄偏大,常年工作在传统档案管理的模式下,习惯于纸质档案的管理规则和办法,---智慧档案馆方案,在传统的档案管理工作中能够---的完成工作,---智慧档案馆费用,但对数字化档案管理工作的职业能力水平相当低,这导致大多数档案管理工作人员对数字化档案管理的接受度较低,有些甚至不熟悉计算机操作,十分容易造成档案的丢失;并且工作人员在管理思想方面还停留在传统的档案管理模式中,认为数字化档案管理是“没---”的,这直接导阻碍了数字化档案管理的发展。
(1)采集
大数据的采集是指利用多个数据库来接收发自---(web、app或者传感器形式等)的数据,并且用户可以通过这些数据库来进行简单的查询和处理工作。比如,电商会使用传统的关系型数据库mysql和oracle等来存储每一笔事务数据,除此之外,redis和mongodb这样的nosql数据库也常用于数据的采集。
(2)导入/预处理
虽然采集端本身会有很多数据库,但是如果要对这些---数据进行有效的分析,还是应该将这些来自前端的数据导入到一个集中的大型分布式数据库,或者分布式存储集群,并且可以在导入基础上做一些简单的清洗和预处理工作。也有一些用户会在导入时使用来自twitter的storm来对数据进行流式计算,来满足部分业务的实时计算需求。
导入与预处理过程的特点和挑战主要是导入的数据量大,每秒钟的导入量经常会达到百兆,甚至千兆级别。
(3)统计/分析
统计与分析主要利用分布式数据库,或者分布式计算集群来对存储于其内的---数据进行普通的分析和分类汇总等,以满足大多数常见的分析需求,在这方面,一些实时性需求会用到emc的greenplum、oracle的exadata,以及基于mysql的列式存储infobright等,而一些批处理,或者基于半结构化数据的需求可以使用hadoop。
统计与分析这部分的主要特点和挑战是分析涉及的数据量大,其对系统资源,---是i/o会有---的占用。
(4)挖掘
与前面统计和分析过程不同的是,数据挖掘一般没有什么预先设定好的主题,主要是在现有数据上面进行基于各种算法的计算,从而起到预测(predict)的效果,从而实现一些高层级数据分析的需求。比较典型算法有用于聚类的kmeans、用于统计学习的svm和用于分类的---bayes,主要使用的工具有hadoop的mahout等。
---智慧档案馆方案----智慧档案馆-北京兴源科创由北京兴源科创科技发展有限责任公司提供。北京兴源科创科技发展有限责任公司是北京 北京市 ,技术合作的见证者,多年来,公司贯彻执行科学管理、---发展、诚实守信的方针,满足客户需求。在兴源科导携全体员工热情欢迎---垂询洽谈,共创兴源科创美好的未来。
联系我们时请一定说明是在100招商网上看到的此信息,谢谢!
本文链接:https://tztz345096.zhaoshang100.com/zhaoshang/277316005.html
关键词: