浙江在线4月11日讯(浙江在线记者 申思婕 通讯员 王肖波)“我们在这里采集,结果能直接转化成文字,保证了档案的原始性……”今天上午,一批以人工智能技术为支撑的“讯飞档案机”在浙江省档案馆亮相,产品经理李衍的口述介绍,实时地在屏幕上转化成了文字。
这些档案机是国家级AI+档案联合实验室(以下简称“实验室”)的落地转化成果之一,以档案信息安全为基础,具备高等级保密性,可随时随地进行口述史的征集整理、重大活动全过程记录建档。
讯飞档案机
去年4月,国家档案局档案科学技术研究所和科大讯飞股份有限公司联合成立实验室。今天,浙江省档案馆与实验室签订战略合作协议,并为“国家级成果应用示范基地”揭牌,标志着“AI+档案”实现了技术研究到成果应用的质变。合作后,实验室将利用自身的技术、人才、产品、服务等核心优势,浙江省档案馆提供权威、专业的档案管理研究资源支持,双方共同制订“AI+档案”科研成果应用及推广的可行性方案规划设计,创新档案管理工作模式,提升“智慧档案”建设水平。
国家级成果应用示范基地揭牌
浙江省档案馆副馆长郑金月介绍,人工智能语音设备在声像档案整理、开发、保护中有非常大的作用。“以往音视频档案的整理查询是非常困难的。现在,人工智能设备可以快速地将音视频转化成文本,输入关键词就可以查找对应的音视频。并且,人工智能可以识别手写的文件,为民国等时期手写的档案数据化提供了便利。”
郑金月说,人工智能设备的引入,对大众来说也是一件好事,主要体现在档案开放前的鉴定工作上。“群众比较关心档案的开放问题,但哪些档案能够开放,每一章节都需要鉴定。一份100万卷的档案,其页数往往上亿,以往人工鉴定的工作量非常大,如今机器协助人工档案鉴定,效率将大大提高。”
据李衍介绍,此次亮相的档案机,与普通的语音识别设备主要有两方面区别,第一是训练了档案方面的专业词汇,比如历史名词、地名、人名,在专业方面识别更精准;第二是区别于普通的联网设备,档案工作因为涉密,不能接入云端,所以这些档案机都是不联网的,具有保密性。
目前,实验室利用智能语音识别和实时转写技术,已经实现了口述征集、智能语音档案著录、音视频数字档案检索利用等革命性成果,通过OCR技术识别(光学字符识别)技术,可以实现民国繁体文书类档案识别率85%以上,达到可用级别。这些技术的运用使得档案工作整体效能提升40%以上。