温州档案馆
围绕温州洞头区档案工作数字化转型,协同推进省档案数据共享中心建设,打造洞头区专题档案管理利用场景应用。针对多部门、多场景的系统性复杂档案利用需求,基于OCR和NLP等先进技术,对档案实现智能聚类,快速精准提供分类科学、针对性强、内容翔实、利用价值高的档案专题数据集合,服务政府部门决策,为全区经济社会发展贡献档案力量。
一、系统架构

二、完成目标
• 建设档案数据库、NLP数据模型、智能聚类、智能标签、专题任务管理等功能模块,可通过训练机器学习模型来实现机器智能辅助档案精准分类。
• 能够不完全依赖关键词,以主题为导向的档案筛选聚合,同时实现大编目将档案通过智能分类导入所建主题中。
• 以专题数据筛查归集为目标,协同全区机关单位实现专题任务同步、数据筛查、数据归集。
三、系统特点
• 基于NLP相关技术实现档案特征值提取、向量计算、高频词统计。
• 基于NLI的零样本分类模型,通过训练机器学习模型实现分类预测。
• 基于opensearch的档案匹配向量化结果对比。