资源发现数智化
上QQ阅读APP看书,第一时间看更新

前言

资源发现系统是一个非常好的被广泛采用的学术资源查询系统,能够帮助图书馆提供一站式的检索查询服务,是学术图书馆提供服务的核心。而随着数据智能时代的到来,学术用户对信息资源及其服务的需求发生了较大的变化;而目前国内外图书馆资源发现系统在检索和服务方面还不能完全满足用户的需求。Google Scholar等学术检索平台的发展使得越来越多的用户转向图书馆外的在线学术平台,给图书馆资源发现系统带来了巨大挑战。

本专著研究经过用户调研与访谈、学术文献调研、实际功能使用、相关理论方法研究,发现目前国内外大多数高校所使用的资源发现系统仍然采用比较原始的检索和查询技术,无法满足用户精准化、个性化与比较智能的检索要求,同时也无法适应大数据驱动研究范式下科研工作者对各类研究所需数据的支持。因此为了适应数据智能时代学术用户对信息资源及其服务的需求,本研究基于“有数”“管数”与“用数”的数据驱动的思维方式,采用数据+智能的方法对资源发现系统进行优化和改进,这也是目前图书馆学术资源服务领域急需解决的问题。

由于资源的限制,本研究采用数据智能的方法主要在以下三方面对资源发现系统进行了优化探索,并进行了实验证明。

(1)资源发现系统资源整合:尝试构建资源发现系统与政府开放数据整合,设计统一的开放数据元数据标准,对元数据从横向和纵向两个方面展开相应的扩展和整合,并基于Elastic Search分布式搜索引擎进行了实验,证明了整合方案的可行。

(2)资源发现系统智能语义检索:建立了基于深度学习的词向量扩展的语义检索系统模型,并将该模型应用于学术资源的语义检索服务领域,即基于开源的全文搜索引擎Elastic Search构建了仿真的语义检索系统,对其语义检索效果进行分析与评估。实验结果证明可以有效提升语义检索水平。

(3)资源发现系统用户行为研究:通过对某大学的图书馆资源发现系统用户日志的处理与分析,研究了资源发现系统用户访问信息、检索行为等,并基于用户大数据构建了用户画像,为图书馆洞察学术用户行为,进而为资源发现系统的进一步优化以及提高管理决策水平提供了可靠的依据。

研究过程中采用了一些仿真实验的方法,由于无法在真实的资源发现系统上进行验证,因而得出的研究结论可以作为借鉴参考。同时由于数据智能的技术方法发展较快,本书提出的方法在实际优化工作中需要结合实际情况进行相应调整。

王仁武

2022年8月于华东师范大学