一、CNMARC到USMARC数据自动转换系统(论文文献综述)
程颖,张耀蕾,刘孝平,凃艳玲[1](2021)在《中文图书书目记录上传WorldCat实践》文中进行了进一步梳理馆藏资源书目记录上传至WorldCat可大力提升图书馆馆藏在全球的显示度。武汉大学图书馆已成功将997892条中文图书书目记录上传至WorldCat。基于该项目的实践,文章研究了书目记录上传时面临的困难、挑战及解决对策,并分三个阶段详细介绍了项目实施过程与实践经验,重点介绍了记录格式批转换的方法,以期为其他图书馆上传书目记录提供参考与借鉴。
谢平凡[2](2016)在《医学生图书借阅行为的数据挖掘 ——以广西医科大学图书馆为例》文中研究指明目的:利用数据挖掘统计的方法,研究2014—2015学年广西医科大学在校学生借阅校图书馆藏书的历史数据,进而掌握医学生借阅馆藏图书的行为习惯和规律,为优化图书馆的读者服务和资源配置提供参考。方法:收集学籍信息,图书馆读者信息、馆藏图书信息、2014—2015学年借阅图书信息等相关数据,对收集的数据资料进行数据集成、数据清理、数据转换等数据准备预处理。(1)运用聚类分析的方法将读者先按借阅量聚分为3类,然后统计分析研究生、本科生、大专生读者群体在3个分类中的分布情况;统计分析男生和女生在各个聚类中的分布情况;统计分析不同年级的学生在各个聚类中的分布情况;(2)将借书时间和还书时间细分为工作日、休息日两个类别,运用聚类分析的方法将借还时间聚分为5类,分析工作日、休息日中读者借还的实际情况;(3)运用聚类分析的方法将图书按图书出借量聚分为3类,然后统计分析不同分类(按中图分类法划分)的图书在3个聚类中的分布情况。结果:(1)该校学生在2014—2015学年里平均在图书馆借阅6. 2本图书,借阅0本图书的学生比例为42.0%,借阅1至13本图书的学生比例为42. 9%;本科生、研究生、专科生的人均借书量依次为7. 9本、6.1本、3.9本;女生人均借书量为6. 7本书,男生人均借书量为5.1本书;一至五年级学生人均借书量依次为7. 8本、7. 3本、5. 6本、4. 4本、2. 1本。(2) 8:00——10:36借书量比例为9.0%,10:37——12:00借书量比例为20. 4%,14:30——18:13借书量比例为19. 9%,18:14——20:26借书量比例为18. 9%,20:27——22:00时间段借书量比例为31.8%。(3) R(医药卫生)分类出借量比例为47.8%、1(文学)分类出借量比例为18.3%、H(语言)分类出借量比例为11.0%、Q(生物科学)分类出借量比例为4.0%; I(文学)类平均出借量7.0本,B(哲学)类平均出借量7. 9本。结论:(1)该校学生借阅馆藏图书的数量偏少,不借阅或少量借阅馆藏图书的学生比例较大;本科生、研究生、专科生借阅馆藏图书的积极性依次降低;女生借阅馆藏图书的状况优于男生;一至五年级学生到图书馆借阅图书阅读的积极性依次降低。(2)中午和晚上距离下班前的1.5小时里借书量最大,早上开馆后的2. 5个小时里借书量最小。(3)该校学生较感兴趣的图书分类依次为R(医药卫生)类、I(文学)类、H(语言)类、Q(生物科学)类,大多数学生的借阅目的是为了辅助自己的专业课程、外语的学习和提升自己文学方面的修养。
贾君枝,白林林[3](2015)在《关联数据中CNMARC到MARC21的映射实现》文中研究指明CNMARC和MARC21在内容上基本一致,这为两者建立映射提供了可能。但由于二者在信息资源划分、字段指示符赋值、子字段数据元素设置及赋值方面存在差异,因此按照功能将数据划分为资源标识符、题名、个人和组织名称、版本出版丛编说明、附注、主题分析、款目连接字段7个部分,分别讨论各个字段的对应情况。在今后的修订中,CNMARC应该注重数据元素来源的规范性和数据元素之间的关联,以加快图书馆数据向关联数据迈进的步伐。表7。参考文献15。
艾金勇,陈小莹[4](2015)在《USMARC和CNMARC在西文编目中的异同分析》文中提出文章通过对USMARC和CNMARC两种格式在国内西文编目中的异同分析,比对了两种着录方式在着录用标识符号、格式设计以及着录内容上的一些不同,对西文图书编目中着录数据的规范化以及促进西文编目格式的统一化进程做了一些积极的尝试。
马卓[5](2014)在《图书馆日文编目系统优化探讨》文中指出图书馆自动化、网络化的发展促使图书馆在图书编目工作上发生了重大改变,但日文图书编目与中西文编目相比仍然比较薄弱。通过对图书馆群的调查和查找相关文献,论文介绍各馆当前应用的日文图书编目系统和MARC格式的使用情况,结合日文图书编目的工作实践,以辽宁省图书馆为例阐述日文图书编目在套录数据时存在的局限性以及自编数据遇到的实际问题,以此探索日文图书编目业务的建设和发展。
李亚斌[6](2014)在《昆明冶专图书馆用户数据与MARC数据转换系统的设计与实现》文中进行了进一步梳理本文从数字化图书馆国内外研究现状和昆明冶专图书馆现相关业务开展的情况入手,分析了图书馆图书流通数据处理、图书数据筛选、用户信息维护等问题,结合目前昆明冶专图书馆相关业务中遇到的问题作为出发点,从昆明冶专图书馆近十年来引入的一系列图书业务管理信息系统应用中出现的各系统间数据处理、筛选和用户信息维护等问题。从需求到开发阶段对用户数据和MARC数据进行分析,并采用了面向对象的开发方法,对各功能模块进行详细的分析设计和细化,方便最终的功能调用。主要从系统需求、设计和开发三个方面进行了考虑:(1)学校图书馆业务流通系统在设计初期未考虑MARC数据转换处理的问题,本系统通过对业务工作的需求分析,通过实现MARC数据与Excel数据相互转换与批量处理的功能,方便了后期与各方的数据交换工作。(2)由于图书馆业务的特殊性,对图书的快速的查重能够为图书采购提供详实的数据支撑和参考,通过系统设计完成对图书数据的比对与快速的查重处理。(3)图书馆内部使用各类信息管理系统间需要进行大量的数据转换和导入工作,系统设计能够针对不同系统不同用户实现快速格式的转换工作。系统开发使用wxPython进行了UI界面的开发,并根据需求开发相应的功能模块,调用Python相应的类库完成系统开发,并且融合了MS SQL Server数据库和Access数据库等数据库的支持。系统开发的目标是满足学校图书馆业务处理的特殊需求,建立高效的数据转换平台。通过对系统的实现和应用,方便了学校图书馆与校外合作书商间的数据交互工作,管理员可以结合自己业务需求对相关的数据进行批量的修改,对编目数据的格式进行快速的对接转换,在现场采购和图书馆电子清单采购过程中能够对书目信息数据进行筛查,并实现Excel格式和MARC格式的信息数据的查重。图书管理员针对不同格式信息系统的需求,利用学校一卡通数据服务器中的用户信息进行导入,并通过本系统进行用户数据格式的转换操作。最终是使得工作量减少,工作效率提升,工作质量提高,并解决了目前学校各系统间数据对接通用性差的问题。
艾金勇,陈小莹[7](2014)在《西文编目中的CNMARC到USMARC转换系统的设计与实现》文中进行了进一步梳理在分析编目数据从CNMARC格式到USMARC格式自动转换可行性的基础上,研究了两种MARC的字段和字符内容对应关系,找出其中的对应规律,编制出转换关系对应表,设计了西文编目中的CNMARC到USMARC的转换软件,实现了两种MARC格式的平滑转换。
艾金勇,陈小莹[8](2014)在《西文编目中的两种MARC格式的转换方法研究》文中研究表明文通过对国内西文编目中存在的USMARC和CNMARC两种格式的比较研究,对比分析了两者在着录用标识符号、格式设计以及着录内容上的一些主要差异,为西文图书编目中着录数据的规范化以及两种数据格式之间的自动转换系统的研究进行了有益的探索。
真溱,汤珊红,许儒红[9](2012)在《信息组织技术发展现状与趋势》文中认为信息组织是信息机构开展的一项关键基础工作,一直以来都受业界和学界的广泛关注。文章主要对信息组织技术体系的构成进行了梳理,对目前技术的热点研究问题进行了阐述,并就信息组织技术的发展现状和趋势进行了探讨。
余敏[10](2011)在《从CNMARC到MARC21数据转换研究》文中研究表明在分析编目数据从CNMARC向MARC21格式自动转换可行性的基础上,提出自动转换映射表,并对数据转换中遇到的问题进行分析。
二、CNMARC到USMARC数据自动转换系统(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、CNMARC到USMARC数据自动转换系统(论文提纲范文)
(1)中文图书书目记录上传WorldCat实践(论文提纲范文)
1 实践及研究现状 |
2 面临的困难及对策 |
2.1 项目组织 |
2.2 格式批转换 |
2.3 数据维护 |
2.4 数据存储 |
3 实施过程 |
3.1 第一阶段:格式批转换前对数据的预处理 |
3.1.1 制定格式转换规则 |
3.1.2 提取有效记录 |
(1)分割记录文件。 |
(2)过滤语种。 |
(3)提取有效馆藏。 |
3.1.3 批转换前的数据清理 |
(1)清理记录着录问题。 |
(2)将CNMARC中全角符号和阿拉伯数字改为半角。 |
(3)修改OCLC不兼容字符。 |
(4)可提前处理的转换规则先执行。 |
3.1.4 批量生成拼音 |
3.2 第二阶段:格式批转换 |
3.2.1 格式批转换 |
(1)多对多字段的映射。 |
(2)中西文内容的分割。 |
(3)子字段间标识符的生成。 |
3.2.2 批转换中的数据维护 |
3.3 第三阶段:记录上传 |
3.3.1 批转换后的数据完善 |
3.3.2 正式上传记录 |
3.4 实施效果 |
4 结语 |
(2)医学生图书借阅行为的数据挖掘 ——以广西医科大学图书馆为例(论文提纲范文)
个人简历 |
摘要 |
ABSTRACT |
1 前言 |
1.1 研究背景及意义 |
1.2 研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 技术路线 |
2 数据挖掘原理 |
2.1 数据挖掘的理论概述 |
2.2 数据挖掘的任务 |
2.3 数据挖掘的常用分析方法 |
2.4 数据挖掘的主要过程 |
2.4.1 数据准备 |
2.4.2 数据挖掘过程 |
2.4.3 结果表达和解释 |
2.4.4 模式评估 |
2.5 K-means算法的基本原理 |
2.6 统计学方法 |
3 图书借还资料的数据挖掘分析 |
3.1 数据准备 |
3.1.1 数据收集 |
3.1.2 数据转换 |
3.1.3 数据清理与集成 |
3.2 关于读者的聚类挖掘 |
3.2.1 不同学历层次读者聚类后的分布情况 |
3.2.2 男生读者、女生读者聚类后的分布情况 |
3.2.3 不同年级读者聚类后的分布情况 |
3.3 关于借阅时间的聚类挖掘 |
3.3.1 工作日借阅时间聚类分析 |
3.3.2 休息日借阅时间聚类分析 |
3.4 关于馆藏图书的聚类挖掘 |
3.4.1 高频率出借图书在中图分类法各分类中的分布情况 |
3.4.2 中频率出借图书在中图分类法各分类中的分布情况 |
3.4.3 低频率出借图书在中图分类法各分类中的分布情况 |
3.4.4 出借图书按出借量从高到低排序 |
4 讨论 |
5 总结 |
参考文献 |
综述 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文 |
(3)关联数据中CNMARC到MARC21的映射实现(论文提纲范文)
1 CNMARC与MARC21的映射对应 |
1.1 资源标识符 |
1.2 题名 |
1.3 个人和组织名称 |
1.4 版本、出版、载体形态、丛编说明字段 |
1.5 附注 |
1.6 主题检索 |
1.7 款目连接 |
2 CNMARC元数据与MARC21元数据映射过程中的问题及解决方法 |
2.1 字段 |
2.2 字段指示符 |
2.3 子字段指示符 |
2.4 无法对应的数据 |
3 结语 |
(4)USMARC和CNMARC在西文编目中的异同分析(论文提纲范文)
0 引言 |
1 USMARC 和 CNMARC 的简单介绍 |
1.1 不断完善的 USMARC |
1.2 我国机读目录格式 CNMARC |
2 USMARC 与 CNMARC 西文编目中主要差异的对比 |
2.1 着录用标识符号的处理 |
2.1.1 CNMARC 的处理方式 |
2.1.2 USMARC 的处理方式 |
2.2 格式设计上的主要差异 |
2.2.1 头标区的差异 |
2.2.2 定长数据元素的不同 |
2.2.3 其他字段着录的差异 |
2.3 内容描述上的差异 |
2.3.1 固定元素代码的差异 |
2.3.2 指示符 |
3 结语 |
(5)图书馆日文编目系统优化探讨(论文提纲范文)
1 日文图书编目系统和MARC格式使用情况 |
1.1 国家图书馆应用ALEPH系统的USMARC |
1.2 南京地区图书馆使用汇文系统 |
1.3 辽宁省图书馆使用ILASII系统、CNMARC格式 |
1.4 INTERLIB系统 |
2 日文图书套录数据的局限性 |
2.1 需要删除的内容 |
2.2 需要修改的内容 |
2.3 需要添加的内容 |
3 日文图书自编数据的实际问题 |
4 日文图书编目采用何种MARC格式 |
5 日文图书编目采用何种分类法 |
(6)昆明冶专图书馆用户数据与MARC数据转换系统的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 选题背景 |
1.2 国内外研究现状 |
1.2.1 国外图书馆信息管理研究情况 |
1.2.2 国内图书馆信息管理研究情况 |
1.3 本文主要工作 |
1.4 本论文的结构安排 |
1.5 本章小结 |
第二章 系统实现相关理论和技术 |
2.1 管理信息系统 |
2.2 MARC数据技术分析 |
2.2.1 MARC元数据概述 |
2.2.2 MARC的优缺点 |
2.3 PYTHON语言 |
2.3.1 PYTHON语言概述 |
2.3.2 WXPYTHON |
2.4 数据库技术 |
2.5 本章小结 |
第三章 系统分析与设计 |
3.1 可行性分析 |
3.1.1 经济可行性分析 |
3.1.2 技术可行性分析 |
3.1.3 系统实施可行性分析 |
3.2 需求分析 |
3.2.1 系统需求分析 |
3.2.2 系统数据流图 |
3.2.3 系统用例图 |
3.2.4 系统时序图 |
3.2.5 系统E-R图 |
3.3 系统总体架构 |
3.4 系统功能模块分析与设计 |
3.4.1 MARC与EXCEL数据转换 |
3.4.2 MARC数据处理 |
3.4.3 数据查重功能 |
3.4.4 用户数据转换功能 |
3.5 数据库连接 |
3.6 本章小结 |
第四章 系统实现 |
4.1 系统编码规范 |
4.2 系统用户界面 |
4.3 数据处理实现 |
4.3.1 数据转换实现 |
4.3.2 MARC文件处理实现 |
4.3.3 数据查重实现 |
4.4 用户数据处理实现 |
4.5 本章小结 |
第五章 系统测试及结果分析 |
5.1 测试用例设计 |
5.1.1 黑盒测试 |
5.1.2 白盒测试 |
5.2 面向对象的软件测试 |
5.2.1 面向对象分析测试 |
5.2.2 面向对象设计测试 |
5.2.3 面向对象编程测试 |
5.2.4 面向对象单元测试 |
5.2.5 面向对象集成测试 |
5.2.6 面向对象系统测试 |
5.3 软件测试的种类 |
5.4 图书馆用户数据与MARC数据转换系统测试 |
5.4.1 运行环境 |
5.4.2 基本业务流程运行及系统测试情况 |
5.5 结果分析 |
5.6 本章小结 |
第六章 结论 |
6.1 本文的主要贡献 |
6.2 下一步工作展望 |
致谢 |
参考文献 |
攻硕期间取得的研究成果 |
(7)西文编目中的CNMARC到USMARC转换系统的设计与实现(论文提纲范文)
1. 引言 |
2. 系统实现的可行性 |
3. 转换系统的设计和实现 |
3.1 转换系统的流程分析 |
3.2 必备字段的选择 |
3.3 转换对应关系表的设计 |
3.3.1 字段对应关系表的设计 |
3.3.2 字符内容转换表的设计 |
3.4 CNMARC数据的校对与规范 |
3.5 转换程序设计与实现 |
4. 结束语 |
(8)西文编目中的两种MARC格式的转换方法研究(论文提纲范文)
一、引言 |
二、usmarc和cnmarc的简单介绍 |
(一) usmarc的介绍 |
(二) cnmarc的介绍 |
三、usmarc与cnmarc机读格式的比较 |
(一) 记录头标区的差异 |
1、数据类型上的不同 |
2、数据内容的差异 |
(二) 目次区数据的处理 |
(三) 可变长字段格式的比较 |
1、格式设计上的不同 |
2、数据内容上的差异 |
3、特殊情况的处理 |
四、结语 |
(9)信息组织技术发展现状与趋势(论文提纲范文)
1 信息组织技术体系构成 |
1.1 信息资源描述技术的构成 |
1.1.1 信息资源编目技术 |
1.1.2 信息资源元数据技术 |
1.2 信息资源标引技术的构成 |
1.2.1 分类模式 |
1.2.2 关联组织模式 |
1.3 信息资源封装技术的构成 |
2 信息组织技术研究热点 |
2.1 信息资源描述技术的研究热点 |
2.1.1 FRBR |
2.1.2 FRAD |
2.1.3 FRSAD |
2.1.4 RDA |
2.2 信息资源标引技术的研究热点 |
2.2.1 众分表 |
2.2.2 本体 |
2.2.3 标引工具互操作 |
2.2.4 受控词表标准 |
2.3 数字信息资源封装技术的研究热点 |
2.3.1 开放档案信息系统 (OAIS) |
2.3.2 元数据编码和传输标准 (METS) |
2.3.3 Electronic Publication (EPUB) |
2.3.4 WARC |
3 信息组织技术的发展现状及趋势 |
3.1 着眼资源获取, 描述技术更加强调为用户提供便利 |
3.1.1 用新的理论方法支撑描述技术 |
3.1.2 元数据互操作从理论走向实践 |
3.2 着眼海量资源组织, 标引技术更加强调网络化发展和互操作研究 |
3.2.1 传统标引工具的电子化、网络化 |
3.2.2 标引工具的互操作研究愈加得到重视 |
3.2.3 相关标准规范促进标引工具互操作 |
3.3 着眼长期保存, 封装技术更加强调新标准应用和封装对象的多元化 |
3.3.1 新的标准规范得到广泛应用 |
3.3.2 封装对象朝细粒度、多元化方向发展 |
附本文缩略语 |
(10)从CNMARC到MARC21数据转换研究(论文提纲范文)
1 自动转换的可行性 |
2 自动转换的实现 |
3 存在问题以及解决对策 |
3.1 数据调用的选择 |
3.2 数据的程序添加 |
3.3 符号的程序添加 |
3.4 主要款目的处理 |
3.5 个人责任者的分词处理 |
3.6 拼音库的不断完善 |
3.7 交替图形文字表示 |
4 结语 |
四、CNMARC到USMARC数据自动转换系统(论文参考文献)
- [1]中文图书书目记录上传WorldCat实践[J]. 程颖,张耀蕾,刘孝平,凃艳玲. 大学图书馆学报, 2021(02)
- [2]医学生图书借阅行为的数据挖掘 ——以广西医科大学图书馆为例[D]. 谢平凡. 广西医科大学, 2016(02)
- [3]关联数据中CNMARC到MARC21的映射实现[J]. 贾君枝,白林林. 国家图书馆学刊, 2015(04)
- [4]USMARC和CNMARC在西文编目中的异同分析[J]. 艾金勇,陈小莹. 江苏科技信息, 2015(02)
- [5]图书馆日文编目系统优化探讨[J]. 马卓. 新世纪图书馆, 2014(11)
- [6]昆明冶专图书馆用户数据与MARC数据转换系统的设计与实现[D]. 李亚斌. 电子科技大学, 2014(03)
- [7]西文编目中的CNMARC到USMARC转换系统的设计与实现[J]. 艾金勇,陈小莹. 电脑与电信, 2014(08)
- [8]西文编目中的两种MARC格式的转换方法研究[J]. 艾金勇,陈小莹. 西藏民族学院学报(哲学社会科学版), 2014(04)
- [9]信息组织技术发展现状与趋势[J]. 真溱,汤珊红,许儒红. 情报学进展, 2012(00)
- [10]从CNMARC到MARC21数据转换研究[J]. 余敏. 图书馆论坛, 2011(03)