万方数据资源系统与中国知网数据库对比分析

发布日期:2014-03-09     编辑整理:早检测网
 

摘 要: 对万方数据资源系统和中国知网两个数据库就文献资源、数据质量、检索系统、成本、服务这5个指标做对比分析。可见:两个数据库的文献资源都十分丰富且各具特色。数据质量指标中,在数据的主题、关键词及分类标引深度方面万方数据资源系统好于中国知网。检索系统指标中,就检索系统提供的检索功能而言,则中国知网好于万方数据资源系统; 但就检索系统的稳定性而言,则万方数据资源系统又好于中国知网。成本指标中,万方数据资源系统在时间成本方面优于中国知网。服务指标中,特色服务方面则中国知网好于万方数据资源系统。对比分析有利于用户根据自身的信息需求恰当的选择数据库。

数据库因其能快、准、全地为人们提供所需信息而愈来愈被广泛使用。在我国目前被广泛使用的国产数据库有:万方数据资源系统、中国知网和维普数据库等,其中万方数据资源系统( 以下简称万方数据) 和中国知网的信息资源更加丰富。这两个数据库以其海量数据资源为基础,在提供传统的信息服务的同时,还因为用户提供信息分析、学术不端检测等增值信息服务而成为众多数据库中的姣姣者。

笔者因工作原因,几乎每天都要访问这两个数据库。在频繁访问这两个数据库的过程中发现它们各臻其美,各有所长。下面就文献资源、数据质量、检索系统、成本、服务这5个指标对这两个数据库进行对比分析。分析对比有利于用户根据信息需求恰当选择数据库。

1 文献资源对比分析

数据库的文献类型、文献量、覆盖学科、时间范围及更新周期,决定着它能否为用户提供全面的、及时的文献信息。因此,文献资源比较的指标应该包含上述各项,见表1。
    由表1可见:万方数据中学位论文、会议论文、科技成果、专利文献的收录好于中国知网; 西文期刊、西文会议、政策法规、地方志、企业信息、科技专家其独特的文献资源;同时动态提供科技动态、专题及OA论文。中国知网中学术期刊和中外标准的收录好于万方数据;图书、工具书、年鉴、报纸是其独特的文献资源;同时提供与国学宝典、哈佛商业评论、FrontiersinChina期刊数据库及Springer数据库的链接。

2 数据质量对比分析

数据库在保证数据类型多样、数据量大的同时还必须保证数据质优,只有量丰质优才能为用户提供高质量的信息。文献数据的质量应包括: 字段标引完整准确,主题、关键词标引深度高,文献保真,剔除不恰当的文献信息。字段标引完整准确,主题、分类标引深度高能够保证较高的文献检索查全率、查准率。其中,文献保真是保证全文质量与原版结构与样式不失真,清晰易读。剔除不恰当的文献信息可减少用户浏览、筛选检索结果的时间成本。如表2所示:

由表2可见,在学术期刊、学位论文、会议论文的主题标引及学术期刊的分类标引深度方面,万方数据明显优于中国知网,但两个数据库的共同缺点是,学术期刊全文数据库中均未能剔除不恰当信息。

3 检索系统对比分析

数据库中数据的质量得到保证后,衡量数据库质量的另一个重要指标便是检索软件。由于两个数据库的资源类型较多,所以,本文在进行检索系统对比分析时,仅以学术期刊、学位论文和会议论文数据库的检索软件功能做对比分析(见表3)。

3.1 统一检索平台的对比分析

3.1.1 检索方式对比分析

万方数据的查新服务中心是万方数据特有的检索方式,其特色在于能为用户推荐检索词,用户只要输入与检索课题相关的文本(例如:科学技术要点,立项报告正文等),查新服务中心便可给出推荐检索词供用户选择。

中国知网统一检索平台的引文检索、学者检索、科研基金检索、句子检索、文献出版来源是其特有的检索方式:引文检索:提供文献出版来源、国家及各级科研项目、被引频次、被引文献作者、被引文献题名、被引文献作者单位等检索入口。文献出版来源的引文检索可检索刊物所发表论文被引、下载频次情况; 国家及各级科研项目的引文检索可检索国家及各级科研项目论文被引、下载频次;通过被引频次的控制检索高质量论文;通过被引文献作者、被引文献题名、被引文献作者单位可获得作者论文、某一篇论文、机构论文的被引、下载频次。这些数据为评价文献提供依据。学者检索:通过学者姓名、工作单位、研究方向关键词、获资助国家科研基金等信息,检索学者的学科专业,发表的全部文献及其基金论文数、核心期刊论文数、第一作者篇数,论文的总被引频次、平均被引频次、总下载频次。通过点击

检索结果中的学者姓名可了解学者的研究方向等信息。科研基金检索:通过国家及各级科研项目名称,检索科研基金资助文献。通过对检索结果的分组分析可了解科研基金资助的学科范围、研究层次等信息。句子检索: 通过用户输入两个关键词,检索同时包含这两个词的句子。由于句子中包含了大量的事实信息,因此,用户通过句子检索可获取有关事实问题的答案。文献出版来源:该检索项包括学术期刊、博士学位授予点、硕士学位授予点、会议论文集、报纸、年鉴和图书出版社。通过文献来源检索可检索到其出版的所有文献,再利用分组、排序等工具,可对这些文献做进一步的分析和调研。

由此可见,中国知网的检索方式更具多样性,能更好地满足用户的多角度检索需求。

3.1.2 检索字段对比分析

万方数据统一检索特有字段为:被引用次数、有无全文。用户通过被引用次数字段的控制,可以检索到高质量的文献; 有无全文字段的控制,当用户意在检索全文时,该字段控制可排除用户未订购全文的文献的检索结果的显示,进而节省用户的时间成本。

中国知网统一检索特有字段为:全文。全文检索字段加上系统为用户提供的词频控制功能有利于用户较准确地检索稀有文献。就统一检索的检索字段而言,两个数据库是各具特色。

3.2 单库检索功能

3.2.1 检索方式对比分析 

中国知网单库检索方式比万方数据多,其中:科研基金检索、句子检索、文献出版来源是其特有的检索方式。

3.2.2 检索字段对比分析

学术期刊文献检索字段对比分析:万方数据学术期刊检索特有字段为:被引用次数、DOI(Digital Object Identifier———数字对象唯一标识符)、有无全文。DOI是数字化对象的逻辑标识符,对所标识的数字对象(如文本、图片、声音、影像、软件等),具有唯一性;且一经产生和分配就永久不变,不随其所标识对象属性(如版权所有者、存储地址等) 的改变而改变,即DOI 具有永久性。由于DOI 的唯一性和永久性,使得DOI具有追踪文献当前地址和参考文献链接的能力。因此,当用户以DOI作为检索入口,既可以得到该DOI所标识资源的完整的书目信息(文摘、题录)和文献全文,还可得到该对象所引用文献的书目及正文信息,以及所有与该资源有关的资源的URL链接,且不论这引用文献与被引文献是否在同一个数据库中或为同一个出版商所有;可以保证即使所链接的资源的存储地址或版权所有者发生变化,用户仍能找到所需的信息;因此DOI检索在网络信息检索、尤其是在参考文献链接检索方面具有很大的优势。中国知网学术期刊检索特有字段为:更新时间、来源类别;全文。更新时间检索有利于检索数据库中的最新文献,有利于反义词跟踪课题检索时避免重复检索。来源类别检索将期刊分为: 全部期刊、SCI 来源期刊、EI期刊和核心期刊。来源类别的选择有利于用户控制期刊检索范围。

学位论文检索字段对比分析: 万方数据学位论文检索特有字段为:导师、有无全文、论文类型。导师字段有助于用户从导师的角度检索学位论文,由此可了解导师所关注的学科方向和研究的主题;文献类型字段可控制检索学科论文的等级,如:硕士、博士和博士后论文。博士后论文是万方独有的学位论文类型。中国知网学位论文检索特有字段为:支持基金、目录、全文、更新时间。

会议论文检索字段对比分析:万方数据会议论文检索特有字段为:主办单位。中国知网会议论文检索特有字段为:更新时间、支持基金、会议级别、报告级别、语种、论文集名称、参考文献、作者单位; 全文。

就单库检索字段而言,中国知网的检索字段多于万方数据,有利于用户从多种检索途径检索文献。

3.3 检索控制对比分析

万方数据特有的检索控制:被引用次数。中国知网特有的检索控制:位置运算、词频控制。

位置运算控制两个检索词间的位置关系;词频控制即检索词出现的次数控制。这两种运算有助于提高检索的查准性。

3.4 检索结果显示对比分析

万方数据特有的检索结果显示:经典论文优先。经典论文优先是指被引用次数较多,或者论文发表在档次比较高的期刊上、有价值的文献排在前面。

中国知网特有的检索结果显示:被引频次、下载频次、浏览频次;研究资助基金、研究层次、文献作者、作者单位、中文关键词。

用户可通过对检索结果的排序,有效地筛选检索结果。

3.5 检索反馈对比分析

万方数据特有的检索反馈:相关博文:与用户选中的论文相关的博客上的文章。添加到引用通知:引用通知是一款新的信息服务,当用户选中的论文被其他论文引用时,用户将得到即时通知。这种服务的独到之处在于可以选中一组文献,了解它们被引用的情况以及引用变更的情况,进而及时了解所选中论文的权威性、受欢迎程度。目前该服务仅面向个人注册用户。推荐检索词:用户输入与检索课题相关的文本,系统就能为用户推荐检索词。高频关键词: 与用户的检索词相关的高频关键词。

中国知网特有的检索反馈:二级参考文献、共引文献、同被引文献、二级引证文献、同行关注文献、文献分类导航、相关期刊、评论该文献;生成检索报告。

知网节是中国知网特有的技术概念。它以一篇文献作为其节点文献,通过对与节点文献有关联的文献的链接形成知识网络,进而清晰地反映文献的继承与发展。知网节内容包括: 节点文献的题录、摘要和相关文献链接; 参考文献;引证文献(引用节点文献的文献);共引文献;同被引文献;二级引证文献;相似文献( 与节点文献内容上较为接近的文献);读者推荐文献;相关文献作者;文献分类导航。

下文仅对中国知网特有的检索反馈进行说明:二级参考文献:节点文献参考文献的参考文献,能反映节点文献的研究背景和依据。共引文献:与节点文献有相同参考文献的文献,与节点文献有共同的研究背景和依据。同被引文献:与节点文献同时被作为参考文献引用的文献,与节点文献共同作为进一步研究的基础。 二级引证文献:节点文献引证文献的引证文献,更进一步反映节点文献研究工作的继续、发展或评价。 同行关注文献:与节点文献同时被多数读者关注的文献,同行关注较多的一批文献具有科学研究上的较强关联性。文献分类导航: 节点文献的中图分类。相关期刊:当用户打开全文时,可通过点击位于全文上方的查看此篇文献的“知网节”信息,获得相关期刊显示。评论该文献:当用户打开全文时,可通过点击位于全文上方的查看此篇文献的“知网节”信息,弹出评论该文献的链接,点击评论该文献,实现用户与中国知网之间的交流。生成检索报告:仅在跨库检索时,才可生成检索报告。其中均属知网节功能。

在跨库检索得到检索结果后,可点击“生成检索报告”。检索报告页面中包含:检索用户姓名、本次检索的时间、检索输入条件、检索结果统计报表、本次检索筛选出的文献及对检索方法和结果的自我评价。

3.6 全文阅读器对比分析

对于全文数据库而言,全文阅读器能为用户提供阅读、下载、打印全文服务,同时还能为用户提供文字摘录、图像摘录及文件的格式转换服务。

万方数据全文阅读器:PDF( 全文下载支持迅雷等加速下载工具)。

中国知网全文阅读器:CAJ、PDF(全文下载不支持迅雷等加速下载工具) 。CAJ阅读器是中国知网的专用全文格式阅读器,它支持中国知网CAJ、NH、KDH和PDF格式文件阅读。

由表3及上文的对比分析可见,在检索系统的功能上,两个数据库的检索系统各有所长,但中国知网相对占有一定的优势。只可惜的是2009年以来,检索非常不稳定,常常会出现同一检索表达式检索结果不一致和检索不准确的现象。

4 成本对比分析

以学术期刊、学位论文和会议论文进行成本对比分析。如表4所示:

4.1 时间成本分析

万方数据无登录时间限制、并发用户数限制。用户不必反复重新登录或受并发用户数限制而无法打开或下载全文,因此,节省了用户的时间成本。

中国知网对用户进行登录时间限制,这常常造成用户要反复重新登录,增加了用户使用该数据库的时间成本;对包库用户又增加了并发用户数限制,常常因用户最大并发数已满,使用户无法阅读或下载全文,同样增加了用户使用该数据库的时间成本;CAJ全文偶见显示空白,同样是增加了用户的时间成本。

4.2 全文下载费用分析

4.2.1 学位论文全文 

其中,万方数据学位论文全文10元/篇;中国知网全文下载每页0. 5元。因学位论文的页数远远大于20页(20页*0.5元/页=10元),用户在中国知网中下载学位论文所要支付的费用便大大的高于万方数据(学位论文全文10元/篇),因此,当用户下载学位论文时,应选择万方数据。

4.2.2 学术期刊、会议论文全文 

其中,万方数据学术期刊、会议论文全文3元/篇;中国知网全文下载每页0.5元。当论文页数大于6页(6页*0.5元/页=3元)时,中国知网全文下载费用高于万方数据( 学术期刊、会议论文全文3元/篇),此时应选择万方数据;当论文页数小于6页时,则万方数据全文下载费用高于中国知网,此时应选择中国知网。由此可见,用户访问中国知网的时间成本较高。学位论文全文下载,中国知网的成本较高。期刊论文、会议论文全文下载,当中国知网下载费用大于3元时,则中国知网的成本较高; 当中国知网下载费用小于3元时,则万方数据的成本较高。

5 服务对比分析

两个数据库服务对比分析分为:站点动态、服务方式、在线帮助、全文付费方式、个性化服务五个指标。见表5。

从表5可知,万方数据特有的动态信息服务有:科技动态、专题;特有的全文支付方式是ilib账户、我的钱包。中国知网特有的在线帮助:意见反馈;特有的全文支付方式是神州行卡、邮局汇款、银行电汇。中国知网特有的服务———个性化服务,包括:个人数字图书馆,个人用户可按需订制资源、检索平台、功能、情报服务;按需配置模板和显示方式。为用户提供了个性化、交互式学习研究的空间。机构数字图书馆,机构可以按需订制数字出版物超市的资源、组织各类自建资源、定制机构相关的文献、信息,并可按需选择模板和检索平台的显示方式,直接满足机构的管理、生产、经营需要。

6 结 论

通过上文的对比分析可见,两个数据库的文献资源都十分丰富且各具特色。数据质量指标中,在数据的主题、关键词及分类标引深度方面万方数据资源系统好于中国知网。检索系统指标中,就检索系统提供的检索功能而言,则中国知网好于万方数据资源系统;但就检索系统的稳定性而言,则万方数据资源系统又好于中国知网。成本指标中,万方数据资源系统在时间成本方面优于中国知网。服务指标中,特色服务方面则中国知网好于万方数据资源系统。

7 建 议

7.1 对数据进行筛选 

两个数据库目前都在追求数据的收全而轻视了数据的筛选。建议对收录的文献进行质量筛选。

7.2 对检索结果进行适度处理 

检索结果的显示可分为三种方式显示:显示全部结果,以便发现学术不端。 重复数据去重,对相同数据应当去重,以节省用户筛选数据的时间。高度相似数据去重,利于用户收集有价值的文献。

〔作者简介〕

李跃青,男,1975年生,馆员,副馆长,发表论文6篇;

孙文文,女,1983年生,助理馆员,发表论文4篇。

宋志飞,男,1982年生,助理馆员,发表论文2篇。




早检测论文检测平台

http://www.zaojiance.com

文章来源:http://www.zaojiance.com/news/newsc-detail-2014-03-09-11-35-58.html

 
标签: paperpass   paperpass论文检测   万方检测   万方论文检测   论文查重   论文检测   论文检测系统   论文检测网站   论文检测软件   

工作日:9:30-10:30
系统24小时检测
【除知网系统】

在线QQ咨询

检测客服QQ 2745439117

反馈邮箱 zaojiance@qq.com

帮助中心 如何使用早检测网

如果您有什么意见或疑问请点击下方建议