首页 期刊知识 期刊数据来源与处理

期刊数据来源与处理

发布时间:2022-08-09 11:08:09

1.基础数据集

期刊作为现阶段高校教学与科研的重要组成部分,在学者评价、基金申请、职称评聘等方面发挥重要作用,对其全面评价的重要性不言而喻。同时,“双一流”建设的逐步推进,需要积极探索一流成果的计量与评价分析方法。应南开大学图书馆Altmetrics研究组要求,Altmetric.com提供2016年1—12月Nature高网络关注度TOP100论文的相关数据,数据采集时间为2016年12月22日。本研究的“高网络关注度”是指论文被网络关注的程度较高,主要采用Altmetric关注度指数(Altmetric Attention Score)来衡量、排序,在一定程度上反映了网民对论文的参与度,而“参与”包括论文被阅读、下载、引用,被在线社交媒体、博客、新闻媒体提及,在学术书签(如Mendeley,CiteUlike,F1000Prime等)被收藏、推荐等。Altmetric.com有关于各指标所占权重的详细评分算法。

2.数据组合与软件应用

Scopus数据库是目前全球规模最大的引文数据库,收录了5000多家出版社的21500多种经同行评议的出版物,包括期刊、会议论文、丛书、专利等。在Scopus官方网站的基本检索界面选择DOI字段,依次获取基础数据集中论文的作者、被引频次,数据采集日期为2016年12月30日,对这些异构化的数据组合进行分析。统计分析软件为IBMSPSSStatistics22.0。

3.作者分析

统计结果显示:Nature高网络参与度论文的篇均作者数为7;48篇论文的作者数量为1,6篇论文的作者数量为2,20位以上作者合著论文所占比例仅为10%;单篇论文作者数量最多为41位。值得注意的是:有1篇论文没有作者署名(doi:10.1038/538427a),本研究将其视为0个作者;有2篇文章(doi分别为10.1038/nature16549和10.1038/nature20148)不仅包括非团队作者,也包括团队作者,仅统计非团队作者数量。

4.学科分析

从学科分布来看,顶级期刊高网络参与度论文的学科分布相对均衡,其中23篇为医疗健康科学,19篇来自人文社科研究,14篇来自生物科学领域。专业基础型学科所获得的关注则相对偏少,高网络参与度论文最多的是物理学(9篇),而数学、材料学则较少(各2篇)。空间发现和环境问题也引起了许多关注,相关论文2篇。人文社科领域范围比较广泛,涵盖儿童教育、出版压力、政府政策等诸多方面。与2015年Altmetrics热点论文相比,2016年Nature的Altmetrics热点论文学科分布更加均衡,不再以生物医学论文为主导。

5.收录引用与文献类型分析

对于引文数据库来说,收录是基础,引文是基于对数据库收录文献的引用。对文献类型的分析发现,Nature文献类型不同,其收录引用差异较大。表1为2016年Nature高网络参与度论文被引用情况。从表1可以看出,Scopus数据库收录的类型为News的零引用论文占10%,有引用(被引频次不为零)的论文占25%,未被Scopus数据库收录的零引用论文占21%;Scopus数据库收录的类型为Article的零引用论文占3%,有引用(被引频次不为零)的论文占38%,未被Scopus数据库收录的零引用论文占3%。

6.Nature影响因子与CiteScore分析

2016年12月8日,Elsevier出版集团依托JournalMetrics平台衡量期刊影响力的重要指标CiteScore,目前其所涵盖的期刊数量为22618种,是《期刊引证报告》中有影响因子(ImpactFactor,IF)期刊的2倍多。Nature5年IF在40上下波动,而CiteScore仅在15上下波动,二者差异较大。

7.指标覆盖率分析

本研究中,覆盖率是指非零值文献占总文献量的比例,可一定程度上反映该指标在科学评价中的可利用价值。表2显示,所有论文均有在线关注,但关注度指数差异较大,这反映出高影响力论文的网络参与度也参差不齐,其他Altmetrics指标数值变化较大。社交媒体指标中,所有文献均在Twitter中被提及,99%的文献在Blog中被提及;在新闻报道中,98%的文献在Facebook、Google+中被提及,其他社交媒体提及率相对较低,如Reddit,覆盖率为70%,96%的文献在Mendeley上被用户保存过,99%的文献出现在新闻报道中,其他指标的覆盖率较低,如policydocuments、Wikipedia、peerreviews、videos、Q&Athreads、Researchhighlight均低于50%,甚至存在指标覆盖率为零的情况(如Weiboposts、LinkedInposts、Pins、Syllabi)。从基本统计指标来看,Blog、Facebook、Twitter、Google+、Reddit、Mendeley、newsstory具有较高的覆盖率,具有广泛代表性,可用于探讨顶级科研成果在网络上的关注程度及其传播规律。

8.标识符PubMedID、arXivID分析

PMC(Pub Med Central)是一个提供有关生命科学与生物医学的回溯性电子期刊全文数据库,由美国国立卫生研究院/国家医学图书馆创建和管理;arXiv作为开放获取的资料库,目前收录物理学、数学、非线性科学、计算机科学、定量生物学、定量金融学、统计学等学科的在线出版文献,可方便科研人员和检索论文,论文上传到arXiv,明确科研成果首发权,避免争议,推进学术传承。PMC、arXiv论文可接受同行随时随地的评论,扩大成果交流范围,对加速科学研究成果共享、助力追踪学科前沿进展大有裨益。查看Altmetric.com提供的Altmetrics数据,发现83%的Nature高网络参与度论文有Pub MedID标识符,4篇论文具有arXivID,可通过PubMed、arXiv获取这些文章的元数据。这说明这些论文在投稿至Nature前,曾在这些开放获取的在线出版平台。

免责声明以上文章内容均来源于本站老师原创或网友上传,不代表本站观点,与本站立场无关,仅供学习和参考。本站不是任何杂志的官方网站,直投稿件和出版请联系出版社。