中文文献信息检索小议

永久ppt链接https://www.kdocs.cn/l/ska2R8al65ka

这个分享是一个较为详细,但依然概括性的,表象的简体中文文献检索经验分享,当然也包含少数具有代表性的繁体中文,英文文献检索经验,主要是面向信息素养方向的,包括一些常见搜索引擎的使用,介绍一些没有使用风险的数据库与其使用方法与使用技巧,最后还有一些推定没有使用风险但自身存在版权风险的现有网站。这个分享是面向45-90分钟自由调控的,而需要15分钟的,可以移步本网站这篇文章的邻居“中文文献信息检索刍议”

先讲讲信息检索,搜索引擎,在中文领域,就是百度,如何使用百度进行搜索呢?这个问题看起来有些傻,但其实百度也有些可以说的,利用它的高级搜索功能能帮我们更准确地找出我们需要的信息

这是我截的一张图,除了我们最常用的那个蓝色的百度一下,还有哪些按钮可以帮助我们更加准确地获取信息呢?最先出现的是“一”下方的“网页”、“资讯”等选项,这些选项的作用是帮助调整百度搜索到的具体内容形式,直接百度得到的是更为通用的信息,但用这下面的得到了结果就更专一,此外还有百度的高级搜索功能,它分别能选取所搜索到信息的时间,所搜索的文件类型,比如只搜索pdf文件,和在具体的网站或类型网站中进行搜索,比如在站内搜索内填上edu.cn就是在中国所有的教育内网站中寻找信息,输入ucass.edu.cn就是在社科大网站群中寻找具体的信息。而www.ucass.edu.cn就是在社科大主网站中寻找信息

如上,百度搜索其实也有些可以讲的地方,百度还有一些命令行检索式的运用,如site:ucasser.cn,就是在本网站进行搜索,但这块其实不是很好用,因为现在的网络环境已经十分复杂了,它自己已经把最常用的搜索结果的时间、搜索文件的类型、在具体的网站中搜索已经列出来了,就也只用图形化界面的就够了。这同时也是一个引子,在对具体的学术数据库进行检索时,不要只看到它那个最显眼的检索按钮,也要去多探索探索,一般的数据库都有高级搜索功能,这能帮我们更精确,找到更具体的信息。google用法同百度,这里不作介绍。

在综合性的搜索之外值得谈的是垂直搜索,进入移动互联网时代,各大app把持了大量流量,如微博微信淘宝哔哩哔哩知乎还有一些行业应用如美团自如马蜂窝等,这些有很多时候在自己特定的领域会比百度好使,比如你如果要找明星,去打榜,那微博显然更快,去旅游,可以去携程、马蜂窝等看看别人对景点的评价,去看别人对消费场所的评价,去大众点评瞅瞅,去bilibili和知乎看一些经验教程,去淘宝除了买东西,也可以看一些东西的详细参数和具体非常容易的使用教程,因为买家给的方法总是最小白,最容易的等。这些各有各的特色,限于并非正题也不多谈,最后就是专业的论坛了,如搞破解总要去52破解逛逛,玩路由器看看恩山,国学和中国传统典籍相关去国学数典,到现在这些专业论坛由于其高度的信息专业性仍然有强大的生命力。这里还需要提及几个容易被忽略的东西
1.1688,这是阿里巴巴下的批发网站,如果有东西需要大量买或定制会比淘宝便宜一些,当然,大部分产品都是不包邮的,你得付物流费,比如我在1688买英雄墨水,一款3元/瓶,加运费划3.7,而淘宝要卖到5到6元
2.搜狗知乎,在搜狗是可以直接进行对知乎内容的搜索,不过建议去知乎网站搜
3.搜狗微信,在pc端直接对微信中的文章进行搜搜,比微信自己的搜一搜要好用些,主要pc屏大,显示内容多且进行操作更方便。
下面进行我的方法论的汇总
一般问题,认为有普遍性的问题,直接百度,如“刘备的出生日期”
比较新的知识,一些技巧的分享与物品评测,有一定指向性的东西,去垂直搜索,如“如何评价……/怎么看….”这无疑是去知乎了,“xx的评测”、“yy的教程”、“zz”的技巧,这个可以去b站,但如果,一些更专业的知识,如“红米ac2100刷机卡反弹telnet”“se2.4脱壳方法”,这类就要上到上文提到的论坛了。

最最重要的一点,在进行搜索时要注意不要使用自然语言,在一些比较基础的问题上,如“刘备的出生日期”由于百度知道的积累,可以得到较好的结果,但搜一些较为复杂的问题时搜索引擎对你想了解的问题时理解不了的,你得学会去使用这个工具,比较好的方法是进行搜索要素的叠加,例如上面提到的那个问题,采取“刘备 出生日期”的方式会使搜索引擎更容易去理解(其中的空格非常重要,这个空格在搜索引擎中代表“and”代表要在结果中同时出现上面要搜索的字符串

接着进入正题介绍学术方面,这部分每年图书馆都会进行基础介绍,在此我的特色为以社科院大学学生为主体进行介绍,且只介绍一些自己觉得重要的,其余的请自行探索,第一部分谈谈可以获取资源的途径,所列内容为社科院系、公共图书馆与网络版权风险资源,当然我也知道不少院校也给校友提供远程访问系统,所以部分硕博士可能还有原来学校的远程访问资源可以使用,大家也可以试试。好的,首先是社科院系图书馆,社科院系统有多个图书馆,拿着那张社科院蓝卡就都可以去,除了熟悉的社科院图书馆与社科大图书馆其他图书馆其实也是有特色的内网资源的,比如我去过历史研究院图书馆,内网有不少档案,虽然我不懂历史,但简单瞅瞅觉得还是不错的。主要介绍为社科院图书馆与社科大图书馆,细心的人会发现,有些数据库只能在学校访问,出了学校就访问不了了,这是因为数据库的购买者不同,所能使用的范围不同,有很多资源是由社科院图书馆进行购买的,中文数据库比如知网再就是很多的外文数据库,这些资源通过远程访问可以进行使用,而一些资源,比如书香中国又比如北大法宝少数英文资源比如westlaw这些是由社科大图书馆进行购买的,所以只能在校内外进行访问,当然,在寒暑假时,图书馆也会联系数据商提供一些短期的临时访问途径,这里需要大家留意图书馆的通知和当访问不了这些数据库时,记得看看图书馆官网lib.ucass.edu.cn中的数据库详情界面,有时候方法就会写在那里。

接着谈谈一些公共图书馆,有很多公共图书馆都提供远程办卡功能,即可使用它购买的电子资源,客观来说,在社科大可以访问到的电子资源的种类是非常多的,但是由于社科大学科众多,分摊到每一个大类学科数据库的限制就比较大了,加上比较有限的经费,整体而言资源比较匮乏(相比较sysu、pku而言,这两所高校图书馆每年经费超过一亿,接近一亿,数据来自教育部高等学校图书情报工作指导委员会官网)。因此,采取一些公共图书馆的电子资源补充是比较有意义的,这里依然偏向方法论层面,以最常见的三大中文期刊库知网、万方、维普为例,我校可以使用最普遍的知网数据库,万方和维普都有内网版数据库,但似乎已经年久失修了,而有时候又其他两个数据库又是必要的,原因在下文会谈及,这时候就需要采用公共图书馆的资源了,这里首先推荐长春市图书馆,如何注册参见这个链接,这个图书馆知网权限比我校高,有时候一些交叉学科由于知网将其划分到了自然科学或工程科技II的类别,我校图书馆无法观看,这时候就可以试试公共图书馆了,然后是西安市图书馆,这个图书馆是目前为止我发现的购买万方文献传递增强包的图书馆,万方增强版就可以文献传递中信所所收藏的学位论文,当然我校读者也有balis获取方法,下面会谈到。还有不少公共图书馆是可以远程办证的,如浙江图书馆、广西壮族自治区图书馆、重庆图书馆、贵州省图书馆、杭州图书馆等,需要大家自行探索,资源都尚可。但请记住,公共图书馆仅是社科大图书馆的补充,因为公共馆更偏向公共,所购买的学术资源是更加大众化的,只有常见的几种。

最后是网络版权风险学术资源,常见的就是一些电子书,这里就不公共讲了,可以参考我的另一篇15分钟的,向后拉就行了,列出了体量比较大的十几个。

最后是进行细分板块,我介绍最常见一般都会用到的四类资源包括,题录、期刊论文、学位论文、电子书。至于报纸,统计数据等资源由于并不是所有学科都能用到,所以学科特殊资源也请大家自行探索。

首先是题录,有些时候想要到某个具体的文章,去常用的数据库找了找没有找到,或者进行大范围的文献检索时,一个数据库是不足以满足穷尽该主题的需要,这时候就有进行题录查询的需要,以下介绍简体中文与英文的题录查询

首先要说明的是,超星公司是目前收集中文题录最全的公司,查题录这个就够了,在综合题录领域,不推荐其他产品,超星系产品,包括全国图书馆参考咨询联盟(这个数据库是对公众开放的)读秀,这个数据库我校可用,超星发现,这个数据库我校可用。第一款产品的优势是对公众开放,直接进入就可以用了,没有ip的限制,在不在校园网时想要简单看看用这个数据库就会非常方便,第二个是读秀数据库,这个题录查询数据库的优势在于它的“知识”搜索功能,这个功能就是可以搜索图书或期刊中文章的内容,当然由于ocr的原因,有些是搜不到的,比如搜索开题报告,一群包含这个关键期的图书和期刊文章就直接出来了,可以阅读限定的一小部分,可以帮助进行开拓思路

最后是超星发现系统,这个系统的优势在于将各种不同类型的文献进行统一检索,仔细看上面的全图盟和读秀,他们一次都只能去搜索一大类文献的题录,而超星发现是可以同时搜索多个大类的文献。这三个数据库的后端都是一样的,具体使用结合情况和个人习惯而定

在说英文题录查询,这部分可供选择的数据库是非常多的,比如说proquest的,北京大学未名学术搜索就是用的这个,又比如ebscohost,南京大学的外文学术搜索用的这的,又比如国产的超星系的百链学术搜索,我校也买了这个数据库,当然还有最出名的web of science 都是不错的题录搜索引擎,但个人认为最权威的最全面的还是oclc的题录功能,oclc firstsearch这个数据库比较便宜,但由于这个数据库专业性较强,国内购买的图书馆没有几个,但可以使用公共图书馆中的浙江图书馆进行使用(以下是演示),当然找到的文献校园网有权限的不多,可以直接google一下,有不少外文文章和学位论文都是oa的。

接着谈谈期刊论文,首先说说起来比较简单的英文的,先需要认识一个概念,那就是doi,由于外文文献环境极其复杂,不像中文,比较大的期刊网站就三个,图书5家,剩下一些出版社自己的网站,熟悉得比较快,而外文期刊有一个特点就是特别分散,出了比较大型的爱思唯尔、斯普林格、威立这些还有一些综合的如牛津剑桥,jstor,还有各种协会的期刊,外文整体环境非常复杂,除了先前介绍的题录查询软件有的有跳转链接外就是现在要说明的doi,几乎所有的现代英文文章都有一个doi号,它主要作用是快速跳转,直接点击就可以跳转到官方的页面,给文章查询带来了方面,此外,在一些引擎如google scholar或者sci-hub中直接搜寻doi号,这样既准确,又快捷。目前不得不承认sci-hub可以看到的论文比通过我校图书馆更多,但由于版权风险,在此不对这个数据库进行介绍。在有外文期刊论文需要时比较好的一个途径就是采用图书馆的电子期刊导航功能,这个功能列出了我们可以访问的外文期刊,可以按需选择,说中文论文,最普遍的三大期刊数据库,知网、万方、维普,知网没什么好说的,应该都会用,说说万方,万方我校只有一个局域网版,但似乎年久失修,推荐通过长春图书馆进行访问,万方的特点是它的学位论文最多,这点在下面的学位论文板块进行介绍,此外它的特点是中华医学会期刊收录,不过我们也没有人学医的,此外它的下载限制比知网要轻,一次下十几篇论文万方下得非常顺畅,但知网估计得输几次验证码搞不好还封ip了。接着说维普,通过下面的图可以看到,维普同时还带有一定的题录收集功能,将没有授权的oa期刊指向它的下载站点

这个《方言》杂志是社科院系的杂志,社科院系的杂志有一个显著特点就是都是oa杂志,在国家哲学社会科学数据库可以供全社会开放下载。在有权限的维普,这里也是推荐使用长春图书馆,会提供下载站点指向。此外维普的论文收录有少部分远古只有维普有,知网还没有回溯到,在古老论文时可以考虑维普,就比如这本《世界宗教文化》知网收录到1994年,而创刊号则在1980年,这时候维普就可以查到并给出oa链接而知网直接没了办法。此外维普的下载限制也比知网要轻,下大量时也可以去考虑。

下面进入到学位论文,英文内容介绍起来比较简单,当然精通就极难了,这里说两个数据库,一个是上文提到的oclc firstsearch,这个库的学位论文题录是最全的,并且具有oa链接,可以直接链接到学校官网开放的学位论文,比较好用,也可以找到论文以后虽然没有链接但是直接google一下,有不少都是oa的,接着就是proquest学位论文,这库我校虽然没有进行主站的学位论文购买,(在2021年4月份有一个月的试用,但是据我的推测这个库不大可能正式购买,当然我也拿不准社科院图书馆的主意)但是参与了中国集团pq论文,英文内容介绍起来比较简单,当然精通就极难了,这里说两个数据库,一个是上文提到的oclc firstsearch,这个库的学位论文题录是最全的,并且具有oa链接,可以直接链接到学校官网开放的学位论文,比较好用,也可以找到论文以后直接google一下,有不少都是oa的,接着就是proquest学位论文,这库我校虽然没有进行主站的学位论文购买,但是参与了中国集团的pqdtcn,这个库就可以看到非常多的外国学位论文了。另外我国香港的学位论文,进学校图书馆的官网去找,而我国台湾的学位论文则依赖华艺,和台湾硕博论文加值系统,关于学位论文的获取途径整理目前看到的最方便的是清华大学图书馆整理的版本,接着谈简体中文学位论文的获取途径。

在简体中文领域,学位论文的获取分为两大种,其中一种为被授权的商业机构即知网【中国优秀博硕士学位论文全文数据库(CDMD)】,这个库没啥好说的,我们学校应该能下所有的人文社科学位论文,遇到下不了的可以尝试上文提到的公共图书馆。另一类为收藏学位论文的法定机构,根据1981年制定的《中华人民共和国学位条例暂行实施办法》,“已经通过的硕士学位和博士学位的论文,应当交存学位授予单位图书馆一份;已经通过的博士学位论文,还应当交存北京图书馆和有关的专业图书馆各一份。”其中“单位图书馆”为该大学或机构图书馆(有的还额外要求档案馆,当然查起来非常麻烦【图书馆的目的是利用而档案馆是储藏】)“北京图书馆”现为“中国国家图书馆”“有关的专业图书馆”一般认为包括“”中国科技情报所“(现为“中国科学技术信息研究所”)主要收录自然科学的,和“中国社科院情报所”现为“中国社会科学院图书馆(中国社会科学院文献信息中心)”,主要收录人文社会科学论文,值得一提的是,虽然找到的法规只规定的收博士论文,但是很多硕士论文也同时被收藏了。

首先是各大高校图书馆,各大高校普遍都有自己的电子学位论文库,但有的只进行存储,不对学生开放,如南开、天津大学,有的对学生开放在线阅读,如pku、我校,还有的对学生开放下载,如吉林大学、武汉大学差别很大,但都是不对外开放的国图,国图有特色博士学位论文库,可以公开阅览前24页,没啥用,接着是中信所,万方一半的股份是中信所的,这也就是它论文收藏的这么全的原因,这里推荐使用西安图书馆的万方账号,这是我目前发现的唯一可以使用万方增强版的公共管,通过这个补充包可以向中信所提交文献传递请求它收藏的学位论文,至于万方为什么不直接上,原因是多样的,一是版权,二是销售。当然我校其实也有迂回的利用方法,那就是balis文献传递,首先在nstl官网进行学位论文查询,首先确保nstl搜藏了这篇学位论文,其次去balis文献传递系统检索这篇学位论文,提交学位论文原文传递请求,出借单位选择nstl,执行机构用默认的中信所即可,这样也能达到万方增强版的效果并且可以获取的学位论文比万方增强版更多。当然,万方增强版的优势在于它的效率,一般第二天邮箱就能收到,而balis文献传递得等2-3天。此外balis还有的有点就是可以文献传递高校自己的学位论文,比如我曾经进行过向人民大学请过的文献传递,但只会给三分之一而中信所是给全部的。最后是社科院图书馆搜藏学位论文,这部分论文在2019年之前寄放在我们学校,学生经申请后即可进行正常阅览,但之后社科院图书馆把这部分资源拉走了,目前在7楼,我之前也咨询过社科院图书馆采编部,他们说这部分资源目前还在编目,太过混乱无法开放,编目后会正常开放。个人估计还要过相当多的时间。

最后是谈谈电子书,这里介绍没有版权风险的电子图书,这部分都是只能在线阅读或加密本地阅读的首先是读秀,读秀扫描了85%以上的现代中文图书,不少人都用过的版权风险图书几乎都是读秀扫描的,读秀提供图书的在线阅读,这里推荐使用重庆图书馆所都买的读秀电子书进行 阅览,约120万册,我校也有一个超星电子书的镜像数据库,但是都是一些老书也不推荐使用。此外我校还购买了中文在线的数据库即“书香社科大”有大约10w册电子书,这个库的书籍质量比读秀要高,特别是其中的习大大系列的图书。在进入具体出版社部分,我们购买了人民出版社的数据库,即中国共产党思想理论资源数据库,中国社会科学出版社和社会科学文献出版社的中国社会科学文库皮书数据库,然后是一些古籍电子书库是比较全的,包括中华书局的、书同文的、雕龙的等。中文版权风险电子书参考旁边的文章,这里不便于介绍。

然后谈谈英文电子书,外文电子书由于其昂贵的价格我校除了像联合国电子书或世界银行电子书还或者一些史料电子书这些专业化极高的电子书外几乎没买什么电子书,公共馆也没有买的,在cadal公众注册后可以看一些扫描的外文电子书,比较少这里主要介绍外文oa电子书,首先是hathitrust,这个库是google book的后继者,是以美国大学为主的扫描电子书存档联盟,google扫描的大部分电子书在那里都有copy,google book当然限制非常严重了,hathitrust还非常旺盛地生长着。公共可以自由地在线阅览hathitrust中版权过期的图书,体量非常大,是百万本级别的数量级,而美国高校成员可阅览自己扫描的部分,下载版权过期的图书,最近还有一个emergency tamporary acess参与高校可以阅读库中有且自己图书馆有的电子书。需要注意的是,这个库并未被屏蔽,但是由于来自中国区的爬虫过多,该库主动屏蔽了一些中国区的ip。此外就是archive books,这个库外文电子书有500w本,很多和hathitrust重合,但也有一些自己独享的资源,有部分得到授权的现代电子书,质量比较高,有少部分只能在线阅读,部分有版权限制的可以下载加密副本在本机阅读,大部分版权过期的资料可以直接下载。然后要提一下google book 首先大家的访问就是一个问题,如若大家可以进行访问,从其中下载电子书又是一件麻烦事,不同地区的ip可以访问到的电子书不同,如若是美国ip则部分日文电子书又访问不了,一本电子书最好选取与其相同地区的ip才最大几率进行访问,而下载也是麻烦事,有些无版权电子书必须将google账号的首选语言调成英语才能进行下载,如果是中文则只能在线看。最后对这三大外文电子书平台做一个总结,hathitrust的现代书量大质优,但必须美国大学的在校学生才能下载,而且权限分散,其中权限最高的两所机构的加州大学(任一分校均可),密歇根大学安娜堡分校。archive book是我最喜欢的,它的优势在于它有印度书和加拿大书,这两个英语区国家的电子书非常难得,特别是有一定历史的电子书,目前archive是最容易的渠道。google book 在于它的体量最大,它虽然官司打输了但是还在一直扫描,所以有些无版权书只有google book才能访问,当然,他们三大机构的无版权书大头都是重复的,选择喜欢的去用就行了。

外文版权风险的电子书,有俄系的libgen,还有z-librarybookfi,这三个库都是非常大的外文电子书盗版库,其中第一个是最大的,因为建立了其他盗版书电子库的索引,但是它的搜索功能做得不好,如若可以找到书籍的isbn(国际标准书号)则直接使用第一个库,如若找不到,只知道名字或者想要进行模糊搜索,则使用后两个数据库,后两个搜搜功能做得好些,库有些偏差,搜的时候最好两个都去尝试一下。

以上就是分享的全部内容,如若能有一点启发,那就再好不过了。

上一篇
下一篇