中文文献信息检索刍议

这个分享是一个比较粗略的,概括性的,表象的简体中文文献检索经验分享,当然也包含极少具有代表性的英文文献,主要是常见搜索引擎的使用,介绍一些没有使用风险的数据库与其使用方法与使用技巧,最后还有一些推定没有使用风险但自身存在版权风险的现有网站。

首先是最基础的,搜索引擎,在中文领域,就是百度,不过多介绍,这主要是综合性的搜索这里要额外说的是垂直搜索,进入移动互联网时代,各大app把持了大量流量,如微博,微信,淘宝,哔哩哔哩、知乎还有一些行业应用如美团、自如、马蜂窝等,这些有很多时候会比百度好使,比如你如果 要找明星,那微博显然更快,去旅游,可以去携程、马蜂窝等看看别人对景点的评价,去bilibili和知乎看一些经验教程,去淘宝除了买东西,也可以看一些东西的详细参数和具体非常容易的使用教程等等。最后就是专业的论坛了,如搞破解总要去52破解逛逛,玩路由器看看恩山,国学典籍相关去国学数典这里需要提及几个容易被忽略的东西
1.1688,这是阿里巴巴下的批发网站,如果有东西需要大量买或定制会比淘宝便宜一些,当然,大部分产品都是不包邮的,你得付物流费,比如我在1688买英雄墨水,一款3元/瓶,加运费划3.7,而淘宝要卖到5到6元
2.搜狗知乎,在搜狗是可以直接进行对知乎内容的搜索,不过建议去知乎网站搜
3.搜狗微信,在pc端直接对微信中的文章进行搜搜,比微信自己的搜一搜要好用些,主要pc屏大,显示内容多。
下面进行我的方法论的汇总
一般问题,认为有普遍性的问题,直接百度,如“刘备的出生日期”
比较新的知识,一些技巧的分享与物品评测,有一定指向性的东西,去垂直搜索,如“如何评价……/怎么看….”这无疑是去知乎了,“xx的评测”、“yy的教程”、“zz”的技巧,这个可以去b站,但如果,一些更专业的知识,如“红米ac2100刷机卡反弹telnet”“se2.4脱壳方法”,这类就要上到上文提到的论坛了。

接着介绍学术方面的搜索了,这部分其实应该是图书馆该做的事情,各大购买的数据库去图书馆的网站探索。首先谈论文找论文,知网,首当其冲,一般写论文知网就够了,但是要去找论文时,可千万不能局限于知网,知网有些比较早的刊物没有收录,但好在收录了的大部分人文社会科学期刊,我们学校都买了,可以直接下载,少不分没买的,可以去这个站点idata,这个站点爬取了知网的几乎所有文章,注册后免费每天可以下一到两篇,当然,这个网站肯定是有法律风险的。除此之外,维普在很多老期刊的收录方面具有一定优势,我们学校虽然主站过期,局域网版权限也不高,但是查题录是不要权限的,找到了文章的题录以后,可以去这个数据库国家哲学社会科学学术期刊数据库,这是一个面向社会的免费库,但收录量很多,有了文章题目后也可以去这里碰碰运气,查题录其实最好的还是超星,不连校园网用免费的全图盟就行了,超星在老刊和综合收录方面是没有第二的霸主,最后是万方,这个在学位论文收录方面有优势,当然我们学校好像主站过期了,目前只有局域网版可以用,权限也不高,这个结合我另一篇讲学位论文的一起看看,接着讲北大法宝,这个参照我写的https://www.tonoo.net/index.php/2020/10/26/pkulaw/,下面进行一些演示,相信会给大家一些启发,就是文献资源不要局限于学校图书馆所能够提供的,有相当一批公共图书馆远程注册就能够访问比较不错的地方图书馆所购买的电子资源。外文的文献比较初级的话知道三个网站就行了,sci-hub(应该是最出名的盗版了),webofscience(我们学校买了ssci)proquest(外国学位论文)
还有就是我校参与的balis馆际互借文献传递,大体就是全北京高校借书,和让别人去扫一些没有电子化的文献,具体去看图书馆的介绍。

再来谈谈网盘搜索与电子书了,这部分的基本所有的数据库都是有法律风险的,而这里我会以十万作为一个分界线,少于10万的引擎我就不介绍了。
1.百度,这是最方便的,加上冰点下载器,可以下载搜到的下不了的东西
2.z-library 560万册电子书,当然是所有语种的,哪里还有?(超星可能有)
3.libgen 30多T的电子书与文献,值得拥有
3.1 openlibrary archive组织的一个非常好的项目,里面都是没有版权风险的过去的精品英文书,超过十万本,很多都可以下载,当然,下下来的书都有drm保护,不过他们的书都是adobe drm,言尽于此。
3.2 google books 查找内容特别好用,相当于英文版的读秀,书籍容量不须多言,大部份有版书现在下不了了(反正我没找到)
3.3 hathitrust 提供很多无版权的书号称200w,当然它的那一大群美国成员馆可以看到有版权的,如何下载呢?账号test密码information这个学院直接挂到了官网,真的。(其实通配符下载就行了)
3.4bookfi 这个网站200w书,只不过主站看样子是俄罗斯的,虽然会自动跳到英文版,但是还看不太懂,不过这200w与上文的z-library应该是有些独有的书的,也可以看看。
4.读秀,中文电子书超星独占8斗(其实还要多),我们学校可以看到大概78万本书的全文(现在突然降到20w本了),如果嫌麻烦的可以用新疆数字图书馆的,直接进入不需ip,可以看到60万本,不嫌麻烦的话可以去用浙江图书馆提供的访问路径,可以看到约120万本
5.鸠摩搜书 久负盛名的搜书引擎,找一些流传得很广的
6.epubee,这是一个付费的盗版epub库,但是在太大了,有20多万epub,重要的是质量高,要知道读秀的很多书质量不高。
7.大圣盘 收录了300多万条百度云分享链接,有很多好书和好东西,和其他的像“罗马盘”用的是一套模板,但这个目前还是免费的,只要求关注公众号。
8.蓝瘦,链接是一个示例的下载地址,一个安卓搜索客户端内收录了400万条蓝奏云分享的信息,开发者非常方,据说链接的来源是穷举法然后去掉失效的。
9.99百度云,比前面的体量要小很多,但是由于单独算法有可能有好东西。
10.中板数字图书馆 链接给的是一个示例免费入口,里面有十万本书
11.书香社科大,这个是书香中国的一个库,大约有10万本图书,我主要用来找习大大的讲话(其实这部分学习强国会更好,这东西有很多电子书,但前者主要epub后者主要pdf,互为补充吧),非常好
12.超星第一代自建库,里面大概有20万本书,用超星阅读器打开,不过都是2010年以前的。
13.长春网络图书馆 注册方法参见,选择馆藏数字化文献,搜索书籍,点进去,点击借阅,约50万本,每天不超过5本,每月不超过15本。
14.两个用着还不错的搜索引擎导航超能搜虫部落(看着很多其实用处不大)
15.实在搞不定还有淘宝闲鱼,那里文献贩子,账号贩子满天飞,对于其中一些定价低的还行,一些高价的纯粹坑人了,亦可以找我,免费的,但是要等。

那么最后再来说说如何找轮子,这里举一个比较典型的网站书签地球,这是一个许多人分享书签的网站,可以看看他们都用的什么网站,一个一个去试,然后找到好用的,适合自己的,或者看百度、知乎、b站各地人们分享的经验,以去寻到合适的轮子,最终造就自己的方法论。以上分享都是挂一漏万的,希望有所启发,仅供一哂。


上一篇
下一篇