利用Bookget下载古籍文献

type
status
date
slug
summary
tags
category
icon
password
一款古籍图书下载工具,目前支持中国、欧美、日本约50+个数字图书馆。

1. 使用方法

解压,打开bookget.exe,输入需要下载的链接,就可以下载
notion image
notion image
notion image

2. 支持的URL

bookget 不是无所不能,它目前仅支持约50+个数字图书馆。每个图书馆的下载地址不同,请仔细阅读下文。

2.1. 中国地区数字图书馆

  1. [中国]国家图书馆
  1. [中国]香港中文大学图书馆
  1. [中国]香港科技大学图书馆
  1. [中国]台北故宫博物院 – 善本古籍注:查阅相关Wiki 10 台北故宫博物院 善本古籍
  1. [中国]四川古籍数字图书馆
  1. [中国]云南古籍数字图书馆
  1. [中国]天一阁博物院古籍数字图书馆
  1. [中国]广州大典注:可通过微信小程序【粤通读】注册读者证。
  1. [中国]深圳市古籍数字图书馆注:可通过微信小程序【粤通读】注册读者证。
  1. [中国]洛阳市图书馆
  1. [中国]温州市图书馆-瓯越记忆
  1. [中国]臺灣華文電子書庫
  1. [中国]北京故宫博物院-故宫名画记
  1. [中国]中华寻根网(国图)
  1. [中国]国家哲学社会科学文献中心-古籍
  1. [中国]云南中医药大学古籍数字图书馆
  1. [中国]云南数字方志馆
  1. [中国]香港大学数字图书馆
  1. [中国]苏州博物馆-古籍
  1. [中国]江苏高校珍贵古籍
  1. [中国]江苏省珍贵古籍

2.2. 欧美数字图书馆

  1. [美国]哈佛大学图书馆 - 哈佛燕京图书馆 - Chinese Rare Books
  1. [美国]hathitrust数字图书馆
  1. [美国]普林斯顿大学图书馆
  1. [美国]国会图书馆注:最佳方案是使用海外VPN,也有其它方法,在此不作讨论。
  1. [美国]斯坦福大学图书馆
  1. [德国]柏林国立图书馆
  1. [德国]巴伐利亚州立图书馆www.digitale-sammlungen.de
  1. [英国]牛津大学博德利图书馆
  1. [英国]大英图书馆(手稿本)
  1. [美国]familysearch.org 中國族譜收藏 1239-2014年familysearch.org 家譜圖像参考「07 [高级]Cookie用户鉴权」编写 cookie.txt 方法。
  1. [美国]史密森尼学会Smithsonian Institution 中国艺术合集注:中国艺术合集,需要手动查找IIIF View ManifestView Mirador Viewer 链接,即格式类似下面第2、第3行URL。
  1. [美国]柏克莱加州大学东亚图书馆
  1. [奥地利]国家图书馆

2.3. 日本数字图书馆

  1. [日本]京都大学图书馆
  1. [日本]国立国会图书馆
  1. [日本]E国宝e-Museum
  1. [日本]宫内厅书陵部
  1. [日本]东京大学东洋文化研究所
  1. [日本]国立公文书馆(内库文库)
  1. [日本]东洋文库
  1. [日本]早稻田大学图书馆
  1. [日本]国書數據庫(古典籍)
  1. [日本]京都大学人文科学研究所
  1. [日本]国立历史民俗博物馆
  1. [日本]市立米泽图书馆
  1. [日本]庆应义塾大学图书馆
  1. [日本]关西大学图书馆
  1. [日本]駒澤大學電子貴重書庫
  1. [日本]大阪府立圖書館
  1. [日本]東京国立博物館
  1. [日本]龍谷大學圖書館-貴重資料

2.4. 其它数字图书馆

  1. [世界]國際敦煌項目注:需先搜索关键词,例如8210,并且URL中含有uid=xxxx,短时间内有效,请在搜索结果后尽快下载。
  1. [韩国]奎章閣韓國語研究所注:在图书简介页面,右侧稍下方有 URL복사 链接,点击后可获取当前图书URL。
  1. [韩国]国立历史研究所注:只测试下载【明实录、清实录】
  1. [韩国]国家图书馆注:请阅读 11 韩国国家图书馆
  1. [俄罗斯]国家图书馆
  1. [越南]汉喃古籍文献典藏数位化计划
  1. [越南]国家图书馆汉农图书馆

3. 使用技巧1:批量下载的方法

我们想一次下载多本图书,可以新建一个文本文件。例如:urls.txt(名字不重要),然后在【终端】中输入以下命令,按“回车键Enter”开始。(须先配置环境变量,参考03 安装 bookget 环境
在urls.txt文件中,毎行一个URL,回车换行,可以有多个URL。格式如下:
更多参数,请使用 bookget -h 查看。
如果某网站需要使用Cookie,可以不用输入参数。只需在bookget目录下,新建 cookie.txt 文件。格式如下:
有些图书馆,bookget 还不支持。如果它的文件名是有数字顺序递增(0001/0002/0003...)规律的。可以尝试使用此功能。
例如:
如果网址太多,可以编写一个文本文件 urls.txt,一行一个URL,回车换行。在终端内输入以下命令:
注解:支持(01-100) 、(1-100)、(001-100)等格式通配符写法。

4. 使用技巧2:需要登录才能下载的网站

有一些网站,需要用户登录成功后,才可以下载。例如:familysearch.org提示: 自2023/08/31日起,bookget v1.2.2版开始,cookie文件只存放cookie值,不包含其它HTTP头信息
此方法适用于其它需要「用户登录」的网站。
  1. 在浏览器中添加收藏夹「得到cookie」。如下图所示,在收藏夹 URL中粘贴以下代码:
notion image
  1. 打开网站,输入用户密码,登录成功。打开你要下载的图书URL,并确认可以在线正常阅读正文图片。例如:
  1. 点击收藏夹「得到cookie」,复制页面上显示的所有内容。粘帖到 bookget 目录下的 cookie.txt 文件中,并保存文件。(需先删除该文件中所有内容)。
    1. notion image
  1. 运行bookget,粘贴图书URL,按回车键,即可开始下载。

5. 常用指令

软件提供了一些可以自定义需求的设置,您可以通过以下两种方法操作。
  1. 使用记事本,修改 config.ini 文件中默认参数。
  1. 或者,临时使用命令行参数, 常用命令参数:
等于号和空格的作用相同,一次可以使用多个参数。
更多的参数,可以使用 bookget -h查看,如下:
PowerShell 终端批量分册下载
安装PowerShell后,在PowerShell中粘贴以下命令,可下载大藏经第100-110册。余仿此。(参考PowerShell关于For循环

6. 香港中文大学图书馆下载技巧

香港中文大学近期改用Amazon 新加坡云服务器,并启用Amazon WAF应用防火墙。访问时会有真人识别。因此下载难度非常高。一个cookie(包含无cookie访问)有效期大约最长5分钟。
自动处理(仅限Windows)
  1. Win7系统,请手动安装 Edge 浏览器 https://www.microsoft.com/zh-cn/edge/download
  1. Win10/11系统内置浏览器,无须安装。可直接操作下一步。
  1. 把图书URL粘贴到软件中,回车。待弹出浏览器窗口,等几秒图片加载完毕后,关闭窗口,即可下载。
  1. 下载过程中会反复弹出窗口,需要耐心多试。确认图片可以在弹窗中看见,关闭窗口。
提示: 如果需要使用分册下载功能,可以参考:

7. 台北故宫博物院善本古籍下载技巧

台北故宫博物院(rbk-doc.npm.edu.tw)是一个技术实现非常规的网站。有以下特征:
  1. 动态URL,只有从首页进入,才会生成会话。长时间不操作,会超时。
  1. 每一次进行的检索条件(搜索书籍),是对会话数据的一次修改。
  1. 你无法知道一本书的具体网址是什么。
  1. 假如你登录后,把下载某书的网址发给了别人。就等于是把你的帐号密码发给了别人,可以通过右键查看网页源代码,看到密码。为方便起见,以下简称【会话URL】。
  1. 你在urls.txt中填写的URL,实际上是把【会话URL】授权给bookget使用。
风险提示: 请妥善保管你的帐户信息,不要发给别人【会话URL】。如果你不小心发出去了,也可以使用那个会话URL打开网页,在右上角退出登录。 一旦你使用bookget,即表示你清楚知晓、并同意:由软件使用者,即是你本人自担风险。
操作步骤
  1. 在浏览器中打开台北故宫博物院 图书文献数位典藏资料库 https://rbk-doc.npm.edu.tw/。右上角有【登入】按钮,先登录再操作。
  1. 点击首页【善本古籍】,看红色对号,有时候它会跳来跳去,有两种界面。
    1. notion image
      notion image
  1. 选择四部类目,或者输入关键词查询。最后点【查询】按钮。
  1. 请注意:每一次你点击【查询】,都会修改会话数据(此数据在对方服务器上),即你能下载的图书URL。
    1. notion image
  1. 【可选】修改每页显示的数量,默认是5条,将它改为100条。
    1. notion image
  1. 找到有【相机】图标的,才可以下载。点击图片进入。
    1. notion image
  1. 复制浏览器地址栏的网址,例如:
notion image
运行 bookget 粘贴网址,按“回车键Enter”,即可开始下载,如图所示:
notion image
notion image

8. 韩国国家图书馆下载技巧

必备条件:
必须安装韩国图书馆开发的专用工具:下载地址:https://viewer.nl.go.kr/nlmivs/installPage.jsp得到文件:nlviewer_setup_onlineNet.exe 双击运行安装即可。 韩图官方提供的nlviewer 只支持Windows 下使用。
查找图书URL
请按以下步骤,操作查找bookget能下载的图书URL。
  1. 打开韩国图书馆电子图书网站 https://www.dlibrary.go.krhttps://www.nl.go.kr/EN/main/index.do 输入要查的书名,点击红色对号按钮(后文不再重复)。
  1. 勾选左则 모두이용 (可阅读全文),筛选结果。
  1. 点击 상세페이지 按钮(图书详情页面)。如下图。
    1. notion image
  1. 点击 LOD 보기/다운로드(txt) 按钮(查看/下载 LOD)。如下图。
    1. notion image
  1. 在新页面中,点击URI,复制打开后的网址,粘贴到bookget中下载。
    1. notion image
      notion image
提示: 只能在windows下使用,在bookget开始下载前,会弹出一个浏览器窗口,等页面中可以看到该图书,关闭窗口即可开始下载。

9. 附录:图书馆目录

9.1. 中国地区数字图书馆

  1. [中国]国家图书馆
  1. [中国]香港中文大学图书馆
  1. [中国]香港科技大学图书馆
  1. [中国]台北故宫博物院 – 善本古籍
  1. [中国]四川省古籍数字图书馆
  1. [中国]云南省古籍数字图书馆
  1. [中国]天一阁博物院古籍数字图书馆
  1. [中国]广州大典
  1. [中国]深圳市古籍数字图书馆
  1. [中国]洛阳市图书馆
  1. [中国]温州市图书馆-瓯越记忆
  1. [中国]臺灣華文電子書庫
  1. [中国]北京故宫博物院-故宫名画记移动端-故宫名画记
  1. [中国]中华寻根网(国图)
  1. [中国]国家哲学社会科学文献中心-古籍
  1. [中国]云南中医药大学古籍数字图书馆
  1. [中国]云南数字方志馆
  1. [中国]香港大学数字图书馆
  1. [中国]苏州博物馆-古籍
  1. [中国]江苏高校珍贵古籍
  1. [中国]江苏省珍贵古籍

9.2. 欧美数字图书馆

  1. [美国]哈佛大学图书馆 - 哈佛燕京图书馆 - Chinese Rare Books
  1. [美国]hathitrust数字图书馆
  1. [美国]普林斯顿大学图书馆
  1. [美国]国会图书馆
  1. [美国]斯坦福大学图书馆
  1. [德国]柏林国立图书馆
  1. [德国]巴伐利亚州立图书馆www.digitale-sammlungen.de
  1. [英国]牛津大学博德利图书馆
  1. [英国]大英图书馆(手稿本)
  1. [美国]familysearch.org 中國族譜收藏 1239-2014年[美国]familysearch.org 家譜圖像
  1. [美国]史密森尼学会Smithsonian Institution
  1. [美国]柏克莱加州大学东亚图书馆
  1. [奥地利]国家图书馆

9.3. 日本数字图书馆

  1. [日本]京都大学图书馆
  1. [日本]国立国会图书馆
  1. [日本]E国宝e-Museum
  1. [日本]宫内厅书陵部
  1. [日本]东京大学东洋文化研究所
  1. [日本]国立公文书馆(内库文库)
  1. [日本]东洋文库
  1. [日本]早稻田大学图书馆
  1. [日本]国書數據庫(古典籍)
  1. [日本]京都大学人文科学研究所
  1. [日本]国立历史民俗博物馆
  1. [日本]市立米泽图书馆
  1. [日本]庆应义塾大学图书馆
  1. [日本]关西大学图书馆
  1. [日本]駒澤大學電子貴重書庫
  1. [日本]大阪府立圖書館
  1. [日本]東京国立博物館
  1. [日本]龍谷大學圖書館-貴重資料

9.4. 其它数字图书馆

  1. [世界]國際敦煌項目
  1. [韩国]奎章閣韓國語研究所
  1. [韩国]国立历史研究所
  1. [韩国]国家图书馆
  1. [俄罗斯]国家图书馆
  1. [越南]汉喃古籍文献典藏数位化计划
  1. [越南]国家图书馆汉农图书馆
Loading...