360文库
———这几种方法很不错——
临近期末,写总结的时期到来了,这些天和各文库平台干上了,先后分享了某度文库、道客88、原创Li、豆叮这些文档的下载方法,今天应老师们要求再来说一下360文库文档的下载。
毕竟各平台的模式有所不同,所以非付费的方式获取到的资源也会有所不同,以下方法仅供借鉴,具体如何使用还要看您个人所需。

缘自全套图片

.........360文库里的文档.........
奇怪的格式
因为没有充值,所以我们在阅读时看到的文章格式都是图片,并非像其他文库平台那样可以复制里面的文字。所以,我们此时就要换个思路来搞定文档的获取了。
那么,我们今天的第一种方法就是以图制图,即,既然看到的是图片,我们就按图片保存下来,然后再做打算。
这就去思考的话就简单多了,保存图片谁不会啊,一张一张保存,或批量保存为套图,比如下面我的这两种操作方法。


方法1:浏览器保存套图
我用360浏览器来操作,在其中一页上(一张图片上)点右键,选择全屏看图,就会把所有页的图片都罗列出来,直接点击上面的另存为套图就可以了。



方法2:图片助手获取
既然我们看到的是图片格式,那就可以借助图片助手插件批量保存网页里的这些图片,关于此助手我在之前专门讲过,详见:【收藏】一些免费的搞图必备资源,其中一个无视会员,批量下载!(文章最后讲到的那个插件)。
现在我们就用上这个插件,识别并批量下载360文库文章里的每一页图片。
1、安装图片助手浏览器插件。
2、进入需下载的那篇文章页面,点击浏览器右上角的AI图片助手插件图标,选择提取本页图片。
3、选择识别出来的所有图片中的属于文章的那几张图片。

4、点击下载,保存每一张图片。


油猴插件+脚本下载

01 安装油猴与该脚本
在此不再多做赘述,和以往的那些操作是一样的,如果不知道如何安装可以去看往期与油猴插件相关的推文。
02 直接下载
看来这个360文库不是那些热闹,单从这个脚本功能上来看就没之前那几个文库平台复杂,它只有一个导出图片链接,连阅读全文没有(当然你也可以理解为对于360那些付费文章获取的效果不好)。

点击导出图片链接,给出的是每一张图片的下载链接,需要单独完成每一张图片的下载,这样看来是比较麻烦的,还没有上面那些保存套图方便。所以说,这种方法大家随意吧。

03 文字识别

把图片中的文字提取出来
因为我们保存的是图片格式,如果想对其进行编辑,必须要把文字识别出来,当然要用到OCR文字工具了。我们可以选择天若OCR,它可以单张局部完成对文字的识别;再高级点的可以借用福昕PDF、ABBYY这类PDF编辑软件完成文字的批量识别。
不过这个动静显得有点大了,如果大家还记得我之前推荐过的那个小巧简易的文字批量识别工具的话,现在就可以拿来用上了。
把保存好的所有图片拖入识别工具,点击开始识别,自动保存为TXT文本文档,即所有文字识别好了。


总结一下
关于文库下载不同的方法
由于不同的平台安全策略不同,所以我们采用的下载方式和手段也不同,针对自己所需可以参考我的其他推文,该收藏的赶紧收藏,随时都能用上。
当我们下载的是图片格式时,可以再借用OCR文字识别工具将文字提取出来,后期再进行排版就可以了。毕竟我们是想白嫖,所以能做到这一步就算不错了。