查看: 330|回复: 20

淘宝书商为啥什么书都能找到:揭秘代找PDF背后的真相

[复制链接]

2

主题

4

帖子

8

积分

新手上路

Rank: 1

积分
8
发表于 2022-9-20 13:16:00 | 显示全部楼层 |阅读模式
你是否好奇过淘宝上那些代找PDF的卖家都是哪来的资源?
好像无论什么电子书他们都能帮你找到
而且最主要的是:这种店家还不只一家,有几十上百家!?
讲道理,如果资源是商家自己的 or 技术是商家自己原创的,肯定不会出现几十上百家同类店铺的
那说明背后一定是有什么公用的途径!



阿虚花了不少时间调查,基本摸清了这个行业背后的一些 “ 内幕 ”
今天就给大家来揭秘一下


看完这篇,你也可以轻松下载到绝大部分的PDF(包括教材!)
▍1 背后是一家什么样的公司?

如果你有在淘宝不同的卖家试过代找PDF
不难发现,虽然卖家不同,但从反馈的截图看来,其实是同类网站


虽然卖家反馈的不是完整截图,但凭阿虚多年的互联网经验 + 非凡的记忆力,这几个网站阿虚还是一眼就看出来了


顺利迈出发现背后秘密的第一步
具体是哪些网站呢?其实就是下面这3个


而进一步查询这3个网站的备案信息会发现,龙岩网络图书馆、全国图书馆参考联盟、读秀三者实际是一家的


前面两个面向公众开放,是读秀的马甲,而读秀一般需要登录才能使用
它们母公司叫超星,全称北京世纪超星信息技术发展有限责任公司,是个数据库公司


高校的同学们肯定都很熟悉「超星」这俩个字——超星尔雅、超星学习通、超星发现等等,都是它旗下的产品
那为啥超星能有这么多市面上没有的电子书呢?
超星实际是中国数字图书馆建设初期,为了解决大部分图书馆没有数字资源才应运而生的。换句话说就是:


据悉目前超星图书馆藏书量超过350万,具体资源不止2300T
通过与图书馆合作,直接在资源数量上甩开竞争对手几光年,让超星成为了全国乃至全球最大的中文电子图书提供商




虽然没有机构能买全库,但一般的学校都会买个几十万册的超星书库,与学校图书馆纸质书互补,在校学生可直接使用
但图书馆都没有那么多书库,淘宝商家是哪来的呢?
据小道消息:超星有个自己的平台,充值200后,上面大部分1块钱就可以买1本,淘宝多数商家其实就靠这个在赚差价
部分内容应要求,已删除这里且不讨论淘宝书商下载电子书后拿来出售所造成的侵权行为


阿虚来说说更多人关心的一点——我们一般人,可不可以下载到读秀/龙岩/全图上面的资源?
答案是可以的,而且还是通过公开的、正规的途径!


▍2 平底锅大法

按知乎规定,此部分内容已删除▍3 图片缓存大法

不知道,肯定很多人不知道!
阿虚原来其实写过怎么免费获取读秀上面的电子书


▲对,就是这篇,建议看,马上看!

方法就是注册那些免费开放注册的图书馆,然后我们就能免费使用图书馆购买的数字资源库了
总之,注册教程请看上面那篇文章,注册好账号之后再继续看这篇文章的下文
这里举例使用广西壮族自治区图书馆
从网页登录图书馆,并找到数字资源,再找到「读秀知识库」,点击包库入口进去


接着我们在图书一栏进行搜索,如果搜索出来的结果显示「包库全文」


那么这本电子书我们就是可以有办法免费获取到PDF版的!!!
我们点击包库全文打开,这时实际就可以下载了


● 3.1 安装新版超星阅读器

但下载的前提是你需要先下载新版的超星阅读器:http://www.sslibrary.com/ssreader/download


因为新版的才支持打包下载(至少阿虚测试的时候旧版不行)


然后你就可以下载到一个PDZ格式的文件
如果你对PDF不是刚需,到这一步实际上就可以了


如果想把PDZ格式转成PDF的话,请继续往下看
● 3.2 获取图片缓存

使用超星阅读器器打开这本书,页面大小设置为100%
同时打开我的电脑,找到这个目录:C:\Users\电脑用户名\AppData\Local\Temp\buffer(如果PDZ是文字版,则生成的文件夹不是buffer而是localX)


然后你就会发现这个目录下,会有超星阅读器生成的扫描图片的缓存文件
准确的说是打开一本书后,每翻一页即会在该目录下生成当前页和下一页的BMP图像



而生成的图像分辨率和页面大小设置有关,这也是为什么上面让你把页面大小设置成100%
那实际不就很简单了 ?
我们只需要一直点击下一页(按方向键→),把整本书都翻完,就能获取到所有页面的图片了




如果觉得手动点击太麻烦,你可以用鼠标连点器啊!
推荐点击间隔设置为0.6秒,你还可以在设置里面设置好翻页次数
点击到官网下载鼠大侠连点器:https://www.shudaxia.com/


别觉得这个方法麻烦,实际上500页的PDF靠鼠标连点器的话,也只需要5分钟就能翻完
相对后面要介绍的第2、3种方法,要快得多


● 3.3 合并PDF

总之等你把正本电子书都翻完后,注意,注意,注意!先不关闭软件,把buffer目录下的所有图像文件拷贝到其他位置的文件夹,然后才能关闭超星阅读器
接着我们用一些PDF编辑器把这些图片合并成PDF即可
如果你嫌弃装福昕、金山、Acrobat一类的PDF编辑器太麻烦,推荐你可以用PDF补丁丁这款软件
点击到作者官网下载PDF补丁丁:https://www.cnblogs.com/pdfpatcher/


一般10多秒钟就能合并完成了:


如果你觉得合并后生成的PDF太大了,除了PDF压缩,或者在合并前批量压缩图片
你还可以选择之前的页面大小可以不设置成100%,设置成50%之类的(其实39%也足够清晰了)
● 3.4 没有显示包库全文怎么办?

没有显示包库全文,只是意味着你使用的图书馆并没有购买这本书的资源


但只要读秀上能部分阅读,或者预览到前言页等,就说明超星实际是有这本书的全文资源的
所以阿虚建议这种情况还是直接靠平底锅大法,花钱节约时间


另外可能会有粉丝问,哪些图书馆购买的读秀书库会比较多呢?
网上据说是浙江图书馆、重庆图书馆购买的书库都比较多
不难推断出书库购买的多少应该是和图书馆的财力有关


另外也不难推断出,医科大学的图书馆会购买更多医科相关的电子书,毕竟图书馆购买书库的目的是和馆藏做互补
还有一些书是显示部分阅读,但点进去会显示「您访问的资源有错误」,这类书应该是出于版权保护没有公开。这种书如果想获取,还是只能寄希望于百度,或者一些电子书站
▍4 新版超星阅读器+虚拟打印机大法

内容应知乎要求,已删除▍5 分章节下载+文献传递大法

内容应知乎要求,已删除▍6 给PDF添加书签

通过上面方式获取到的读秀PDF电子书,要么就是没目录书签,要么就是像下图这种「有等于没有」的书签




而PDF有书签的话,真的会方便很多,所以阿虚这里再教一下怎么生成书签
不过如果你不需要,可以略过此部分
● 6.1 重新下载电子书

第一步就是把之前超星阅读器下载的电子书删掉!


再重新到读秀上下载一遍电子书,注意这次要选择:分页下载!


这一步的目的是为了获取下载后的文件夹里面 BookContents.dat 这个文件,它里面包含了书签信息!


然后用 PdgCntEditor
点击下载PdgCntEditor:https://axu.lanzoux.com/iPLWkhykfde


软件里面就能加载出目录了,我们先全选,并复制所有的目录信息


● 6.2 加上书签

再用 PdgCntEditor 打开你刚刚制作好的PDF


接着全选,Ctrl+V 粘贴刚刚复制的目录信息就行了
不过这时我们需要矫正一下目录误差!
比如这里目录是第1页,而实际PDF中是第7页


我们需要手动矫正这个误差——点击PDF目录选项,7-1+1=7,所以基准页这里填 7


避免大家不懂,这里再举个例子,假如获取到的目录页是5,而实际PDF的页数是14,那么基准页那里就要填10


总之基准页填好之后,点击左上角的保存


这时候我们打开PDF就已经有比较不错的目录了
但有个缺点是现在这种目录没有层级结构!


也能用,但强迫症看起来可能会不舒服



● 6.3 给目录加上缩进

想给目录加上层级结构的话,我们需要手动编辑
再把PDF拖进 PdgCntEditor,建议是点击切换到树形编辑模式,比较明显一点


我们这时候只需要用到下图这一个功能,其实通俗点讲,这个功能就是:缩进


目录的层级结构是怎么样的大家应该都懂吧,总之下图阿虚演示了一下怎么对第一章的目录进行缩进:


总之全部缩进完成之后,记得点击左上角的保存,最后我们就拥有完美的目录啦!




● 6.4 自动添加缩进

不过如果 BookContents.dat 文件获取到的目录信息是这种格式,其实是可以靠软件可以直接自动生成层级结构的


我们只需要点击「自动切分页码」这个功能,就能一键生成了


手动选择目录信息,再点击自动切分页码即可:


▍全文总结

这篇文章写了很多内容,但其实基本上推荐你用文章最开头介绍的平底锅大法
毕竟多数人可能也只是急需1-2本教材而已


另外阿虚写这篇文章的目的是帮助大家去获取一些市面上不太好购买的电子书
实际上现在很多书本身就有发行电子版,尤其是教材的话,一般直接在出版社官网就可以购买到正版电子书!
用上文所述方法下载到的电子书也仅限用于学习交流目的!
同时下载的电子书请使用完及时删除,请勿传播!
任何想借机牟利造成的侵权违法行为,请自负!


总之这篇文章就写到这里
更多精彩请见下图~

回复

使用道具 举报

2

主题

5

帖子

9

积分

新手上路

Rank: 1

积分
9
发表于 2022-9-20 13:16:27 | 显示全部楼层
6666太秀了 果然看完这些方法我想我还是花钱吧  脚本那个香
回复

使用道具 举报

1

主题

4

帖子

5

积分

新手上路

Rank: 1

积分
5
发表于 2022-9-20 13:16:33 | 显示全部楼层
1.书库是图书馆授权超星了2.我教的注册图书馆读者证账号的途径也是正规的3.用超星的客户端从他网站上下载也是正规的 4.个人不拿来出售,并不涉及侵权行为 5.非要纠结侵权行为是超星这个平台的问题
回复

使用道具 举报

2

主题

4

帖子

8

积分

新手上路

Rank: 1

积分
8
发表于 2022-9-20 13:17:31 | 显示全部楼层
没办法知乎很多内容不让发,想看原文可以从文末最后一张动图,或者我个人简介找来看
回复

使用道具 举报

0

主题

2

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2022-9-20 13:18:04 | 显示全部楼层
我也做过代找,里面很多坑,建议不要轻易入坑,讲讲我的经历吧。刚开始我是用的油猴加平底锅插件,但是这个每一份成本就需要3,我刚开始想着慢慢积累嘛,下次有人需要同一个书就不用再花钱了,这是最笨的方法。后来一次偶然的机会在某宝上看到有卖积分软件的,了解了一下价格很便宜,大概0.4到1.5的样子,那当然很兴奋了,于是赶紧买来,试用了一下果然又全又便宜,然后充值的积分越来越多,直到最近某一天,告诉我软件因种种原因需要暂停一段时间,后面会恢复,等通知,结果等了快一个月还是没有任何回复,我这才发现被坑了,商家跑路了。所以需要劝告大家的是,软件虽便宜,但一定不要一次性投入太多,据我所知很多这种商家跑路的。因为之前跟几个同行关系比较好,通过沟通,我又从同行那里买了书库,资源跟之前那软件是一样的,而且都是有ss号的方便查询,于是全部转存到网盘里,导出目录,后面查找时用目录查询工具查询,根据目录可以快速找到,虽然比软件慢了一点点,但是这个才是最稳定的。再后来,某宝管得越来越严,不让做了,哦豁,书库又闲置了大家肯定很多想尝试的,真心建议,不要轻易入坑
回复

使用道具 举报

0

主题

3

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2022-9-20 13:18:41 | 显示全部楼层
博大精深,佩服佩服[发呆]
回复

使用道具 举报

3

主题

6

帖子

12

积分

新手上路

Rank: 1

积分
12
发表于 2022-9-20 13:18:49 | 显示全部楼层
我下载过许多读秀的pdz,但是10几年从来没有读。所以现在一般不找书了。
[摊手]
回复

使用道具 举报

3

主题

7

帖子

13

积分

新手上路

Rank: 1

积分
13
发表于 2022-9-20 13:18:57 | 显示全部楼层
脚本的钱,谁赚了?
回复

使用道具 举报

1

主题

4

帖子

5

积分

新手上路

Rank: 1

积分
5
发表于 2022-9-20 13:19:13 | 显示全部楼层
脚本作者赚了。你可以把他当作一个会技术的淘宝卖家,不喜用的话自己花时间去问淘宝卖家一样的
回复

使用道具 举报

4

主题

8

帖子

16

积分

新手上路

Rank: 1

积分
16
发表于 2022-9-20 13:20:01 | 显示全部楼层
楼主好人一生平安
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表