@
hiko2chen #45
36 楼的 PDF ,可能重复图片只保存了一份,但你可能重复压缩并存储了,所以体积缩小不明显?
---
1. 我用 pdfimages 解包出原始图片,压缩前共 55.6 MB ,极致压缩后共 21.0 MB ,都是 6297 张。
2. 再用 rdfind 删除重复文件后,压缩前剩 3086 张 27.4 MB ,极致压缩后剩 3186 张 9.2 MB 。(难道同一张图片,多次压缩结果不同?)
3. 猜测:
3.1 原 PDF 只存储一份重复图片(因为 55.6 MB > 51 MB ,还有其他内容、字体等要存储)
3.2 极致压缩后,可能重复图片也原样存储了,因为 ( 51 MB - 42 MB = 9 MB 极致压缩后节省体积 ) = ( 27.4 MB - 21.0 MB + 其他被精简掉的 2.6 MB ),看起来对得上?
3.3 如果极致压缩后,也能去掉重复图片,最终文件应该能小至 30 MB ?
---
感觉除非大幅牺牲画质,jpg / png 已经很难再减少体积了。。
要是 PDF 支持 avif 、heic 、jpeg-xl 等先进格式图片,就好了。。
4K 阿凡达图,4.23 MB jpg ,压成 0.15 MB avif ,减少 97% 体积,细节纹路噪点都还保留的可以。。
实测 avif-enc 压一遍那 3086 张原图,原始分辨率,画质基本不变时,可减少 72% 体积,只剩 7.8 MB 。。
