V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
jackon
V2EX  ›  分享创造

做个牛 X 的电子书工具--BookHub

  •  
  •   jackon ·
    JackonYang · 2018-02-09 00:04:11 +08:00 · 5460 次点击
    这是一个创建于 2481 天前的主题,其中的信息可能已经有所发展或是发生改变。

    大学的时候,就想找个好用的电子书管理工具,至今没找到。sad...

    用过 Calibre, Mendeley, 也曾是文献管理工具 JabRef(Latex) 的重度用户。

    都挺棒,但都少那么一点感觉。

    日常痛点

    1. 花了那么多时间整理电子书,找书的时候依旧一脸懵。

    信息大爆炸的时代,最好的交互工具就是“搜索引擎“

    互联网上的 Google, Mac 上的 SpotLight, Windows 下的 Everything(软件名)

    能不能做一个软件,不需要太多时间整理书,但找书的时候,搜一下就够了。

    随着使用时间的增加,搜索可以越来越 AI 智能(障)

    2. 电子书管理工具和笔记管理,一直是两条平行线, 为什么?

    或许,开发成本/技术栈是个主要原因。

    现在,我们有 electron 了,无所不能的 node.js 什么都可以写。

    3. Calibre 可以根据文件信息自动从豆瓣等网站匹配作者、出版社等信息

    如果有一个云端,就可以把电子书文件及其匹配结果共享出来,不用每个人重复做一遍了。

    4. 电子书管理和文献管理之间的距离,很近,又很远。

    文献管理,只考虑怎么能简单的生成参考文献。

    电子书管理,似乎从不在乎科研群体。

    一个好的阅读工具,是可以做图书推荐的。

    举个例子:

    最近读 <机器学习高手攻略>, 看不懂。

    A 读过,很喜欢。B 读过,也很喜欢。他们在读这本书以前,都读了《机器学习入门》。

    那么,我们可以认为,我应该先读一读这本书。

    A 和 B 之后又都读过 《颈椎病指南》,我看懂这本书之前,不要给我推荐,看不懂的。

    做图书推荐的时候,阅读顺序是很重要的。

    这其实已经有知识地图的概念了,

    豆瓣也有这些数据,但那个标记一本书的成本太低,装 B 的因素也很重。

    标记自己全部阅读记录的成本又太高,

    无法做到基于阅读顺序的推荐。

    电子书工具,可以获取用户完整的阅读记录,甚至打开一本书的时间和频率。

    数据更真实,推荐更靠谱。

    参与

    代码库: https://github.com/JackonYang/bookhub

    技术栈

    • PC Client:Electron + React + Redux
    • Data Platform: Python

    调查问卷 https://jinshuju.net/f/3wSWpy

    第 1 条附言  ·  2018-02-09 10:04:43 +08:00
    1. 工具还在开发中,client-PC 目录下是 active 的代码。README 有贴 UI Design / Release Plan 的 document。
    2. 稍后会把调查的结果,以邮件的方式 share 给填写了邮箱的有效回答。昵称/邮箱/微信/坐标不会 share。
    3. Release 的时候,会打包,绿色软件。Mac/Linux/Windows 都可以使用。
    4. 如果想尝鲜,可以 clone 代码,npm install 一下,根据 README 的步骤就可以跑起来。
    5. V0.1 版本,已经画完了页面,做了 Scan 电子书的逻辑。剩下的主要是搜索。
    6. MainProcess 是单线程的,会 Block GUI,大概要用 web worker 来做,node.js 新人还没玩转。稍微会 Fix。
    23 条回复    2018-03-01 10:42:07 +08:00
    01802
        1
    01802  
       2018-02-09 00:06:42 +08:00 via Android
    靠谷歌桌面这软件可以方便搜索,早就没升级了
    youxiachai
        2
    youxiachai  
       2018-02-09 00:34:55 +08:00
    Calibre 不是自带就能分享了吗....为啥要手动...?

    无论是 Calibre-web 还是 Calibre 整库分享或者导入
    youxiachai
        3
    youxiachai  
       2018-02-09 00:37:58 +08:00
    看了一圈,推荐这块...感觉就像个 calibre Goodreads 插件干的事情..
    qianyi0129
        4
    qianyi0129  
       2018-02-09 08:16:34 +08:00
    你这是还没完工?
    qianyi0129
        5
    qianyi0129  
       2018-02-09 08:17:00 +08:00
    我说怎么不知道咋安装
    qiuai
        6
    qiuai  
       2018-02-09 08:26:46 +08:00
    加油.我 NAS 里的几万本书都不知道怎么办好了...
    hei1000
        7
    hei1000  
       2018-02-09 09:02:49 +08:00
    @qianyi0129 #5 +1,README 就是个项目简介,什么都没有
    jackon
        8
    jackon  
    OP
       2018-02-09 10:08:46 +08:00
    @youxiachai Calibre 的这几个功能,你感觉非常好用么?工具的功能点来自于 calibre 的启发,只是对他的 UX 接受无力。所以,决定自己做?

    @qianyi0129 , @hei1000

    还在开发中,附言更新了开发进展。

    @qiuai 看起来像是一个潜在的重度用户。 :D
    qiuai
        9
    qiuai  
       2018-02-09 10:27:01 +08:00
    @jackon 我一直需要一个合适的软件来管理...
    qianyi0129
        10
    qianyi0129  
       2018-02-09 10:35:48 +08:00
    @jackon calibre 有命令行工具啊 很好用 尤其是那个格式转换 我用不喜欢他那个界面
    qianyi0129
        11
    qianyi0129  
       2018-02-09 10:36:15 +08:00
    @qiuai 搭建个本地网站
    shoumu
        12
    shoumu  
       2018-02-09 10:37:36 +08:00
    考虑加论文管理什么的吗?
    shoumu
        13
    shoumu  
       2018-02-09 10:41:43 +08:00
    弱弱地问一句,UI 图有什么制作的,看起来挺好的
    jackon
        14
    jackon  
    OP
       2018-02-09 10:51:42 +08:00
    @shoumu 关于论文管理,暂时计划以下功能:

    1. 主要是自动生成参考文献吧?跟 word/latex 对接,可以自动更新 references
    2. 支持导入 citation 信息
    3. 与期刊网站自动同步 citation 信息/下载论文

    还有其他你比较看重的功能么?

    UI 图是朋友做的,不了解是什么工具。
    omph
        15
    omph  
       2018-02-09 11:01:13 +08:00
    基于盗版资源做共享服务,怕是会出问题
    但对散装书籍做分类检索,信息管理,倒没见过这方面比较完善的软件
    对于大量书籍,增量更新是个问题
    电子书可以加书签、 批注,md5 会变化
    shoumu
        16
    shoumu  
       2018-02-09 11:24:16 +08:00
    @jackon
    额,已经过了写论文的年纪了,现在主要是看论文,经常下载很多论文,管理挺麻烦的
    文献管理方面,感觉 Papers 做得还行,可惜是一个收费软件

    关注这个项目,但是感觉你现在对整个工具的需求还没有想清楚,用户具体的痛点分析也不够透彻。关于推荐这一点,也是片面地追求和 AI 之类的技术结合,然而推荐系统想要发挥出作用,基本的数据什么的也很难在短期内积累到。

    如有冒犯,还请见谅

    又仔细看了一下,UI 应该是用 Sketch 做的,但是现在看,亮点不足
    jackon
        17
    jackon  
    OP
       2018-02-09 12:26:03 +08:00 via iPhone
    @shoumu 我不太理解,如果不写论文,电子书管理和论文管理,有什么区别?
    jackon
        18
    jackon  
    OP
       2018-02-09 12:28:18 +08:00 via iPhone
    @omph 书签和批注不会加到原始文件里,所以 md5 不变。

    另外还可以读取指定位置的 content 计算 md5,即使改了批注,也不会变。只是计算 md5 的逻辑要复杂了一些。
    Cbdy
        19
    Cbdy  
       2018-02-09 12:54:02 +08:00 via Android
    没有人考虑给 pandoc 做个 gui 吗?大多数时候都用这货
    adrianzhang
        20
    adrianzhang  
       2018-02-10 06:44:32 +08:00 via Android
    看了介绍,我认为不得不说这是一个空白市场,所谓的蓝海。有内容的厂商不少,有良好管理的分享有豆瓣,但结合得很好的目前据我所知并没有。正如楼上有 v 友指出,没有内容基于盗版来做有问题。我的理解是:可以作为个人知识管理工具,先实现个人云和端,你的这些 idea 可在端实现。然后该技术可以给有内容的厂商做 OEM。最终这个技术改良是属于有内容厂商例如亚马逊的。
    mawangye
        21
    mawangye  
       2018-02-11 11:30:33 +08:00
    支持下,之前也做过一个电子书,文档,文献类的管理工具是个 saas 服务。用户使用量还是还挺大的,但大多用户是在管理盗版书,所以一直也没敢开放分享,共享的功能。春节后有时间打算把这个工具修改修改开源出来。
    jackon
        22
    jackon  
    OP
       2018-02-11 20:39:04 +08:00
    @adrianzhang 如果是工具的思路,不需要内容。如果是分享,则存在版权的问题。云端,可以走 dropbox 的思路,不会涉及内容及其版权问题。至于 百度云 等国内的云盘纷纷关闭,则是局部地区非商业因素导致的。

    @mawangye SaaS 服务,那是类似于 dropbox, 百度云的逻辑么?
    fbqk2008
        23
    fbqk2008  
       2018-03-01 10:42:07 +08:00
    赞一个
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   929 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 19:46 · PVG 03:46 · LAX 11:46 · JFK 14:46
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.