首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
black11black
V2EX  ›  问与答

想要做一个多人协同文档编辑器,请问有什么算法可以判断出文档中修改了那部分内容吗?

  •  
  •   black11black · 35 天前 · 940 次点击
    这是一个创建于 35 天前的主题,其中的信息可能已经有所发展或是发生改变。

    如题,昨天在折腾 websocket 的 demo,折腾好了以后想做点什么项目

    web 聊天好像没啥意思,然后想了想似乎做一个多人协同在线编辑文档不错。 有一个技术上的问题想不明白就是,多人同时连线到一个文档,ws 发送到同步服务器的内容肯定是增量更新,不可能编辑一个大文档把整个文档都发过去,所以快速地查找到哪里修改了些什么是前端必须要做的,

    简单想了一下算法,想不太懂。之前用过 beyond compare 那种对比软件,可以光速查找出来两个文档的差异,还有 github 上也是,之前就不太懂是怎么做的。 我想比如你用 lsc,虽然可以 dp 优化,但复杂度仍然是 O(m^2),一万字的文档时间复杂度是一亿,实在是太过匪夷所思,基本上可以确定 github 和 beyondcompare 不是这么实现的。

    那么到底咋做啊? 求教求教

    9 回复  |  直到 2020-01-18 00:49:26 +08:00
    agagega
        1
    agagega   35 天前 via iPhone   ❤️ 1
    为什么一定要 diff ?虽然我不知道这些系统是如何实现的,但是把编辑的动作建模成一个个事件,然后用类似事件溯源的模式来在另一个客户端上重放事件应该也可以?而且这样要解决冲突似乎要方便点?
    agagega
        2
    agagega   35 天前 via iPhone
    而且 diff 的 lsc 也不是以字符为单位的吧
    casparchen
        3
    casparchen   35 天前 via iPhone
    Operational transformation
    Austaras
        4
    Austaras   35 天前
    存 diff
    learnshare
        5
    learnshare   34 天前
    有论文,可以去研究
    passerbytiny
        6
    passerbytiny   34 天前   ❤️ 1
    这种东西,你不能用常规的增删改查思路去做。文档差异化对比的方式,不止是性能问题,一致性也保证不了的。你可以考虑 Event Soucring + CQRS。
    RyuZheng
        7
    RyuZheng   34 天前   ❤️ 1
    上次看阮一峰博客看到了,不是用 diff,而是存时间戳+操作步骤

    [ShowMeBug 核心技术内幕]( https://yafeilee.com/blogs/100)
    black11black
        8
    black11black   33 天前
    @agagega
    想了一下,这种追溯操作有递归性,你影响一个后面的全变了。实际情况比如网络突然中断,丢了一个包之类的
    agagega
        9
    agagega   33 天前 via iPhone
    @black11black 能合并的就合并,不能合并的就当作冲突呗,类似 Git merge 一样
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   3015 人在线   最高记录 5168   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 01:17 · PVG 09:17 · LAX 17:17 · JFK 20:17
    ♥ Do have faith in what you're doing.