V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
thinkdiff
V2EX  ›  分享创造

做了个阿里云盘搜索工具 YaPan

  •  
  •   thinkdiff · 123 天前 · 4920 次点击
    这是一个创建于 123 天前的主题,其中的信息可能已经有所发展或是发生改变。

    地址 https://pan.ccof.cc

    支持PWA ,可以添加到桌面

    以后不用看到好东西就存自己网盘占空间了。

    考虑做一个订阅功能,不知道有没有人感兴趣。

    56 条回复    2023-02-13 15:54:34 +08:00
    Xhack
        1
    Xhack  
       123 天前
    再做个失效检测
    buyan3303
        2
    buyan3303  
       123 天前
    以前有一个百度盘搜索比较好的网站,花点钱买网站的币,就能买资源下载,后来那个网站可能被发律师函了。
    lvsshuttao
        3
    lvsshuttao  
       123 天前
    试了下不错,就怕很快下线了,要不搞个备份网址?
    buyan3303
        4
    buyan3303  
       123 天前
    @lvsshuttao #3 更建议分享思路,不做成品,这样一般来说也不用考虑下线。
    SenLief
        5
    SenLief  
       123 天前   ❤️ 1
    来个 TG Bot 这样就算是网页挂了,也还能接着用。
    wbwm
        6
    wbwm  
       123 天前
    还以为是 yapian
    thinkdiff
        7
    thinkdiff  
    OP
       123 天前
    @Xhack 是的,还得过滤需要密码的
    thinkdiff
        8
    thinkdiff  
    OP
       123 天前
    @buyan3303 百度不行 下载速度太慢了 咱这个不收费,以后也不收费(如果能活到以后的话。。。)
    thinkdiff
        9
    thinkdiff  
    OP
       123 天前
    @lvsshuttao 谢谢 资源还在不断丰富中 关注这个帖子 如果挂了 我再更新
    thinkdiff
        10
    thinkdiff  
    OP
       123 天前
    @SenLief 用户量不多 再搞个 tg bot 貌似也没几个人用
    thinkdiff
        11
    thinkdiff  
    OP
       123 天前
    @wbwm yapian = ya + pian 这个名字还蛮有意思的
    fhzyi
        12
    fhzyi  
       123 天前
    试了下挺好的,如果能加一个筛选条件就更好了
    NeedforV2
        13
    NeedforV2  
       123 天前
    试了下挺不错的,希望能长久
    tediorelee
        14
    tediorelee  
       123 天前
    有无 pikpak 盘的..
    Ritter
        15
    Ritter  
       122 天前
    什么原理呀
    entimm
        16
    entimm  
       122 天前
    谢谢,如获至宝
    zhoujx
        17
    zhoujx  
       122 天前
    这种一般是怎么实现的呢
    Asimov01
        18
    Asimov01  
       122 天前
    试了好些东西都搜不到,自己分享过的东西也搜不到 😂
    iamcy
        19
    iamcy  
       122 天前 via iPhone   ❤️ 1
    @buyan3303 云盘精灵吧,确实很好用,很多资源都能搜到。
    toan
        20
    toan  
       122 天前
    嚯!速度好快,数据定时抓取的?
    asly
        21
    asly  
       122 天前
    好厉害啊,已收藏~
    SenLief
        22
    SenLief  
       122 天前
    好像无法直接定位过去啊
    amlee
        23
    amlee  
       122 天前
    有点好奇,原理是啥
    mway
        24
    mway  
       122 天前
    谢谢,现在收藏有三个搜索工具了。
    danhua
        25
    danhua  
       122 天前
    同好奇这类的网盘搜索的原理是啥
    zhygkx
        26
    zhygkx  
       122 天前
    好用 +1
    lincanbin
        27
    lincanbin  
       122 天前
    做爬虫的都很刑
    lizhesystem
        28
    lizhesystem  
       122 天前
    不错,速度很快。
    utre938722
        29
    utre938722  
       122 天前
    同好奇这类的网盘搜索的原理是啥
    w3cll
        30
    w3cll  
       122 天前
    @danhua 同好奇
    FightPig
        31
    FightPig  
       122 天前
    试了下,挺快的啊
    jfds
        32
    jfds  
       122 天前
    @mway 老哥分享下?
    Pogbag
        33
    Pogbag  
       122 天前 via iPhone
    挺好用的,感谢
    flymeto
        34
    flymeto  
       122 天前
    申请开源
    yukun666
        35
    yukun666  
       122 天前
    好用
    好奇原理是啥
    op351
        36
    op351  
       122 天前
    @Ritter
    我猜是从微博等平台上定向爬分享类博主的微博
    因为我搜了两部电视剧 结果都指向同一个分享账号
    estk
        37
    estk  
       122 天前 via Android
    2013 年我做百度网盘搜索时,还收到优酷官方邮箱发的警告函
    pkwenda
        38
    pkwenda  
       122 天前
    见过,但是一直搞不懂原理是什么 😂
    baisensenseng
        39
    baisensenseng  
       122 天前
    我有个朋友说为什么搜不到波多野结衣?
    TomPig0216
        40
    TomPig0216  
       122 天前
    搜了下 速度还挺快
    thinkdiff
        41
    thinkdiff  
    OP
       122 天前
    感谢大家的鼓励和收藏,特别是给予我感谢的朋友。

    不出意料很多人对背后的原理感兴趣,这也是我喜欢 v2 的原因。其实不复杂,从网络上爬取公开分享的资源链接,并解析链接内的文件。将得到文件名和链接地址做成 KV 缓存到 MongoDB 。在搭建一个 WSGI ,做个搜索页面即可。

    主要到技术栈:Python / Scrapy / MongoDB / HanLP / Vue 3 / UnoCSS / NativeUI


    @zhoujx
    @amlee
    @danhua
    @utre938722
    @w3cll
    @yukun666
    @op351
    @pkwenda
    thinkdiff
        42
    thinkdiff  
    OP
       122 天前
    做这个工具初衷是为了方便我个人使用。主要解决两个问题,一是存储空间,太多想要的资源无奈自己网盘空间有限。二是找资源效率,以前需要从各种渠道获取资源,有些还得爬楼找,遇到一个大合集还得进入合集内部搜索,效率太低。

    合规性是网盘搜索工具的共性问题,所以想向 V 有请教下如何尽量规避此类风险?

    如果像 @estk 那样收到官方告警函,网站会尽快下线,毕竟咱不获利,没必要引麻烦。

    如果有天网站被下线,我会考虑开源代码。

    @buyan3303
    @SenLief
    @NeedforV2
    @lincanbin
    @flymeto
    @estk
    estk
        43
    estk  
       122 天前
    @thinkdiff #42
    2013 年优酷有一部新剧在上映,百度网盘有人传,我就采集到了,优酷没找网盘反而来找我。我就把哪部剧的名字放进搜索黑名单然后回复邮件告知对方,同时把百度网盘官方的举报链接也发给他们。这是网盘的责任,搜索引擎如果也要担责,那谷歌就是黄色网站搜集器
    mway
        44
    mway  
       122 天前   ❤️ 1
    @jfds UP 云搜、猫狸盘搜
    thinkdiff
        45
    thinkdiff  
    OP
       122 天前
    @estk 谢谢,学到了,我打算加个免责声明和举报功能 :)
    pkwenda
        46
    pkwenda  
       122 天前
    @estk 👏🏻
    fenglingyu
        47
    fenglingyu  
       122 天前
    楼主这个不错啊,以前用过几个,现在都死了
    weiliangweiliang
        48
    weiliangweiliang  
       122 天前
    谢谢 op ,我拿来出版社 挺好用的
    macy
        49
    macy  
       122 天前
    很不错,建议增加一个筛选功能,是文件夹还是文件,有些电视剧是在一个文件夹里有好多集,这样方便下载
    moranrs
        50
    moranrs  
       121 天前
    感谢 op ,用这个我找到了一个很不错的电子书分享合集
    https://www.aliyundrive.com/s/sD4YdCPQx93
    yusifeng
        51
    yusifeng  
       121 天前
    牛的
    heyleo
        52
    heyleo  
       120 天前
    真的感谢楼主分享
    noshiro
        53
    noshiro  
       120 天前
    感谢分享
    lion
        54
    lion  
       112 天前
    建议在搜索页加个首页 log 点击返回的设计
    QuinYim
        55
    QuinYim  
       109 天前
    感谢分享
    colarxu
        56
    colarxu  
       40 天前
    在用了 谢谢!
    关于   ·   帮助文档   ·   博客   ·   nftychat   ·   API   ·   FAQ   ·   我们的愿景   ·   广告投放   ·   实用小工具   ·   2531 人在线   最高记录 5556   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 47ms · UTC 08:05 · PVG 16:05 · LAX 01:05 · JFK 04:05
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.