V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
SKull4
V2EX  ›  程序员

抖音是怎么识别视频的呢

  •  1
     
  •   SKull4 · 2020-04-14 10:57:52 +08:00 · 6349 次点击
    这是一个创建于 1685 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我把抖音上好看的下载下来,然后自己再发布一下,结果一个播放量都没有
    我看别人原先视频再播放一下都有几十万的点赞

    第 1 条附言  ·  2020-04-14 15:45:03 +08:00
    没想到这么多道德卫士能联想这么多
    https://ieeexplore.ieee.org/document/7014798
    翻到一篇关于 video fingerprint 挺有意思,再有人来喷麻烦 @站长直接删帖吧
    45 条回复    2020-04-15 14:16:29 +08:00
    lxghost
        1
    lxghost  
       2020-04-14 11:01:03 +08:00   ❤️ 1
    ......
    Vegetable
        2
    Vegetable  
       2020-04-14 11:03:43 +08:00
    参考大魔导师马化腾
    westoy
        3
    westoy  
       2020-04-14 11:05:52 +08:00
    和原不原创没关系, 是不是好看的, 你权重低都没流量的

    当然你要原创的可以考虑氪 DOU+
    wutiantong
        4
    wutiantong  
       2020-04-14 11:06:09 +08:00   ❤️ 3
    知不知道丢人啊?
    Juszoe
        5
    Juszoe  
       2020-04-14 11:06:47 +08:00
    这不是...盗视频吗?
    keithying
        6
    keithying  
       2020-04-14 11:09:07 +08:00 via Android
    盗视频……
    SKull4
        7
    SKull4  
    OP
       2020-04-14 11:09:53 +08:00
    @wutiantong #4
    @Juszoe #5 抖音下载下来,都带有原视频的抖音号和头像,怎么丢人了,就是想再发布一下啊,我看别人也是下载下来再播放有好多心心啊
    zjl03505
        8
    zjl03505  
       2020-04-14 11:12:12 +08:00
    就是盗视频了,当然去掉水印的更加下贱而已
    JerryCha
        9
    JerryCha  
       2020-04-14 11:13:20 +08:00
    @迷惑行为大赏
    你一个三无号还想要流量,洗洗睡吧。
    zhangH258
        10
    zhangH258  
       2020-04-14 11:16:11 +08:00
    我也挺好奇的,单纯出技术角度来说。

    理论上相同的视频也应该能有差不多的流量
    wutiantong
        11
    wutiantong  
       2020-04-14 11:18:26 +08:00
    @SKull4 带有原视频的抖音号和头像,怎么丢人了

    带这些的理由不是为了允许你盗发,而是为了最大程度地降低原创者受到地伤害。

    如果你喜欢一个视频并希望传播它请用“转发”这个功能。
    haohh
        12
    haohh  
       2020-04-14 11:20:20 +08:00
    低权重号播放过不了 500... 氪金也没用 氪完还是那样
    SKull4
        13
    SKull4  
    OP
       2020-04-14 11:20:23 +08:00
    @zhangH258 #10 技术角度来看播放量低肯定和账号权重相关,但是一个播放量没有那肯定是视频被封了,是怎么识别的呢,如果说下载下来有特征值识别的话,那为什么有的也是带有水印的视频有很高的播放量
    wutiantong
        14
    wutiantong  
       2020-04-14 11:21:06 +08:00
    @SKull4 另外,带抖音号和头像的主要原因其实是,当你通过转发到微信来下载它并发到微信上后,微信上看到的人可以通过这个抖音号去抖音上找到原作者。
    SKull4
        15
    SKull4  
    OP
       2020-04-14 11:38:02 +08:00
    @haohh #12 什么是低权重号,能留个联系方式么交流下么
    itgoyo
        16
    itgoyo  
       2020-04-14 11:47:04 +08:00   ❤️ 1
    [我把抖音上好看的下载下来,然后自己再发布一下,结果一个播放量都没有] 每个视频都有 md5 值,抖音后台会查重,不然搬运号这么好养的?二,视频截帧识别。你以为去掉水印从心发布就可以了?不存在的,还有二次剪辑
    odi
        17
    odi  
       2020-04-14 11:49:31 +08:00
    技术社区怎么了?

    识别一条视频是不是重复很难么,毕竟视频不也是二进制的,提取特征不是很容易?

    实际上,高级点的盗视频,也会特意去解决这样的问题。混淆一下,生成新的特征码

    你看到的是两个视频是一样的,那只是你的眼睛欺骗了你,或者你眼睛识别不了罢了。
    hoyixi
        18
    hoyixi  
       2020-04-14 11:54:24 +08:00
    不推测你的原因。
    单说识别技术,完全可以识别你是搬运的。
    TimeRain
        19
    TimeRain  
       2020-04-14 11:56:34 +08:00
    识别算法呀,不过还是别这样搬运,youtube 更厉害
    chinaqzxh
        20
    chinaqzxh  
       2020-04-14 12:22:54 +08:00 via Android
    不仅仅是 md5 会抽帧对比
    superrichman
        21
    superrichman  
       2020-04-14 12:38:57 +08:00 via iPhone   ❤️ 1
    老营销号了 /doge
    cz5424
        22
    cz5424  
       2020-04-14 13:00:12 +08:00 via iPhone
    反感营销号,建议楼主收手
    finely
        23
    finely  
       2020-04-14 13:05:41 +08:00
    字节跳动最出众的就是算法,搞个视频查重有啥难的
    mumbler
        24
    mumbler  
       2020-04-14 13:11:28 +08:00 via Android
    非原创视频会限流,除非主动进主页观看,feed 流是一个流量不给的,判断原创主要通过随机截图对比
    MooneyDiy
        25
    MooneyDiy  
       2020-04-14 13:21:00 +08:00
    D 音推荐跟第几次发关系不大,内容优秀就会推荐,不存在第一次还是第二次
    第二遍火了,很有可能是抖音推荐的用户喜好与视频内容匹配度更高,获得了比较好的用户反馈
    SKull4
        26
    SKull4  
    OP
       2020-04-14 13:50:37 +08:00
    murmur
        27
    murmur  
       2020-04-14 14:11:38 +08:00
    这是最弱智的洗稿方式,真的,至少做个串烧做个解说,加工一下也不止于此
    no1xsyzy
        28
    no1xsyzy  
       2020-04-14 14:23:22 +08:00
    https://www.v2ex.com/about
    > 这里绝对不会有任何教人如何钻空子的讨论

    而楼主的问题容易导致别人开始教楼主如何钻空子,请各位注意。

    而且,比对查重太 trivial 了,请课后花两个小时自己完成(
    hotcool100
        29
    hotcool100  
       2020-04-14 14:48:11 +08:00
    有的人会倒放、左右调换,总之原模原样肯定不行
    jellybool
        30
    jellybool  
       2020-04-14 15:00:37 +08:00 via Android   ❤️ 1
    @SKull4 你这就是盗视频,你这就是丢人。

    这行为还理直气壮,真牛逼。
    ipixeloldc
        31
    ipixeloldc  
       2020-04-14 15:57:57 +08:00
    @hoyixi 哈哈,把别人剪辑的 xxx 直播录像和 xxx 直播直播录像,识别为同一个,然后根据播放量高低,判断 xxx 抄袭,然后封掉 xxx 的收益化这种事情也就油管的智障 AI 干的出来了,噗
    wangyzj
        32
    wangyzj  
       2020-04-14 16:00:27 +08:00
    这玩意得看命
    Aruforce
        33
    Aruforce  
       2020-04-14 16:02:32 +08:00
    @SKull4 你不该这么问....你该问怎么识别站内视频再投稿...
    745839
        34
    745839  
       2020-04-14 16:03:11 +08:00 via Android
    @ipixeloldc 你自己能明白你在说什么吗
    tabris17
        35
    tabris17  
       2020-04-14 16:04:05 +08:00
    你好歹文件压缩处理一下啊,一模一样的视频文件,hash 都一样的好嘛
    Aruforce
        36
    Aruforce  
       2020-04-14 16:04:20 +08:00
    @Aruforce 或者图像相似度算法
    eGlhb2Jhb2Jhbw
        37
    eGlhb2Jhb2Jhbw  
       2020-04-14 16:38:43 +08:00
    流氓会技术,谁都挡不住,玷污了程序员这个圈子。
    areless
        38
    areless  
       2020-04-14 18:43:49 +08:00 via Android
    我也很疑惑,为什么去上海拍沈大师的都能有那么多星星
    ipixeloldc
        39
    ipixeloldc  
       2020-04-14 22:42:39 +08:00
    @745839 额,这事最近闹的很大啊,你不知道吗???很多 Youtuber 的收益化都没了(不过现在倒是大多都申诉成功了)。你看不懂是你的问题,我描述的十分清楚。(当然由于我不能直接说 youtuber 的名字,所以我这里全部用 xxx 代替,这确实是一个可能会被误解的地方)所以你是哪里看不懂,指出来,我可以给你解释下。
    ipixeloldc
        40
    ipixeloldc  
       2020-04-14 22:48:27 +08:00
    @745839 油管 AI 把其他人剪辑过的视频(剪辑的内容是 A 的直播录像)和 A 自己直播录像的存档识别为了同一个。现在清楚了吧
    ipixeloldc
        41
    ipixeloldc  
       2020-04-14 22:58:56 +08:00   ❤️ 1
    @745839 哈哈,把 别人剪辑(过)的 “xxx 直播录像” 和 “ xxx 直播录像(存档)” ,识别为(了)同一个(视频),然后根据(这两个视频)播放量高低(等因素),判断 “xxx” [注:人名] 抄袭,然后(据此)封掉 (了)“xxx” [注:人名] 的收益化(,)这种事情也就油管的智障 AI 干的出来了,噗
    qwerthhusn
        42
    qwerthhusn  
       2020-04-15 10:14:37 +08:00
    我感觉现在抖音越来越 lj 了

    司马笑声这个就不说了,有人就喜欢听,倒也没什么。
    视频上有字,经常会出现一些非常简单的错别字,不知道是不是 up 主故意为之,比如把“钱”打成“前”
    一个视频,各个版本都有,加水印的,没水印的,滤镜的,左右翻转的。
    zhw2590582
        43
    zhw2590582  
       2020-04-15 13:37:30 +08:00
    什么叫我看别人这样做没事,你也这样做,居然以别人不道德的行为作为标准?!
    locoz
        44
    locoz  
       2020-04-15 14:15:13 +08:00
    @qwerthhusn #42 错别字是因为语音识别转字幕,发布者也没觉得这个是什么大问题(不用心),于是就一堆错别字
    locoz
        45
    locoz  
       2020-04-15 14:16:29 +08:00
    将人工智能融入多媒体 助力视频产业加速——阿里云视频 AI 全能力解读
    https://yq.aliyun.com/articles/364886
    参考视频版权保护部分
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2723 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 11:10 · PVG 19:10 · LAX 03:10 · JFK 06:10
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.