现在很多时候会去 b 站搜索视频学习,但是搜到的基本都是培训机构的视频,所以萌发了想提取出优质视频的想法,爬取弹幕,评论,播放量什么的应该没什么问题,关键是这个识别算法,不知道怎么弄
所以想问下 v 友们,识别 b 站某个视频质量应该怎么搞,是直接关键词判断什么的,还是有专门的这样一种机器学习算法,不知道是不是这种 https://www.infoq.cn/article/9PJVW5Ef5KsbubzJccPd
同时还想问下,如果涉及到机器学习,成本是不是有点高,因为没有接触过机器学习
1
murmur 2020-05-16 10:48:44 +08:00
你的试看,b 站都是搬运的盗版视频,总有能搬到优质资源
另外,培训班的视频不是一无是处,他讲的概念可能达不到术语标准,但是基本都是要做代码演示的,如果瞎讲演示就要翻车 |
2
M3ng 2020-05-16 11:00:50 +08:00 via iPhone
质量的定义是什么,每个人的定义都不一样何况机器。浏览量、弹幕数与评论数这些至少能说明受欢迎程度。
|
3
lyminghao 2020-05-16 11:02:51 +08:00 1
基于学习的思路就别想了,需要获取大量标注数据来训练,个人 /小团队很难实现。
还是基于规则现实一点,拟合一下播放量、点赞投币、评论弹幕,弄个打分函数。 |
4
em70 2020-05-16 11:04:06 +08:00
机器学习可以发现人无法总结的规律,但参数维度要足够多才行
|
5
chocovon 2020-05-16 11:25:34 +08:00
特意去查了一下,这都是画面质量上的评估吧……
|
6
zero469 2020-05-16 14:24:01 +08:00
建议直接用播放量、弹幕数、点赞数这些数据拟合一个得分,然后根据得分高低选视频
|
7
dingwen07 2020-05-17 09:57:00 +08:00 via iPhone
硬币数除以点赞数
越高的视频质量越好 |