V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  xyyandxyy  ›  全部回复第 1 页 / 共 1 页
回复总数  14
@gaobh 谢谢佬, 从你这才知道 cf 有这个, 看了一下好像我的数据这么大还是要比较高的费用的, 但是 mark 了!
@xianghaolin 嗯嗯我看了一下确实是

@NewHere 没有公网 IP 呜呜

@NSAgold
@IvanLi127
@XiLingHost
谢谢佬的建议! mark 了!
是这样的...

主要是组内一般只维护一个静态的官网, 对外开放的存储还没有人来做, 要做也得抓其他同学(会维护且愿意做的同学不多)或自己来做, 整个流程更麻烦(因为还要去和管理的老师对接), 不如我在自己的服务器上写一个.

我们领域有一些数据集是如佬所说的附属 edu/ac 机构页面, 也是比较大的数据集, 但是时间久了(5 年往上), 很多也断了维护, 或者是下载速度龟速. 也基本是靠社区分享才能获取. 确实审核也就维持个前一段时间的几年, 之后就不在了...

所以综合时间和精力成本还是自己来研究下... 寄希望能少折腾点. 数据集还是有价值的, 我希望能送到需要的研究者手上, 减少他们去翻找的痛苦. 但是大组可能确实不 care, 每年三大会一堆, 不差我一个小小数据集.
@northbrunv 但是带宽成本感觉有点吓人
@1423 archive 是?
@chesha1 嗯嗯, 大佬说的有道理. 因为数据集涉及到一些隐私, 按照目前类似数据集的做法, 一般都是我做一个 request form, 然后审核 request 后发一个下载链接过去. 感觉 HF 可以研究一下怎么放上去, 刚刚查了一下好像没有上传大小限制.
@kebamt 可以完全不管国内访问, 因为国内访问我直接提供个百度云. 佬除了 PikPak 还有什么推荐吗? 自建也可以, 我是校园网, 校内有自己的服务器, 但是校外访问, 并下这个大个数据集, 没有想到怎么解决办法.
@UncleCAT4 淘宝上写的是扩容, 原理应该是拼车
害怕。小弟 985 本,华 5 硕,计算机视觉方向。最近导师能硕转换博,但是由于感觉可能做的方向不喜欢,在考虑去大厂捞几年。看了贴之后担心在 30 岁之后会不会和 op 遇到一样的情况和纠结。有没有老哥能指点一下
169 天前
回复了 szxht 创建的主题 问与答 有没有大佬讲讲光电专业
如果是 985 ,如果本来成绩或应试还可以,可以利用考研或保研适合深造,因为本科直接上班不太好利用本专业优势。看你是什么本科
230 天前
回复了 robking 创建的主题 程序员 本科深度学习毕设
@robking 那你可以先假设这篇论文也是纯水的,不要太依赖去通过这篇文章解决你现在的问题。如果你还想稍微跑一下结果的话(假设你已经有数据了!), 建议你需要做的就是面向 google ,b 站学习,配好 conda 环境。剩下的事情面向 gpt 编程,你可以让他帮你写好 pytorch 下 dataloader ,dataset 对应的类,写好 model 的定义,然后写好 train 和 test 的过程。你有了 dl 基础知识,面向 gpt 编程的可行性还是有的(或者你去 copy github 上对应这个领域的开源工作改改)。如果你感觉为时已晚,已经要完蛋了,建议还是先请客吃饭找身边前辈请教一下,然后也边做上面的事情,这样你答辩糊弄的时候也有话可说。
230 天前
回复了 robking 创建的主题 程序员 本科深度学习毕设
@hello2090 ccf-a 类会议类似的
231 天前
回复了 robking 创建的主题 程序员 本科深度学习毕设
不知道 op 提到的这个研究生论文是毕业论文还是投顶会的,以下按照是毕设来理解。

建议找靠谱的师兄师姐或导师的学生(通过请客吃饭喝奶茶)非常具体地口头指导一下要做什么,不然最后可能是要纯糊弄,那一篇研究生论文大概率训练代码是拿不到的(也不一定存在)。认真的话,基本路线就还是学一下 pytorch 怎么写,可以通过问问 gpt 进行学习,然后可以考虑复现那篇研究生毕设工作(这一步除了准备数据集,应该也是可以通过问 gpt 来写好整篇的最简单框架,一些实验 trick 还有小问题可以通过咨询之前你找的前辈),如果最后结果还 ok ,那就改装模组换 backbone ,扯出一个自己的贡献。如果结果不 ok ,你此时应该也熟悉了深度学习的流程,你也可以再 follow 一些其他工作,糊弄下
240 天前
回复了 44maker 创建的主题 职场话题 应届生在上海找不到工作怎么办
什么 u 呢
289 天前
回复了 LinKang777 创建的主题 GitHub 好像又可以裸连 github 了
日经
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1130 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 23ms · UTC 18:20 · PVG 02:20 · LAX 10:20 · JFK 13:20
Developed with CodeLauncher
♥ Do have faith in what you're doing.