V2EX › thinszx 的所有回复 › 第 6 页 / 共 6 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

1 2 3 4 5 6

❮

❯

2020-03-27 23:46:56 +08:00

回复了 thinszx 创建的主题 › 机器学习 › 在图像识别时，图像大面积空白的部分对算法学习到的特征会有影响吗？

@lsvih 其实我这个是复现一篇论文的，文中用的是 resnet/cnn 加 bilstm 的结构，resnet/cnn 部分主要是截取的报文部分转图片，其实利用的就是流量交换的信息头和数据，可能是因为图像的算法还是成熟些吧，现成的东西多，不过你说的对，seq model 从效率上讲比图片高多了，光是转图片的过程就够我训练模型了...

2020-03-27 22:00:55 +08:00

回复了 thinszx 创建的主题 › 机器学习 › 在图像识别时，图像大面积空白的部分对算法学习到的特征会有影响吗？

@ColinDowney 谢谢！😊

2020-03-27 21:59:49 +08:00

回复了 thinszx 创建的主题 › 机器学习 › 在图像识别时，图像大面积空白的部分对算法学习到的特征会有影响吗？

@Mohanson 谢谢指教！这个图片是用恶意流量转十六进制转出来的，因为想着图像识别的算法比较成熟，所以试了一下，空白部分是流量长度不够做的补位，如果要丢弃掉黑色部分的话可能就只能选取图片中完整的部分做了，会不会丢掉很多特征呀？

2020-03-27 20:56:14 +08:00

回复了 thinszx 创建的主题 › 机器学习 › 在图像识别时，图像大面积空白的部分对算法学习到的特征会有影响吗？

@ThirdFlame 可是我模型跑出来的结果很好（我本来以为能有七八十的准确率就上天了），如果有影响的话，是图片具有多少空白部分这个特征也被学习到了吗？实在是想不通，查论文好像也没人研究过

2020-03-19 20:26:27 +08:00

回复了 thinszx 创建的主题 › Python › pandas 关于 groupby 的分组保存问题：如何将分组完以后的值按照某个列分别存为新 dataframe？

@jyyx 得到的数据没有问题，但是数据类型不太对，我想直接得到 dataframe 类型的数据，你的方法得到的是 list 型的，如果要得到 dataframe 型的数据还需要再转一次，可能我表达的不太清楚，MisterLee 的方法就是我想要的了，直接得到了 dataframe 格式的分组

2020-03-19 12:54:10 +08:00

回复了 thinszx 创建的主题 › Python › pandas 关于 groupby 的分组保存问题：如何将分组完以后的值按照某个列分别存为新 dataframe？

@wittyfans 谢谢，真的很有帮助！！！

2020-03-19 12:33:32 +08:00

回复了 thinszx 创建的主题 › Python › pandas 关于 groupby 的分组保存问题：如何将分组完以后的值按照某个列分别存为新 dataframe？

@wittyfans 啊，是的，学习到了！原来有这么简洁方法，谢谢(◦˙▽˙◦)

2020-03-19 12:13:45 +08:00

回复了 thinszx 创建的主题 › Python › pandas 关于 groupby 的分组保存问题：如何将分组完以后的值按照某个列分别存为新 dataframe？

@jyyx 谢谢你的回答，不过和我想得有一些出入，我想得到的是拆分后的 DataFrame，因为后续对各个分组的操作还要用到 pandas 的一些函数

目前我解决的方法是新开了一个列表，来存储排序后 DataFrame 中各个分组的大小（直接调用了 count()函数），然后用了一个 for 循环每次切片操作，得到小的 DataFrame

大致的做法像这样：
itr = 0 # 起始指针
sorted_group_list = [] # 存放每个小分组对象
separate_group_counts = np.array(df['A'].count()).tolist() # 存储了各个分组的大小

for count in separate_group_counts:
sorted_group_list.append(df[itr:itr + count].copy()) # 这里的 copy 不要可能会省点内存，不过有点危险
itr += count

楼下那位的做法好像也挺不错的，比我的简洁一点

1 2 3 4 5 6

❮

❯