西西河

主题:【图像处理求助】后续 -- 一双草鞋

共:💬5 🌺39 新:
全看树展主题 · 分页
家园 【图像处理求助】后续

不好意思占用一个新主题的资源,因为无法回复那个【图像处理求助】出国的就别管了,先救救国内群众的急老帖了。

问题可以点击上面链接查看,我这里说说解决办法。

1. 按照 @假设 的建议,以FFmpeg软件提取关键帧,这个对于正确标记的或许有用,但是恰好我得到的这些视频大多标记并不对,常常搞错。

2. 基于 @小科 的建议,略有发展,即以每一帧前后若干帧(根据数据测试,我的这些视频前后各取2帧是个好的折中)作比较,若如果差别很小,则判断这帧为一个稳定的帧。在稳定的帧这个子集里,按照主贴办法去除重复,得到需要的单一帧。

3. 基于chatgpt的建议的算法。读取全部数据后,用kmeans做聚类分析。这需要自己给于一个聚类个数的假设。先取一个比较大的值,然后聚类完成后,再去看他们之间的距离,足够近就合并。但是后者效果不好。即我能得到几乎全部的希望得到的图片,但是会有部分重复,或不需要的转换帧。

另外我向chatgpt抱怨电脑性能不够,它建议我subsample还有把彩色改黑白,确实效果几乎不变的情况下,大大提升速度。

如果是能挣钱的话,我估计会在kmeans之前,加一个图像分割的步骤,比简单的像素做输入应该更好。当然整个任务弄个多层的神经网络更好,只是我缺乏足够精力去学习、细化这个东西了。

最后的处理是:先用主帖办法,失败后退到方法2,再失败退到方法3。这三个办法依次更消耗资源,需要手动参数越多,但是也越普适。

感谢前面提到的两位网友和 @盲人泪 , @小科 , @hamigua 的参与和关心。

家园 刚才试了下FFMPEG提取场景转换帧

你可能是没看我最后跟的那个贴子,用FFMPEG也可以提取场景转换帧。

刚才用一个PPT演示的视频试了一下,效果还是不错的,几乎每一张PPT都提取出来了,只是多了一些切换页面时的黑屏以及过渡的不完整图片。

而且这个方法还很快。

通宝推:一双草鞋,
家园 我试过

不成功。前面试关键帧也不成功。不知道是不是视频作者在tag上做了什么手脚。

家园 可以试试不同的参数

select='gt(scene,0.1)'

这个0.1是个参数,可以调整一下试试。

通宝推:一双草鞋,
家园 我回头再试试

当时不记得有这个参数,可能我没弄对。

全看树展主题 · 分页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河