-
-
Notifications
You must be signed in to change notification settings - Fork 1
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[DoIs] 原始数据集整理 #2
Comments
「 MMMM: 我先介绍一下我们之前的数据收集和处理流程哈
太辛苦了...整体过程要多久? 处理一次出海的数据?
|
@linsong: 昨天从早到晚一天在外面跑,早上系统看了下,说说想法。
关于数据集的准备,前面聊天最后三张图就很好,宗旨是让所要研究的目标尽量大,海水背景尽量小。作为纳入训练模型用的素材,对于每一只,不管哪次拍的只要能用上的就都纳进来,毕竟姿态光照什么的越丰富越好。 关于特征,因为机器识别毕竟不同于人眼,一个海豚身上所有斑点加起来的像素点的个数应该还没有背景海水多,所以恐怕从机器识别的角度,背鳍远重要于斑点。我个人对这个案例里面让机器用斑点来区分持非常不乐观的态度。(当然demo1.0可以说先通过背鳍做了初步筛查,减轻了后续人眼验证的重复劳动量?) 之前看过养殖场对猪牛之类的根据身上斑点做分类的,和海豚的区别在于,养殖场可以通过通道设计,把每只动物姿态一致的限制在一个位置一小段时间,这样你采集到的图片都是相当一致的,并且效果比较好的那些的斑点占躯体的面积,要远大于海豚斑点的面积。(当然,说到底我觉得养殖场这种识别是为了作秀,你都养殖了直接在脖子或者耳朵上栓个牌不就得了?) 咱们一开始是不是可以先静态的只考虑目前这些海豚的情况,至于长大了体征有变化,或者又被咬了一口之类的,可以2.0,3.0版的时候再说?(其实如果被咬了,那么从机器识别角度来说,之前没被咬的那项样本就废掉了,因为原有特征没了,今后再识别就得用咬了之后的了) 至于到底是发现了新海豚,还是由于光照角度什么的分明是原来的某只但是没匹配上,这个就需要试了。这一点就像大妈讲的那个mnist手写里面,新来一个人写一个数字2,只是和原有数字2风格不一致,那么也可能认错。或者你写个m,分明不是数字,但是可能也勉强的给分到某一个数字那一类里面。 你们现在已经识别了的种群里面总共多少只了? 最后,道理我都懂,但是海豚不是很白啊。 」 @mmmmm: 珠江口现在大概两千多,我们数据库里有两千三百多,已经识别了绝大部分了,包括一些已经死的,可能还会有还没发现的或者新生的没在数据库里 」
@mmmmm: [发呆][发呆]上次吃饭的时候不是说机器可以自动学会鉴别特征吗? 」
当然可以自动,
是的, 人工一眼看出来的事儿,
而, 要一次综合对边缘外形和斑点来识别
因为, 你想, 之前就针对一条边界曲线不同角度下的识别, 也就是说, 难度从1 变成了 1000000 」 但是, 不妨碍我们折腾出一个, 到时, 一位新志愿者要作的事儿可能:
这样, 这位从来没出过海的志愿者, 瞬间将几万张照片的逐一处理,
|
「 莫莫莫莫: 这个工程量有点大,有没有什么方法或工具可以快速截取的? 」 是也乎,( ̄▽ ̄) 而且, 这里的 1:1 只是俺的建议, 都只能在新目标驱动下作起来, 才能发现的 |
「 莫莫莫莫: 截取的照片里面背鳍的占比需要一致吗?比如这样行不行? 」 「 莫莫莫莫: 因为海豚有的露出水面多一点,有的少一点 」 「 莫莫莫莫: 所以按照相同比例截取的话,有的可截取的部分会多一点,有的会少一点 」 是也乎,( ̄▽ ̄) 综上, 比例,位置, 大小, 颜色,,, |
背景
~ 阐述 记录/问题/事件/... 发生的背景
demo/DoIs at master · tfugzh/demo
分析
~ 先给出自己的态度以及尝试
一个可用的 AI 模型, 很大程度上依然训练集的良好;
所以, 从根据
背鳍外形
来自动识别目标看,需要的照片应该是:
海豚编号-照片编号.jpg
-._+~
等等连字符-._+~
等等连字符000001
方案
~ 给出可以追踪进展的行为追踪顺序
记录
~ 原始数据/过程/现象/...收集
变更
~ 记录合并大家 建议/增补/.. 来的主要变动信息
参考: 禁止事项清单
The text was updated successfully, but these errors were encountered: