【求助!真的是崩溃了】豆包爱学拍单题批改是怎么快速准确定位到题干信息的?他们自己训练的模型?

【求助!真的是崩溃了】豆包爱学拍单题批改是怎么快速准确定位到题干信息的?他们自己训练的模型?
【求助!真的是崩溃了】豆包爱学拍单题批改是怎么快速准确定位到题干信息的?他们自己训练的模型?

9bfbadebee9af4f1a2b1392028f193d1
需求是:拍摄后整页后在2s内就能自动调整边框,准确定位单个题干和图形(也就是题块)

我观测豆包基本10次中9.5次能成,而且速度奇快。

我用ocr,怎么滴也得7,8s,太慢。

再用layout切版面题块,效果不太好,经常不是丢题干就是少选项。

难道他们训练了题块识别模型来单独解决这个问题?

有懂的佬么,解个惑吧,折腾2天了 :joy:

23 个帖子 - 11 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文