杨宗纬洋葱歌词网友关心什么?
时间:2022-12-02 08:02来源:未知 作者:小编 点击:996

  实例朋分取语义朋分的“全图切割”分歧,它还具备方针检测的特点,例如下图凭仗名词“掀背车”(hatchback car),间接找出对应物体:

  此前,实例朋分模子凡是分为“两步走”,第一步检测可能的方针,第二步对可能的方针进行排序,预测出最有可能的成果。

  但取这种体例分歧,TOIST框架间接采用一整个Transformer架构,此中解码器中的自留意力机制能够成立候选方针之间的偏好关系。

  此中,多模态编码器(棕色部门)担任提取特征标识表记标帜,Transformer编码器(绿色部门)担任将两种模态的特征聚合起来,并基于Transformer解码器(蓝色部门)中的留意力机制来预测最合适的方针。

  随后,论文提出了一种新的名词-代词蒸馏方式 (noun-pronoun distillation)来锻炼模子。

  具体来说,即基于学问蒸馏(上图教师-学生模子)框架,以无监视进修的体例,锻炼AI凭仗上下文来“猜测”名词原型。

  例如本来的实例朋分使命是“用滑板挖洞”,但正在锻炼模子时,会把名词“滑板”(skateboard)用代词“某个工具”(something)替代:

  简单来说,TOIST比此前的实例朋分和方针检测模子SOTA模子表示更好,而有了名词-代词蒸馏方式加成的“强化版”TOIST,表示又比TOIST更上一层楼。

  此中正在方针检测使命上,比拟当前最好的Yolo+GGNN,“强化版”TOIST的鉴定框精度mAP提拔了10.9%,正在实例朋分使命上,遮罩精度则比Mask-RCNN+GGNN高6.6%。

  至于提出的名词-代词蒸馏方式,比拟TOIST原版,又正在实例朋分使命上别离提高了2.8%和3.8%的精度。

  我们尝试室其实是担任研究机械人的,但正在日常平凡的调研中发觉,用户有时候会更倾向于给机械人描述“需求”,而不是间接告诉机械人做什么。

  这篇论文的做者来自清华大学智能财产研究院(AIR)、北京大学和英特尔研究院,AIR院长张亚勤也是做者之一。

  论文一做李鹏飞,清华大学智能财产研究院的正在读博士生,本科结业于中国科学院大学,研究标的目的是从动驾驶、计较机视觉等。

  通信做者赵昊,清华大学智能财产研究院帮理传授(incoming Assistant Professor)、英特尔中国研究院研究科学家、北大结合博士后,本博结业于清华大学电子工程系,研究乐趣是机械人、计较机视觉标的目的。

  原题目:《AI理解不了“他她它”咋办?动词成为新冲破口,机械人听到抹黄油就晓得拿刀叉 清华AIR&北大&英特尔》

  本文为磅礴号做者或机构正在磅礴旧事上传并发布,仅代表该做者或机构概念,不代表磅礴旧事的概念或立场,磅礴旧事仅供给消息发布平台。申请磅礴号请用电脑拜候。

(责任编辑:admin)

关键词:

随机推荐

联系我们 -