博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Multi-Task Networks With Universe, Group, and Task Feature Learning-阅读笔记
阅读量:4069 次
发布时间:2019-05-25

本文共 1406 字,大约阅读时间需要 4 分钟。

文章将任务区分为三个层次:

  1. 单个任务。
  2. 任务组(task group)
  3. 全体任务(task universe)

提出一些类MTL框架,包含并行网络结构、串行网络结构,在 ATIS, Snips和一个自有大数据集上表现良好。

Parallel MTL Architecture

Group features、Universe features、Task features并行生成。

在这里插入图片描述

  • 不同的任务 a, b, c 都会被输入到 Universe Encoder 中,生成 Universe features
  • 同一 group 的任务(x1a, x1b 是一个 group,x2c 是另一个),会送到 Group Encoder 中,生成 Group features;
  • 每个任务都会被输入到 Task Encoder 中,生成 Task features;
  • 每个 Task features 会和 Universe features,Group features 连接,作为 Task Decoder 的输入,得到最后的结果。在这个模型中,三类 feature 是并行生成的。

Serial MTL Architecture

Group features、Universe features、Task features三类特征会又先后顺序生成。

在这里插入图片描述

  • Serial: Group features 和 Universe features 并行生成,拼接后输入到 Task encoder 去生成 Task features;
  • Serial + Highway:和 a 一样,但是在 Decoder 时,会把 Task features 和前面的 Group features,Universe features 进行拼接;
  • Serial + Highway + Swap:先生成 Task features,然后再生成 Group features 和 Universe features,再和 Task features 进行拼接。

Loss

作者加入对抗损失(adversarial loss)和正交限制(orthogonality constraints),来避免 Task Features 在共享空间中:

L all  = L tasks  + λ ∗ L adv  + γ ∗ L ortho  \mathcal{L}_{\text {all }}=\mathcal{L}_{\text {tasks }}+\lambda * \mathcal{L}_{\text {adv }}+\gamma * \mathcal{L}_{\text {ortho }} Lall =Ltasks +λLadv +γLortho 
具体见:
1.
2.

任务主要包含:ner、intent classification.

ner使用BiLSTM+crf

在这里插入图片描述

L t a s k = w S F ∗ L S F + w I C ∗ L I C \mathcal{L}_{\mathrm{task}}=w_{\mathrm{SF}} * \mathcal{L}_{\mathrm{SF}}+w_{\mathrm{IC}} * \mathcal{L}_{\mathrm{IC}} Ltask=wSFLSF+wICLIC

reference

转载地址:http://kxaji.baihongyu.com/

你可能感兴趣的文章
React Native(二):属性、状态
查看>>
JSX使用总结
查看>>
React Native(四):布局(使用Flexbox)
查看>>
React Native(七):Android双击Back键退出应用
查看>>
Android自定义apk名称、版本号自增
查看>>
adb command not found
查看>>
Xcode 启动页面禁用和显示
查看>>
【剑指offer】q50:树中结点的最近祖先
查看>>
二叉树的非递归遍历
查看>>
【leetcode】Reorder List (python)
查看>>
【leetcode】Linked List Cycle (python)
查看>>
【leetcode】Linked List Cycle (python)
查看>>
【leetcode】Candy(python)
查看>>
【leetcode】Clone Graph(python)
查看>>
【leetcode】Sum Root to leaf Numbers
查看>>
【leetcode】Pascal's Triangle II (python)
查看>>
java自定义容器排序的两种方法
查看>>
如何成为编程高手
查看>>
本科生的编程水平到底有多高
查看>>
AngularJS2中最基本的文件说明
查看>>