返回信息流虽然网上的文章对BiLSTM-CRF模型介绍的文章有很多,但是一般对CRF层的解读比较少。
于是决定,写一系列专门用来解读BiLSTM-CRF模型中的CRF层的文章。
我是用英文写的,发表在了github pages上。
如果文章中有描述不对,不准确或者引起困惑的地方,欢迎随时发表评论。
文章链接:
(2017.09.15)标题:CRF Layer on the Top of BiLSTM - 1 链接:https://createmomo.github.io/2017/09/12/CRF_Layer_on_the_Top_of_BiLSTM_1/
(2017.09.23)标题:CRF Layer on the Top of BiLSTM - 2 链接:https://createmomo.github.io/2017/09/23/CRF_Layer_on_the_Top_of_BiLSTM_2/
(2017.10.08)标题:CRF Layer on the Top of BiLSTM - 3 链接:https://createmomo.github.io/2017/10/08/CRF-Layer-on-the-Top-of-BiLSTM-3/
(CRF Layer on the Top of BiLSTM - 4 进行中...)
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #25947同步于 2017/9/23
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
通俗理解BiLSTM-CRF命名实体识别模型中的CRF层
createMoMo
2017/9/23镜像同步13 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
图是拿什么工具画的?
【 在 createMoMo 的大作中提到: 】
: 虽然网上的文章对BiLSTM-CRF模型介绍的文章有很多,但是一般对CRF层的解读比较少。
: 于是决定,写一系列专门用来解读BiLSTM-CRF模型中的CRF层的文章。
: 我是用英文写的,发表在了github pages上。
: ...................
请问transition matrix的获取上,可以通过初始化矩阵,然后随着训练不断更新这个矩阵的值。
另外其实也可以通过预先统计训练语料中的标签从而获取到transition matrix,请问这样是否可行?相比于第一种方法有什么坏处?
【 在 createMoMo 的大作中提到: 】
: 虽然网上的文章对BiLSTM-CRF模型介绍的文章有很多,但是一般对CRF层的解读比较少。
: 于是决定,写一系列专门用来解读BiLSTM-CRF模型中的CRF层的文章。
: 我是用英文写的,发表在了github pages上。
: ...................
【 在 Zprince 的大作中提到: 】
: 没有中文版么
如果很多人都想看中文版,可能后面用英文写完了这个系列,会继续翻译成中文版。不过其实,并没有用太难的词汇。如果哪里感觉模糊,一定要提出来呀,我会改进的。
【 在 yunhuan 的大作中提到: 】
: 请问transition matrix的获取上,可以通过初始化矩阵,然后随着训练不断更新这个矩阵的值。
: 另外其实也可以通过预先统计训练语料中的标签从而获取到transition matrix,请问这样是否可行?相比于第一种方法有什么坏处?
:
你好,这个确实是可以从预料中统计转移矩阵的值,我感觉是可行的,但是其实神经网络训练的充分的话,他自己也可以学到那些。
说不上相比第一种方法有什么坏处(因为我也没有做对比试验,如果你有兴趣可以试一下)
我感觉你可以尝试下:
1. 用统计的值来初始化,并且设置在训练过程中可以被调整更新
2. 用统计的值来初始化,但是训练过程中,不会发生改变
3. 原始的方法,随机值初始化,在训练过程中可以被调整更新
好的。
【 在 createMoMo 的大作中提到: 】
:
: 你好,这个确实是可以从预料中统计转移矩阵的值,我感觉是可行的,但是其实神经网络训练的充分的话,他自己也可以学到那些。
: 说不上相比第一种方法有什么坏处(因为我也没有做对比试验,如果你有兴趣可以试一下)
: ...................