标题:Generating Text via Adversarial Training
作者:Yizhe Zhang, Zhe Gan, Lawrence Carin
发表:NIPS 2016
论文使用LSTM作为生成器,CNN作为判别器来进行对抗训练生成文本,在训练生成器时,使用匹配特征分布的方法。另外,论文还使用了多种预训练的方法并解决了离散变量的问题。
文本生成一个简单的方法就是通过基于 RNN 的 encoder-decoder 学习表示句子的隐藏空间,然后通过解码隐藏空间的随机样本来生成句子。但是用autoencoder将句子映射到潜在向量空间时,映射往往只会覆盖很小的结构性的区域,所以如果选择嵌入空间的任意向量的话,解码很可能得到无意义的句子。另外一个不足是因为RNN的结构很可能导致错误的累计,就致使句子的前半部分较合理但后半部分偏差就比较大。而用GAN模型就能很好解决以上问题。
more >>