Dive in question generation

问题生成(Question Generation) 指什么?

“天是蓝的。” 请根据这句话出一道考试题。

“天是什么颜色的?” “什么是蓝色的?” ……

如上所述,能够对一段陈述句或一个知识点提出问题,而且问题的答案就是这句话,这就可以看作是问题生成。

据说如果程序能够实现问题生成,后续可以教人如何提出好的问题,构建知识库,甚至通过提出新问题生产新的知识,这着实人兴奋。

作者接下来准备启动一个项目,熟悉下问题生成这个领域。

项目介绍

项目代号为qg,对应question generation,下面是项目的基本信息。

  • 目标 实现一个简单的QG程序
  • 时间规划 2周 (2020.9.14-27)

项目阶段

项目分解为4个步骤,每个步骤将对应一篇md

  • 搭建环境
  • 熟悉一个nlp框架
  • 熟悉一篇qg论文
  • 实现一个简单的QG(根据文本生成问题)程序

项目分析

从4个项目步骤看,nlp框架和qg论文是重点,从之前的接触中,nlp框架将会提到很多概念,像分词、语义、模型等,需要具备一定的机器学习基础。 qg论文中将会出现诸多术语,理解论文中表达的思想是第一步,第二部理解公式预计将会耗费较多时间。

QG展望

我从哪来,来了要干什么,最后要到哪去?

等计算机能提出这3个问题的时候,我想qg的发展就迈出了一大步。