本数据集是什么?
本数据集是国家重点研发计划“基于大数据的软件智能开发方法和环境”公布的软件工程研究数据集系列之一,主要是对GitHub上Pull-request(PR)评论的类别标注集。
本数据集为什么?
审阅者在审查PR的时候,会以评论的形式留下相关意见。在这些评论中当中往往包含评论者不同的意见。我们依据相关研究和实际调研为这些评论建立了层次化类别体系,根据这个分类体系,我们对PR的评论进行了人工标注。
本数据集有什么?
Rails的一部分PR、PR的评论以及评论的标注。
详见:GitHub Pull-Request评论的标注数据集