《文本挖掘》课程期末大作业要求

本学期《文本挖掘》课程即将结束,为了全面考察大家对课程知识的掌握程度,特别是将理论应用于实践的能力,现将期末大作业的具体要求布置如下。请大家仔细阅读,并按时完成。


一、 作业核心任务

近年来,大语言模型(Large Language Model, LLM)为自然语言处理(NLP)领域带来了范式性的变革。其核心特征在于,能够以一个统一的模型“提示” (Prompting) 的范式来处理极其多样化的NLP任务,而不再需要像传统方法那样为每个任务单独设计和训练专门的模型

那么,在这种新范式下,大语言模型在各类具体的NLP任务上表现究竟如何?本次期末作业的核心,就是要求大家通过实证研究来回答这一前沿问题。每位同学需要:

  1. 从期末作业任务列表选择一个中文语言理解任务。
  2. 调用大语言模型API,以“提示”的方式来解决这个任务。
  3. 借鉴人工智能顶会论文中的研究方法,对大语言模型在具体NLP任务上的表现进行专业、深入的定量与定性分析

二、 具体要求与步骤

1. 任务选择

2. 文献研究与理论阐述

在动手实验之前,你需要进行充分的文献调研,结合你所选择的任务的数据集的特点,清晰地阐述以下内容:

3. 文献检索与学习

3. 实验操作:调用大语言模型API

4. 结果分析与评估

此步骤是本次作业的重点。你需要参考所选的3篇顶会论文,对你的大语言模型实验结果进行分析。


三、 最终成果与提交

1. 期末论文撰写

2. 提交要求


希望各位同学认真对待本次大作业,它将是你们展示学期所学、锻炼研究能力和实践能力的绝佳机会。预祝大家取得优异的成绩!

如有任何疑问,请及时与我联系。