Business Text Intelligence Analysis · 杭州师范大学商学院
本课程面向商学院本科生(大数据管理与应用、数字经济、国际商务等专业),以理论与实践相结合的方式讲授商务文本智能分析技术。课程围绕大语言模型展开,涵盖文本预处理、N-gram 与词向量、朴素贝叶斯/逻辑回归、RNN/LSTM、Transformer 及检索增强生成(RAG)等核心主题,培养学生利用 AI 工具解决真实商业文本分析问题的能力。
课程实验依托 Kaggle和阿里云魔搭的免费在线 Jupyter 环境,以 NLTK、spaCy、scikit-learn、Transformers 及 Hugging Face 为主要工具,配套真实商业语料的分类、聚类与大模型微调实践,为学生数字经济时代的职业发展打下坚实基础。
| 章节 | 内容 | 实验资料 |
|---|---|---|
| 第一讲 | 文本挖掘概述 讲义 |
Kaggle示例代码 chatGPT科普视频 |
| 第二讲 | 文本预处理 讲义 |
文本预处理 调用Deepseek API预处理文本 |
| 第三讲 | N-gram 语言模型 讲义 |
训练N-Gram语言模型 |
| 第四讲 | 生成模型 · 朴素贝叶斯 讲义 |
朴素贝叶斯文本分类及性能评估 |
| 第五讲 | 判别模型 · 逻辑回归 讲义 |
逻辑回归文本分类及正则化 |
| 第六讲 | 向量语义 讲义 |
文本向量化(稀疏) 文本向量化(稠密) 探索词嵌入的语义属性 |
| 第七讲 | 神经网络 讲义 |
前馈神经网络-文本分类 前馈神经网络-语言模型 前馈神经网络-fastText分类 |
| 第八讲 | RNNs 和 LSTMs 讲义 |
新闻分类-Bi-LSTM 新闻分类-Bi-LSTM-Attention |
| 第九讲 | Transformer 讲义 |
— |
| 期末作业 | 题目要求 论文模板 |
提交链接 DDL: 2025-06-23 20:00 |
以下工具经课程组测试推荐,可显著提升学习效率与实验体验。