CSPGPT是夏雨千望为信息技术学奥赛(包括但不限于CSP、NOI)研发的垂直大模型,基于openai开源GPT-2。共分为3个微调阶段,1.从知乎、哔哩哔哩上面搜集,爬虫获得高质量中文互联网语言数据集。2.从Github、CSDN等多个开发者聚集地爬虫得到高质量信息技术、编程数据集。3、从CSP官网、NOI官网下载往年题目进行最后的微调。819M版本可以在任何可以运行语言模型(iPhone4以上、mate20以上等移动设备)运行。我们将在明年3月左右提前开源,欢迎大家下载使用!