南京农业大学发布首个农业开源大语言模型:“司农”
南京农业大学正式发布司农大语言模型(Sinong)。该模型是国内首个面向通用农业领域的开源垂直大语言模型,同时也是南京农业大学主导研发的首个农业领域大语言模型。 据介绍,“司农”的命名取自中国古代财政与农业管理官职体系,卓越性能源于南京农业大学深厚的农业学科底蕴与大规模、高质量的农业领域数据基础。研究团队依托学校农业领域顶尖学科优势,收集了包括动物科学、农业经济管理、农业资源与环境、园艺学、智慧农业、动物医学、植物保护、作物育种等细分学科数据,总量超过40亿token的农业领域专业数据,涵盖了近9,000册书籍、24万余篇学术论文和近2万份政策、标准以及海量网络知识,构建了体系相对完整、质量过硬的农业基础数据集。 数据类型 数据样例 QA "instruction": "在人多地少、耕地后备资源不足的背景下,如何借鉴中国古代‘精耕细作’传统提升单位面积粮食产量,且避免过度投入导致的生态退化?","output": "应采取‘三才’统筹的精耕细作模式:一是因地制宜优化耕作制度,..." COT-QA "instruction": "宋代南方水田农业中出现了哪些新型农具?这些农具如何促进...
