
近日,中国农业科学院农业信息研究所科学数据研究室构建了水稻种质信息自动化提取工作流程,该方法可实现自动提取非结构化文本内的关键种质信息。相关研究成果发表在《大数据杂志(Journal of Big Data)》上。
水稻是保障国家粮食安全和推动农业可持续发展的战略性资源,但大量种质信息分散于文献、报告等非结构化文本中,仍未被充分发掘利用。
科研团队通过将大语言模型与精细化提示词工程相结合,构建水稻种质信息提取框架Chat-RGIE,通过分模块多层级提示词设计提高整体识别的准确性与大模型的指令遵循能力,并有效约束的“幻觉”现象的产生,在实验环境下提取准确率高达95.54%,“幻觉”的发生率约束至1.5%。该研究为水稻种质资源的数字化管理提供了强有力的技术工具,有助于加速种质资源的鉴定评价与共享利用,推动“经验育种”向“智慧育种”的转型升级。
该研究得到中国农业科学院科技创新工程和国家农业科学数据中心项目的支持。
本站部分信息由相应民事主体自行提供,该信息内容的真实性、准确性和合法性应由该民事主体负责。农民调研网 对此不承担任何保证责任。
本网部分转载文章、图片等无法联系到权利人,请相关权利人与本网站联系。
第一办公区:北京市西城区敬胜胡同甲3号东侧;第二办公区:北京市东城区建国门内大街26号新闻大厦5层