基于实体联合关系抽取的材料文本挖掘平台

平台首页图片
基于深度学习的文本挖掘技术能够很好地挖掘出文本序列蕴含的有价值实体与实体间关系。但直接将文本挖掘技术应用到材料领域存在两大问题,一是材料类文献通常以便捷式文档格式存储且包含大量复杂化学式,文本预处理较困难;二是不同材料存在不同实体和关系定义,很难针对不同材料类型实现材料实体关系挖掘。因此,本课题组针对第一个问题提出了视觉信息引导的材料文献文本预处理方法,解决传统 PDFMiner 和光学字符识别在文本预处理上的问题;针对第二个问题提出可溯源的多类型实体关系抽取方法,实现多类型材料文献的可靠文本挖掘。最后,基于上述两种方法,构建基于实体关系联合抽取的材料文本挖掘系统,辅助领域研究者实现自动、高效且高质量的材料文本挖掘。
点击下载
点击下载
点击下载
点击下载
参考文献
作者:Yue Liu, Xianyuan Ge, Zhengwei Yang, Shiyu Sun, Dahui Liu, Maxim Avdeev,Siqi Shi
An automatic descriptors recognizer customized for materials science literature
期刊名称:Journal of Power Sources, 年份:2022
论文下载
作者:刘悦,刘大晖,葛献远,杨正伟,马舒畅,邹喆乂,施思齐
高质量的材料科学文本挖掘数据集构建方法
期刊名称:物理学报, 年份:2023
论文下载
作者:Yue Liu, Dahui Liu, Zhengwei Yang, Xianyuan Ge, Wenxuan Yao, Jie Wu, Maxim Avdeev, Siqi Shi
A knowledge acquisition automatizing framework from literature exemplified by Na+ activation energy prediction of NASICON solid-state electrolyte
期刊名称:Energy Storage Materials, 年份:2025
论文下载
软件著作权
登记号:2024SR1034684
材料科学文献图文挖掘平台V1.0
点击下载
发明专利证书
专利号:ZL 2022 1 0553720.5
文本数据的描述符识别方法、装置及介质
点击下载