2025年9月,实验室李亚辉博士撰写的论文“Named Entity Recognition Based on Anchor Span for Manufacturing Knowledge Extraction”被期刊Engineering Applications of Artificial Intelligence(影响因子8.0)录用。

智能制造背景下,工业知识正逐渐成为优化生产和辅助决策的关键资产。为实现对工业非结构化文本中富集知识的有效利用,本文致力于解决高信息密度场景下的嵌套命名实体识别难题,提出了一种基于多级分类的机制的嵌套命名实体识别方法。通过边界匹配神经网络精准识别实体边界,有效解决了高密度信息下多层实体遗漏问题,并在此基础上结合锚点映射筛选高置信度实体候选区域语义上下文特征,实现了多层嵌套场景下跨类别候选片段的高精度提取。实际工业文本数据上实验结果表明,本方法在嵌套实体识别任务中同时保证了较高的准确性与完整性。
论文研究得到了国家自然科学基金项目(62127808、62320106005)的资助。