学院新闻
首页学院新闻 正文

徐庸辉教授团队发布LexPro律智法律大模型

【 发布日期:2025-11-03 】    作者:

近日,由山东大学-南洋理工大学人工智能国际联合研究院(C-FAIR)、软件学院、数据科学研究院依托国家重点研发计划专项课题联合研发的LexPro律智法律大模型正式亮相。该模型基于海量中文司法语料和有监督司法微调数据训练而成,聚焦法律实务核心需求,为检察官等专业用户提供高精准、全方位的法律咨询与解答服务。

图1:基于知识检索增强的LexPro法律大模型推理流程

LexPro训练语料不仅包含百万篇20种罪名的判决文书,还涵盖刑法、民法典、宪法及相关司法解释等核心法律法规。模型全量收录全国31个省级行政区(不含港澳台)的司法案例资源,形成百万级数据规模,实现地域覆盖无死角;罪名体系上,重点涵盖故意伤害罪、抢劫罪、合同诈骗罪、盗窃罪等20余个高频刑事案由,同时延伸覆盖刑事、行政等全领域纠纷类型,满足多样化实务需求;信息处理上,每份案例均被结构化拆解为案由要素、判决结果、法条适用等多类属性标签,形成超百万级可解析案件样本,确保信息颗粒度精细可控。研发团队通过多阶段清洗、去重、结构化处理及人机结合标注流程,构建了大规模高质量指令微调数据集,让模型既具备扎实的法律知识图谱,又能通过监督学习精准掌握法律推理范式。

图2:法律要素识别任务微调流程示例

LexPro采用多阶段微调技术,实现法律专业化能力的关键突破。通过高质量法律指令集的监督微调,为模型搭建起坚实的法律知识框架;借助大量无标注裁判文书开展强化学习训练,重点提升模型法律文本格式化生成能力和逻辑推理链构建能力,显著增强法律文书处理的规范性与一致性。针对法律要素识别这一核心任务,模型创新性融合法律条文检索增强机制,在微调阶段动态接入外部知识库,大幅提升识别准确率。经测试,相比基模型,LexPro的法律要素识别F1指标提升约40%,充分验证了技术方案的有效性。

LexPro以国产开源大模型DeepSeek-R1的蒸馏模型为基座,依托其强大的思维链能力,在保持出色推理性能的同时控制计算成本,适用于高度专业化的检察业务(如法律文书分析、法律要素识别、法条适用推荐等),并可广泛应用于(如检察机关、律所等法律实务场景)。目前,律智-1.0 研发已实现产学研用一体化发展,其详细性能测试报告已发布于Arxiv平台(https://arxiv.org/abs/2503.06949),供行业交流参考。

该模型由徐庸辉教授团队主导研发,团队长期深耕多模态大模型、知识检索增强等前沿技术领域。相关研究获得国家重点研发计划、国家自然科学基金项目等重要资助,未来团队将持续推进模型迭代升级,不断提升其专业性、智能化水平和实际应用能力,为法律行业数字化转型注入更强动力。

(文/图:徐庸辉 责任编辑:闫中敏)