徐庸辉教授团队发布LexPro律智法律大模型-山东大学软件学院

徐庸辉教授团队发布LexPro律智法律大模型

【发布日期：2025-11-03 】作者：

近日，由山东大学-南洋理工大学人工智能国际联合研究院（C-FAIR）、软件学院、数据科学研究院依托国家重点研发计划专项课题联合研发的LexPro律智法律大模型正式亮相。该模型基于海量中文司法语料和有监督司法微调数据训练而成，聚焦法律实务核心需求，为检察官等专业用户提供高精准、全方位的法律咨询与解答服务。

图1：基于知识检索增强的LexPro法律大模型推理流程

LexPro训练语料不仅包含百万篇20种罪名的判决文书，还涵盖刑法、民法典、宪法及相关司法解释等核心法律法规。模型全量收录全国31个省级行政区（不含港澳台）的司法案例资源，形成百万级数据规模，实现地域覆盖无死角；罪名体系上，重点涵盖故意伤害罪、抢劫罪、合同诈骗罪、盗窃罪等20余个高频刑事案由，同时延伸覆盖刑事、行政等全领域纠纷类型，满足多样化实务需求；信息处理上，每份案例均被结构化拆解为案由要素、判决结果、法条适用等多类属性标签，形成超百万级可解析案件样本，确保信息颗粒度精细可控。研发团队通过多阶段清洗、去重、结构化处理及人机结合标注流程，构建了大规模高质量指令微调数据集，让模型既具备扎实的法律知识图谱，又能通过监督学习精准掌握法律推理范式。

图2：法律要素识别任务微调流程示例

LexPro采用多阶段微调技术，实现法律专业化能力的关键突破。通过高质量法律指令集的监督微调，为模型搭建起坚实的法律知识框架；借助大量无标注裁判文书开展强化学习训练，重点提升模型法律文本格式化生成能力和逻辑推理链构建能力，显著增强法律文书处理的规范性与一致性。针对法律要素识别这一核心任务，模型创新性融合法律条文检索增强机制，在微调阶段动态接入外部知识库，大幅提升识别准确率。经测试，相比基模型，LexPro的法律要素识别F1指标提升约40%，充分验证了技术方案的有效性。

LexPro以国产开源大模型DeepSeek-R1的蒸馏模型为基座，依托其强大的思维链能力，在保持出色推理性能的同时控制计算成本，适用于高度专业化的检察业务（如法律文书分析、法律要素识别、法条适用推荐等），并可广泛应用于（如检察机关、律所等法律实务场景）。目前，律智-1.0 研发已实现产学研用一体化发展，其详细性能测试报告已发布于Arxiv平台（https://arxiv.org/abs/2503.06949），供行业交流参考。

该模型由徐庸辉教授团队主导研发，团队长期深耕多模态大模型、知识检索增强等前沿技术领域。相关研究获得国家重点研发计划、国家自然科学基金项目等重要资助，未来团队将持续推进模型迭代升级，不断提升其专业性、智能化水平和实际应用能力，为法律行业数字化转型注入更强动力。

（文/图：徐庸辉责任编辑：闫中敏）