位置:
首页
理论
王禄生 | 论法律领域对法律大模型的能动塑造

王禄生 | 论法律领域对法律大模型的能动塑造

来源:中国法学 发布时间: 2025-06-23 浏览:2143 次

法律领域对法律大模型的能动塑造 王禄生 东南大学法学院教授、未来法治与数智技术创新实验室研究员

 本文发表于《中国法学》2025年第3期,因篇幅限制,注释省略。作者身份信息为发文时信息。      

内容提要

 法律大模型是兼具技术属性与社会属性的大型技术系统。法律领域通过对价值追求、知识基础、组织偏好、制度准备、认知结构的多重引导,调控法律领域数据、知识、组织、制度、符号等资源的生产、供给与配置,从而能动塑造法律大模型的功能表征、应用场景与扩散路径。中国法律领域的资源禀赋与资源困境在技术动力与技术约束两个层面塑造中国法律大模型的技术风格。因此,不应将法律领域单纯视作法律大模型的应用场景和改造对象,而应赋予其破除法律领域资源困境的能动地位。这就要求以推动中国法律大模型自主创新为总体目标,协同领域内多层次意图形成一致性能动塑造行动。在此基础上,以组织资源为中心化约各资源之间的复杂互动关系,构建法律领域资源的优化方案,打造符合中国式法治现代化核心要求的法律大模型技术风格。    

关键词

法律领域 法律大模型 生成式人工智能 系统理论 能动塑造

目  次

 一、引言

二、法律领域能动塑造法律大模型的理论基础

三、中国法律大模型的法律领域资源禀赋与资源困境 四、面向能动塑造中国法律大模型的法律领域资源优化 五、结语    

一、引   言

2022年末以来,大语言模型加速迭代并日益在通用任务上表现出良好的泛化能力与涌现特征。然而,通用大模型广而不专、全而不精的特点势必催生其深度适配法律、医疗等垂直领域的时代需求。一般认为,非人智能体使法律人感到生存危机需要具备三个前提:不亚于法律人的专业技能;自主生长性,甚至产生意识;法律人与AI产生非常广泛且日常化的生存联结。从长远看,法律大模型可能改变法律知识的生产方式,并在诸多法律业务中展示出值得期待的潜力;同时,法律大模型在大参数训练基础上表现出来针对法律任务的涌现与泛化能力已经具备最初级层次的“自生长性”;更进一步,法律大模型的推广可能建立人机协作的法律业务模式,从而形成与法律人日常业务的泛在联结。尽管诸多对未来的畅想暗含AI取代法律人的隐喻,但该危机此前一直并不紧迫。法律大模型的出现,则可能意味着法律人主体性自我消解的序曲已经奏响。

总体而言,学界当前围绕法律大模型的专题研究相对有限,且聚焦硬币的一面,即法律大模型对法律实践、法律组织和法律职业的塑造作用。关于硬币的另一面——“法律领域影响法律大模型”的研究则更为缺乏。从已有研究看,法律组织与法律职业者对法律大模型的影响是消极乃至消隐的:其要么被视作法律大模型的应用者,并可能因为技术素养不足导致技术推广不力;要么被视作受技术“改造”的对象,因为担心被取代而消极对待。在此叙事框架中,法律领域行动者被动卷入科技规训大潮,“顺从”地成为法律科技塑造法律现代性的自然延伸。上述视角过于简化了法律大模型的研发与应用逻辑。事实上,法律大模型并非独立于法律领域的“自主存在”,而是深深嵌入法律领域的数据、知识、组织、制度与符号资源之中,法律大模型的研发与应用结果由技术领域与法律领域共同塑造。这也是为何尽管具有相似的技术属性,但法律大模型在不同国家的推广差异显著,有的方兴未艾,有的浅尝辄止;不同主体可能基于不同目的使用同一法律大模型技术,但其应用样态可能相去甚远。

本文尝试探讨法律领域对法律大模型的能动塑造作用。具体而言,首先在理论基础层面揭示法律大模型兼具技术性与社会性的“大型技术系统”本质,以及法律领域如何对其能动塑造的深层机理;其次,分析中国法律领域的资源禀赋如何塑造中国法律大模型的技术风格,并在此基础上梳理中国法律领域的资源困境给中国法律大模型带来的系统性约束;最后,基于能动塑造理论,面向中国法律大模型的自主创新,提出破解法律领域资源困境的系统性方案。

二、法律领域能动塑造法律大模型的理论基础

法律领域能动塑造法律大模型的理论将法律大模型视作大型技术系统,认为法律领域的数据、知识、组织、制度、符号等资源通过相互作用,共同塑造该技术在法律领域的功能表征与最终形态。在该理论框架下,法律大模型既非本质主义的自主力量,亦非工具主义脱离领域目标的中立对象。技术先进性只是法律大模型研发、应用与扩散的必要非充分条件,法律领域可以通过对价值追求、知识基础、组织偏好、制度准备、认知结构等进行目的性调控与引导,影响法律领域资源的生产、供给与配置,最终完成对法律大模型的能动塑造。

(一)作为大型技术系统的法律大模型

大型技术系统(large technological system)由技术史与科技社会学学者托马斯·休斯提出,意指那些规模庞大、复杂性高,涉及众多技术组件(如物理设备)与社会要素(如组织架构、技术标准、法律法规)的系统,比如电力、铁路、电信等。相较于一般技术系统而言,大型技术系统的“技术动量”(technological momentum)使其在发展过程中不断累积技术惯性,并在系统扩展和成熟后因失去可塑性和灵活性而愈发难以改变或停止。

法律(垂域)大模型是专门设计用于法律领域,旨在满足法律场景对准确性、公正性的严格要求,具有极强法律语言理解、专业任务泛化和可信知识生成能力的一种基于大语言模型的生成式人工智能系统。它在本质上是由大语言模型的硬件组件(如算力、能源基础设施)与作为社会要素的法律领域共同组成的大型技术系统,兼具技术属性与社会属性。首先,法律大模型作为法律领域新型基础设施,包含与用户互动的前端系统应用,训练与运行需要依托的服务器、云存储等计算基础设施,以及支撑训练与推理的能源基础设施。其次,在法律大模型研发与应用过程中,技术组件与社会要素密不可分,它既受制于人工智能技术的创新发展,又受制于法律领域围绕技术创新与应用的价值追求、组织偏好、制度准备、认知结构的交织影响。可见,实现特定目的的硬件设备、特定的技能和知识、庞大的物理架构以及组织的科层体制等都是法律大模型发展的动力之源,决定着法律大模型增长的持续性与演变的倾向性。“技术发展的不顺利,问题常常主要地不在技术本身,甚至也不在单一的社会原因,而在复杂的社会条件。”当技术创新无法与法律领域相容时,法律大模型的发展方向与速度均会受到实质制约。最后,在法律大模型的发展初期,由于“技术动量”不足,技术具有高度的灵活性和适应性,因此更可能受到法律领域的能动塑造。随着法律大模型的技术扩散与深度应用,其“技术动量”日益积累并形成对法律领域不可逆的影响。

(二)作为行动领域与资源系统的法律领域

法律领域可以被理解为具有独特价值目标、动态权力结构、系统规范体系和明确行为准则的功能性行动领域与复杂性资源系统。对外而言,法律领域是现代社会功能分化出的不可互相替代的社会子系统,通过参照其与社会整体、相邻子系统以及自身的关系而维持自主运行;在此过程中,法律领域通过创造和维护与环境的差异来建构自我,并利用系统边界来调节这种差异,从而实现“自我指涉”的功能运作。对内而言,法律领域则是一个由特定规则、逻辑和权力关系构成的自主行动领域,行动者按照法律领域自身的符码、纲要与程序逻辑生成意义并构建资源要素的再生产结构。法律领域通过数据、知识、组织、制度、符号等资源的生产、供给与配置,不断调整领域的结构与功能,塑造自身的复杂性、多样性与动态性。更进一步,根据社会系统“运作封闭”但“认知开放”的特性,法律领域在确保自身独立性的前提下仍需与其他领域形成资源交换,从而维持自身的生产与供给。可见,法律领域存在功能性或结构性的“能动性”,这种能动性在维持自我指涉中得以体现,也即通过内部沟通和结构耦合对外部环境扰动作出响应。与法律大模型的“硬”组件相比,法律领域从技术基础、理论积累、协作机制、规范保障、文化认同等“软”维度为法律大模型研发与应用全链条提供不可替代的资源支撑。

法律领域数据资源是指用以支持法律大模型预训练、优化与运行的,以法律文书(包括裁判文书、合同文本等)、法律法规、法学论文等为代表的数据资源。法律领域数据资源由法律组织与法律职业群体在法律实践过程中不断产生,其生成过程嵌入了法律职业群体的价值追求、专业知识、实践经验,是法律领域共识的直接体现。相较于一般的数据资源而言,法律领域数据资源具有高度的专业性、权威性和规范性。

法律领域知识资源特指法律大模型研发过程中数据标注、价值对齐、指令微调等技术知识,以及法律大模型运用过程中法律提示、信息辨识、风险规避等技术素养。波兰尼的知识论包含显性知识与默会知识的二元区分。其中,显性知识主要以书面文字、图表和数学公式表达;默会知识则主要是指难以表达的、具有个体特质与情境依赖的实践性知识。就法律大模型而言,以法律科技界的技术积累为核心的显性知识与以法律理论界、实务界的技术素养为核心的默会知识,共同构成了法律领域知识资源。两者的形成均源于法律习惯、价值、文化的共同塑造,在技术知识方面体现为嵌入法律专业知识和法律场景需求的客观知识体系,在技术素养方面则表现为具体法律情境中使用技术的实践经验凝结。

法律领域组织资源是指支撑法律大模型研发、应用与扩散的,以组织偏好、组织结构与组织能力为核心内涵的资源网络。组织理论框架下对于技术的研究,经历了从强调决定论意义上技术对组织的影响到强调技术与组织互动的范式变迁。在上述转变过程中,组织对技术的塑造作用日益受到关注,并逐步成为影响技术演化的关键资源。法律领域组织资源具有鲜明的领域特征。一方面,法律领域内各类组织的偏好深受法律职业者在个体与群体两个层面的塑造。具体而言,个体法律职业者的行为偏好通过法律实践的日常积累产生对法律组织偏好的微观影响。在此基础上,异质性的个体偏好依托组织环境实现协调与整合,逐步汇聚形成法律组织的整体偏好。另一方面,在结构功能主义框架下,法律领域各类组织的结构弹性又受到组织功能定位的深度影响。

法律领域制度资源是支持和规范法律大模型开发与应用的各类正式与非正式的政策指引、行业标准、伦理规范等。制度资源通过正式规则、非正式规范、物质手段和话语框架的有机组合,对法律领域的科技创新与应用施加各层面的激励与约束。值得注意的是,法律领域制度资源并非所有社会现象的制度资源,而是特指由法律领域组织在个体与整体层面生产的,针对法律科技研发与应用的各类制度规范的总称。 法律领域符号资源是指法律领域职业群体与接受法律服务的社会公众对法律大模型的认可和接受度。

法律领域符号资源受法律领域思维模式、知识框架、决策逻辑等认知机制塑造。布迪厄认为符号资本是个体或群体在特定社会环境中获得的尊重、荣誉、声望和认可等以符号方式存在的资本,其本质是以认可和声望为基础的资源,具有无形性、象征性和稀缺性。我们可以将与荣誉、声望相关的资本视作法律大模型的符号资源,即由于法律组织与法律职业群体认可以及信任等非物质因素构成的一种法律领域总体层面的信任和预期。

(三)法律领域对法律大模型的能动塑造机理

法律领域的整体能动性并非指向“意识主体”,而是指其作为一个行动领域与资源系统,通过集体行为、文化规范、制度安排等方式,调控各类领域资源生产与供给,进而塑造法律大模型的功能表征、应用规范与社会接受度。法律大模型并非独立于社会时空的“自主存在”,而是深深嵌入法律领域之中的大型技术系统。

1. 法律领域数据资源对法律大模型的能动塑造机理

法律领域数据资源的可及性和可用性直接影响法律大模型生成内容的全面性、实用性、时效性与准确性,进而深度塑造其法律语言理解、法律任务泛化和可信知识生成能力。其中,对法律法规数据的预训练有助于强化大语言模型对法律条文体系结构、逻辑关联和规范内容的“理解”,增进其运用法律规则解决法律问题的能力。同时,对法律文书的预训练有助于大语言模型加强对法律表达的理解与应用,强化对法律案例的分析,并优化在法律咨询和法律论证等场景的表现。此外,若能充分利用电子合同等巨量法律文书资源,将有利于加强法律大模型在合同生成、解释、分析等任务中的表现。更进一步,对法学论文的预训练能够帮助法律大模型加深对法学理论的掌握,提升其在法学认识论和方法论层面的能力,优化其在法律思维和法律逻辑推理方面的表现。

2. 法律领域知识资源对法律大模型的能动塑造机理

法律大模型开发与应用的法律领域显性知识主要包括:针对法律场景特定任务而设计和训练的各类算法;数据采集、清洗、标注、管理的技术规范;开发和部署法律人工智能系统的行业标准与工程方案等。法律领域显性知识为法律大模型的研发和应用提供了可复制、可操作、可验证、可传播的知识基础与实践框架,有利于技术开发与应用的标准化和一致性。与之对应,法律领域默会知识主要包括经验与技巧层面的法律人使用法律大模型的技术素养。其中,技术认知素养决定了法律领域行动主体对法律大模型的感知和理解,并深刻塑造该技术被实际使用的方式;提示素养决定法律领域用户能否高效、准确与法律大模型进行交互,并影响生成内容的准确性与可用性;信息辨识素养决定了法律领域用户能否区分法律大模型生成内容的准确性与可靠性,从而有效避免知识幻觉,并确保人在回路的决策方式。在技术效能相同或相近的情况下,法律职业群体的技术素养(知识资源)将会在根本上影响其对法律大模型的理解与使用。

3. 法律领域组织资源对法律大模型的能动塑造机理

法律组织通过技术偏好、结构弹性、实践场景限制和引导法律大模型的采用与实施。首先,组织技术偏好(文化)影响对技术比较优势、兼容性、复杂性的判断,决定了组织对技术创新的采纳。当法律大模型能够契合法律组织业务需求时,该技术更可能被广泛使用并加速扩散。其次,法律组织的结构特点,及其内部外部、横向纵向之间所表现出来的组织弹性,决定了法律组织在面对法律大模型所带来的机会与挑战时,对其进行因应、吸收并转化为实际效能的可能性。最后,法律大模型通过同形压力和同侪竞争得以在组织间扩散。当法律大模型的研发应用成为一种行业普遍的潮流趋向,并演化为一种法律组织的压力与目标时,法律组织为了增加自身的制度合法性,会在竞争性自我调适中相互模仿,并最终在推动法律大模型创新与运用方面趋于“同形”。随着法律大模型在法律组织间扩散,法律组织本身成为其扩散的支持资源。

4. 法律领域制度资源对法律大模型的能动塑造机理

不同层次和不同属性的法律领域制度资源通过激励或约束的方式影响法律大模型的研发与应用。其中,政策指引是指各层级政法机关出台的引导与规范法律科技研发与应用的各类指导性文件的总称。政策指引能够在不同颗粒度上引导法律科技的发展方向、优化法律领域资金和资源配置,并有效管控法律科技风险。行业标准通过标准化流程和技术指标的设定塑造法律大模型的技术有效性、正当性与合法性框架。伦理规范为法律大模型的开发与使用提供伦理约束和底线标准,保障法律大模型在高速发展的同时兼顾对伦理正当性的关注。

5. 法律领域符号资源对法律大模型的能动塑造机理

法律领域符号资源供给的实质是法律大模型潜在用户的态度、价值观和信念趋同的过程。该资源通过影响法律领域行动主体的主观认知而塑造法律大模型的研发、采用与扩散。这也是为何有学者认为,在决定采用技术时,围绕技术感知形成的社会力量比技术的物理属性更加重要。当法律领域对法律大模型高度信任时,意味着该技术符合领域的价值观与符号体系,领域内行动主体将会对其产生更多期待,进而鼓励相关主体投入更多资源支撑该技术的研发。因此,符号资源在很大程度上决定了技术最初被采用。更进一步,在法律大模型发展过程中,法律领域内行动主体的共同认可及专业信任会进一步降低推广阻力、提升扩散速度。值得注意的是,技术的准确度并非主体对模型信任的充分必要条件,社会群体对法律大模型的信任度还与法律大模型背后算法的可解释性与透明度相关。

三、中国法律大模型的法律领域资源禀赋与资源困境 法律大模型并非单纯给法律领域施加影响的“技术物”,而是深受法律领域资源影响的“社会—技术物”。正因如此,中国法律大模型研发与应用在遵循技术逻辑的同时,还需要充分关注中国法律领域的资源禀赋与资源困境在技术动力与技术约束两个层面的综合影响。

(一)中国法律大模型的法律领域资源禀赋

中国法律领域的数据资源、知识资源、组织资源、制度资源和符号资源的充分积累所形成的资源禀赋塑造了中国法律大模型的技术选择、路径依赖与发展模式,形成具有鲜明政策导向与应用驱动的技术风格。

1. 法律领域数据资源禀赋

中国法律领域的全方位数字化转型为法律大模型的训练积累了存量丰富的领域数据资源。该数据资源决定了中国法律大模型本土化深耕和中文定制化的总体技术风格,以及适应中国语境的法律语义理解、法律推理和法律决策的目标定位。在法律法规方面,各种大型法律法规数据库的建设为法律大模型的开发提供了天然的训练数据集。例如,国家法律法规数据库作为由国家立法机关建设的官方数据库,收录了包括宪法、现行有效法律、法律解释、地方性法规等法律文本近2.65万件,涵盖了中国特色社会主义法律体系最主要的内容。在法律文书方面,国家与社会层面电子化法律文书的海量积累能够为法律大模型提供充分支持。虽然在线公开的裁判文书为各法律人工智能研发主体提供了重要的支撑,但已公开部分仅是全社会法律文书数据资源池中非常有限的部分,比如仅2023年中国电子合同的签约数量就达1337.1亿份。在法学论文方面,存量巨大、增量可观的电子化法学论文文献也是中国法律大模型的重要数字资源基础,仅最高人民法院数字图书馆就聚集了达1.929万亿字的1.505亿篇文献。

2. 法律领域知识资源禀赋

在科技创新领域新型举国体制逐步健全的背景下,依托科技部国家重点研发计划在公共安全、智慧司法等领域的项目布局,我国围绕法律大数据、法律人工智能领域产出了一批关键的算法与模型,形成中国法律大模型研发的重要显性知识基础。有数据显示,早在2018年,全球申请的法律科技专利中就有超过一半(51%)来自中国;次年,中国法律科技专利的占比更是上升到了61.9%。近年来,清华大学、北京大学、浙江大学、复旦大学、山东大学、东南大学等高校先后发布了PowerLawGLM、ChatLaw、智海·录问、DISC-LawLLM、夫子·明察、法衡等法律大模型。各科技公司也积极开发智慧法律系统、法律智能助手等面向法律行业的大模型产品与应用。可见,当前各领域围绕法律人工智能的深入探索为法律大模型的研发提供了较多的显性知识资源。

在默会知识方面,中国数字法治实践中“百花齐放”与“全体总动员式”的繁荣面貌助推了法律领域围绕法律科技的知识启蒙。正如技术社会塑造主义者认为的那样,行动者倾向于通过熟悉的模式或者框架来理解新技术。一方面,法律领域的组织与个体在数字化、网络化、智能化的不同阶段围绕前沿技术的部署应用、逻辑机理、风险问题等形成了丰富的默会知识;另一方面,社会公众在数字法治转型中也整体性、普遍性地提升了参与数字化司法活动的技术素养与实践知识,在与法律人工智能的互动中生成了关于其基本概念、应用方式等方面的认知。这些都为法律大模型的研发与应用提供了充分的实践经验支持。

3. 法律领域组织资源禀赋

法律领域内各类组织的组织需求与偏好、较强的组织结构弹性与可塑性、围绕技术应用的组织间压力和竞争共同形成了中国法律大模型的领域组织资源禀赋。这一资源禀赋决定了中国法律大模型的研发与应用具有面向国家需求的全局动员特征,也决定了中国法律大模型仍然在一定程度上延续地方试点主义和同侪竞争相结合的技术扩散风格。

其一,在组织需求与偏好方面,法律大模型在法律领域具有广泛的应用场景。智能技术应用一直以来都承载了正向、积极且热切的期望,并被视为中国式法治现代化的新道路、新动能。政法机关不仅在应对“诉讼爆炸”、强化配合制约、优化职权配置、提升法律服务等方面对法律大模型具有现实的组织需求,其作为国家层面的政治法律组织共同体,还通过国家推进主义与整体主义的组织行动路径,衔接法律大模型创新的举国体制与领域实践,实现组织偏好的有效对齐。

其二,在组织结构与弹性方面,政法机关通过内部结构的专门调整,为法律大模型的引入提供了有力的组织支持。从自适应结构化理论来看,法律组织既为法律大模型提供应用场景,也通过自身内部结构的自我调适实现对法律大模型的自适应使用。在国家层面,最高人民法院、最高人民检察院先后成立了人民法院信息技术服务中心、数字检察工作领导小组等内设机构或协调机构,有效提升了应对智能化建设任务复杂性的组织结构弹性。在地方层面,各级政法机关也根据地方实际优化组织内部的机构设置与职权配置,组建技术处、信息处等专门管理应用法律科技的内设部门来统筹信息化智能化建设。总的来说,这些专门机构一方面具有规模上的弹性,在平常状态下,负责组织内部技术应用的评估、保障等日常性工作,在涉及法律科技应用的重大专项时也能够迅速组织大量人力物力资源;另一方面具有权责上的弹性,所负责的内容以技术为核心,能够覆盖组织内的各个业务领域,并有效服务于管理法律大模型的复杂性需求。

其三,在组织压力与竞争方面,中国法律大模型有望在技术与组织的密切互动中获得多维、多层的组织资源支持。作为“任务”的法律智能化改革催生了政法机关间的“同形”,即组织基于服从由权威产生的正式或者非正式压力而导致的组织趋同。无论是数字法院建设还是数字检察改革,乃至整个政法领域智能化改革,前沿技术的应用普遍遵循国家推动、顶层设计、官方主导的总体布局,并依托科层制下的“命令—服从”“目标—考核”机制自上而下地分解为工作任务得以实现。这种压力使得法律组织迅速适应前沿技术的变革,通过大量“一线”探索创新来回应社会对组织正当性的需求。随着法律大模型被纳入顶层推动下的数字法治建设任务序列,组织间基于对技术应用本身以及完成技术应用任务的共同需求,形成一种“强制同形”压力。与此同时,由于顶层支持的风向标与指挥棒效应,不同地域、层级、类型的法律组织围绕前沿人工智能技术的应用展开激烈的同侪竞争。法律大模型作为最前沿的法律人工智能技术之一,对其的研发应用符合智能化建设推陈出新的总体要求。受此影响,不同组织就会逐步在结构和实践上进行转变,并最终在“模仿同形”的组织行动中扩散对于法律大模型的组织偏好。

4. 法律领域制度资源禀赋

作为中国式法治现代化的重要名片,数字法治的理论与实践在近年来取得飞速发展。良好的制度准备被视作中国数字法治建设的重要优势。《关于充分运用智能化手段推进政法系统顽瘴痼疾常治长效的指导意见》、《最高人民法院关于加快建设智慧法院的意见》(法发〔2017〕12号)、《人民法院信息化建设五年发展规划(2019—2023)》(法〔2019〕79号)、《检察大数据行动指南(2017—2020年)》、《司法部关于进一步加强司法行政信息化建设的意见》等规范性文件中明确了全面推进法律领域围绕大数据与人工智能技术进行科技创新的重要政策导向。2024年12月26日,最高人民法院发布的《人民法院第六个五年改革纲要(2024—2028年)》(以下简称《六五纲要》)明确提出,强化大语言模型技术应用。以一系列“中华人民共和国法院行业标准”为代表的领域行业标准为法律大数据与人工智能的研发提供了全面的指引。政法机关还探索了法律大模型应用的伦理规范,如《最高人民法院关于规范和加强人工智能司法应用的意见》(法发〔2022〕33号)就关注了法律人工智能可能产生的伦理道德风险。不容忽视的还包括各类行业自律规范,如智慧司法技术总师系统、浙江大学、上海交通大学、阿里云计算有限公司、科大讯飞研究院联合发布的《法律大模型评估指标和测评方法(征求意见稿)》也在产学研用共同体层面塑造法律大模型的研发与应用。

5. 法律领域符号资源禀赋

受数字法治建设的知识启蒙,中国社会对于以大数据与人工智能为代表的法律科技保有较高的知悉度和认可度,认为其对于司法公正、司法权威、司法效率与司法便民均有显著的正面效应。有调查显示,近90%的中国公众表示有兴趣使用机器预测他们法律纠纷的结果,87.7%的受访者认为引入大数据和机器学习将提高法律结果的确定性。从深层逻辑来看,法律领域作为社会治理的重要实践面向,受到实用主义的影响,对技术适用秉持开放态度,这极大拓展了人工智能在法律领域适用的深度与广度,为法律大模型的创新与发展创设了更为宽松的认知环境。同时,在法律领域积极运用法律大模型往往是特定机关积极跟进时代、推动改革的重要表征,能够为政法机关获得足够的符号资源。与中国官方积极助推的态度不同,域外对法律大模型的态度较为保守。以美国为例,只有9%的受访者认为应该在法庭环境中使用生成式人工智能;有93%的受访者表示其目前并未使用并且在可预见的阶段也不会安装人工智能技术系统。

(二)中国法律大模型的法律领域资源困境

中国法律领域资源禀赋尽管为中国法律大模型的研发与应用提供了技术动力,但需正视的是,法律领域在数据准备、知识储备、组织基础、政策环境、认知传统等方向面临的多维资源困境,正对法律大模型的领域塑造形成系统性的制约与挑战。

1. 法律领域数据资源困境

虽然当前中国有着巨量数据资源,但法律语料的总体比重极低,高质量法律语料更加有限。法律大模型所需要的法律领域数据资源存在可获性和可用性双重困境。

法律大模型数据资源的可获性是指获取法律文本数据的机会和可能性,主要涉及能否通过公开的数据库或者渠道获取法律大模型训练所需的法律文本数据。虽然中国通过数字法治建设乃至整个数字中国建设实现了海量法律文本的数字化,但是法律大模型仍面临着多种数据资源可获性困境。

在法律法规方面,当前我国高质量法律法规数据库主要由若干大型法律类商业平台控制,免费开放型法律法规库的数量、规模与法律大模型的开发要求不完全匹配。在法律文书方面,掌握大量法律文书材料的政法机关之间存在不同程度的数据壁垒,数据孤岛情况严重;部分地区政法机关尤其是部分基层政法机关的卷宗电子化归档、数字化流转等基础的信息化任务还未完成;此外,存量丰富的电子合同因涉及大量的个人隐私与商业秘密,难以大规模地开放使用。在法学学术文献方面,海量论文主要被收录于商业数据库,难以开放获取。 法律大模型数据资源的可用性指法律文本数据能否被有效应用于法律大模型的预训练,主要涉及数据的质量、格式、结构化程度等。法律行业作为一个具有浓厚职业化、专业化色彩的行业,领域数据对于来源、识别、表达、传播的规范性要求较高。实践中,部分法律领域语料,如网络问答等公开语料虽然具有较强的通用性与较大的数据体量,但是数据质量难以保证,隐含较大的偏差甚至错误风险。此外,虽然当前大语言模型基座训练时愈发强调无监督或者自监督学习,但在开发法律大模型时仍需要基于海量法律领域数据对通用大模型基座进行微调以提升法律领域任务的表现。“微调”在中文语境具有一定误导性。“微”通常被认为与较低工作量对应。实际上,微调分为局部微调和全局微调。考虑到法律大模型与通用大模型在源数据和目标任务上有较大差异,需要进行大比例甚至是全局意义上的“微调”,包括对模型的所有参数进行重新训练和优化,从而适应法律领域的需求。在此过程中,涉及大量精标的法律领域数据,比如标注法律因果关系链、责任归属推导逻辑链、案件争议焦点与法律依据等,这对法律职业群体的有效参与和知识嵌入提出了较高要求。因为法律文本中法律术语的复杂性、法律规范的变动性、法律渊源的多样性、法律知识的地方性、法律认知的具身性、法律表述的差异性等,法律语料的标注需要具有专门法律知识的法律从业者花费大量的时间进行。这便制约了法律文本数据的高质量结构化处理,产生了法律大模型训练中法律语料的可用性困境。

2. 法律领域知识资源困境

法律大模型作为垂域大模型,不仅依赖与通用大模型共通的基础算法等知识底座,更需要场景化研发、工程化落地的法律领域技术知识。截至2025年4月,国家互联网信息办公室公布的已备案的340余项生成式人工智能服务中仅有寥寥数项法律大模型。这凸显了现有基于通用模型领域微调的法律大模型技术范式在应对法律领域高精度需求、细粒度理解、复杂逻辑推理、长法律文本处理等专有需求方面的显性知识困境。首先是模型训练环节的困境。中国的法律规范体系具有高度复杂性,转致规定、特别规定、例外规定乃至法条竞合、法律冲突不同程度存在,因此,尽管法律大模型以大量法律法规文本作为基础训练语料,但作为基于模式识别的人工智能,还无法完全理解法律体系的层次结构、竞合关系和规范冲突。同时,由于包括法律法规在内的法律文本以大量专业化、特定化的法律术语、法律概念为基础,尽管法律大模型通过法律文本训练能够在一定程度上捕捉到法言法语与日常用语的差别,也能在一定程度上识别法言法语背后的语言模型,但仍然无法完全理解不同法律用语在不同法律文本中的细微区别。其次是结果输出环节的困境。为避免知识幻觉出现,法律领域要求法律大模型提供的信息是可验证的,具有权威来源的支持。常见的技术框架有大小模型协同、知识增强、检索增强等。以检索增强(RAG)为例,该技术旨在确保法律大模型不仅可以提供答案,还可以指向答案来源的超链接。在RAG框架下,模型在回答问题或生成文本时能够从广阔的专门数据库中寻找相关信息,从而提高回答的准确度。但RAG技术在信息检索时,向量表示可能无法识别复杂法律用语之间的细微差别,进而造成概念混淆、答非所问。总之,法律大模型的知识滞后以及知识幻觉等问题虽然可以通过采用RAG技术提供外接知识库的方法在一定程度上得到缓解,但现有技术仍无法从根本上解决这一问题。

此外,虽然近年来中国的数字法治建设在整个社会形成了法律业务数字化转型的积极氛围,但法律职业群体在关于法律大模型的诸多默会知识方面仍有所欠缺,主要体现在:一是技术认知素养不足。中国通用大语言模型的商业化部署处于起步期,相当部分法律大模型也处于开发试验阶段。因此,目前中国社会对于法律大模型的技术机理及其在法律领域的典型应用场景等基本问题的认知仍较为不足。二是法律提示素养不足。精准的提示可以引导法律大模型更加接近提问者的询问意图,并生成更符合期待的内容。目前部分法律人在综合运用法律指令提示、法律角色提示、法律案例提示、法律条文提示等默会知识方面的经验不足,导致法律提示的准确性、层次性、有效性与完备性仍有较大提升空间。三是信息辨识素养不足。法律大模型的技术逻辑决定了其不可避免地出现知识幻觉,因此需要法律职业群体准确辨识生成内容的准确性并避免被错误信息误导或操纵。上述信息辨识素养的获得和提升,仍需要长期应用的经验积累。四是风险规避素养不足。在法律大模型的自我学习进化机制下,应用者在利用其进行法律问答、案例分析的过程中可能产生个人隐私、商业秘密、国家机密的泄露风险。面对上述风险所应具备的风险规避素养,也有赖于关于法律大模型技术认知、应用方法、信息分辨等默会知识的整体积淀。

3. 法律领域组织资源困境

在智能化建设的“同形”压力下,法律组织围绕法律科技进行攀比式竞争,法律领域部分智能技术的研发、部署与应用呈现出内卷化的态势,甚至出现了以人工智能为噱头而实际上只是经过包装的传统技术的伪智能。由此也就导致了“实践中真正有用并投入常态化运营的法律人工智能系统并不普遍”。这种实效性不足在一定程度上影响了以政法机关为代表的法律组织对于法律大模型的热情,使其在面对法律大模型时更加审慎。《六五纲要》明确提及的“加强对人工智能司法应用的审查监管和风险评估”就体现出了最高人民法院对于前沿法律人工智能技术的研发部署应用将采取更慎重、更稳健的态度。此外,由于在组织属性、利益关切、财力物力等方面存在差别,不同政法机关推进法律大模型研发应用过程中的自发性、自觉性以及最终的建设成果存在显著差异。中国人口庞大、地域辽阔、国情复杂的特征也决定了在同一政法机关系统内部,不同层级特别是不同区域的数字化、网络化与智能化水平也存在很大差异。政法机关智能化水平的不均衡影响了法律大模型在法律组织间的技术扩散。不容忽视的还在于,作为法律共同体的律师事务所相对游离于法律人工智能的应用之外,可能整体上对法律大模型的应用需求与部署意愿不够强烈。因为律师事务所具有社会性、市场化法律组织的原子化属性,单个律师事务所通常无法负担法律大模型开发应用的高昂成本,相对松散的组织间关系也难以通过组织整合与组织动员凝聚合力共同展开法律大模型的部署应用。

4. 法律领域制度资源困境

现有法律制度尚未有针对性地就生成式人工智能在法律领域的应用进行全方位的规划与指引,整体呈现出激励不足、约束缺位的双重制度性困境。这导致法律大模型研发缺乏专项的政策扶持与财政保障,降低了市场主体的政策预期,并削弱了其投入研发的意愿。同时,法律大模型在性能指标、测试方案、部署标准等方面缺乏统一标准,致使市场主体因为信息壁垒、资源错配及协同机制缺失等市场失灵现象而陷入不公平、不充分与不透明的竞争格局。例如,差异化的组织需求和监管标准可能增加“一院一策”的负担,显著抬升市场主体的交易成本。此外,我国法律领域尚未针对生成式人工智能的应用出台专门的伦理准则与安全规范,不仅导致无法对法律大模型的多重数据安全、伦理、隐私风险进行有效识别与防控,还使得对如何把握法律大模型的应用边界缺乏可操作性的行为指引。

5. 法律领域符号资源困境

法律大模型面临的多种知识幻觉影响了法律职业群体和社会公众对法律大模型的信任度。通过加强专业性与准确性消除知识幻觉固然重要,但就文化认知层面的符号资源而言,准确度与信任度之间并非充分必要关系。对于法律领域而言,法律职业群体、社会公众对于法律大模型的信任还可能和算法的可解释性与透明度相关联。算法可解释性强调算法能够“以人类可理解的语言向人类展示算法系统为何作出特定预测或决策的方法”。尽管在法律大模型的训练过程中增加了与法律人的价值对齐,但其底层逻辑仍然呈现非线性学习特性(如数据驱动的增量效应),这就导致法律大模型算法决策路径仍然难以追溯。此外,普通用户缺乏分析和评估机器学习算法执行的复杂操作结果的专业知识,认知上的局限可能导致即使技术上有所突破也难以实现有效解释。尽管现有法律大模型可以在有效互动中为用户提供分析过程的形式解释,但此种形式可解释性背后仍然是基于统计上的相关性而非真正的因果关系,本质是以复杂的方式按照算法和概率将输入映射到输出、剪切和粘贴文本。简言之,法律大模型可能导致的知识幻觉与实质性解释能力缺失的风险在一定程度上阻碍了以用户认可与信任为基础的符号资源的充分获取。

四、面向能动塑造中国法律大模型的法律领域资源优化

在推动中国法律大模型创新与应用时,不应单纯围绕技术谈技术,而应将法律领域放置到能动塑造的关键位置,从协同和简化两个维度构建破解法律领域资源困境的改革方案。一方面,需要明确法律领域能动塑造中国法律大模型的总体目标,协同领域内多层次意图,形成目的性干预、反思性调控、策略性选择的一致性集体行动;另一方面,需要简化法律领域内各资源之间的复杂互动关系,形成具有可操作性的数据、知识、组织、制度和符号资源的有效供给机制。

(一)以推动中国法律大模型自主创新为总体目标

在中国式法治现代化建设的背景下,应将推动中国法律大模型自主创新作为法律领域资源系统优化的总体目标,自上而下统合法律领域各类资源的生产与供给,从而形成具有纵向对齐性与横向一致性的系统性资源供给。要通过“集聚法律界和科技界力量进行原创性引领性科技攻关,突破法治领域科技发展的各种卡脖子难题,确立起中国在世界法治科技发展上的领跑地位”。这不仅要求在每类资源的生产与供给过程中主动创造条件与中国法律大模型创新的目标对齐,还要求法律领域的多元资源形成合力,共同向支撑中国法律大模型自主创新的目标聚集。

习近平总书记指出,要全面推进人工智能科技创新、产业发展和赋能应用,完善人工智能监管体制机制,牢牢掌握人工智能发展和治理主动权。在此背景下,中国法律大模型的自主创新需要围绕关键技术、应用场景、标准规范、行业生态、安全保障等方面的自主与可控展开。具体而言,关键技术自主可控要求中国法律大模型的数据处理、价值对齐、领域微调、算力支持等关键技术独立发展,保障算法与模型架构自主、数据资源可获可控;应用场景自主拓展强调面向中国法律领域的真实需求,在无需依赖外部技术的基础上,持续探索法律大模型的场景化应用,是领域需求与技术能力深度耦合的产物;规范标准自主制定是指中国法律大模型的规范标准应以本土需求为关照,聚焦发展的主动权和国际话语权;行业生态自主建构的目标在于推动中国法律大模型从技术到应用、从硬件到软件、从研发到商业化全链路生态的自主建构;安全自主保障关注中国法律大模型研发、部署和应用全生命周期安全保障技术与制度的自主化。

以中国法律大模型的领域能动塑造理论为关照,中国法律大模型的自主创新意味着依靠我国的科技力量全面掌握与法律大模型相关的数据资源、知识资源、组织资源、制度资源与符号资源,从而自主推进法律大模型技术的突破性进展,有效支撑中国式法治现代化建设。其中,数据资源和知识资源在很大程度上决定了中国法律大模型能否实现关键技术的自主可控;组织资源是中国法律大模型应用场景自主拓展的关键所在;制度资源是标准规范自主制定、安全自主保障的基础和前提;数据资源、知识资源、组织资源、制度资源和符号资源共同支撑了中国法律大模型行业生态的自主构建。

(二)法律领域复杂资源系统的简化机制

法律领域是一个典型的复杂资源系统,其构成要素以非简单方式进行直接或间接的相互作用。其中,符号资源与制度资源既受其他资源影响,又决定了其他资源的生产、供给与配置。比如,对法律大模型的高度认可意味着更多的组织支持和场景应用,制度资源则可以决定数据资源的获取和使用方式。组织资源既在符号资源与制度资源的框架下运作,又通过组织运作实践与反馈而调整制度资源与符号资源。数据资源、知识资源的禀赋深受制度资源的影响,其面临的困境亦可以直接或间接推动制度资源的优化。数据资源与知识资源之间也存在复杂的互动关系。比如,法律从业人员的技术素养影响对数据资源的生产和运用;法律从业人员参与数据资源的生产不仅影响模型的开发,还通过反馈作用于知识资源,推动法律从业人员的技术素养提升。

若在法律领域资源系统优化的过程中充分考虑各资源之间的互动关系,将使得资源供给策略变得过于复杂而失去可操作性。此时,需要在层次系统理论的指导下实现对领域资源系统复杂动态交互的有效简化。层次系统理论认为,大规模系统通常面临复杂性的问题,而将系统分解为层次化的子系统是复杂性系统最为核心的简化机制;在复杂系统的层次架构中,高层次单元定义任务并协调较低级别的单元;各层次单元通过协调机制保证局部目标与全局目标的一致性。受制于社会系统之间弱耦合形成的“近似可分解性”(near-decomposability),各子系统在专注实现自身最优状态的基础上,主要与关系最为密切的直接上层或者下层子系统进行交互与反馈。那种强调“万物皆相互联系”的全局交互理念在处理复杂问题时并无帮助,甚至可能会产生误导。

在层次系统理论的框架下,可以基于功能层次将法律领域各类资源区分为宏观、中观与微观三个层面。其中,宏观层面主要包括作为整体意义上的符号资源与具有广泛影响和基础性作用制度资源。中观层面是在认知和宏观制度基础上相对更为具象的概念,主要包括组织资源以及部分延伸至中观层面的制度资源。微观层面与法律大模型的技术直接相关,主要包括数据资源与知识资源。由此,法律领域复杂资源系统的优化问题就可以被简化为:宏观层面的符号、制度资源确定领域资源系统的战略性、全局性、认知性、制度性框架,并影响中观层面和微观层面领域资源的生产与供给。尽管宏观与微观资源之间存在直接交互可能,但为了避免各层次资源全面交互带来的高度复杂性,在化约整体方案时,宏观、中观、微观三个层面的领域资源主要与关系最为密切的上层或者下层领域资源互动。在此过程中,应以中观层面的组织资源为中心,其通过衔接微观层面与宏观层面实现资源之间的流动与交换,确保整个领域资源系统围绕推动中国法律大模型自主创新的总体目标展开。

选择以组织资源为中心系出于理论、历史与现实三方面的原因。其一,从理论上看,复杂系统需要一个控制中心或协调节点,以确保各子系统高效运行。在法律领域的复杂资源系统中,组织往往是资源整合的关键节点。它是直接作用于其他资源的调度器,通过规划和整合能力对数据、知识、制度和符号资源进行有效配置和优化。一方面,组织资源协调微观层面数据资源与知识资源的生产,参与宏观层面制度资源与符号资源的建构,并承接制度资源与符号资源的宏观目标指引。另一方面,组织资源作为居中的节点还承担反馈与调控的功能,可以汇聚数据与知识资源的反馈(如强化数据资源供给的建议)作为调整制度资源的依据,以及以制度和符号资源设定的目标为指引调节数据和知识资源的具体生产。以组织为中心的资源供给机制既避免了脱离总体目标的碎片化、多方向的领域资源供给格局,又将领域资源系统复杂的资源互动与耦合关系简化为可操作的管理机制。其二,从历史维度看,自工业革命以降,组织始终既是技术研发和应用的重要场景,又是技术创新的关键推动者。技术创新往往通过“系统组装”实现,而系统组装的关键在于组织资源的整合能力。其三,立基于中国法律大模型发展的现实背景,我国法律科技的改革长期以来奉行地方试点主义与同侪竞争相结合的路径,这使得组织层面的政法机关一直是我国法律科技研发与应用最为核心的推动力量。

(三)法律领域资源供给的优化方案 在优化数据资源供给层面,以政法机关为代表的法律组织需要通过法律数据的开放与共享以及法律数据的标准化等举措有效回应数据可获性与可用性的困境,从而形成高质量、广泛覆盖的自主法律数据生态系统。2023年新一轮机构改革中正式组建的国家数据局为法律大模型数据资源的优化供给提供了组织基础。当务之急,是由国家数据局牵头、各政法机关数据管理部门配合,形成“合作型数据治理格局”,共同推动构建法律数据的分级标准,将政法机关数据划分公开数据、受限数据、敏感数据、涉密数据四大类。其中,公开数据为可向社会公众完全开放的政法数据,如已公开判决书、法律法规等;受限数据为不涉密但需控制知悉范围的政法数据,如案件流程数据;敏感数据包括当事人身份信息等政法数据;涉密数据则为涉及国家安全、重大公共利益的政法数据。在此基础上,应明确全生命周期的法律数据分级管控措施:对于公开数据,可以开放下载或对联合开发的授权主体提供API接口;对于受限数据,应允许在签订保密协议的基础上,在内网环境部署数据沙箱进行法律大模型训练,但原始受限数据全程不能离开政法机关服务器;对于敏感数据,除了遵循受限数据相同的方案外,还需要在训练前进行强脱敏处理,并且所有输出结果均须经过差分隐私审核,确保无法反推个体信息;对于涉密数据,则禁止任何意义上的对外共享。此外,可在“数据二十条”推动行业性数据流通使用的要求下,探索法律行业数据交易平台与国家级数据交易场所的互联互通,提供法律领域数据资源交易的良性环境。对于法律领域数据资源的可用性困境,法律组织可以搭建法律大模型研发的分布式参与机制,将法律大模型研发的任务分解为可以顺便完成的小任务,嵌入到法律职业群体的日常业务流程,并允许法律职业群体在碎片化时间内以灵活的方式生产结构化领域数据资源,如在使用智能法律辅助系统时,允许法律职业群体随手对生成内容进行“点赞”或“纠错”。在此基础上,可在国家级法律数据资源库的建设过程中阶段性地推进法律领域结构化数据的供给,保障社会公开或市场可交易的法律数据资源的模型训练可用性。

在优化知识资源供给层面,法律组织应在法律大模型研发应用的显性知识与默会知识构建过程中强化法律职业群体与法律科技群体之间的互动,形成国家层面自主的法律大模型核心技术优势。一方面,相较于通用大模型而言,法律大模型具有极高的专业性、准确性与价值性需求,因此法律大模型训练研发的具体流程应面向法律职业群体开放,引导法律人提炼有关法律领域价值的专家原则,协助构建法律领域指令数据的微调标准和法律输出的验证标准,通过引入法律职业群体的专业能力来弥补法律技术群体对法律规范体系和具体法律判断的显性知识缺陷。例如,用于实现法律大模型检索增强的法律知识库必然包括大量高质量法律知识及其来源,需要法律职业群体的合力建构。考虑到当前法律职业群体以显性知识对法律大模型研发的参与度有限,法律组织应优化体制机制为法律职业群体参与法律大模型的价值对齐、指令微调、输出验证提供正向激励和流程便利,从而为领域显性技术知识的优化提供专业支撑。另一方面,法律组织应在培训机制中充分发挥法律科技群体对于法律职业群体技术素养提升中的作用,针对技术认知素养、法律提示素养、信息辨识素养、风险规避素养等默会知识展开有针对性的、成体系的查漏补缺。

在优化组织资源供给层面,以政法机关为代表的法律组织也应作为系统内部层次不断地自我优化,在强化与其他领域资源层次沟通的同时克服自身内部的资源困境。其一,政法机关应调适组织偏好,以更加务实和审慎的态度参与构建并应用真正实用的法律大模型系统,尤其要避免以大模型为噱头造势而忽视其实效的应用。当然,审慎与务实绝非意味着对法律前沿科技的态度由“来者不拒”到“因噎废食”。这就要求调整组织结构,建立一套以实用性和适配性为核心的法律大模型的事前评估机制,重点关注技术能否真实解决法律场景的业务痛点。政法机关不应过多冲到推动法律大模型在内的法律前沿科技突破性创新的“第一线”,而更应该为具有一定成熟度的法律大模型提供应用场景。在事前评估中,尤其要利用法律职业群体熟悉的案件场景(如民事纠纷或刑事审判)构建模拟场景,从而更加准确地测试法律大模型的具体应用效果。与此同时,法律组织还应当建立法律大模型适用后的动态评估与持续跟踪机制,并基于法律职业群体的有效反馈而推动法律大模型的迭代优化。其二,以律师事务所为代表的法律服务机构应逐渐成为法律大模型推广与应用的关键主体。实际上,随着技术的加速演进,法律大模型可以与法律人形成良好的人机协同关系,为全面提升法律服务的数量、质量与可及性带来可能。因此,处于市场商业竞争环境中的律师事务所等更应充分发挥法律大模型的赋能作用,以人机协同的高质量法律服务在市场竞争中取得优势;组织规模更大的法律服务机构(如大型律所)可与科技公司合作,积极参与法律大模型的训练研发。从结果上看,法律组织资源的自我优化最终应实现法律大模型应用场景的自主扩展。

在优化制度资源供给层面,法律组织也是形成法律大模型政策指引、行业标准、安全规范与伦理规范等的核心力量,这些制度资源的生产和供给应从激励和约束两个维度聚焦组织、制度与市场的有机协同,强化法律大模型的市场创新,并保障法律大模型的安全应用。最高人民法院、最高人民检察院、司法部等可以发布法律大模型的政策指引,通过设置领域需求来引导市场主体积极投入法律大模型研发;加快编制法律大模型(可信可溯源)的行业标准,明确性能指标、测试方案、安全需求、接口标准、部署方案等核心内容,为市场主体提供公平透明的竞争环境,避免过分强化组织资源而造成的权力寻租与市场扭曲的风险;及时出台法律大模型的伦理规范,构建法律大模型的负面应用清单,提示法律大模型使用过程中的潜在风险,如国家机密、商业秘密与个人隐私的泄露等;指导法律职业群体识别可能由大模型生成的材料,并在法律组织内部构建法律职业群体负责任地使用法律大模型的正当程序。

在优化符号资源供给方面,法律组织应积极构建第三方算法测评与算法审计相结合的可信法律大模型双重保障体系。其中,算法测评关注法律大模型的准确性、稳定性等技术指标,旨在量化评估法律大模型的“性能”与“效率”,是“技术导向”下消除法律知识幻觉的优化工具;算法审计则重点围绕“监管”和“问责”展开,聚焦法律大模型的合法性、合伦理性、正当性、透明性与可问责性,通过伦理测试、数据溯源、多方验证等方式确保法律大模型的“可信”与“可控”,是“治理导向”下提升可解释性与透明度的优化工具。算法测评与算法审计赋予法律组织有力的技术与治理工具,共同支撑了可信法律大模型的建设,有利于提升社会公众与法律职业群体对法律大模型的信任度,实现法律领域符号资源的高效生产。在此基础上,法律组织在确保法律大模型核心参数、训练数据及其关键优化细节安全的同时,可探索推动模型基本架构、算法原理、模块划分、推理代码、评估数据集、测试用例等内容的有限开源,允许独立第三方对法律大模型进行架构复现并展开验证,但不能直接使用完整的法律大模型。更进一步,法律组织应积极搭建“开放性参与”的机制,吸收法律职业群体与社会公众的有效参与,打造可公开、可解释、可救济的法律大模型。同时,针对不同受众采取个性化的解释方式,从而最大化提升公众对法律大模型的信任度。

五、结   语

随着法律大模型的加速迭代,其掀起的智能浪潮可能对法律领域带来重塑性影响。因此,法律大模型的发展绝非单纯意义的技术工具,而是关乎中国式法治现代化未来演进方向的重要命题。在此浪潮中,法律领域行动者不能止步于做法律大模型的技术应用者——拥抱技术固然重要,但这仍是技术决定论意义上的被动回应与消极防御。相反,法律领域行动者应以价值守门人、知识生产者、制度供给者等多重身份,能动介入法律大语言模型的进化与演进,塑造符合中国式法治现代化需求的法律大模型技术风格。这势必是一个长期、渐进的,需要大家共同参与、体验和创造的时代进程。尽管本文以法律大模型为关注点,但领域塑造理论的本质是研究法律领域的复杂资源网络如何影响法律科技,因此同样适用于其他技术与法律领域的互动分析。从更广的维度看,强调法律领域对法律大模型的塑造作用,意味着技术发展并非基于纯粹的技术逻辑,还可以从优化中国法律领域的资源条件入手,为形成我国法律科技的自主创新优势提供理论资源,并与“高水平科技自立自强”的国家战略形成对话。