埃森哲应用人工智能分析合同和负债
法律智能合同探索(ALICE)项目启动时考虑到了两方面的需求。首先,团队需要帮助法律组织在公司的MMR系统中执行超过百万份合同的常规文本搜索。其次,它需要被允许搜索合同条款。 “我们有一群数据科学家,他们建立了分析解决方案的模型,这些解决方案可以对大量合同进行索引,并构建特定的分析算法来提取条款和条件。”Maresca说。 这不是一件容易的事情,因为埃森哲的历史合同几乎没有任何的标记条款,这意味着团队无法为项目建立和评估一个分类模型。它正在处理一个不可见的文档集合,必须确定如何在没有标记数据的情况下开发条款识别组件。 更有挑战的是,埃森哲的许多合同都是基于客户文件的,不同的客户会以不同的格式列出他们的条款和条件。这意味着团队不能应用模板方法来确定条款--包括不可抗力、责任、数据隐私等等。合同还不一定会直接引用子句,因此解决方案还需要找到能够识别子句存在的相关关键字。 自然语言处理的能力 为了解决这个问题,团队转向了“"word embedding”,这是一种基于语义相似性的NLP方法,可以促进词之间的比较。该模型可以从合同中提取出一个关键字列表及其相关性得分,从而允许子句提取解决方案计算一个相似度得分,该得分将指示文档中每个段落与特定子句类型的相关性,Maresca说。
埃森哲的word- embedded模型将逐段检查合同文档,寻找关键字以确定该段落是否与特定的条款相关。例如,“水灾”、“地震”或“ (编辑:唐山站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |