首页 > 舞弊新闻 >

使用技术辅助审查来发现可疑交易

2022-12-06

本文由ACFE China翻译如需转载,请提前告知。


1.png


技术辅助审查(TAR)已经在电子发现事务中使用了近20年,以降低成本,提高效率,并加快通常繁琐的手动审查电子邮件和用户文档的工作。舞弊检查人员还可以使用TAR技术(带有一些护栏)来发现结构化数据中潜在的不当支付(pip)或交易。


美国司法部 (DOJ) 正在调查一家在拉丁美洲、西非和东欧开展业务的全球性公司,涉嫌违反《反海外腐败法》 (FCPA)。在与外部法律顾问及其法务会计服务提供商的协调下,该公司将技术辅助审查 (TAR) 技术应用于支付交易,将 DOJ 的 3000 万美元贿赂和腐败指控减少到不到 800 万美元,并允许他们在庭外和解。我引起你的注意了吗?


在本专栏中,我将描述这个实际案例的虚构版本,在真实的政府调查中,TAR确实被用作一种防御策略(我更改了数字和细节)。美国司法部指控该公司通过多家第三方供应商,以贿赂的形式向包括海关人员在内的政府官员支付不当款项。美国司法部声称,20多家供应商涉嫌受贿超过3000万美元,公司有责任证明他们是错误的。


为了计算成本,假设手工跟踪和审查来自24个供应商的3000万美元涉嫌贿赂的7.5万张发票平均需要30分钟。这需要律师和法务会计师花费37,500个小时,以平均每小时400美元的专业费率计算(当然,数量有折扣),手工审阅这些发票——这给公司带来了高达1,500万美元的成本。考虑到此案的高风险、潜在的声誉损害、公司面临的潜在罚款和/或监督,其董事会实际上同意支付1500万美元,尽管有些犹豫。但是等等!随之而来的是取证数据分析英雄和 CFE 的救援,他们向公司提出了一个建议:如果我们使用TAR(电子发现和文档审查中经常使用的概念),以高效和成本效益的方式训练一个模型,以统计预测潜在可能性会怎样?


塞多纳会议是一个非营利的研究和教育机构,致力于反托拉斯法、复杂诉讼、知识产权、数据安全和隐私等领域的法律和政策的高级研究,它将电子发现定义为:“在法律过程的背景下,识别、定位、保存、收集、准备、审查和生成电子存储信息(ESI)的过程。(参见《关于我们所做的事情的完美电梯游说是难以捉摸的:eDiscovery趋势》,作者道格·奥斯汀,《eDiscovery Today》,2022年3月14日。)


TAR 的含义


根据Bolch司法研究所和杜克大学法学院发布的“技术辅助审查(TAR)指南”,“TAR(也被称为预测编码、计算机辅助审查或监督机器学习)是一个审查过程,在这个过程中,人类与软件(计算机)一起工作,训练它识别相关文件。这个过程包括几个步骤,包括文件的收集和分析,使用软件训练计算机,质量控制和测试,以及验证。这是一种替代手工审查集合中所有文件的方法。”


该指南进一步解释说,TAR减少了基于人工的文档审查所需的工作量,它可以更快速、更廉价地执行任务。就像基于人工的审查一样,TAR也需要相关领域的专家来训练计算机,以确保结果是可靠和准确的。[参见“技术辅助审查 (TAR) 指南”,博尔奇司法研究所和杜克大学,2019 年 1 月。]


Bolch Judicial Institute 和 Duke Law TAR 指南由数十家电子发现服务提供商、律师事务所和学者开发,并且经常与其他判例法和公开可用的指导来源一起被引用。这包括塞多纳会议的 2017 年判例法入门。


一个双赢的故事


回到我们的案例研究:如果我们可以获取发票的统计样本并使用它来训练预测模型,该模型可以描述什么是,什么不是潜在的不当付款 (PIP),也就是“涉嫌贿赂”?然后,我们可以使用该模型来统计确定公司的风险敞口。在这种情况下,取证技术/数据科学团队确定一个可辩护且在统计上有效的样本是大约 3,000 份文件。一个律师和法务会计师团队手动审查了这些文件(30 分钟 3,000 份文件 = 1,500 小时,每小时 400 美元 = 60 万美元)。在这个样本中,大约 450 张发票被标记为 PIP,其余 2,550 张被标记为“非 PIP”。这两个类别对于模型学习都很重要。


通过使用随机森林、神经网络和其他机器学习技术,该团队能够调整模型,以识别驱动450个pip的关键变量。结果表明,当交易中出现“便利费”、“帮助费”、“整数美元金额”和“统计异常支付”等短语时,且支付货币与供应商的本国不同(还有十几个其他关键变量),此类交易属于pip的置信度为95%。这台机器进行了大约6次迭代——要么错误地预测了一笔实际上不是PIP的交易的PIP(假阳性),要么没有标记出实际的PIP(假阴性)——才将置信度评分(F1评分)提高到司法部可以接受的置信度水平。(见下文TAR决策矩阵)值得注意的是,司法部已经接受TAR在电子发现问题上的结果超过15年了,它在数据科学、统计和相关主题方面的内部专业知识还在继续扩大。


2.png


TAR 决策矩阵


结构化数据与非结构化数据?TAR 不在乎


这个虚构但实用的示例说明了在电子邮件和用户文档的电子发现中使用的相同 TAR 技术如何也可以应用于结构化的金融用例以识别 PIP。


“十多年来,TAR 一直被律师和调查专业人士用来协助围绕相关性做出文件决策,以替代详尽的手动文件审查,”研究教授、电子发现律师和 TAR 专家 Maura R. Grossman ,说出舞弊杂志。


“这些步骤通常包括要审查的数据的收集和处理,通过标记某些文档的相关性来训练计算机,质量控制程序和结果的验证。数据是否是非结构化的,例如电子邮件或用户创建的文档;或者是结构化的,比如支付给第三方;只要有足够的文本和其他数据元素,这些都是电子存储的信息,很容易被技术辅助的审查技术所利用。”


需要考虑的风险因素


DOJ 在很多场合都明确表示,使用数据分析是公司合规计划的一个重要组成部分,包括在他们最近的指导文件《公司合规计划评估》中。像TAR这样的审查效率技术(用于结构化和非结构化数据源)是存在的,并且只会随着工具和技术的发展而增长。


Jonathan Nystrom是Cataphora Legal(一家大数据分析平台开发商)的先驱,他说:“TAR的应用非常广泛,特别是在并购领域,大量的结构化和非结构化信息需要以及时、有效和可防御的方式进行审查。”


“尽职调查和谨慎是每个TAR事项的重要考虑因素,因为模型可以被训练成始终有偏见或错误,几乎和它们被训练成正确一样容易。当涉及到文件或交易决策时,CFE或法律专业人员的判断是不可替代的,而技术在任何方面都放大了专家的决定。”


正如 Nystrom 指出的那样,道德是这项工作中的一个重要方面,我们学得越多,就越能避免偏见问题,同时从新技术中受益。


原文标题:

https://www.fraud-magazine.com/article.aspx?id=4295019782

原文链接:

https://www.fraud-magazine.com/article.aspx?id=4295019782

作者:

Vincent M. Walden,CFE,CPA