在近期于中关村论坛系列活动框架内举办的第12届数字金融与科技金融大会上,蚂蚁数科凭借其在Deepfake检测技术上的突破,成功吸引了业界的广泛关注。其Deepfake检测方案被大会评选为“金融科技技术创新与应用案例”,标志着蚂蚁数科在这一领域的领先地位。
蚂蚁数科通过旗下的天玑实验室,首次在金融行业内构建了一个大规模、高质量且包含多种模态的Deepfake数据集。该数据集合成了超过百万级的多媒体内容,全面模拟了金融风控环境中可能遭遇的Deepfake攻击,为评估现有金融领域Deepfake检测模型的性能提供了重要基准。在实际金融业务场景中,蚂蚁数科的Deepfake检测方案在多个测试数据集上均达到了98%以上的准确率,有效阻止了多起利用Deepfake技术进行的欺诈行为,有力保障了用户的财产安全。
这一数据集的推出,解决了金融领域Deepfake检测模型长期以来面临的大规模训练及真实环境测评难题。同时,从多模态分析的角度出发,该数据集也推动了传统检测模型的进一步发展。目前,该数据集已成为蚂蚁数科反深伪产品ZOLOZ Deeper对外服务客户的核心竞争力。
蚂蚁数科在构建这一数据集时,采用了多达81种先进的Deepfake技术,生成了高质量的合成图像。这些图像涵盖了多种伪造技术类型、复杂光照条件、背景环境和面部表情,从而能够模拟出复杂且逼真的真实世界攻击环境。除了静态图像外,蚂蚁数科还收集并生成了大量包含声音的视频数据,涵盖了100多种伪造技术类型,并考虑了不同语种、口音和背景噪音的多样性,进一步确保了数据集的全面性和复杂性。
在数据预处理和标注阶段,蚂蚁数科对收集到的数据进行了严格的清洗和预处理,确保了数据的高质量。同时,蚂蚁数科还组建了专家团队对数据进行标注,明确了每张图像或每个视频是否为Deepfake生成的内容,并尽可能减少了伪造痕迹,以达到高度逼真的效果。蚂蚁数科此前发布的AI数据合成与生产平台,在数据标注层面实现了“AI主导”,显著降低了人工标注的工作量,标注模型依赖人工标注量降低了70%以上。
为了进一步验证和评估Deepfake数据集的有效性,蚂蚁数科在2024外滩大会上发起了一场Deepfake攻防挑战赛。该比赛以Deepfake数据集为基础训练和测试数据,吸引了来自全球26个国家和地区的2200多名选手报名参赛。通过选手们贡献的算法方案,Deepfake数据集的攻击质量和检测难度得到了全面而有效的验证。
随着人工智能技术的快速发展,Deepfake技术也在不断进步。该技术利用深度学习算法,能够实现对视频中人脸的逼真替换。尽管Deepfake在娱乐和传媒等领域有着广泛的应用前景,但在金融领域,特别是身份验证和交易验证环节,Deepfake技术却带来了新的安全挑战。金融机构的身份验证系统通常依赖于生物识别技术,如人脸识别。一旦这些系统被Deepfake技术所攻破,将可能引发严重的金融欺诈事件。因此,开发针对Deepfake攻击的检测系统,对于金融领域来说具有至关重要的意义。
然而,构建强大的Deepfake检测防御模型,需要高质量且符合真实世界环境的人脸Deepfake数据集。因此,如何构建模拟真实世界的数据集,以及如何验证其有效性,成为了当前亟待解决的问题。蚂蚁数科在这一领域的突破,无疑为金融行业的Deepfake检测技术发展提供了新的思路和方向。