中关村科金副总裁邓江：AI音视频技术在金融场景下的应用实操

传统金融业面临运营低效、风险管控不力、获客成本高等痛点。通过金融与科技的融合破解传统业务痛点和难点是当前金融业创新发展的重要支撑。

日前，在51CTO主办的 AISummit全球人工智能技术大会上，中关村科金副总裁邓江带来了主题演讲《AI音视频技术在金融场景下的应用实操》，从应用、技术、作用与价值三个层面来介绍音视频技术与金融的技术应用与思考。

在过去的三年，疫情对整个经济社会都造成了很大的影响。严重依赖于线下场景的金融业务也不例外。

AI音视频技术在金融场景下的应用

在前几年疫情的大环境下，金融业务受到了很大影响，国家也出台了一系列的管理办法，来推动无接触金融的发展。

在新环境的要求下，在新技术的驱动下，由传统的人工驱动的服务模式（线下人工驱动的服务模式）迭代为AI驱动的智能服务模式（线上+线下全渠道人机系统的服务模式）。传统人工驱动的服务模式下，只能实现线下面对面、文字、电话语音、音视频等服务模式，在AI驱动下，可以实现智能/无人网点、智能客服、智能IVR/外呼、AI智能视频、AI虚拟员工等服务。

为了实现远程银行，邓江表示，有五大核心技术在驱动整个技术的进步。五大核心技术包括，人工智能技术、实时计算、生物识别及身份核验、数据决策数据计算、隐私保护。

在实现过程中，还有三大核心算法及四大核心技术能力，是技术落地过程中的另外两部分技术需要。三大AI核心算法：语音技术、自然语言处理、机器视觉。四大核心技术能力：全渠道高质量的音视频通信能力、全渠道SDK封装及适配能力、基于音视频的AI算法深度整合应用能力、灵活可视化的视频服务场景编排能力。

金融场景下，智能视频云建设的技术实操

邓江表示，智能视频云是一种推动基础视频的数字化升级，以AI智能化、RPA流程自动化，构建”人机协同、人机自助”的视频服务新模式。其在基础云计算资源的支撑下，底层构建支持高并发、快速响应的音视频平台，包括ASR、TTS、NLP、OCR、人脸识别、防翻拍、活体检测等。在业务中台层面，实现客户的流程管理，高并发下的智能排队，相关信息的统计分析，订单的管理，一系列的中台支撑。

中关村科金副总裁邓江：AI音视频技术在金融场景下的应用实操

在前端，除了多端介入的支持以外，一系列对于仿冒身份的多模态的生物的核验，客户端的自助和客服的远程视频，以及对现场视频的实时计算和捕捉。最前端是业务场景端，像理财、保险、信托等等一系列的业务所对应的相关线上线下结合的流程办理。

依托于强大的底层基础，形成五大核心产品：多模态身份核验、AI现场视频服务、AI自助视频服务、AI远程视频服务、AI智能音视频质检。并对AI视频云的视频服务体系进行了介绍，拆解产品体系，介绍产品特性、流程管理及产品价值。

AI音视频技术在金融场景下的应用实操—移动信贷

传统金融信贷面签有六大难点：

面临信息孤岛，面签数据独立于风控体系，未充分发挥其动态数据价值；全人工驱动模式，质量高度依赖人员经验，参差不齐；业务效率低，无智能化或弱智能化辅助，基层压力大、效率低；展业渠道单一，现场式面核面签模式，覆盖难且成本高；业务量瓶颈，业务波峰波谷，动态扩展匹配性差；人工抽检风险大，人工离线抽样审核，潜在风险大，反馈及时性不足，人员工作压力大。

邓江在介绍了面签难点后，又从政策层面解读了四项由银保监会发布的行业《通知》。邓江表示，音视频留痕已成为银行业、信托业、保险业、证券行业的硬性规定。

中关村科金副总裁邓江：AI音视频技术在金融场景下的应用实操

在邓江老师的演讲中，分享了移动信贷的四个场景：远程视频面签、自助视频面签、客户经理上门面签、网点柜台现场面签，同时介绍了全流程视频风控流程以及中关村科金在生物防伪方向的实践成果，即多模态生物防伪与安全平台。

多模态生物防伪与安全平台，支持动作、读数等多种活体检测方式，利用服务端强大的AI算法，提供更加精准地识别和反欺诈能力，其平台分为四层，由接入层、核心层、功能层、场景层组成。

中关村科金副总裁邓江：AI音视频技术在金融场景下的应用实操

接入层，由微信小程序、APP、移动H5、Web、摄像机端口以及第三方系统组成。

核心层有三部分功能模块，包括活体伪冒、欺诈检测以及生物对比。在活体伪冒功能部分又由基础、增强防伪检测以及行为风险检测组成，基础防伪检测包含人脸呈现式攻击、声纹呈现式攻击、链路劫持检测；增强防伪检测包含，音色迁移合成检测、深度仿造检测；行为风险监测包含人脸姿态检测、唇语识别、音画同步检测、遮挡语义分割。欺诈检测包含身份证伪造检测、签章伪造检测、人像背景相似度、声纹团伙发现。生物对比包含对抗样本增强学习、声纹对比检索、人脸对比检索。

功能层由核验能力评估、行为风险评估、策略管理、第三方数据接入、联邦学习、主动攻击拦截、加密存储、无感注册、无感录制、无感刷新、生命周期管理、安全审计等12个模块进行功能实现。

场景层包含的业务场景有，多维实名认证、授信用信、员工合规监管、中介代理检测、电审团伙发现、CC投诉追查、办公桌面安全、大客户进线。

在对多模态生物防伪平台进行了深度解析后，讲解了AI智能音视频质检+人工抽查复查的平台功能，借助AI视觉及语音质检技术，在视频服务中，实时质检，实时纠偏（文本纠偏、语音纠偏），实时提醒用户和业务经理，大幅提升一次通过率，避免用户二次补录成本高体验差问题，其中主要涉及的技术包含智能图像识别、智能生物特征识别、智能语音识别、智能动作识别、音画同步检测等。

在智能催收及智能回访部分的介绍中，智能催收可以实现全自动化催收作业，拟人化沟通；针对不同逾期阶段和客户类型可灵活定制话术；标准话术流程，避免人工催收话术不规范引起的合规风险和投诉问题。而智能回访可以实现拨打效率高；通过后台统计了解客户触达率；热情饱满，不影响客户体验；降本增效。

在对AI智能视频云的功能及涉及技术进行剖析后，进行了AI智能视频云的相关案例分享，案例详见官网视频回放。

结语

在AI音视频技术中，无论是人脸、声纹、唇语、语音合成这些技术，都在场景中有深度的场景化定制。作为科技公司来说，除了打磨技术能力以外，更多的是深入业务场景，以客户为中心，了解客户需求，做到解决客户业务中真实的痛点，能够把工具用好，这是未来对于科技公司的更高要求。最终通过技术在金融场景中的深度应用，来提升整个金融业务的水平，拓宽整个金融业务的规模化发展边界。

中关村科金副总裁邓江：AI音视频技术在金融场景下的应用实操

大会演讲回放及PPT已上线，进入官网查看精彩内容–>AISummit全球人工智能技术大会官网