发布日期:2017-2-14 来源: | |
科技从未如此接地气,AI成为大众共同关注的热门。李开复曾公开表明,过去两年所有的投资决策,都由人工智能来辅助完成;百度宣布将人工智能列为未来十年最重要的战略方向。 誉存科技,一家专注挖掘金融领域企业大数据的公司,创新业务应用,如用户画像、信用风险、操作风险、实时风控、时序分析等。 2016年,以机器学习和深度学习为基础的风控体系人工智能应用——风险监控平台上线,整合了贷前多维风险调查、贷中关联关系复核、以及贷后风险实时监控等一系列风险管理功能,系统性地解决了金融机构迫切需要的全息画像需求和风险管理滞后的痛点。 1、打破信息孤岛 数据源——智慧爬虫——海量数据高频计算 关键词:企业身份验证 金融机构在选择风控产品时,第一关注的就是这家公司的数据存量,数据从哪里来,因为海量高质数据是提高算法精准度最有效的手段之一。 目前,誉存科技的数据主要有三种来源: 自筹数据:在互联网上部署爬虫引擎,通过不间断运行,并与本地数据库实现交互对比。 公共数据:公共数据开放平台获取想要的数据。 对接数据:和产业链上游平台,如电信、其他权威数据部门建立合作关系。 针对海量数据的多源异构特点,誉存科技采取符合Visa和PayPal数据存储及数据库安全管理的规范标准,数据在获取完成后、入库存储前,必须经过数据清洗和其他方式的数据预处理,确保入库存储的数据符合管理和调用的规范。 众所周知的只是冰山一角,在面对用户的“已知”查询时,平台会对孤立点信息进行扩展查询,极力解决“信息孤岛”问题。并不止步于7500万+的企业大数据,持续更新的百万黑名单数据库匹配对比,还对企业关联人及其对外投资任职进行剖析,科学地对企业身份进行一个多角度的验证。 2、秒级定律 时效性——数学算法——动态多维信用画像 关键词:动态监控 风险大盘 拥有海量数据仅是第一步,就瞬息万变的市场“未知”层面来说,数据处理有一个著名的“1秒定律”,我们还得对数据的实时采集、实时加工、实时分发提出更高要求。一个直观的例子就是“地震数据的时效往往只有几秒钟,在此之后就基本失去意义了。” 而这同样适用于风云变幻的金融市场,上一秒还显示正常交易的企业,下一秒可能就出现危机苗头;贷前没有问题的企业,贷款一到账可能就投入了某个错误的资本决策。 传统重报告轻监控的风控模式终将被信息社会淘汰! 风险监控平台可即时监测企业本身全维度信息变化。通过随机森林、逻辑回归等判别模型,时间序列等趋势分析技术,平台的风险大盘功能模块不仅能让用户看到实时风险异动预警,还有基于全局业务数据的趋势分析。 3、作出风险预测 风险事件——关联分析——风险传染模型 关键词:关联网络 机器学习 金融作为人类的重要活动更是关系的活动,要看清本质、抓住先机的关键就在关系的梳理。鉴于此,风险监控平台核心的亮点之一就是关联网络。 关联网络基于机器学习与深度学习的模型训练,根据用户提交的数据处理请求,自动匹配最优算法,深挖多个关键维度的关联关系,智能识别关联数据中的共通点和差异化。系统默认数据即为机器的记忆,指令驱动记忆回顾,并拓展自我优化。随着交互的加深,机器思维转为智能化见解。 简单来讲就是,通过"建立标准——采集样本——特征提取-——模型训练"等关键流程建立病毒流感传染模型,抽取异常关键词,形成风险事件,追踪事件的传导路径,最终实现风险预测。 4、写在最后 风险监控平台作为一款由计算智能向认知智能发展的产品,对金融机构的风控体系架构有着重要的作用。其效果功力,在很大程度上也取决于使用者经验,应用经验越丰富,计算结果越精确。 |