先锋洞见 | 白雪:从“智商”到“情商”,聊一聊数智化投研的前世今生
2022年02月08日

当我们搜索什么是数智化投研时,常常会找到如下相关词:智能投研、数字化投研、产业链知识图谱、投研投资风控一体化、投研数据中台、数据治理等等。那么,什么是智能投研/数智化投研?数智化投研的前世今生是如何演变的?2021年以来有哪些新的亮点?其明天将走向何方?站在2022年的开端,我们邀请丹渥智能CEO白雪博士分享数智化投研的前世今生。

 

数智化投研的前世今生

 

智能投研/数智化投研是Fintech领域的重要细分行业,由于受众专业、技术难度高,目前在全球范围内仍处于成长初期,其定义也较为分散和宽泛。基于多年专注于该行业的实践经验,笔者认为智能投研/数智化投研的定义为基于大数据和人工智能技术,对金融市场、行业、公司进行数字化建模,提供基本面分析、数据监控、预警等智能工具,从而达到提高投研效率、辅助研判的目的。智能投研/数智化投研的关键技术主要包括知识图谱、自然语言处理、深度学习、数据挖掘等人工智能技术以及大数据技术。

 

早在2000年,贝莱德开始研发阿拉丁平台,使用自然语言处理技术对文档进行解析,提供风险管理和投研咨询信息,已初具智能投研雏形。2010年后,国外创业公司Alphasense、Kensho陆续成立,成为后续几年大热的智能投研公司。自2013年起,国内涌现出诸多智能投研赛道的初创公司,有致力于建设产业链数据的,有专注于产业链知识图谱技术平台的,有擅长数据中台投研数据治理的,有专攻金融NLP舆情分析的,也有专攻因果/相关分析的。近年来,各大金融科技巨头、金融数据公司也纷纷开辟数智化投研产品线,结合各自的传统优势加入这块细分市场的竞争中来。

 

智能投研经过多年市场需求与人工智能技术的碰撞,其主要产品形态也演化了很多版。

 

2013年以前

多为金融舆情NLP解析相关系统建设。

2013-2016年

随着Kensho的横空出世,市场对智能投研的期望飞速上升到事件智能关联投资决策的高度。

2016-2019年

智能投研常常与产业链知识图谱相提并论,并随着产业链上下游数据进入了大多数头部、中部机构,开始在网金部门、研究部门崭露头角。

2020年起至今

数字化、数智化兴起,智能投研又称之为数字化投研、数智化投研,伴随着数字化产业浪潮迈入了百花齐放的时代。

 

作为智能投研现象级明星企业,Kensho主打寻找事件与资产之间的相关度来做投资预测,自创立之初便以“华尔街之狼”、“取代分析师”等口号吸引了海内外大量的关注。2018年标普的收购事件,是Kensho产品风格一个标志性的分水岭:从金融分析问答引擎“Warren”,到如今的“Kensho Scribe”、“Kensho Link”,通过将标普的“数”与Kensho的“智”相结合,如今的Kensho致力于打造亮眼的数智化工具,来帮助客户提高投研效率并更好地利用数据辅助投资决策。 

 

赛博空间的每一个Entity(实体)均能对应到现实社会中的公司、行业、产业链并建立起同等的关联,连接到丰富的、实时更新的全球数据库,从而更好地支撑基于数据分析的投资决策。产业链知识图谱,是企业数字孪生的一类解决方案,近年来在国内很多头部机构已经落地展开探索和应用。面向金融投研投资领域的产业链知识图谱,依据组织方式的不同可分为三类:第一类主要依据“总分”关系(又名“上下位”关系),对行业进行自上而下的拆解;第二类主要依据“上下游”关系,对产业链进行自原材料到终端消费品的拆解;第三类为“总分”关系与“上下游”关系的混合体。

 

若仅有产业链知识图谱,其应用场景是受限的:其主要面向投研“入门”级场景,从“不懂”到“半懂”。因此,产业链知识图谱(只有图谱,不连接EDB、财务数据)应用最为广泛的是面向散户的券商网金部APP。而在专业投研场景,产业链知识图谱只有当Entity连接上相对应的宏观行业指标数据(EDB)、财务数据、股权数据等,且保持即时更新,才能给研究员带来真正的价值。要想做到这一点,需要实现:实体统一映射,与其相关的各个维度的数据都能智能关联、自动补齐且即时更新。这里不仅需要实体对齐、实体消歧、相似度计算等NLP技术,还需要背靠庞大的金融资讯数据库以实现即时订阅、自动更新。

 

Kensho的变迁,“产业链知识图谱”产品演化过程,只是IT技术及数据如何与金融投研场景需求融合碰撞的一个剪影。从智能投研到数智化投研,主流产品形态已经经历了多次演化迭代,以适配更真实的需求,成长出更大的市场空间。

 

数智化投研2021的三个新方向

 

2021年上半年,数智化投研的需求多集中在投研数据库、投研数据治理、投研数据中台的建设上,旨在接入并整合投研所需的常用数据,如高频调用的宏观行业指标数据、另类数据、公司财务数据等等。这也是数智化投研平台建设的基础。进入到2021年下半年,数智化投研演化出三个值得关注的新方向

 

集研究、投资、风控全流程一体化平台典型案例来自买方机构某基金公司,基于关键假设理论建立投资研究的机构理性,提高研究、投资、风控的沟通协作效率,促进研究成果对投资业绩的转换,以实现研究数字化、投资风格化、风控全流程发展的目标。

 

投研数据魔方平台典型案例来自卖方机构某证券公司,以公司为核心组织投研数据,包括ESG数据、投研图谱、政策数据、研报集合、财务模型、在线会议、赛道投融资等等,成为卖方研究所研究成果对外服务的数字化在线门户。

 

买卖方数据数字化对接典型案例来自某基金公司牵头的“机构间数据流通解决方案”金融科技创新试点项目,通过建立一套行业标准和基础设施平台,将线下券商提供的投研服务搬到线上,实现投研精准服务。

 

数智化投研的趋势与展望

 

关于数智化投研未来的发展趋势,笔者在这里抛砖引玉分享一些观点,期待更多的行业专家、相关从业者一起参与到脑洞中来:

 

 
更有“情商”的数智化投研一站式平台

 

富国基金的一位老师曾指出,数智化投研平台在过去的很多年里专注于提高“智商”,现在到了该提高“情商”的时候了。曾经的数智化投研,过于强调人工智能属性、数字化留痕特性、功能流程的完备性,而在“好用易用”等“情商”方面下的功夫远远不够。做出更好用的数智化投研一站式平台,需要深刻理解真实的需求场景并抽象成产品功能模块,“一站式”将相关联的场景尽可能打通,将相关联的数据尽可能打通。最终的衡量标准只有一个:用户愿意用起来。

 

 

买卖方知识对接的线上化、数字化趋势

 

买卖对接尚处于探索初期,也是丹渥智能重点投入研发的产品方向。数字化、AI技术、区块链技术的发展,已然从传递分发精准性、知识消息保密性、服务留痕可追溯性等多个方面,为买卖方知识对接线上化数字化做好了技术储备。目前IT技术已经可以实现多种知识形态的精准对接、增量更新,使得卖方可以数字化追溯投研知识从“生产”到“消费”的全过程,进一步优化生产效率;买方可以在更广的域内进行知识生态搜索和智能推荐,更快更精准地获取到期望的投研知识服务。

 

买卖方知识对接线上化、数字化

 

卖方贡献清洗后的、数字化的投研知识数据,可以在平台上进行高速分发,供买方“消费”,并能量化跟踪到“消费清单”统计数据;买方可以快速轻松地找到期望的数据,长期订阅的主题数据或估值模型可以即时自动推荐并更新,通过线上访问日志为机构打分提供客观量化的数据基础。

 

买卖方知识对接所需的底层数字化投研数据标准,本身处在金融科技创新最前沿,这个共识的达成是需要不断演化、不断尝试的,因此,初期的“军阀割据”恐怕是必经之路。伴随着市场竞争的过程,大家逐步“发现”一套恰当的数据对接底层规则,进而形成真正的共识或联盟,才能实现投研数据标准的“大一统”。

 

其次,买卖方知识对接所需的底层IT基础设施,需要专业的IT供应商来提供,且供应商的中立性和公信力是最为重要的。如何做出一系列可验证的透明化安排,从而获得其他参与方的信任?数字孪生、区块链与智能合约也许是一种解决方案。此外,买卖方知识对接的数字化升级,可能伴随着新角色(例如,数据监管者、数字治理监管联盟)的出现,可能伴随着新规则新秩序的演化,也可能伴随着工作方式生活方式的改变。

 

 

 

笔者相信,不久的将来,数智化投研将建立起面向投研投资的实体物理空间到赛博空间的数字孪生,从数据的产生,到数据的清洗加工标准化,从买卖方知识数字化对接分发,到“生产”到“消费”数字化留痕,让数智化技术更好地辅助投研投资回归到基本面、价值发现、机构理性的本质,进而赋能更美好的未来。