您当前的位置是:  首页 > 新闻 > 文章精选 >
 首页 > 新闻 > 文章精选 >

神州泰岳张瑞飞:智能语义分析 在成本和成效的平衡中发展

2018-05-23 14:41:45   作者:   来源:CTI论坛   评论:0  点击:


  自然语言的概念是无限的,概念单元是有限的;语言是无限的,句类是有限的;语境是无限的,语境单元是有限的。
  5月20日,神州泰岳AI大数据副总裁张瑞飞受邀出席在国家会议中心举办的2018GAITC全球人工智能技术大会“自然语言处理”论坛,并做了题为“认知能力:在成本与成效中平衡”的精彩主题演讲。
神州泰岳AI大数据副总裁张瑞飞
  张瑞飞指出,神州泰岳在人工智能领域主要的攻坚点在自然语言处理的能力,我们更加关注怎样把人工智能技术转化为企业的盈利目标,在自然语言处理方面要取得成本和成效的均衡。
  神州泰岳在人工智能基础上的投入非常坚定。在数据的获取和处理层面,神州泰岳投入大量资源,成功获取400万份有效样本,并在此基础上做了向量化和特征提取,可覆盖99%的应用场景,有效提升了系统的泛化能力。同时,神州泰岳采用独特方法,解决多态性的问题,实现了属性要素的提取,尤其是对事件的地点、物品、手段、特征、码号等要素的提取,其中包括190多万个地址库。
  在上述投入的同时,神州泰岳引入最新的技术理念,优化算法,提升成效:采用迁移学习,减少样本模型训练的样本量;通过深度学习和DINFO-OEC非结构化文本分析挖掘平台,在命名实体识别场景,实现数据处理10%-15%的结果优化。
  在谈到人工智能的应用成效时,张瑞飞指出,神州泰岳面向公安系统,建立了一体化的合成作战平台,在语义解析引擎、互联网数据采集、大数据流水线、数据展现、流程引擎以及融合通讯等基础能力上,不断扩充应用,最终形成可落地的行业应用体系。最近神州泰岳和北京师范大学的自然语义联合实验室在业界首次推出了NLP集成开发环境,把语义资源、算法体系、场景化能力等集成在一起。
“自然语言处理”论坛
  最后,张瑞飞呼吁,鉴于自然语义处理技术开发的难度,业界应当建立生态联盟,在共同在生态中合作起来,共通共享,降低成本,发挥各自在不同的领域里形成的独特优势,共同提升自然语言的处理能力。
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题