深瞳技术

格灵深瞳的技术愿景是让计算机理解世界,特别是理解物理世界中人、车、物等目标的位置、属性、身份、行为和关系等信息。我们研发的深瞳大脑学习平台、高性能计算平台、智能大数据平台帮助构造更加低成本、高性能、可扩展的视觉计算系统;基于这些平台研发的全目标抓拍、全目标属性识别、人脸识别和聚类、以图搜图、行为识别,以及即时定位和地图构建等智能算法已经应用到各种智能终端和感知云产品中。

关于技术
智能算法
基础平台
全目标抓拍技术

全目标抓拍,指的是利用物体检测、跟踪等技术获取图像或视频中物体的位置和大小的能力,目前,全目标抓拍主要支持人脸、人体、机动车、非机动车(二轮车、三轮车)等物体;

该技术既可以应用于服务器等云端智能引擎中,也可以应用于抓拍机等嵌入式智能终端上。

全目标属性识别技术

全目标属性识别,指的是利用智能图像识别技术识别物体属性的能力。目前已支持人脸的性别、年龄、人种、佩戴物等属性的识别,人体的年龄段、性别、头部特征、上衣特征、下衣特征、手提物特征等近50种属性的识别,车辆的颜色、车型、品牌、车牌号、标志物、是否违法等近20种属性的识别,非机动车的车型、车身特征、驾驶员特征等40余种属性的识别,该技术所支持目标以及属性在持续增加中;

该技术既可以应用于服务器等云端智能引擎中,也可以应用于抓拍机等嵌入式智能终端上。

静态人脸检索技术

静态人脸检索技术,指的是利用人脸识别技术去得到人脸库中与查询人脸最相近的前N张人脸的技术;

该技术可应用于常驻人口库查询、抓拍人脸图片检索以及人脸轨迹查询等多种产品功能中。

动态人脸识别技术

人脸虚拟ID技术,是近年来在技术和应用双重驱动下新出现的一种新型人脸识别应用技术,其目的是在事先没有建立人脸库的情况下,利用在线聚类技术,确定查询人脸是属于现有的人脸ID还是新出现的人脸ID的能力(如果查询人脸属于现有人脸ID,则将其合并添加到现有人脸ID上去);

该技术可应用于智能商业领域人脸货品的自动关联、智慧城市领域的人脸档案、人脸轨迹等多种产品功能中。

人脸虚拟ID技术

人脸虚拟ID技术,是近年来在技术和应用双重驱动下新出现的一种新型人脸识别应用技术,其目的是在事先没有建立人脸库的情况下,利用在线聚类技术,确定查询人脸是属于现有的人脸ID还是新出现的人脸ID的能力(如果查询人脸属于现有人脸ID,则将其合并添加到现有人脸ID上去);

该技术可应用于智能商业领域人脸货品的自动关联、智慧城市领域的人脸档案、人脸轨迹等多种产品功能中。

物体以图搜图技术

物体以图搜图技术,指的是利用图像表示技术确定待检索物体图像库中与查询物体图像最相似的前N张物体图像的能力,目前主要支持人体以图搜图,机动车以图搜图和非机动车以图搜图。

具体而言,先利用物体(比如人体、机动车、非机动车)再识别技术获取物体表示模型,用于将物体图像转换为对应的特征,事先将待检索物体库中的图像转换为对应的特征,对于查询物体图像,先将其转换为对应的特征,并与待检索物体特征库中的所有特征进行相似度计算并排序,得到相似度最高的前N个物体图像并返回;

该技术本身不依赖车牌识别等属性识别技术,但可以与属性识别技术结合使用。

行为识别技术

行为识别技术,指的是利用各种传感器信息和视频分析技术,通过分析人体的轨迹或者肢体动作,进而识别人的行为的技术。

即时定位和地图构建技术

即时定位和地图构建技术,常简写作SLAM,指的是机器人在未知环境中从一个未知位置开始移动,在移动过程中根据位置估计和地图进行自身定位,同时在自身定位的基础上建造增量式地图,实现机器人的自主定位和导航。

深瞳大脑
深瞳大脑是一套从数据采集、数据预处理、数据标注、模型训练、模型优选等模块组成的人工智能在线学习系统,该系统主要包含数据平台和训练平台两个子系统。数据平台子系统的目标是自动收集各种不同来源的数据,经过自动化处理和人工标注形成海量不断增长的标注数据。训练平台子系统的目标是打造由数以千计的GPU组成的训练集群,通过训练任务管理、硬件资源分配和管理、模型挑选等功能,最大限度提高训练的自动化水平,从而提升算法人员的产出。该平台目前可支持数以千计组成的GPU训练集群,可支持数十亿数据、数亿类别的训练任务,可支持数十亿参数、数百层深度的模型。
高性能计算技术
充分发掘GPU、ARM、FPGA、DSP以及深度学习芯片等各种硬件平台的计算能力,提升计算机视觉系统的处理性能,降低单路视觉智能的成本和时延,在丰富多彩的边缘计算平台和云平台上,打造高效、低成本的计算机视觉产品。
智能大数据技术
一方面利用分布式架构和云计算技术,提升单体系统支持的前端规模,另外一方面,汇聚和分析来自不同终端设备的信息,挖掘其中隐藏的大数据智能规律。
X
X
X
X
X
X
X
X