墨奇科技汤林鹏：如何用 AI 技术秒级识别 20 亿指纹图像？

随着深度学习等AI技术的成熟，生物识别成为了关注度较高的领域，指纹、人脸、虹膜等识别技术，正在越来越多的场景中得到应用。根据前瞻产业研究院的数据，目前中国生物识别技术的市场规模已超过 300 亿元，到 2023 年，这一数字将达到 379 亿元。虽然人脸识别、虹膜识别近几年大有成为「后起新贵」之势，但指纹识别凭借其“证据之王”的权威性和较高的安全性，仍然占据整个生物识别领域的半壁江山（52%）。

在生物特征识别产业中，有这样一家公司，他们利用AI+指纹识别技术，解决了传统指纹识别耗时长、精确度低、指纹大库搜索困难、无法处理低质量指纹等问题。通过海量高精度图像搜索技术，实现了超过数十亿枚指纹秒级精准对比的落地应用；同时，其自主研发的非接触3D指纹采集技术，也已在强身份认证领域获得应用。这家公司就是墨奇科技。

作为墨奇科技的联合创始人兼CTO，汤林鹏在普林斯顿大学获得博士学位，曾在 KDD、AISTATS、OSDI、ATC 等顶级机器学习和系统会议上发表多篇论文。早在读博期间，他就开始了机器学习和人工智能方面的研究，并开发出了一套高精度的图像搜索系统，这套系统成为了墨奇科技业务方向和核心技术的开端。尽管彼时深度学习的发展已相对成熟，但谈到成立墨奇科技的初衷时，汤林鹏坦言：“还是想在 AI 的原理和应用上，做出比较大的突破，继续推动技术的发展。”

「小众」赛道不小众，为何要做指纹识别？

CSDN：你从什么时候开始研究深度学习，你的技术生涯是怎样的？

汤林鹏：我最早关注深度学习是我本科刚毕业的时候，大概是2012年，那个时候深度学习还处在早期阶段，但国内已经有一批公司在这个领域做了。我个人对这个领域也比较感兴趣，所以在博士期间开发出了一套高精度的图像搜索技术，并将其运用到了指纹识别之中。这也成为了成立墨奇科技的契机之一。

2017年博士毕业后我就回国了。主要是看到AI在国内的落地更优势，包括计算机视觉、图像感知、工业互联网、NLP等领域，关注度都非常高。此外，我当时也觉得，虽然深度学习历经了四五年的发展后已经相对成熟，但依然有一些瓶颈需要突破，因此希望能在方法论上去做一些创新。

CSDN：我记得那个时候，很多初创公司都是选择切入到图像识别、人脸识别等较宽的赛道，为什么你们却瞄准了指纹识别这么一个相对细分的领域？

汤林鹏：这里有一个误区，其实指纹识别的市场并不小。我们可以看看前瞻产业研究院的预测，到 2021 年生物识别的市场规模将达到 340 亿元，而在生物识别中，指纹识别的占有率为 52%，这样来看的话，其实指纹识别是一个百亿级别的市场。

究其原因，是因为指纹识别相比于其他的生物识别方式更加成熟，指纹门禁、手机指纹解锁、二代身份证、护照等都已经应用了指纹识别技术。而另一方面，中国这样的人口大国，特别需要通过指纹识别实现全民的身份认证，从而进入智能社会的快车道，因此我们才希望能在这一领域做出一些技术突破，提供一系列能够落地的AI解决方案解决现实的难题。

CSDN：既然指纹识别已经是一个发展迅速且相对成熟的领域，那么还有哪些「现实的难题」呢？

汤林鹏：传统的指纹识别中，其实还有不少可以提升的空间，主要包括以下几个方面：

耗时长，专业指纹人工编辑非常费时，对相关专家要求较高；
精确度低，大库容比对时唯一比中率不足；
海量指纹搜索困难，随着指纹库容增大，系统计算会造成延时甚至宕机；
安全及隐私风险，指纹信息一旦泄露会造成一定的欺诈风险；
无法处理低质量指纹。

重新定义指纹识别技术

CSDN：针对上述传统指纹识别中的痛点，墨奇科技做了哪些技术创新？

汤林鹏：我们研发出了高精度图像搜索引擎技术，它包含三个部分：图像的自适应多尺度表示和索引系统、无标注或极少标注的自学习框架，以及高速异构的搜索系统。通过这套技术我们可以实现20亿量级指纹图像秒级识别。

CSDN：可以分别讲讲这三个部分的作用及基本原理吗？

汤林鹏：好的。我们首先讲讲图像的多尺度表示和索引系统，在展开前，我们不妨先来看看传统的指纹识别的原理是怎样的。传统的指纹识别主要依靠的是特征点，比如手指上的纹线、纹线的分叉和断点等。但在真实场景中，指纹的质量往往比较低，模糊、残缺、扭曲都十分常见，给识别增加了难度。

而在我们的多尺度算法索引下，我们会按照整体到局部在到细节等多个尺度，对指纹图像进行特征提取，不同尺度之间我们还会考虑它的多样性刻画。相比于传统的指纹识别，这种算法可以提取到更多的信息，看到更多的细节。而相比于深度学习算法，这种多尺度的算法则可以更有效地对质量较差的指纹进行识别。

高精度图像搜索数学模型

再说说只需极少量样本的自学习框架。其实这一框架与上面的多尺度表示是相辅相成的。传统的深度学习框架需要大量的标注数据，其原因在于一张图片能提取的特征只有一两个。比如要识别一只猫的体态，需要对成百上千张不同体态的猫的图片进行特征提取，才能完成训练。而在多尺度多样化表示的算法中，一张图中就可以提取出成百上千个特征，这样一来，我们所需要的样本数量就可以压缩到传统深度学习的千分之一，甚至万分之一。不仅如此，由于有了多尺度多样化表示这一特点，图像搜索过程中对于误差的容忍性也提升了数十倍。

最后是高速异构的搜索系统，它的核心是通过对图像搜索精度要求的判断，来调用不同的运算资源。对于量大且不需要高精度的图像，可以使用 GPU 来进行运算；而对精度要求较高的图像则调用 CPU 来进行运算，从而实现指纹图像的高速比对。完成比对之后，系统会对相似度较高的结果进行排序，就类似网页搜索引擎反馈的排名较高的搜索答案一样。

高性能异构搜索系统

CSDN：刚才我们讲到的是指纹的搜索和比对，其实指纹的采集也是很重要的一个环节，一般的指纹都是通过指压的方式进行采集的，但我了解到墨奇科技研发出了非接触指纹识别技术，请问研发这一技术的原因是什么？

汤林鹏：原因有三。第一是指纹识别在应用上的普及，无论是办证、出入境还是其他场景，指纹识别都是首选的生物识别方案。传统的指纹采集方式却存在一些弊端，例如手指表面的脱皮、破损、干湿度、按压力度/角度，都会造成指纹的畸变，导致指纹的质量降低。而多次反复采集又非常耗时。

第二，得益于深度学习的发展及行业的积累，现在我们已经有能力对低质量的指纹进行处理。

第三，随着边缘计算、AI 芯片的发展，边缘端的计算能力得以增强，一些图像处理过程完全可以在边缘端去实现。

另外，新冠疫情也让大家深刻体会到非接触指纹采集的重要性。不少国家接触式的指纹门禁已经被禁用，出入境指纹采集后还需要消毒，非常的不卫生不方便。美国国家标准与技术研究所（NIST）最近也加速了非接触指纹技术的评估和推广。

我认为，这几点是历史性的机遇，也是我们为什么要做非接触指纹识别的原因。

CSDN：那么非接触指纹识别的技术原理是怎样的？

汤林鹏：主要原理是基于多目视觉+结构光这样一个三维成像方法，从不同角度来重建指纹的三维曲面，再进行融合，然后再对指纹信息从三维曲面到二维曲面进行展开，这样就得到了一个高质量、大面积的指纹。

与一般 3D 扫描不同的是，墨奇的非接触指纹采集的精度非常高，可以精确到亚毫米。

CSDN：在人脸识别中 3D 扫描技术可以对人脸的真实性进行判断，那么 3D 扫描指纹是否也可以对指纹的真假进行判别？

汤林鹏：没错，在指纹识别中我们称之为「活体指纹识别」。因为在传统的指纹识别中，像指纹膜、假手指等欺骗手段很容易骗过指纹采集设备。因为传统的按压式的指纹设备得到的只是一张黑白的二维图像。而在非接触采集中，我们却可以得到 RGB 彩色图像。同时，通过对三维手指外在的眩光、时序信号等，可以精确地分析手指的生理和光学性质，从而判断指纹是否来自活体。

未来，打通 AIoT 和 5G 场景

CSDN：你如何看待深度学习的发展？

汤林鹏：我认为深度学习取得今天的成绩，跟一批有远见卓识，且孜孜不倦在这个领域上努力研究的人有关，例如神经网络之父 Geoffrey Hinton 和一些年轻的研究者，他们用很多年的时间来推动这门技术的发展。

此外，深度学习在一开始表现的并不如传统的算法好，是因为它对数据量的要求比较多，但早期的数据量不够。所以想要提升深度学习的性能的前提，需要先建立一个海量的数据集。我在普林斯顿的导师李凯教授和李飞飞教授一起在早期推动了 ImageNet 数据集的建立，也直接促成了 2012 年以来深度学习发展的浪潮。当然在很多应用中，大规模的数据采集是比较困难的，我们的技术规避了深度学习的这一瓶颈，同时实现了更加精准的视觉信号的搜索。

CSDN：墨奇科技的未来计划是怎样的？

汤林鹏：近期的规划是继续深耕指纹识别领域，并以此为核心建立起下一代的强身份认证平台。未来2~3年，我们希望能够打造通用的、精确的图像搜索技术，并将这些技术应用到 AIoT、5G 等场景中。但总结起来一句话，我们的核心是希望不断在技术上有所突破，推进 AI 的发展，并以此来撬动更多重要的行业应用。

「小众」赛道不小众，为何要做指纹识别？

重新定义指纹识别技术

高精度图像搜索数学模型

高性能异构搜索系统

未来，打通 AIoT 和 5G 场景

关于墨奇+

墨奇招聘+

商务合作+

媒体合作+

售后服务+