YannLeCun我是卷积神经网络之父,

公益中国爱心救助定点医院 http://disease.39.net/yldt/bjzkbdfyy/6173182.html
机器之心报道机器之心编辑部学术研究的专利归属对于学者而言很重要,是对自己所做工作的保护和肯定。但如果因公司变故而将自己参与研究的专利分了出去,后续研究还怎么搞?深度学习三巨头之一、卷积神经网络之父YannLeCun就曾遇到过这种「烦心事」。提起美国贝尔实验室,喜欢研究科技史的同学想必都不陌生。它是晶体管、激光器、太阳能电池、发光二极管、数字交换机、通信卫星、电子数字计算机、C语言、UNIX操作系统、蜂窝移动通信设备、长途电视传送、仿真语言、有声电影、立体声录音以及通信网等许多重大发明的诞生地,拥有数万项专利。但很多人不知道的是,卷积神经网络也曾是这数万分之一。最近,约克大学EECS副教授KostaDerpanis就挖出了这么一个冷知识。他发现,早在和年,ATT贝尔实验室就提交了两份关于卷积神经网络的专利申请。专利的名称是「HIERARCHICALCONSTRAINEDAUTOMATICLEARNINGNEURALNETWORKFORCHARACTERRECOGNITION」,即用于字符识别的分层约束自动学习神经网络。为什么ATT贝尔实验室那么早就申请了卷积神经网络的专利呢?这还要从卷积神经网络之父——YannLeCun的早期职业生涯说起。20世纪80年代后期,LeCun就职于贝尔实验室。年,他发表了「将反向传播用于手写邮*编码识别」的相关研究,而且已经在美国的邮*系统中成功应用。随后,这一系统的应用范围扩展至银行支票。90年代末期,该系统已经处理了美国10%~20%的支票识别。关于卷积神经网络的专利,LeCun是这么回复的:卷积神经网络(ConvNet/CNN)有两项专利:一个是具有stridedconvolution的ConvNet,另一是具有独立池化层的ConvNet。它们分别于和年提交,并于和年获准。官方认证:卷积神经网络的专利确实是贝尔实验室90年前后申请的。但LeCun之前还提到过一个细节,在年之后,该专利就跑到了NCR的手里。这又是怎么回事呢?我们接着看LeCun的回忆:我们最开始与一个构建基于ConvNet的OCR系统的开发团队合作。此后不久,ATT收购了NCR公司,后者正为银行构建支票成像器和分类机,然后支票图像被发送给人类操作员进行转录。显然,NCR想要实现这些业务的自动化。我们最终构建了一个完整的支票读取系统,该系统足够可靠,可以进行部署。银行从年起开始商业部署。该系统可以读取大约一半的支票(机器打印或手写),并将另一半发送给人类操作员。实际上,首次部署是在ATM机上实现金额验证(由法国CMB银行率先部署)之前一年进行的。接着年出现了重大变故:ATT拆分成了ATT(服务)、Lucent(朗讯,电信设备公司)和NCR。我们的研究(research)团队留在了ATT(包括ATTLabs-Research),工程(engineering)团队则去了Lucent,产品(product)团队去了NCR。在律师们的努力下,ConvNet的专利最终分配给了NCR,因为他们销售的正是基于ConvNet的产品。所以,我停止了ML的研究工作。当时,神经网络正变得不再受欢迎,我开始与LéonBottou(法国学者,因机器学习与数据压缩的工作而闻名)致力于一个名为DjVu的互联网图像压缩项目。我们在20世纪90年代早期写了一系列关于这方面工作的论文。(注:LeCun、LéonBottou以及另一位学者PatrickHaffner都是DjVu图像压缩技术的主要创建者)直到年离开ATT,我才重新开始ConvNet的研究工作。我希望NCR没人意识到他们拥有我所做研究的专利。事实上确实没有。年该专利到期时,我开了香槟庆祝。所以我们从这个故事中得到的启发是:当专利与最适合构建他们的人分开时,专利系统可能会起到反作用。对于实体的东西来说,专利是合理的,但对于软件这种东西来说,它几乎从来都不适用。明明是自己参与发明的东西,但却因为公司的变故被迫与专利分离,甚至在后续的研究中被卡脖子,LeCun的遭遇恐怕不是个例。最近两年,谷歌为Dropout等算法申请专利的新闻也在社区引发了激烈讨论。尽管JeffDean后来亲自解释说:「这些有关算法的专利是防御性质的,主要是为了防止谷歌研究人员的成果被其他机构申请专利后进行讹诈,进而引发经济损失。」但很多人依然非常反感这种做法,认为「这是一种野蛮且自私的举动,科学和数学的专利阻碍了人类文明的发展。」从LeCun的遭遇来看,反对者的看法似乎是有依据的。


转载请注明:http://www.180woai.com/afhzz/5827.html


苏ICP备11050075号-10

当前时间: