投稿问答最小化  关闭

万维书刊APP下载

产生科研idea的基础套路

2022/3/24 14:32:33  阅读:269 发布者:chichi77


前两节咱们给创新下了个定义:找到「有价值的临近可能」,而创新思维的大敌是思维定式。有了这个基础,我们在战略上要藐视敌人,创新不靠智商,也不靠灵感,“文章本天成 妙手偶得之”是巨大的谎言!在战术上,避免思维定式、产生科研idea有很多固定的“套路”,这一节我们就来谈谈其中最常见也是最重要的一种。

在此之前,咱们先来定义一下什么样的idea够资格称之为科研idea,什么样的科研idea够资格称之为牛idea

Novel:想法必须要新颖;

Implementable: 想法要能够实现;

Unique value:想法要有(独特)价值;

任何一个合格的科研idea都必须新颖、可实现且有价值,而一个科研idea是否牛就在于它是否有独特价值!牛idea相应会产生eXcellent impact,带来“牛X”的影响力!

接下来,咱们拿图形验证码这个超牛科研idea作为例子,讨论一下产生idea的基石思维方式……

从图形验证码谈起

上图显示的这几种验证码多年前很常见,为什么网站和APP需要我们做这种费时费力又不好玩的任务?

这就不得不提到游戏外挂和抢票软件这类流氓脚本软件,你在辛辛苦苦一次一次点击,人家可以不停刷,甚至分分钟刷个成百上千次。有人问了,这个还不好检测吗?在服务器端限制IP地址或者访问量不就好了?还真没这么简单,软件可以模拟人点击的模式。更重要的是,只要有足够的利益,提供这类流氓服务的商家可以控制一票僵尸电脑来干这个黑产。

事实上,如何判断某次点击是来自人还是来自机器这个问题困扰了互联网服务提供商多年,使用各种手段与外挂斗法而不得 ……

直到2002年,当时还在CMU读博的大神Luis von Ahn提出使用图形化验证码对人机做区分,才算是开启了系统化的防御体系。前面章节(动手前先来画棵树吧)我们提到过图灵测试这个思想实验,其目的在于测试机器能否表现出与人等价或无法区分的智能。无数AI学者前仆后继试图制造出能pass图灵测试的机器,然而机器还是很难解决很多人类能够轻而易举完成的任务,尤其是在深度学习席卷整个人工智能领域之前。

说到这里,验证码这个想法已经呼之欲出了,既然很多AI难题对于人很简单,我们就可以用它们来区分人与机器。在当时,图像识别对于机器来说还是非常困难的任务,因此,Luis von Ahn就设计了如上图所示的第一代图形化验证码CAPTCHACompletely Automated Public Turing test to tell Computers and Humans Apart)。

这个想法点破之后“似乎”也没什么大不了的,咱们普通科研汪“似乎”也能想到,真的是这样吗?

咱们接下来就来做些元思考,探究一下这个超级大牛idea是采用什么思维方式得到的?为什么前人没有想到?

首先,如何区分人机点击不是个新问题,而且牵涉到巨大商业利益,在图形验证码诞生之前就有很多人试图解决。他们思考的基本是如何能更好地找到机器点击的特定模式,尽可能在这一个维度上做到更好,这是典型的线性思维模式!而这个思维定式就决定了不可能找到验证码这类新方案。

与此同时,尽管有众多AI学者们清楚地知道机器还很难解决很多对于人类很简单的任务,但他们的关注焦点一直在如何让机器更智能,进而pass图灵测试。这也是典型的思维定式!错过了把它用于其他领域的机会。

因此,提出图形验证码这个idea没那么简单,至少要用到了以下两种思维方式:

迁移思维:again,创新就是找到「有价值的临近可能」,要找到这种临近可能,就是要把某个领域的知识迁移过来解决另一个领域的问题。在图形验证码面世之前,虽然众所周知图灵测试就是为了测试机器是否能区分人机,但没有人看到它跟判断某次点击是来自人机这个问题之间的联系!

逆向思维:前人都在正向思考如何pass图灵测试,Luis von Ahn考虑的是既然机器还不能pass一些简单的任务,那么我们能利用这个事实来做些什么,这种逆向思维经常是解决难题的关键!原因其实也很简单,大多数人都擅长于正向思考,能够用这种办法解决的问题都已经解决完了!

这两者的结合笔者称之为「逆向迁移思维」,这是个有巨大潜力的科研思维方式,如果产生的idea可行,几乎可以保证是牛idea!为什么?

咱们前面提到科研idea是否“牛”在于是否有独特价值!而逆向迁移思维方式必定会突破常规,保证了独特性,产生的结果如果有价值,就一定是独特价值!

然而,这种逆向迁移获得重大突破的机会毕竟是少数,科研idea大多数情况下还是依赖于组合不同领域的进展,进行正向迁移得到的,也就是科研汪们耳熟能详的a+b式的创新。不过,同样是a+b,有的让人耳目一新,堪称神来之笔;有的则被称之为灌水,这背后是什么鬼?

什么是好的a+b式创新?

Steve Jobs说过:“创造力就是把相关事物连接起来……”,这其实描述的就是a+b这种迁移思维。

最常见的a+b式创新就是拿个锤子找钉子敲:某个领域发明了一柄大锤,抓紧时间拿过来砸自己领域的钉子,如果做的早的话也能产生不错的结果和影响力。不过,常见就意味着不够独特,因此一般也谈不上是牛idea

咱们再回头来看看验证码这个问题。安全是个博弈过程,自从CAPTCHA诞生以来,黑产兄弟们也与时俱进,开发了各种自动识别的手段。相应的,为了提高防御能力,图形验证码也变的越来越难以识别,相信不少童鞋也吐槽过某些变态验证码,话说12306的验证码号称打败了90%的正常用户……

CAPTCHA席卷互联网后,据估算全球人口每天在图形验证码入口处所耗费的时间累计高达10几万小时,换算到一个人身上就是接近20年,实在是不可忍啊……大神Luis von Ahn再次华丽登场,带来了让人耳目一新的a+b式创新,推出了第二代图形验证码ReCAPTCHA,后来被Google收购:

你看到的这张是一个从扫描不良的Google图书中截出来的模糊单词,而你输入该词拼写的过程,其实是在协助识别了一段有效文本。

这个idea巧妙的把人机验证这个问题迁移应用到OCR领域,把原本浪费的时间用于创造价值,实在是吊炸天!

ReCAPTCHA这个迁移思维跟锤子类的迁移思维有什么本质区别吗?

区别主要在于迁移过程中「临近可能」元素之间的距离!如果ab两个元素在普遍认知中就已经是临近的,多数情况下a+b组合出来的就是灌水工作。换句话说,这个idea谁都能想到,所以拼的是谁抢的快,科学意义不大!

相反,如果我们能改变人们认知中的“临近”,把两个看似遥远甚至无关的元素ab有机组合起来解决问题,显然带来的启发就会更大,也因此科学意义重大!

此外,大道至简!结合a+b的方式越简单,idea越让人狂拍大腿感叹“为啥自己会忽视这么明显的连接关系”,就越有冲击力和影响!

人机验证跟OCR文本识别在普遍认知中是两个无关领域,ReCAPTCHA这个idea带来了全新的人类辅助计算(Human-Based Computation)这个概念,把两个看似无关的领域连接起来,构思精巧,不得不服!

从某个角度上来说,咱们天朝的黑产兄弟们使用到人类辅助计算这个概念比ReCAPTCHA还要早,有些童鞋可能听说过人工打码平台:既然验证码很难识别,花钱雇低成本的打码工人就好了,羊毛党的福音啊……

这也催生了第三代无知识型的验证码,在Web前端周期性的对Javascript代码进行混淆和更新加密,服务器端风控引擎再做人机判断。黑产兄弟们当然也不甘人后,博弈还在继续,不过这就不在本节讨论科研idea产生的范畴了。

小结一下,迁移思维是产生科研idea的基石思维方式,我们要找那些似远实近的元素进行组合,这样产生的「临近可能」才更有科研价值!

这个原则说起来容易,但如何做到呢?咱们下一节来具体谈谈有哪些方法。

本文部分取自网络,版权归作者所有。

如有侵权,请联系本站删除!

  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com