“咱们现在看到的这些应该都只是表象,或者说是大赛组委会有意让咱们看到的,在这背后,其发起这项赛事的终极目的,我猜他们很可能是在为一套超级AI系统积累基础的样本数据。”
“然后,让AI系统对这些样本数据进行机器学习与数据挖掘,从中吸收营养,不断自我完善。”
李幻将自己的猜测向潘正道娓娓道来。
潘正道又吸了一口手上的香烟,然后目光炯炯地看着李幻,若有所思地问道:“你的意思是,大赛组委会在暗地里用这些比赛数据训练一套AI系统?”
“嗯!”李幻轻轻地点了点头。
“但是这些比赛中发掘的漏洞数据,大赛组委会在赛后都会与所有赞助商分享的呀,咱们数字护盾也是可以得到一份的。按你这样的说法,不但大赛组委会可以用这些数据来训练AI系统,每一个拥有这份数据的厂商应该都可以做同样的事情才对,但实际情况却是得到这份数据的厂商似乎都没有这样做,这其中就包括了咱们的数字护盾。每年得到的这些数据,最终只是进入了咱们公司安全类产品的基础样本库,除此之外貌似也别无它用了,难道这些数据还可以用来训练AI?”潘正道说出了自己心中的疑惑。
李幻笑着摇了摇头:“潘总,大赛组委会与赞助商分享的那些数据,确实是只能当成基本的样本库来使用,无法用来训练AI系统的。”
“原因何在?”潘正道问。
“这是因为这些数据中少了用来训练AI系统最为关键的‘行为数据’。”李幻回答得很是简单。
看着潘正道依然有些疑惑的目光,李幻温声说:“我给您打个比方吧。以咱们公司的杀毒软件为例,杀毒软件都有自己的‘病毒特征库’,我想这个您应该是知道的吧?”
潘正道点了点头,示意知道。
“好。当杀毒软件查杀病毒的时候,它会将从所查杀的那个文件中提取出来的特征数据与‘病毒特征库’中已经存在的样本数据进行比对,如果存在,则标记那个文件有病毒,如果不存在,则跳过,继续查杀后面的文件,绝大多数杀毒软件的工作原理就是这样的。”
“但这样其实有一个很大的问题,就是病毒永远会先于杀毒软件出现,因为病毒不出现,就没办法提取病毒的特征数据加入到杀毒软件的‘病毒特征库’中,而‘病毒特征库’中没有这个病毒的特征数据,杀毒软件就无法识别出这个病毒,也就无法对此病毒进行有效地查杀。这样一来,杀毒软件其实始终是在扮演一个‘事后诸葛亮’的角色。”
李幻徐徐地向潘正道解释着。
潘正道点了点头,肯定地说:“是的,目前的现状就是如此。虽然现在有些杀毒软件号称可以查杀未知病毒,但实际效果并不怎么好,因此目前的主流杀毒软件还都是在靠‘病毒特征库’来查杀病毒的。你举这个例子是不是想说,大赛组委会提供给我们这些赞助商的数据其实就相当于是一个‘病毒特征库’数据?”
“没错,说白了就是一个‘病毒特征库’数据,这些数据不能说没有用,在许多情况下可以说是很有用很有价值的,但如果用这样的数据来训练AI系统的话,估计这个AI系统最后也只能与杀毒软件一样,做一个‘事后诸葛亮’罢了。”
“一套AI系统能否做到真正的‘智能’,只让它学习这些已知的样本数据是远远不够的,最关键的是要让它学习如何得到这些数据的,即发掘这些系统漏洞的过程与方法,只有这样,AI系统才会真正的‘智能’起来。俗话说‘授人以鱼不如授人以渔’,此语同样适用与AI系统的训练。”
李幻的一番话让潘正道眼睛一亮,他拉着李幻坐回了沙发,然后将手中的烟头丢到了烟灰缸中。
潘正道说:“你的意思就是说,这项赛事最为关键的数据,其实是你们这些选手在破除障碍发掘漏洞时所用到的那一套方法?”
李幻点头称是:“对的,这套方法才是训练AI的关键所在,也就是所谓的‘渔’,而被用这套方法发掘出来的系统漏洞其实就是所谓的‘鱼’了。”
“原来如此!”潘正道自言自语了一句,似是已经完全明白了李幻的意思。
“像你们发掘一个系统漏洞,怎样尝试,怎样试错,怎样设断点……等等方法,这些都是在你们每个人的脑子里的呀,而且并不是发掘每一个漏洞都会用到所有的这些方法,如此一来,这些不完整的方法,对于训练AI来说意义应该也不怎么大吧?”潘正道又提出了自己的问题。
李幻笑了笑:“在这点上,您可能想错了。一个人发掘一个系统漏洞,可能只需要用到一种方法;一个人发掘一百个系统漏洞,就可能需要用到几十种不同的方法;如果是一百个人,每个人都发掘一百个系统漏洞呢?所有用到的方法,用大数据汇总起来,再放给AI系统去进行机器学习,就算AI系统每次只能够有效地掌握其中一半的方法,经过这么多届比赛的数据积累,这套AI系统发掘系统漏洞的能力,估计要比许多参赛选手都要高出很多了吧。”
“啊?真的可以这样吗?”听了李幻的一番话,潘正道一脸震惊之色。
“虽然这些都只是我个人的猜测,但我认为此法的可行性非常高。”李幻肯定地回答。
“而且,我发现,今年的比赛,在构建破障范例的时候,比赛系统会记录选手的所有操作过程,其中甚至包括了选手们敲击键盘的习惯,这种情况在我前年第一次参加这项赛事时是没有发现的。所以,今年的十场预选赛,我在第一场比赛发现了这种情况之后,从第二场比赛开始,我就不再在比赛系统之中,敲击完整的破障过程了,而是只会将脑海中演算后得到的破障结果,以范例的形式提交给系统。这种做法就像是解一道数学题,我将所有的解题过程都在脑海中完成,只把答案或很简略的过程写在题目的下面类似。”
潘正道一只手摸着自己的下巴,眼睛一眨不眨地看着坐在自己对面的李幻,思索着他所说的每一句话。
他知道,如果李幻的这些猜测为真,那系统安全这个行业,在不久的将来可能就真地要变天了。