我写的自传不可能是悲剧_第四百七十二章跑步进场（3 / 6）爪机书屋

sp; 刚刚那进度条，满打满算也不超过3分钟。

3分钟，看似有些漫长，但相对规模庞大的文献数据库检索量来说，简直快到不可思议！

要知道，蜘网的单次查重耗时一般为30~60分钟，在毕业高峰期间甚至会超过2个小时。

相比之下，这样的“查重”耗时，多少显得有些儿戏了。

什么样的运算速度和检索算法，能在这么短的时间内检索完那么庞大的文献库？

“不可能吧……这么优秀的公司，而且人家也给了查重结果的。”

俞华说着点开下方的“查重报告”按钮。

下一刻，电脑前的两人都愣住了。

画面上，这篇论文超过一半的地方都被红色标注了出来，旁边挂了引用文献和对应跳转链接。

密密麻麻的根本不像是胡编乱造……

“真的假的啊？”郑秋有些傻眼。

他一把拿起那份蜘网的查重报告，开始逐行比对。

“这个有，这个也有……嘶~全中！”

蜘网检索出来的重复段落标注和引用文献，这里全都有，而且还贴心的给了文献链接，真假一目了然。

那么多出来的这些……

通过两人比对，得出了一个令人震惊的结论。

那就是这个智慧树所检索的数据库……居然比蜘网来的还要全面！

通常来说，论文查重系统的数据库，主要包括“学术期刊数据库”、“学位论文数据库”以及“互联网数据库”。

这其中“互联网数据库”最为复杂，指的是大量的网页、博客、论坛等互联网信息资源。

论文查重系统会将互联网数据库作为重要的对照，检测论文中是否存在互联网上已被公开发布的相似内容。

“卧槽！对方哪儿来的这么庞大的数据库资源？”俞华不解道。

下一刻他似乎是反应过来……

“该不会，是爬虫程序吧？”

国外有个牛逼的程序猿，靠着编写的强大爬虫程序，抓取了世界上超过6亿个网站的网络公共资源！

最后就连骨歌、亚马孙、Adobe、ebay等互联网大厂，都前来寻求数据支持。

一桌一椅一电脑。

单枪匹马搞出了年营收1400万美元的夸张战绩！

而整个公司仅有一个员工，堪称有史以来商业效率最高的企业！

所以……会爬数据，也是绝对的高科技！

“不止！你看，就连图表或者公式的抄袭……对方也能检测出来！”

郑秋指着一串字符旁的标注震惊道。

蜘网的检测技术是有缺陷的，部分“图表”，“mathtype编辑公式”，“word代码”都不能识别，这就留下了一些漏洞。

而现在……这个漏洞被堵上了……

这已经不是牛逼了，而是牛逼Plus啊！