第四百七十二章 跑步进场(3 / 6)

sp;  刚刚那进度条,满打满算也不超过3分钟。

    3分钟,看似有些漫长,但相对规模庞大的文献数据库检索量来说,简直快到不可思议!

    要知道,蜘网的单次查重耗时一般为30~60分钟,在毕业高峰期间甚至会超过2个小时。

    相比之下,这样的“查重”耗时,多少显得有些儿戏了。

    什么样的运算速度和检索算法,能在这么短的时间内检索完那么庞大的文献库?

    “不可能吧……这么优秀的公司,而且人家也给了查重结果的。”

    俞华说着点开下方的“查重报告”按钮。

    下一刻,电脑前的两人都愣住了。

    画面上,这篇论文超过一半的地方都被红色标注了出来,旁边挂了引用文献和对应跳转链接。

    密密麻麻的根本不像是胡编乱造……

    “真的假的啊?”郑秋有些傻眼。

    他一把拿起那份蜘网的查重报告,开始逐行比对。

    “这个有,这个也有……嘶~全中!”

    蜘网检索出来的重复段落标注和引用文献,这里全都有,而且还贴心的给了文献链接,真假一目了然。

    那么多出来的这些……

    通过两人比对,得出了一个令人震惊的结论。

    那就是这个智慧树所检索的数据库……居然比蜘网来的还要全面!

    通常来说,论文查重系统的数据库,主要包括“学术期刊数据库”、“学位论文数据库”以及“互联网数据库”。

    这其中“互联网数据库”最为复杂,指的是大量的网页、博客、论坛等互联网信息资源。

    论文查重系统会将互联网数据库作为重要的对照,检测论文中是否存在互联网上已被公开发布的相似内容。

    “卧槽!对方哪儿来的这么庞大的数据库资源?”俞华不解道。

    下一刻他似乎是反应过来……

    “该不会,是爬虫程序吧?”

    国外有个牛逼的程序猿,靠着编写的强大爬虫程序,抓取了世界上超过6亿个网站的网络公共资源!

    最后就连骨歌、亚马孙、Adobe、ebay等互联网大厂,都前来寻求数据支持。

    一桌一椅一电脑。

    单枪匹马搞出了年营收1400万美元的夸张战绩!

    而整个公司仅有一个员工,堪称有史以来商业效率最高的企业!

    所以……会爬数据,也是绝对的高科技!

    “不止!你看,就连图表或者公式的抄袭……对方也能检测出来!”

    郑秋指着一串字符旁的标注震惊道。

    蜘网的检测技术是有缺陷的,部分“图表”,“mathtype编辑公式”,“word代码”都不能识别,这就留下了一些漏洞。

    而现在……这个漏洞被堵上了……

    这已经不是牛逼了,而是牛逼Plus啊!