《剑无双肥羊》43.大数据时代

    “这有什么问题么?”
    “唉,别要老像个小孩一样告状。”
    以上,肥羊严肃地思考了一下,主编咸鱼可能给他的回复,于是掐灭了向咸鱼报告的念头。
    “想办法哄住剑无双啊,还要我教你?”
    “你就不能想想办法,把控住稿子么?”
    “被刚毕业的小女生耍得团团转,你让我怎么说?”
    一分钟后,又严肃地思考了一下,肥羊再次掐灭了向冰糖报告的念头。
    “小哥哥,你怎么可以冤枉我,你是不是想对人家图谋不轨……雅蠛蝶!”
    “小哥哥,这个主意很不错,就这么写吧!哦活活活!”
    最后想了想去警告剑无双,可能会发生的后果……,人生简直无路可走生无可恋啊。
    肥羊决定放弃,管他呢,出事再说。更何况,哪一次不都是等出事了再说?
    肥羊的担心不无道理,要说之前影射缪梦知,苏沉羽,那两人毕竟只是和天宝有合作关系,天宝可以放过这件事,但是这次若是要惹到《重生为恶》这本书的作者魏碑……
    真是越想越头痛,这年头的年轻人啊,总想搞个大新闻。
    不过这本《重生为恶》早在八百年前就是个大新闻了。
    据说这本书抄了近500本长篇以及短篇作品,在间歇不断,不断升级的掐架过程中,被以讹传讹得传成了抄袭500本书。
    肥羊看到群里贴了一张图,果然提到了抄袭了500本书的事。
    那是一张代码图,是当时在掐架过程中,用来论述抄袭500本书的可能性,以及其原理。
    这是一个依托大数据,正在实现高度智能化时代,只要有足够的范本和素材,一切皆有可能。
    早在智能写作软件出现前,网文界就流行共享写作素材包,这个素材包扩充和共享,本来也无可厚非,以节省作者找寻资料的精力来看,是一件好事。
    犹记当年香兰笑,为证清白,在《宋妃传》后列出参考书单,并截取图书馆借书记录,并且以满满一大本笔记本摘抄来自证,足见写书前,找资料做设定是多么辛苦的一件事。
    像香兰笑这种传统作家,依赖图书馆的找素材方式,在这个时代,的确是有些过时了,效率也低了些。
    资料素材包的出现,本是好事,但渐渐的,这些素材包就变味了。
    最初以古籍、学术社科类书籍为主的素材包,不知何时起,慢慢添加了一些模板型素材。
    诸如人物设定,世界地区设定等到。
    这些模板都是根据一些网文大神的作品整理出来的。
    起先也就是常用设定模板,再后来有了剧情大纲模板,再后来是情节线索模板,再后来是各种细节描写素材模板等等,每一次的素材包扩充,都让网文的同质化变得更为严重。
    发展到后来,从素材包翻找资料太麻烦,索性出来了设定检索器。
    简单来说,如果作者想写一段人物外貌描写,可以在检索器上设定分类,然后通过条件筛选,或者关键词的方式,搜索出相关素材来进行“创作”。
    当然,有些手癌党,会选择直接粘贴复制,也不管语句通不通顺,语境合不合适。
    于是,读者就能在一部西方奇幻小说里,突然看到一段十分东方奇幻风格的描写。
    又或者明明是在写言情,突然冒出一段极具武侠风格的打斗场面,让人看着一头雾水。
    随后,在推荐位日益紧张的情况下,单纯的设定检索,已经不能满足日益变态的日更比拼了,在这样的环境下,设定检索器终于众望所归得升级为了网文生成器了。
    最初的生成器,生成的段落bug还比较多,需要作者花功夫调整语句,进行修剪,到了后来,有了爬虫软件的助阵,简直就进化到了近乎人工智能的阶段。
    爬虫软件是一种网页内容抓取软件。
    通过一定的编程代码,可以对抓取的网页图片或者文字,做出各种数据分析样本。
    这种软件原本主要用途是做大数据收集,来进行商业分析,在电商这块儿用得比较多。
    在网文这块的运用,早期也不过是用来做盗版网站。
    但到了后期,由于样本数量庞大,通过大量文本分析,很容易就能找出一些机制,通过软件来实现文章自动生成。
    起初比较容易开发的是诗词、对联自动生成软件,到后来,随着网络小说的兴起,网页抓取样本也大大丰富起来,于是也就进化到自动生成文章的地步了。
    即使某些网站使用了图片防盗技术,但没多久,看图识文的补丁程序就被编写出来,丝毫不能阻止软件抓取大量文本。
    至于有些网站采取的加乱码防盗措施——既从小说网站上复制下来的文本,粘贴后中间夹杂大量乱码——更是非常容易破解,因为这些乱码本来就是通过程序编写进去,加密规则再复杂,也是可以通过程序再批量去除。
    当然了,网文网站的加密规则,并不会太复杂。
    总而言之,抓取样本越多,网文生成器就能越智能,发展到极致,终于出现了一本,汲天地之灵气取日月之精华汇古今之人文萃事实之新闻的奇书——《重生为恶》。
    要说,如果这本书真是用人工智能编出来的,还真有一种人工智能下诞生了一个怪物的感觉。
    另一方面,对于这样的推论,有不少人,尤其是魏碑的读者,是不信的,也对这类说法嗤之以鼻,认为这简直是天方夜谭。
    其间,也有好事者去买了一个近五位数的网文生成器,似乎日更过万不是梦,但能否达到魏碑这样大火的效果,掐架群众则各执一词。
    而发掘魏碑抄袭出处的工作一开始也不怎么顺利。
    最初被指认抄袭的大概是六七本左右,随着调色盘的比对,反抄袭联盟发觉,所抄袭的书的量竟然直接多了个零还不止。
    在查都查不完的情况下,反抄袭联盟不得不为这本旷古奇书立了一个单独的项目组,并建立志愿者群,在历时两年的情况的下,整理出500本书的名单和调色盘。
    由于调色盘的篇幅巨大,不得不单独出了七个主线支线剧情对比简化版,来告诉吃瓜群众到底是怎么回事,并在共享空间里分享了了所有调色盘。
    在整理工作结束后,反抄袭联盟最终得出了一个惊人的结论,这篇120万字巨作,只有最开始的八章,不到2万字的篇幅是作者自己写的,其余的篇章全部是抄袭。
    但在这两年间,魏碑的小说早已卖出了版权,做了影视备案,并在此期间出版了全部书籍,电子版更是在全渠道大卖。
    红蓝责编花七:“哎,当年为了这事,天宝的缥缈楼还走了一个主编,三个作者。”
    “小哥哥!”冷不防剑无双的声音从背后冒了出来,把正在盯群看八卦的肥羊吓了一跳。
    他眼疾手快得关了群,才转身,就看到剑无双在狭窄的办公区被电脑椅,下的转盘椅脚绊倒,向他摔了过来。
    肥羊不得已将她接住抱了个满怀,然后就被她一身的链子弄得龇牙咧嘴。
    卧槽,这妹子有毒吧!
小说推荐
返回首页返回目录