华新社

第17章 爬虫(第1页)

“接下来,就是试试获取小说的内容了。”

接下来,他开始编写程序以获取小说的详细信息和内容。

由于小说内容比较庞大,他决定把获取内容的频率放低。

毕竟是在奶茶店,店里面还有不少的人在使用着店里面提供的ifi。

如果他瞬时间向服务器的请求量过大,其他人的网络,基本上就会陷入瘫痪的状态。

他现在只是手痒痒了,想试试手,真正要爬取到足够多的小说数据,至少需要好几天的时间。

“接下来,就是见证奇迹的时刻。”

他开始启动他的爬虫程序,程序开始在小说网站上爬取小说的内容。

无数本小说的内容文字一闪而过,便进入了数据库之中。

“哟,还有点意思。”

他现,在爬取的过程中,点娘小说网站的反爬虫机制还算是不错,他的爬虫程序很快就被封禁了。

针对ip的。

不过,他快升级了他的爬虫程序,加入了无数的ip池,以及强大的识别验证码能力,使其更难被网站检测到。

“咦,看来我这掌握的五级信息技术,比我想象之中的要强!”

经过一番小小的折腾,点娘都市小说分类下的数百万本小说,全部进入了他的数据库里面。

“最强的点娘的反爬虫机制也不过如此。

看来获取数据集的过程,会比我想象的简单不少。

那现在就是时间的问题了,等我爬取到足够多的小说数据集,就可以开始训练我的写小说ai模型了!”

他心中充满了自信。

现在,就让小说模型先跑着吧。

今天是周末,奶茶店的人比往常多上不少,等到了快要歇业的时间里,铺子里还有不少的人。

林小玲没办法,只好延长了奶茶店的营业时间。

连带的,王卿一遍看着ai模型的训练,一遍记着单词。

“喂,我要下班了,咱们一起走吧。”

王卿还沉迷于互联网世界的新奇时,林小玲的声音传了上来。

他抬头一看,“都已经十二点了啊。”

“等我一会儿。”

“好,我在门口等你。”

林小玲没有上楼去,今天太累了,她就在楼下等着王卿收拾东西。

“怎么还没出来呀。”

她在店门口等了两三分钟,王卿那边还没有动静,就想上楼去看看。

还没有走到门口,便看到他扛着一台巨大的电脑主机和一个显示器,不禁笑了起来。

王卿嘴里喘着粗气,额头上挂着一粒粒细密的汗珠,身上的衬衫湿漉漉的贴在了背上。

本月排行榜
热门小说推荐
惊悚狩猎计划[无限]

惊悚狩猎计划[无限]

预收文大佬们都混吃等死了无限v章防盗比例80,每晚21点更新,不要养肥温馨提示微恐怖,爆笑沙雕,热血爽文桀骜明艳通缉犯冷傲果决执行官狩猎计划重启的那一年,各个系统分区被选中的300万玩...

九星之主

九星之主

寒星映戟月照弓,龙雀辚辚雪夜惊。半纸功名千山外,银花火树故乡中。我,荣陶陶,总有一天,会成为那九颗星辰的主人。那一年,一个背着小书包头顶天然卷手持方天画戟的少年,在天台上如是说道。轻松搞笑,欢迎入坑。已有四百万字完本作品九星毒奶,欢迎各位阅读。...

每日热搜小说推荐