并非凡人,归纳总结统计文字资料是他专长,他心中已有盘算。
不错,脚本走你!
与他第一次用脚本检索资料略有不同,没有筛选并排除错误答案的过程,每篇都得解析。
并且,由于作者不同,文章结构与表述方法都不太一样,很不成系统。
有些人有做表格的好习惯,还有些人又是很随意的文字排列。
那么脚本的复杂程度前所未有,甚至近乎摸到人工智能的边缘。
难度不可谓不大,但对沈崇而言,难度再大都比肉眼扫描一万多份文章小。
他要做的无非就是不断完善脚本逻辑,往里面塞进去新的算法和分析方法,并最终延伸出自发学习能力,再消耗庞大的算力来代替人工阅读就行了。
举个例子,假定这一万多份文章分别来自上百名作者,沈崇先把古人的剔选出来,这部分肉眼啃。
另一部分,他就分别针对每个作者的写作方法制作出一个逻辑,面对每一篇文章,都同时用上百种不同的逻辑去套用解析,总能找到正确的分析模式。
他最终要的,却又是一个完善的数据表格,自己再来着手分析数据。
先提炼文章,形成数据库,再解