<!--go-->
“简单举一个例子,比如‘东坡’二字,在历史典籍里随时会出现,只有在作为主语和宾语,而且谓语为人可以施行或者接受的动作的时候,我们才可以大体判定这里的‘东坡’是指人。”
“因此‘与东坡同醉’,这样的语句我们可以粗判为与苏轼有关,而‘醉于东坡’,东坡不是宾语,我们就让程序认为与苏轼无关。”
“当然也有两可之间的,例如‘东坡有田’,这一类语句就还需要扩展判定,这底下涉及到一整套的句法分析逻辑。”
“最后我们会得到这么一批和苏轼有关的子标签,还有一批与其关连较为紧密的关系人,比如这里的‘苏洵’,‘苏辙’,‘王弗’,‘宋仁宗’,‘曹太后’,‘章惇’等。”
“我们暂时先屏蔽掉这类人物标签,仅通过之前的‘轼’,‘子瞻’,‘东坡’三个标签来确定子标签,开始在文库当中检索。”周至熟练地操作和讲解道:“看,最终我们就会得到几千条与苏东坡有关的资料。”
“当然了,我给几位老师展示的是以前的项目,这是运算后的结果,具体的真实运算过程还是需要一些时间的,不可能这么快。”
“在这几千条记录当中,我们可以分作几类。”周至一敲键盘,数千条记录,分出了好几种颜色。
“一类是包含时间的,一类是包含地点的,一类是包含官职的。”周至再一敲键盘,三类数据开始重新排列聚合:“我们根据苏轼的职官、任职地变化,宋史年号,用字用号的变化等等,便能够将这数千条记录排出一个《苏东坡行状》,并在此基础上排出一个《东坡轶事汇编》。”
Loading...
未加载完,尝试【刷新】or【关闭小说模式】or【关闭广告屏蔽】。
尝试更换【Firefox浏览器】or【Chrome谷歌浏览器】打开多多收藏!
移动流量偶尔打不开,可以切换电信、联通、Wifi。
收藏网址:www.baimalook.com
(>人<;)