当前位置:K88软件开发文章中心电脑基础基础应用19 → 文章内容

说“快乐”还是“安康”?如何在不抬杠的情况下用AI搞定这问题

减小字体 增大字体 作者:华军  来源:华军资讯  发布时间:2019-3-19 22:17:03

这个领域的代表人物,可以说是台湾的黄一农院士,其用《红楼梦》相关文献与清史文本结合,得到的成果令人耳目一新。但E考据的局限性,在于它仅仅解决了考据第一步的问题:数据庞大。而面对庞大的数据和不同层次的文本,能否用技术取代进一步的人工,则成了考据学发展中的下一个话题。考据的本质是什么?乾嘉学派代表人物王引之,在评价其父王念孙的治经之道时,总结为“诸说并列,则求其是,字有假借,则改其读”,充分体现了考居家的工作依据:音、形、义之间的转换与互通。让智能体实现对语境的理解和跳出跳入,显然是仅仅依靠数据技术所无法达到的。那么AI技术也就成为了接下来文献学与历史学发展中,可以相互融合的技术手段。马创新等所著的《中文古籍数字化的开发层次和发展趋势》中,谈到下一步电子考据与古籍开发的任务,是解决古籍内容的深层语义标注和知识检索方法。那么其能凭借的核心,似乎也仅仅是AI而已。在电子文本分析中,AI可以让尝试,至少是帮助研究者摆脱对关键词考据的依赖,实现主动对文本含义的辨别、搜求,与多重内涵确认。这是其他技术所无法复制的。当然即使这项技术很有用。摆在今天人文科学,尤其是文献学研究面前的挑战也非常艰巨:想要让AI技术、硬件环境与人文素养与研究能力结合,今天似乎很难有这样的跨学科人才与研究环境。而且即使是技术相对简单,效果很清晰的E考据,在传统人文研究领域面前,走的也是举步维艰。更多现实应用场景上面这些考据学的相关内容,可能相对有点生涩。那么最后我们不妨看看几个AI+文本考据可能带给大众的能力释放:1、文本溯源。其实相比于端午安康的合理性,我更好奇的是这个说法是谁编出来的。而今天显然经常有这样的问题,谣言、不实信息这类的有害信息。或者一个精彩段子,一个奇思妙想的真正作者;一个文本如何被改的面目全非;一篇报道有没有断章取义,这些场景都会让我们想要溯源文本,看看最初的文本模样。这就需要成熟的AI文本考据来实现,至少是作为辅助文本溯源的方案之一。2、问答式搜索。今天搜索引擎已经有了问答式搜索的功能,但很显然,这还仅仅是个雏形。因为大量垂直问题和具体问题,是搜索引擎的知识图谱技术无法侦测到的。而发展AI文本考据技术,可以让算法主动连接海量文本,去识别深处归纳出答案,这对于知识的传播价值巨大。3、过往文本加链。区块链很火爆的时候,一个被提及的重要场景是电子合约与文本著作权保护。但加链技术仅仅能保存新文本。如果我们想对过往文本,比如说以某人的聊天信息、某个网站发布的谣言等等进行加链,保留不可更改的证据逻辑时,就需要涉及到对过往文本的识别与分析处理。这也是AI与区块链相结合的一个可能性。说了不少,其实我们是想借端午安康这个梗,来谈一个平时谈比较晦涩,但其实十分重要的AI技术类别。说到底,安康还是快乐,又有什么关系呢?最好的端午节解释,当然是闻一多先生说的那样:只要屈原的精神在就行了。而在笔者这样的吃货看来,只要粽子是甜的就行了……

上一页  [1] [2] 


说“快乐”还是“安康”?如何在不抬杠的情况下用AI搞定这问题