为了让大家体验人工智能在语义理解和自然语言处理有多强大,谷歌近日发布了一个新的搜索引擎,以及两个“文字游戏”。
在Google新发布的语义体验网站“Semantic Experience”里,有一个全新的书籍搜索“Talk to Books”,以及基于机器学习的单词关联游戏。
相比平常我们搜索一本书,主要是通过书名、作者等关键词进行检索,在Talk to Books里,我们可以像平常讲话一样输入一句话,随后搜索引擎就会对这句话进行解读和预判,从而给出搜索结果。
也就是说,你可以用“聊天”的方式找到你想要的书籍。
我在搜索框输入了一个问题:
What is the best programming language?(什么是最好的编程语言?)
排在第一位的搜索结果,是一本用C语言编程的书籍,《C Programming for Arduino 》,作者是Julien Bayle。这本书里有这样一句话,在搜索结果中被加粗:
There is no scientific or universal way to define what is the absolute best style of programming。 (目前没有一个科学的或者广义的方式去定义什么是绝对好的编程方式。)
在搜索结果中,能够回答这个问题的句子或者段落被加粗显示,下方还有作者及书籍的信息。给我的体验就是,我们用聊天的方式向Talk to Books提问,然后它用搜索结果告诉你,这本书里的这段话,可以回答你的问题,这些或许就是你想要找的书。
在另一个名为“SEMANTRIS”的页面中,有两个基于机器学习的单词游戏Arcade和Blocks。
玩Arcade时,需要在一定时间内输入与某个目标词语最相关的单词、短语或者句子,越相关得分越高,同时目标词语会下移。
Blocks则像是无时间限制的消消乐游戏。输入某个单词、短语或者句子后,游戏会自动判断页面上的哪个单词与之最相关,然后这个单词所在的方块,以及相邻同色的方块就会被消除。每一次消除都会有新的方块掉下来,方块堆积到达顶部,游戏结束。
“Semantic Experience”这个项目呈现的是机器学习中“词向量”的技术,这项技术能让机器更快、更准确地去理解人类的语言。目前Google已经在自己家的人工智能开源软件库TensorFlow上开源了一个预训练语义的模块,开发者可以使用自己的词汇或语句进行实验,训练自己的模型。