程锦斌的毕业论文研究机器如何理解人的语言。机器理解语言很困难。机器没有眼睛没有耳朵。机器只能处理数字。人说话是一串声音。人写字是一排符号。机器需要把这些变成数字。这个过程不容易。
程锦斌想了一个办法。他的办法用两个部分。第一个部分找词语的意思。第二个部分分析句子的结构。两个部分一起工作。机器就能明白句子的意思。
找词语的意思很关键。每个词语都有意思。同一个词语在不同地方意思不一样。比如“苹果”这个词。有时指水果。有时指手机。机器需要知道具体指什么。程锦斌让机器看很多很多文章。机器从文章里学习词语的意思。机器看“苹果很甜”。机器知道这里说水果。机器看“苹果手机很好用”。机器知道这里说手机。看得多了机器就明白了。
他用的方法叫“词向量”。词向量把词语变成一串数字。这串数字表示词语的意思。意思相近的词语数字也相近。“猫”和“狗”都是动物。它们的数字串比较像。“猫”和“汽车”不一样。它们的数字串差别大。机器通过数字比较知道词语的关系。
光知道词语不够。句子里的词语有顺序。顺序改变意思就改变。“猫追老鼠”和“老鼠追猫”完全不同。程锦斌的第二个部分处理这个问题。这个部分看词语怎么排列。它找出谁做什么动作。动作指向谁。它分析句子的主干。主干是句子的核心。去掉枝叶保留主干。意思就清楚了。
他让机器练习分析句子结构。机器先看简单的句子。比如“小明读书”。“小明”是动作的人。“读”是动作。“书”是动作的对象。机器学会找这些部分。然后看复杂些的句子。“穿着红色衣服的小明在图书馆认真读书”。机器还是能找到“小明读书”。其他词语是修饰。修饰告诉时间地点方式。机器先找主干再加修饰。
两个部分结合起来。机器先处理每个词语。把词语变成数字串。这些数字串表示词语的意思。然后分析句子结构。找出谁对谁做什么。把数字串按结构组合。组合结果表示整个句子的意思。
程锦斌做了很多实验。他用电脑做实验。电脑的运算速度很快。他准备了很多句子。这些句子有中文有英文。他让机器读这些句子。然后问机器问题。看机器是否理解句子的意思。实验结果不错。机器能回答大部分问题。
比如一个句子“昨天下午李华在操场踢足球”。机器读完这个句子。问“谁踢足球”。机器回答“李华”。问“在哪里踢足球”。机器回答“操场”。问“什么时候踢足球”。机器回答“昨天下午”。这说明机器理解了。
有些句子比较复杂。比如“虽然下雨了但是比赛继续进行”。机器需要理解转折关系。下雨通常会让比赛停止。这里比赛没有停止。机器需要明白这种特殊情况。实验显示机器能做到。
程锦斌的方法有实用价值。可以用来改进搜索引擎。现在搜索关键词经常找不到想要的内容。用他的方法搜索引擎能真正理解问题。能给出更准确的答案。比如搜索“苹果最新款多少钱”。搜索引擎知道这里“苹果”指手机。会显示手机价格。不会显示水果价格。
这个方法也能帮助残疾人。有些残疾人不能说话。他们用设备输入文字。设备把文字变成语音。现在的设备只是机械转换。用程锦斌的方法设备能理解意思。能根据意思调整说话的语气。高兴的事用高兴的语气。悲伤的事用悲伤的语气。这样交流更自然。
这个方法还能用于教育。学生写作文。机器可以批改作文。不是简单找错别字。机器能理解作文内容。能判断文章是否通顺。能评价逻辑是否清晰。能给出具体建议。帮助学生提高写作水平。
程锦斌的论文写得很详细。他记录了所有实验步骤。他说明了每个设计选择的原因。他比较了不同方法的优劣。他的工作建立在前人基础上。他改进了现有方法。他的改进确实有效。
论文答辩时老师问了问题。老师问这种方法需要多少数据。程锦斌说需要大量数据。数据越多效果越好。老师问如果数据不够怎么办。程锦斌说可以先用小规模数据训练。然后逐步增加数据。效果会逐步提升。
老师还问了计算资源的问题。这种方法需要强大电脑。普通电脑可能跑不动。程锦斌说现在电脑发展很快。普通电脑也越来越强。而且可以优化程序。让程序在普通电脑上也能运行。
程锦斌的论文获得通过。评委认为他的研究有价值。他的方法切实可行。他的实验充分证明效果。他的写作清晰易懂。
这项研究只是开始。机器理解语言还有很长的路。目前只能理解简单句子。复杂的长篇文章还很难。比喻反讽等修辞更难。机器需要更多学习。
程锦斌毕业后继续研究。他去了一家研究机构工作。他带领团队开发新算法。他想让机器真正理解人类语言。这条路不容易。需要很多人共同努力。需要很长时间。
我们每天使用语言。说话写字都很自然。从没想过这有多复杂。机器要模仿这个过程。需要解决无数问题。程锦斌解决了一部分问题。他的工作有意义。