人工智能现在很热。人工智能需要计算机系统帮忙。计算机系统怎么学会思考?这是一个问题。机器学习是一个方法。机器看很多数据。机器从数据里找规律。机器找到规律就能做判断。我们想研究这个问题。我们研究图像识别。图像识别就是让机器认识图片。机器认识猫狗汽车房子。机器怎么认识呢?我们看看现在的办法。
现在的办法有很多种。有一种办法叫深度学习。深度学习模仿人的大脑。人的大脑有很多神经元。神经元连接在一起。深度学习也有网络。网络有很多层。每一层都处理信息。第一层看图像的边角。第二层看图像的形状。第三层看图像的部件。最后层看整个物体。网络层数越多看得越仔细。层数太多也有麻烦。层数太多需要很多数据。层数太多需要很长的计算时间。普通计算机可能算不动。我们需要更好的计算机。我们需要更好的算法。
我们做一个实验。我们收集很多图片。图片里有猫和狗。我们给图片打标签。这张是猫那张是狗。我们把图片分成两组。第一组用来训练。训练就是让机器学。第二组用来测试。测试就是检查机器学得好不好。我们用一个深度学习模型。模型是一个程序。这个程序有很多参数。参数就像旋钮。我们调整旋钮让模型变好。训练开始。模型看训练图片。模型猜图片是猫是狗。模型开始猜得不对。我们告诉模型正确答案。模型根据答案调整参数。模型慢慢学得更好。训练很长时间。训练结束我们做测试。
测试的时候不给答案。模型自己看新图片。模型说出图片是猫是狗。我们记录模型的答案。我们对照真实答案。我们计算正确率。正确率百分之九十。模型还不错。模型还会出错。有些狗像猫模型认错。有些猫像狗模型认错。我们需要找出原因。我们看模型出错的图片。这些图片光线暗。这些图片角度怪。这些图片背景乱。模型没学好这些情况。我们需要更多样的数据。我们需要更聪明的模型。
我们改进模型。我们加一个注意力机制。注意力让模型聚焦重点。模型看图片的时候。模型先找重要的地方。猫的眼睛狗的耳朵。模型重点看这些地方。模型忽略不重要的背景。这样模型更准。我们再做实验。训练测试再来一次。这次正确率提高了。正确率百分之九十三。模型有进步。模型还有问题。模型需要很多计算。手机用不了这个模型。手机算力不够。我们需要小模型。小模型可以放在手机里。
我们想办法压缩模型。模型有很多参数。参数很多是多余的。我们去掉一些参数。我们让参数变小。我们让计算变简单。这个过程叫模型轻量化。我们试了几种方法。我们减少网络层数。我们减少每层的参数。我们使用更简单的计算。我们得到一个小模型。小模型正确率低一点。正确率百分之八十九。小模型速度快很多。手机可以用了。这是一个平衡。准确和速度需要平衡。不同场合用不同模型。
我们还想让模型解释自己。现在模型像个黑箱。模型给答案不说原因。我们想知道为什么。我们想知道模型看哪里。我们用一个热力图。热力图显示图片重要区域。模型说这是猫。热力图显示猫脸很亮。这说明模型看猫脸。这样我们就放心了。我们知道模型真的认识猫。模型没有乱猜。模型解释很重要。医生用模型看病。模型说病人有肿瘤。医生要知道肿瘤在哪里。热力图可以指出来。这样医生可以相信模型。
人工智能需要数据。数据质量很重要。垃圾数据训练垃圾模型。我们清理数据。我们去掉模糊图片。我们去掉错误标签。我们增加不同种类图片。不同颜色的猫。不同品种的狗。不同天气的照片。白天夜晚下雨下雪。数据越多越好。数据越杂越好。这样模型更健壮。模型遇到新情况也能应付。
训练模型需要技巧。学习率是一个重要设置。学习率太大模型不稳定。学习率太小模型学得慢。我们慢慢调整学习率。我们观察训练过程。训练损失一直下降就好。训练损失突然上升就不好。我们需要停下来检查。模型可能学歪了。我们重新开始训练。我们换一种方法初始化参数。参数开始值也很重要。开始值不好模型学不好。我们用一个好的开始值。训练更顺利。
人工智能不只是图像识别。人工智能还能听声音。人工智能还能读文字。人工智能还能下棋。人工智能还能开车。原理都差不多。都是让机器从数据中学。数据不同任务不同。模型可以变化。核心思想不变。我们研究图像识别。我们的方法可以用到别处。我们的经验可以分享。
计算机硬件一直在发展。显卡计算很快。显卡帮助训练模型。以前训练一个模型要一个月。现在可能只要几天。将来可能只要几小时。硬件进步推动人工智能进步。人工智能软件也在发展。新算法不断出现。新模型越来越强。我们的工作是一个小部分。很多人一起研究。大家分享成果。人工智能慢慢进步。
我们的研究有实际用处。手机相机能识别人脸。商店摄像头能数顾客。工厂机器能检查零件。医院系统能分析片子。农业无人机能看庄稼。这些都用图像识别。我们的研究帮助改进这些技术。技术改进生活更方便。技术也有风险。技术可能用错地方。我们需要小心。我们需要制定规则。技术应该服务人类。技术不应该伤害人类。研究者要想清楚。
我们写论文记录工作。论文说明我们做了什么。论文说明我们怎么做的。论文说明我们有什么结果。论文帮助别人理解。论文帮助别人重复实验。论文推动科学发展。我们诚实报告。好结果报告。坏结果也报告。我们指出工作的不足。数据还不够多。模型还不够快。解释还不够清楚。这些是未来的方向。未来可以继续研究。
人工智能是一个工具。工具本身没有好坏。看人怎么用。我们希望用好这个工具。我们希望解决实际问题。我们希望让生活更好。计算机科学有趣也有用。我们喜欢这个工作。我们继续努力。