计算机病毒有很多种类。木马是其中一种。木马程序很特别。它伪装成正常的软件。用户会自己把它打开。木马进入电脑后开始做坏事。它偷走用户的密码。它偷走银行账号。它让坏人控制电脑。研究木马非常重要。
现在很多人都用电脑。很多人用手机。我们的生活离不开网络。我们上网买东西。我们上网和朋友聊天。我们上网处理工作。网络让生活方便了。网络也带来了危险。坏人一直在制造新的木马。这些木马越来越聪明。它们的样子看起来像游戏。像音乐文件。像有用的工具。人们一不小心就会点开。点开以后电脑就中毒了。用户的重要东西会被偷走。有时候整个公司的电脑都会坏掉。造成的损失非常大。所以我们必须了解木马。我们必须想办法对付它。
以前木马很简单。它可能只是弄乱你的文件。现在的木马复杂多了。它们会隐藏自己。它们会改变自己的样子。它们会在电脑里躲很久。它们偷偷把信息发出去。有些木马专门偷钱。有些木马偷公司的秘密。有些木马破坏工厂的机器。这些攻击越来越厉害。我们需要更好的方法来发现木马。我们需要更好的方法来清除木马。这就是写这篇论文的原因。
这篇论文想做一些事情。第一件事是讲清楚木马是什么。我们会看看木马的历史。最早出现的木马是什么样的。木马是怎么一步步变成今天这样的。这能帮助我们理解它的本质。第二件事是把木马分分类。有的木马是为了偷东西。有的木马是为了开后门。有的木马是为了破坏。分类能让我们看得更明白。第三件事是看看木马怎么工作。它会怎么进入电脑。它在电脑里做什么动作。它怎么联系控制它的人。知道这些就能找到它的弱点。
我们还要看看现在大家是怎么找木马的。常用的方法有两种。一种方法是看特征。就像认人一样。我们知道坏人的样子。我们拿一个软件和坏人的样子比对。样子一样就是木马。这个方法很快。但坏人会换衣服会化妆。样子一变就认不出了。另一种方法是看行为。看这个软件在干什么。如果它在偷看密码文件。如果它在偷偷连接不认识的网站。那它可能就是木马。这个方法能发现新的木马。但有时候正常软件也会做一些奇怪的动作。会搞错。这两种方法都有问题。我们需要更准的方法。我们需要更快的方法。
这篇论文想试试新的思路。我们想用机器学习来帮忙。机器学习是计算机自己学习。我们给它看很多例子。我们给它看很多正常的软件。我们也给它看很多木马软件。计算机自己找出规律。以后它看到一个陌生的软件。它能判断这个软件是不是木马。我们觉得这个方法可能有更好的效果。我们会在论文里做实验。我们会收集真实的软件样本。我们会用不同的机器学习方法。我们会比较结果。看看哪种方法最好。看看这个方法到底行不行。
做这个研究有很多困难。木马样本很难收集。坏的木马不会公开出现。实验的环境要安全。不能让木马跑掉。实验的数据要很大。计算机要算很久。但我们认为这个工作有价值。如果我们的方法成功了。它能帮助普通用户。它能帮助公司的网管。它能更快地发现新木马。它能减少人们的损失。电脑和手机能变得更安全。大家上网能更放心。
这篇论文的结构是这样的。第一章是前言。就是现在写的这部分。它说明为什么要研究木马。它说明论文要做什么。第二章会介绍背景知识。讲清楚木马相关的概念。讲清楚机器学习相关的概念。第三章会详细讲我们的方法。我们怎么准备数据。我们怎么训练模型。我们怎么设计实验。第四章会展示实验的结果。会有很多表格和数字。我们会解释这些结果的意思。第五章会讨论这些结果。说明我们的方法哪里好。说明哪里还有不足。第六章会总结整个工作。会讲以后还可以做什么。
我们希望这篇论文能有一点用。希望它能为安全研究添一块砖。希望它能让网络世界少一点危险。这就是我们写这篇论文的愿望。