Python机器学习算法入门之简单感知器学习算法
问题背景
考虑一个问题:现在我们有一些过往核发信用卡的资料,包括用户个人信息和审核结果。根据这些资料,我们希望预测能不能给下一个用户发信用卡。用户基本信息如下:
这些基本信息组成了一个向量。不同的信息有不同的权重,设权重向量
。我们希望构造一个函数来给用户的信用打分,并且,如果信用分超过了某个阈值,我们就认为这个客户是可靠的,可以给他发信用卡:
通过阶跃函数,进一步将这个过程函数化:
所以,当,通过;当
,拒绝;当
,忽略。
其中:
整理该方程如下:
具体到二维空间
简化上面的问题,假设用户只有两个属性,就可以用二维空间的一个点来表示一个用户。如下所示,蓝圈表示通过,红叉表示拒绝。注意到直线的两边,一边大于0,一边小于0,也就是一边都是蓝圈,一边都是红叉。所以现在的目标就是,找到一条直线,可以将已知的蓝圈和红叉完美区分开。