机器学习实战之线性回归
线性回归原理与推导
如图所示,这时一组二维的数据,我们先想想如何通过一条直线较好的拟合这些散点了?直白的说:尽量让拟合的直线穿过这些散点(这些点离拟合直线很近)。
目标函数
要使这些点离拟合直线很近,我们需要用数学公式来表示。首先,我们要求的直线公式为:Y = XTw。我们这里要求的就是这个w向量(类似于logistic回归)。误差最小,也就是预测值y和真实值的y的差值小,我们这里采用平方误差:
求解
我们所需要做的就是让这个平方误差最小即可,那就对w求导,最后w的计算公式为:
我们称这个方法为OLS,也就是“普通最小二乘法”
线性回归实践
数据情况
我们首先读入数据并用matplotlib库来显示这些数据。
def loadDataSet(filename): numFeat = len(open(filename).readline().

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Python能用来做什么?以下是Python的三大主要用途
如果你想学Python,或者你刚开始学习Python,那么你可能会问:“我能用Python做什么?” 这个问题不好回答,因为Python有很多用途。 但是随着时间,我发现有Python主要有以下三大主要应用: · Web开发 · 数据科学包括机器学习、数据分析和数据可视化 · 脚本 让我们来依次介绍。 一、Web开发 Django和Flask等基于Python的Web框架最近在Web开发中非常流行。 这些Web框架可以帮助你用Python编写服务器端代码(后端代码)。这是在你的额服务器上运行的代码,而不是运行在用户设备和浏览器的代码(前端代码)。 为什么需要Web框架 因为用Web框架可以更容易地构建通用后端逻辑。这包括将不同的URL映射到Python代码块,处理数据库以及生成用户在浏览器中看到的HTML文件。 应该使用哪种Python Web框架 Django和Flask是最流行的两种Python Web框架。如果你刚刚入门,我建议使用其中一种。 Django和Flask有什么区别 Gareth Dwyer 关于这个问题有一篇出色的文章,在这里我引用几段: 主要区别 Flask:能够...
- 下一篇
关于爬虫,首篇
补充基础知识 爬虫,毋庸置疑就是爬去互联网的网页,理论上,只要是互联网中存在的web页面,都可以爬取。用来做数据采集非常合适,尤其是现在大数据领域,爬虫必不可少。 爬虫种类有很多,了解概念可以参考百度百科 这里采用Java语言做爬虫,没有什么特别的原因,第一我用Java多,第二Java效率也挺好,第三我们的很多项目都Java的,做互相集成非常方便。当然pyhton的很多爬虫也很优秀。 爬虫框架: java的爬虫也很多,我选了一个简单易用,方便扩展,完全开源的爬虫为基础来修改 。 壁虎:https://github.com/xtuhcy/gecco 爬虫原理 爬虫无非就是模拟浏览器和一些人们操作浏览器的动作,自动的访问网站,下载网页,然后抽取有用的网页内容,当采集的数据量达到一定数量级时,便会产生非常壮观或有价值的效果。麻烦的地方就在于很多网站有登陆、验证码、ajax、js等等技术防止你进行数据爬取。 使用爬虫基础要求: 1.了解网络基础,了解从浏览器输入网址到看到数据经历了什么,整个过程是什么。 2.可以分析web网页,可以抓包。开发过网页前端的具有css基础的即可。 3.Java语言...
相关文章
文章评论
共有0条评论来说两句吧...