学习日志---线性回归实现-创新互联

由对偏导数的计算可以得到w的计算公式:如下

盐田网站制作公司哪家好,找创新互联建站!从网页设计、网站建设、微信开发、APP开发、自适应网站建设等网站项目制作,到程序开发,运营维护。创新互联建站成立于2013年到现在10年的时间,我们拥有了丰富的建站经验和运维经验,来保证我们的工作的顺利进行。专注于网站建设就选创新互联建站

假定输入数据存放在矩阵x中,而回归系数存放在向量w中。那么对于给定的数据学习日志---线性回归实现学习日志---线性回归实现,预测结果将会通过学习日志---线性回归实现学习日志---线性回归实现给出。对于x和y,如何找到w?常用的方法是找到平方误差最小的w。

    平方误差可以写做:

学习日志---线性回归实现

学习日志---线性回归实现

    用矩阵表示还可以写做学习日志---线性回归实现学习日志---线性回归实现。对w求导,解得w如下:

学习日志---线性回归实现

采用的数据是在UCI上下载的回归汽车msg性能的数据集;

由于下载的数据格式不标准,因此这里自己写了一段java代码将数据集的格式进行了重新的规整,代码如下:

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;

public class MyMaze {
    
    public static void main(String[] args) throws Exception {
        FileInputStream fileInputStream = new FileInputStream(new File("E:\\DataRegression.txt"));
        BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(fileInputStream));
        File file = new File("E:\\result.txt");
        FileOutputStream fileOutputStream = new FileOutputStream(file);
        BufferedWriter bufferedWriter = new BufferedWriter(new OutputStreamWriter(fileOutputStream));
        String line;
        String newline = null;
        while((line = bufferedReader.readLine())!=null)
        {
            if(line == null)
            {
                break;
            }
            int length = line.length();
            for(int i = 0; i
输出的文件是每个变量之间都有两个空格的数据集,其中第一项是因变量,也就是msg。

下面是采用python方法对数据集进行线性回归:

import numpy as np
import matplotlib.pyplot as plt

numFeat = len(open('result.txt').readline().split('  '))
dataMat = []; labelMat = []
fr = open('result.txt')
//这里对每行的数据进行分割,提取每行的数据
for line in fr.readlines():
    lineArr=[]
    curline = line.split('  ')
    for i in range(1,numFeat):
        lineArr.append(float(curline[i]))
    dataMat.append(lineArr)
    labelMat.append(float(curline[0]))
//将序列转为矩阵
xMat = np.mat(dataMat)
yMat = np.mat(labelMat).T
xTx = xMat.T*xMat
/判断行列式的值是否为0
if np.linalg.det(xTx) == 0.0:
    print "wrong"
//利用公式求参数
ws = xTx.I*(xMat.T*yMat)

//利用matplotLib画图,制定在fig中
fig = plt.figure()
ax = fig.add_subplot(111)
xCopy = xMat.copy()
xCopy.sort(0)
yHat = xCopy*ws
//这里是找x矩阵中某一项与yHat的关系,如这里是第二项
ax.plot(xCopy[:,1],yHat)
//展示图像
plt.show()

//这里是求出相关系数的函数,越接近1越好
yHat = xMat*ws
print yHat.T.shape
print yMat.shape
print np.corrcoef(yHat.T, yMat.T)

附件:http://down.51cto.com/data/2366089

另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。


标题名称:学习日志---线性回归实现-创新互联
文章来源:http://pwwzsj.com/article/decpci.html