首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://yq.aliyun.com/articles/476848

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

DC学院学习笔记(十五):验证型数据分析

一些概念 1.随机变量:是试验结果的函数,是定义在样本空间$\Omega$上的实值函数:$X=X(\omega)$,随机变量一般用大写拉丁字母或小写希腊字母来表示 2.概率分布 关于随机变量,有一个非常值得关心的特性就是概率分布 概率:是一个在0-1之间的实数,度量随机事件发生的可能性,通常用于来量化某些不确定性命题 概率分布:在概率的基础上,一个随机变量所有的可能取值加上它取某一个值的概率,比如在投掷硬币的事件中,正反面的取值的概率分布就就是正面0.5,反面0.5 3.离散随机变量 定义:随机变量仅能取有限个或可列个值 4.连续随机变量 定义:随机变量的可能取值充满数轴上的一个区间,有无限个可能取值 如正态分布的曲线呈现一个钟型,也称为bell,由两个参数:均值(最高点在横轴的哪个位置)、方差(曲线的方差)确定,和Z检验密切相关 假设检验 假设检验是根据数据样本所提供的证据,肯定或否定有关总体的声明 假设检验的基本流程 假设检验一般分为三步 提出零假设,以及对应的备择假设 零假设前提下,推断样本统计量出现的概率(统计量可符合不同的分布,对应不同的概率分布有不同的检验方法) 设定拒绝零...

DC学院学习笔记(十六):线性回归实战

预测型数据分析:线性回归 回归:预测数值型变量 分类:预测样本所属类别 聚类:在未知样本类别的情况下,根据样本之间的相似性把样本分成不同的类别 适用:用于股价、房价、空气质量等数值型变量的预测 数学模型:分析两组变量之间的关系 x:自变量(Independent variable) y:应变量(Dependent variable) 如图是一个线性回归的示意图 通过x来预测y,函数:f(x) = y,例如在房价问题中,用房子大小等特征作为自变量,房子价格为应变量 房价回归预测案例: $x_1$:房子大小 $x_2$:房子楼层 $x_3$:绿化规模 $x_4$:距离最近的地铁站距离 $x_5$:距离最近的公交站距离 $x_6$:是否配备停车位 …… y:房子价格 根据常识来讲,房价和很多因素相关,房子的大小、楼层等等都是比较明显的影响因素,还有一些需要花功夫去寻找的特征。 要寻找一个函数f,将x映射到y上,这就是回归的关键。 回归的经典方法:线性回归 线性回归认为y是x的一个线性的叠加 方程式: 向量形式: 参数含义 图中y轴上的截距为,回归曲线的斜率代表横坐标变量的系数,即 参数优化方...

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。

用户登录
用户注册