独家 | 一文带你读懂特征工程!
无论它的规模和大小如何,数据已经成为现代企业、公司和组织的一流资产。任何一个智能系统都需要数据驱动,无论它多复杂。每个智能系统的核心,均有一个或多个基于某种数据学习方法的算法,例如机器学习、深度学习或统计方法,它们利用这些数据来生成知识,并在一段时间内提供智能洞察。
算法本身是非常通用的,但无法在普通原始数据上有效发挥作用。因此,需要从原始数据中提取有意义的特征,我们才能够理解和使用这些数据。
任何一个智能数据洞察系统基本上都由端到端的管道组成:
• 先是 获取原始数据 ;• 然后利用数据处理技术,从这些数据中 获取、处理和提取有意义的特征和属性 ;
• 最后,通常利用统计模型或机器学习模型等技术 对这些特征进行 建模 。
如果有必要的话,还需要根据手头要解决的问题部署该模型以供将来使用。
获取原始数据后,直接在数据之上构建模型是鲁莽的,因为我们无法从普通
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
阿里云助力重庆打造“亚洲最智能大型城市”
8月24日,2018云栖大会·重庆峰会上,阿里云总裁胡晓明表示,将从智能交通、智能制造、智能汽车、智能金融、智能服务、智能人才等领域,助力重庆打造“亚洲最智能大型城市”,助推智能化重庆发展高质量发展经济带。视频回顾及资料分享详见:https://yunqi.aliyun.com/2018/chongqing/index 他表示,阿里云将通过提供创新的云计算、人工智能、物联网以及区块链,全面融入重庆智能化建设。 飞象:让工业互联网大象起飞 重庆智博会上阿里巴巴董事局主席马云表示,未来90%的制造业会在互联网上,而智能制造、IoT、区块链等智能新技术在新制造中扮演越来越重要的角色。 此次发布的飞象工业互联网平台,为工业企业提供安全高效、低成本、易部署的工业各领域解决方案,并将解决方案云化沉淀到平台上。 汽车零件制造商瑞方渝美率先插上了飞象“翅膀
- 下一篇
计算机视觉领域最全汇总(第1部分)
计算机视觉领域最全汇总(第2部分) 计算机视觉是人工智能(AI)中的热门研究课题,它已经存在多年。然而,计算机视觉仍然是人工智能面临的最大挑战之一。在本文中,我们将探讨使用深度神经网络来解决计算机视觉的一些基本挑战。特别是,我们将研究神经网络压缩,细粒度图像分类,纹理合成,图像搜索和对象跟踪等应用。 1、神经网络压缩 尽管深度神经网络具有令人难以置信的性能,但它们对计算能力和存储的需求对其在实际应用中的部署提出了重大挑战。研究表明,神经网络中使用的参数可能非常多余。因此,在提高精度的同时还需要投入大量的工作来降低了网络的复杂性。 低秩近似用于接近原始权重矩阵。例如,SVD可用于获得矩阵的最佳低秩近似,或者Toeplitz矩阵可与Krylov分析结合使用以近似的原始矩阵。 1.1:修剪 一旦训练完成,一些不相关的神经元连接(可以在损失算法中加权
相关文章
文章评论
共有0条评论来说两句吧...