首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://yq.aliyun.com/articles/180301

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

重磅干货丨互联网数据挖掘导论

本文说的主题是关于「数据挖掘」,以下为内容大纲,让大家对互联网搜索与挖掘有一个宏观的了解,即知道要做什么和怎么做。注:本文的框架来源于北京大学万小军开设的互联网数据挖掘 Web Data Mining 课程,笔者对内容进行了筛选和编排,用来作为『不周山之数据挖掘』系列的导论部分。 任务目标 了解搜索和自然语言处理的基本知识 熟悉数据挖掘的流程与各个步骤所用的技术 对数据挖掘的应用场景有基本的认识 写在前面 随着互联网的日益蓬勃发展,如何从广袤的信息海洋中提取出有价值的信息、模式和关系,逐渐成为了一门新的领域 —— 数据挖掘。作为一门交叉学科,数据挖掘融合了信息检索、互联网、数据库、机器学习、自然语言处理等不同的学科,用多样技术完成具体的数据挖掘应用。常见的应用有:垂直搜索、推荐系统、智能问答、机器翻译、舆情监测、情报收集等等,可谓是深入到了我们日常生活的方方面面。 接下来我们会从基础技术说起,从以下三个方面来了解数据挖掘: 搜索技术 数据挖掘技术 具体应用 搜索 搜索其实是一个很大的主题,但是核心问题其实并不复杂,一是如何去表示文档,二是在这样的基础上如何去检索文档。具体的评价标准是『...

企业应用大数据探索发展新路径

8月6日,第四届中国数据分析行业峰会在北京中国国际展览中心举行。此次峰会以“大数据用起来”为主题,旨在探讨如何更好地应用大数据造福人类。 北京犀数科技首席数据官孙雪女士介绍了大数据技术的前沿应用。在介绍Facebook人脸识别软件的应用时,孙雪谈道,现如今,机器对人脸识别的准确性已经达到了很精确的程度。2014年度Facebook对人脸识别的精确度为97.25%;不看正脸的情况下,仅凭背影、穿着、走路姿势等特征进行人脸识别,精确度达到了83%。到2016年,应用大数据,各个企业将继续发展人脸识别的应用,不仅能从图片中识别人脸,还将发展成从视频中进行人脸识别。 据孙雪介绍,机器不仅拥有了智慧的“眼睛”,还拥有了“最强大脑”。微软研究院应用大数据,甚至可以对奥运会、世界杯、美国总统大选等活动进行结果预测。“在大数据背景下,犀数科技设计了Datahoop平台,用来进行用户画像和用户流失分析,以帮助企业创造并留住客户。” 大数据时代给医疗健康产业也带来深远的影响。SCG大健康产业投资基金创始合伙人冼峰提出:“大数据可以为个人提供个性化的医疗服务。过去我们看病,医生只能对我们当下的身体情况做出判...

相关文章

发表评论

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。