阿里云视觉智能API，核心技术一站共享！

2020-02-25 566

随着人工智能的技术不断成熟，AI技术已应用到了社会的各行各业，尤其是计算机视觉技术应用更为广泛，计算机视觉（Computer Vision）是一门研究如何使机器“看”的科学，计算机视觉智能技术试图创建能够从图像视频或者多维数据中获取“信息和知识”的人工智能系统。作为AI技术的主要组成部分，计算机视觉（图像、视频、3D图形）智能技术近年来随着深度学习、大规模数据处理能力及云基础设施的迅猛发展，逐步应用到各行各业中，发挥了越来越大的作用。

背景：阿里巴巴集团内的视觉智能基石

视觉智能技术相比其它AI类技术（语音语言等），功能流派更多，场景也更复杂。整个阿里巴巴经济体围绕着自身大量业务场景（电商零售、金融物流、文娱营销、企业服务等多个行业）的应用需求，应用了大量的视觉智能技术作为产品和解决方案的基石，这些产品有些在今天已经被社会所熟知，如天猫，淘宝，支付宝，1688等。

这些视觉类技术方案、产品或能力中，除了场景内部的业务属性技术外，起到核心且基础作用的，是数量众多、功能各异的，以API形式服务于上层的视觉原子能力（或能力组件）。这些原子能力，有些是通用的，但大部分是面向场景的。在服务模式上，为了体现规模化、多样性的优势，以及追求接入、发现和运行的低成本，需要有一种统一的平台和服务方式，让这些大厦的基石走出阿里，去服务更广泛的用户和开发者群体，发挥更大的价值。

全栈式视觉智能：阿里云视觉智能平台

为了荟聚整个经济体的视觉技术基础能力，更好的服务于企业用户、生态合作伙伴、开发者，由阿里巴巴集团技术委员会视觉技术小组和战略合作部牵头，达摩院联合阿里云产品与解决方案管理部以及集团各个视觉技术团队一起创建了阿里云视觉智能API开放平台（https://vision.aliyun.com/）。

亮剑：阿里巴巴集团下的顶尖视觉智能技术

阿里云视觉开放平台基于阿里巴巴视觉智能技术实践经验，集成了阿里巴巴内部最顶尖的技术，如今面向全社会的企业和开发者，共享这些技术。目前聚焦如下主要服务类目：图像识别、图像分割、图像增强、图像搜索、人脸人体、文字识别、商品理解、内容安全、视频理解、视频分割、视频增强、视频搜索和3D视觉等40多种视觉原子能力。

人脸识别：基于图像或视频中的人脸检测、分析/比对技术，以及人体检测技术，提供人脸/人体的检测定位、人脸属性识别和人脸比对等独立模块。可以为开发者和企业提供高性能的在线API服务，应用于人脸AR、人脸识别和认证、大规模人脸检索、照片管理等各种场景。

人脸识别

文字识别：基于阿里云深度学习技术，为用户提供通用的印刷文字识别和文档结构化等能力。文字识别技术可以灵活应用于个人证件识别、行业票证识别、资产类证件识别、通过文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。

身份证识别
商品理解：基于阿里云深度学习算法，结合图像或视频的商品检测、分析/比对技术，为用户提供对商品类目、标签、属性的识别以及置信度信息等能力。可广泛应用于电子商务、零售、生产等行业，实现货架商品识别、商品二维码识别、商品属性识别与商品比对等应用场景。

电子商务
内容安全：基于阿里云视觉分析技术和深度识别技术，并经过在阿里经济体内和云上客户的多领域、多场景的广泛应用和不断优化，可提供风险和治理领域的图像识别、定位、检索等全面服务能力，不仅能帮助用户降低色情、暴恐、涉政、广告、垃圾信息等违规风险，而且能大幅度降低人工审核成本。

新零售
图像识别：基于阿里云深度学习技术，可实现精准识别图像中的视觉内容，包括上千种物体标签、数十种常见场景等，可为用户提供图像打标、场景分类、颜色识别、风格识别以及元素识别等能力。图像识别技术可广泛应用于数字营销、新零售、广告设计等行业场景。

智能相册编辑与管理
图像增强：基于阿里云深度学习技术，为用户提供图像视觉质量修复和图像属性增强等能力。图像增强技术灵活应用于摄影、艺术、广告、媒体等行业，满足老照片修复、图像去噪、图像曝光矫正、图像色彩矫正等业务需求。

图片素材加工

图像分割：基于阿里云深度学习技术，结合检测识别技术，为用户提供高精度图像分割能力，可实现秒级全自动主体、场景像素级识别，4通道透明素材制作能力。不仅实现了发丝级精抠，对高度镂空主体、复杂背景等场景都有很好的效果，同时支持人、货、场等三种类型需求，可广泛应用于电子商务、零售、泛文娱、个人应用等各种场景。

电商行业banner制作
目标检测：基于阿里云计算机视觉与深度学习技术，对通用或指定的目标进行检测、识别、打标。目标检测技术广泛应用于安防、交通等行业内图像场景的目标检测与跟踪。

路况分析
这些能力都是由阿里数十年的研发和实践沉淀下来的原子能力。而达摩院作为整个集团的先进技术探索集中探索研发基地，也将不断的为平台提供着更多通用或专用的优秀视觉算法能力。阿里云视觉智能平台作为面向全社会的OPENAPI开放平台，企业用户、开发者可以在阿里云视觉平台上选择相关能力，自行封装产品、服务或者是解决方案满足自身或者最终用户的应用需求。

体验：OPENAPI即试即用

作为视觉小组OpenAPI战役的承载产品，阿里云视觉智能平台未来将集成达摩院，阿里云等200余种视觉能力，并精选100余种优质能力上线API集市，由各个视觉技术团队、平台和工具支撑部门不断更新支持，平台所上线的API能力均可以在OPENAI平台（https://api.aliyun.com/），试用，无需代码，无需部署，可视化交互场景让产品经理也能清楚了解手上视觉能力的价值。

以文字识别-银行卡识别RecognizeBankCard为例
1、打开OPENAI平台（https://api.aliyun.com/）搜索文字识别，选择银行卡识别点击上传本地图片或者输入OSS的url链接

2、点击立即调用即可在瞬间完成调用

实战：一键开通，多能力调用

1、阿里云视觉智能平台（https://vision.aliyun.com/）目前已集成8大类目40多项明星原子能力，只需要选择类目查看详情，一键开通即可调用此类目下所有API能力。

2、进入SDK参考-查看对应语言类目-安装阿里云SDK核心库-安装视觉智能API相关服务-配置参数-调用成功

原石：用明星能力搭建应用场景的核心

平台的愿景是搭建一个完美的舞台供“能力”表演，如今，我们拿出了当初用于构建淘宝，支付宝，1688内视觉场景的原子能力，让开发者能使用最优质的能力进行研发场景，让算法团队接触最真实的开发场景进行能力开发，让每一个参与方各取所需，实现能力交易，多方共赢。希望能够帮助企业，开发者孵化造就更多的淘宝，支付宝，甚至阿里巴巴。

了解更多AI产品请戳：https://vision.aliyun.com/
点击观看产品发布会：https://developer.aliyun.com/live/1915

微信关注我们

原文链接：https://yq.aliyun.com/articles/746594

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

覆盖电商、推荐、ETL、风控等多场景，网易的实时计算平台做了啥？

作者：吴良波摘要：本文由网易 Java 技术专家吴良波分享，主要内容为 Apache Flink 在网易的实践，文章提纲如下：业务与规模演进 Flink 平台化案例分析未来发展与思考重要：公众号后台回复关键字「0224网易」，即可获取作者现场分享的完整版 PPT。一、业务与规模演进网易流计算演进在很久以前，网易内部基本上都是使用 Storm 来处理实时的计算任务，比较主要的使用场景是实时邮件反垃圾，广告，新闻推荐等业务。如今内部仍有一部分任务是运行在 Storm 上，目前正往 Flink 上迁移。 16 年左右 Flink 社区在网络上逐渐开始火起来，网易这边开始调研 Flink，发现 Flink 具有很多优秀的特性，比如高吞吐、低延迟、支持 Checkpoint、支持 Exactly once 语义，支持 Event time 等，能够很好的满足业务实时计算的场景，因此很多项目开始使用 Flink 来作为流计算的引擎来搭建流计算平台。在 2017 年 2 月份，网易杭州研究院成立了一个代号为 Sloth 的项目，基于 SQL 的实时计算平台，底层计算引擎采用 Apa...

2020-02-26

609

1月底，阿里云正式推出以计算机视觉AI能力为核心的视觉智能开放平台（vision.aliyun.com），平台目前已上线8大类目，超过50多种视觉AI能力，面向人脸识别，文字识别，商品理解，内容安全，图像识别，图像增强，目标检测等多个视觉应用核心场景。所有视觉AI能力都以API方式进行开放，最大程度降低开发者接入成本。阿里云作为亚洲最大的公有云服务商，支撑起了国内最大的零售平台淘宝，天猫，最大的支付平台支付宝，背后得益于雄厚的技术研发能力和运维能力。视觉技术作为AI领域应用最广泛的技术之一，在阿里巴巴内部一直作为核心技术不停的进行研发创新，最终形成了成熟的视觉体系。今天，阿里这些所有成熟的视觉AI都能在阿里云视觉智能平台调用（vision.aliyun.com）据了解，阿里云视觉智能平台上所有AI能力均来自阿里巴巴经济体，包括达摩院、阿里云、支付宝、菜鸟、天猫等事业部，其中包含了深度学习、图像识别、OCR，图计算等方面的最新前沿研究成果，并且所有AI能力都经过了阿里经济体的具体应用与实践，确保各能力符合场景实际需求。平台特点阿里云视觉智能平台荟聚了阿里巴巴集团最专业、全面、易用...

2020-02-26

531

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。