音视频技术开发周刊 67期-低调大师

音视频技术开发周刊 67期

2018-09-19 575

『音视频技术开发周刊』由LiveVideoStack团队出品，专注在音视频技术领域，纵览相关技术领域的干货和新闻投稿，每周一期。点击『阅读原文』，浏览第67期内容，祝您阅读愉快。

架构

展晓凯：短视频APP架构设计与实现

本文来自全民快乐研发高级总监展晓凯在LiveVideoStackCon 2018讲师热身分享，并由LiveVideoStack整理而成。分享中展晓凯详细介绍了短视频APP场景中视频录制、编辑、保存模块的相关技术，以及变速不变调算法W-SOLA的实现。

相机+激光雷达重绘3D场景

将激光雷达与相机结合，再通过深度学习的方式获得场景的3D模型——Ouster首席执行官在博客中介绍了相机OS-1，并装有激光雷达。LiveVideoStack对原文进行了摘译。

冯迅：YY多媒体实时传输系统演进

本文来自YY基础架构部负责人冯迅在LiveVideoStackCon 2017上的分享，并由LiveVideoStack社区整理而成。冯迅重点介绍了，YY直播平台的架构演进，包括技术栈选择权衡，自建网络与采购CDN协作等。

常青：小程视频能力再升级序音

LiveVideoStack采访了腾讯云音视频业务终端研发团队负责人常青，针对小程序音视频能力技术升级、场景支持、政策审核以及未来演进趋势进行了详细的探讨。

即构科技金健忠：回顾20年音视频技术演进

多媒体技术是一个传统行业，从模拟到数字，VCD到蓝光，从窄带到宽带，标清到高清，技术演进让人的视听体验发生了颠覆式的改变。LiveVideoStack采访了即构科技CTO金健忠，他回顾了过去20年多媒体技术的发展，并展望了未来的技术趋势。

音视频--SDP协议

SDP：会话描述协议，是一种会话描述格式，为描述多媒体数据而设计。 SDP协议介绍 SDP 完全是一种会话描述格式（对应的RFC2327 , RFC4566) 它不属于传输协议，它只使用不同的适当的传输协议，包括会话通知协议（SAP）、会话初始协议（SIP）、实时流协议（RTSP）、MIME 扩展协议的电子邮件以及超文本传输协议（HTTP）。

WebRTC降低直播延迟——Limelight方案

曾经点播在视频传输中占据很大的比例，但如今越来越多的平台希望能够通过直播的方式增加观众的兴奋程度和参与度，同时直播时的延迟成为了一个关键的挑战。在音视频传输的过程中，在不同阶段都会产生延时，有设备端上的延时，设备端与服务器之间的延时，服务器之间的延时，但是，不同的行业对于实时音视频的延迟也有不同的要求，需要找到画质、音质、延时和功耗等方面的平衡点。

5G接入网的架构

本文首先结合5G愿景与需求，阐明了5G接入网络架构的特点和重要性；然后从学术界和产业界两个角度详细介绍了5G接入网络架构的设计原理和具体组成，分析了优点和不足；最后，探讨了接入网络架构的挑战和未来的可能发展方向。

音频/视频技术

Android下AudioRecord采集音频写入PCM和WAV文件中

本文主要介绍如何将采集到的音频数据保存到PCM和WAV文件中。其实保存PCM数据不难，只要直接写入文件即可，而保存数据至WAV文件只需要将WAV文件格式头补上即可。

基于Qt、FFmpeg的音视频播放器设计

本篇文章主要介绍视频处理的原理以及实现。对于视频的处理我们这里对它分开总结，不然看起来会显得很冗余复杂，不易理解,主要分为以下几方面。1、打开视频获取视频信息；2、读取视频分析视频包；3、打开视频解码器；4、视频解码并分析H264解码；5、打开格式转换和缩放；6、视频转RGB并缩放。

快速搭建自己的直播服务器，完成属于你的直播服务

通过本文您能学到以下内容： 1、动手搭建直播服务器，完成一次对移动端支持的直播。2、使用OBS推流。3、使用HTML5网页播放M3U8流媒体文件。

音视频通话：小议音频处理技术与压缩

在视频或者音频通话过程中，一方面为了减小原始声音数据的传输码率，需要进行音频压缩，另一方面为了得到更高质量的音质，需要进行音频处理。那么，如何处理好这两方面，保证声音传播的高真性？本篇文章将会结合网易云信在音视频技术方面的实战和经验，小议音频处理与压缩技术。

编解码

FFmpeg 中AVPacket的使用

AVPacket保存的是解码前的数据，也就是压缩后的数据。该结构本身不直接包含数据，其有一个指向数据域的指针，FFmpeg中很多的数据结构都使用这种方法来管理数据。

X264实现H264编码以及MediaMuxer的另类用法

本系列文章涉及的项目HardwareVideoCodec已经开源到Github，支持软编和硬编。使用它你可以很容易的实现任何分辨率的视频编码，无需关心摄像头预览大小。

FFmpeg解码视频文件并播放

最近学习了一下如何使用FFmpeg解码音视频，网上的教程挺多但是也挺杂的，搞了好几天，明白了FFmpeg解码音视频的大体流程，这里记录一下FFmpeg解码视频并播放音视频的例子，但并没有做音频、视频播放的同步处理。

Netty编解码框架

Netty提供了一套完善的编解码框架，不论是公有协议/私有协议，我们都可以在这个框架的基础上，非常容易的实现相应的编码/解码器。输入的数据是在ChannelInboundHandler中处理的，数据输出是在ChannelOutboundHandler中处理的。因此编码器/解码器实际上是这两个接口的特殊实现类，不过它们的作用仅仅是编码/解码。

AI智能

人脸检测算法综述

人脸检测是目前所有目标检测子方向中被研究的最充分的问题之一，它在安防监控，人证比对，人机交互，社交和娱乐等方面有很强的应用价值，也是整个人脸识别算法的第一步。本文将和大家一起回顾人脸检测算法的整个发展历史。

卷积神经网络的压缩和加速

针对卷积神经网络模型的压缩，最早提出的方法应该是网络裁枝，LeCun在1989年就提出根据损失函数对各个参数的二阶导，来估计各个参数的重要性，再删去不重要的参数。后来又是到2012年之后，压缩方法更加多样，总体大约分为4种：网络裁枝、模型量化、低秩估计、模型蒸馏。下面SIGAI将对4种方法进行逐一介绍。

如何优雅地从四个方面加深对深度学习的理解

在今年的 ICML 上，深度学习理论成为最大的主题之一。会议第一天，Sanjeev Arora 就展开了关于深度学习理论理解的教程，并从四个方面分析了关于该领域的研究：非凸优化、超参数和泛化、深度的意义以及生成模型。

短视频如何做到千人千面？FM+GBM排序模型深度解析

信息流短视频能够满足用户的碎片化阅读需求，目前已是移动互联网流量风暴的中心。各互联网大厂纷纷涉足此领域，推出自己的短视频产品，群雄争霸，逐鹿短视频市场。今天，UC事业部国际研发团队，将为大家介绍排序层的模型演进过程，带你深入了解模型创新部分。

【ECCV 2018】Facebook开发姿态转换模型，只需一张照片就能让它跳舞（视频）

DensePose 是 Facebook 研究员 Natalia Neverova、Iasonas Kokkinos 和法国 INRIA 的 Rıza Alp Guler 开发的一个令人惊叹的人体实时姿势识别系统，它在 2D 图像和人体3D 模型之间建立映射，最终实现密集人群的实时姿态识别。

图像

深度学习AI美颜系列----AI人脸自动美型算法

人脸智能美型技术主要用于智能美颜，对用户的照片进行自动智能调整，而不需要用户手工调整，该技术在美颜相机、天天P图等app中都已应用。本文在这里对人脸智能美型进行详解。

微信关注我们

原文链接：https://yq.aliyun.com/articles/668534

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

大型网站技术架构核心原理与案例分析(读书笔记)

大型网站技术架构核心原理与案例分析 1.概述网站衡量的标准：高可用，高性能，易扩展，可伸缩，安全 1.1 大型网站特点高并发高可用海量数据用户分布广泛，网络情况复杂安全环境恶劣需求快速变更，发布频繁渐进式发展 1.2 大型网站演化发展历程一台服务器（应用程序+数据库+文件）应用服务和数据服务分离使用缓存改善网站性能（应用服务器缓存+分布式缓存服务器）使用应用服务器集群改善网站的并发能力数据库读写分离使用反向代理和CDN加速网站响应使用分布式文件系统和分布式数据库系统（先可以考虑分库分表）使用NoSQL和搜索引擎业务拆分 --- 每个业务独立部署 ---- 通过消息队列进行数据分发分布式服务 1.3 大型网站演化发展价值观随着业务发展，灵活应对网站业务驱动 1.4 网站架构误区一味追随大公司的解决方案为了技术而不是业务企图用技术解决所有问题（12306采用分时分段售票，引入排队机制） 2.大型网站架构模式模式：对于问题和场景的解决方案可重复使用。 2.1 网站架构模式分层（网络通信协议--每一层关注自己的业务）禁止跨层调用，以及逆向调用...

2018-09-18

597

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/82784122 LiveVideoStack采访了容联云通讯CTO许志强，分享了从一线研发到团队leader的软硬性能力提升经验，解析了通讯行业音视频技术难点、踩的坑以及优化方案，并展望了AI、5G为音视频技术发展带来的革新。文 / 许志强整理 / LiveVideoStack LiveVideoStack：许总您好，首先非常感谢您接受采访，还请您先介绍下自己和容联云通讯。许志强：本人毕业于华中理工大学自控系，中山大学MBA。先后就职于广州新太科技任开发中心副总经理、高阳圣思园任云通讯项目技术负责人。目前主要负责容联整体平台设计与开发，互联网/AI等前沿技术与通讯的融合跟进。容联是国内专业的企业通讯云服务提供商。容联以云计算方式，为企业客户提供通讯平台服务（PaaS）、通讯软件服务（SaaS）、行业新通讯解决方案和“AI+通讯”服务，助力企业精准获客，提升终端用户服务体验；变革企业内部沟通协作方式，提升企业运...

2018-09-19

601

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。