欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.6.13
今日要闻
Stability AI 宣布 Stable Diffusion 3 Medium 现已开源,是 Stable Diffusion 3 系列中最新、最先进的文本生成图像 AI 模型 —— 官方声称是 “迄今为止最先进的开源模型”,其性能甚至超过了 Midjourney 6。
SD3 Medium 可以根据用户输入的文本描述,重点克服了文生图模型中手部和脸部的挑战,生成足以乱真的的图像。SD3 Medium 还利用其底层的 Diffusion Transformer 架构,高精度地整合了文字元素。
![]()
PowerInfer-2 是专为智能手机设计的高度优化的推理框架。PowerInfer-2 最多支持 Mixtral 47B MoE 模型,实现每秒 11.68 个令牌的惊人速度,比其它最先进的框架快 22 倍。即使对于 7B 型号,仅将 FFN 权重的 50% 放置在手机上,PowerInfer-2 仍然保持最先进的速度!
![]()
谷歌在博客透露称,ChromeOS 底层将更广泛地与 Android 共用同样的技术栈。
为了继续以更快、更大规模的方式向用户推出新的 Google AI 功能,我们将采用部分 Android 堆栈(例如 Android Linux 内核和 Android 框架)作为 ChromeOS 基础的一部分。
将基于 Android 的技术栈引入 ChromeOS 将使我们能够加快 ChromeOS 核心的 AI 创新步伐,简化工程工作,并帮助手机和配件等不同设备更好地与 Chromebook 配合使用。
根据研究机构Counterpoint Research发布的最新数据,2024年第一季度,华为鸿蒙OS在中国市场超越苹果iOS,这意味着,鸿蒙OS已成中国第二大操作系统。从全球手机系统市场份额来看,安卓和iOS同比均下降1%,而鸿蒙OS的全球份额从2%翻了一番,达到4%。
![]()
今日观察
社交观察
如果简单的回答是:值得报。但更长的答案是:不是值不值得报的问题,而是考上了应该怎么学的问题。
因为在AI时代,掌握计算机理论肯定没有坏处。但是如果在计算机专业只学计算机就意义不大了(当然,如果是天才选手,目标是要把transformer架构拉下马的除外),但是在计算机的基础上,再修一个行业技能专业意义很大。因为AI的价值,未来一定在应用落地。计算机+传统行业。
计算机专业以后更多将是一种语言能力,而语言需要在具体的交流场景中(也就是某个行业),才能更大发挥作用,每个人都应该努力成为一个双语者。
- 微博 高飞
苹果对于 Apple Intelligence 背后技术的介绍,他们的模型分成三层:
1. 本地模型
这部分包含语言模型和扩散模型,另外还有用来做 RAG 的 Semantic Index (语义索引)和 App Intents Toolbox(应用意图工具箱)。
其中语言模型是 3B 的小模型,并且针对一系列任务微调过,比如说摘要、润色、回复邮件等,在这些微调模型权重之上有个适配器,可以根据任务来选择最合适的权重,所以虽然只有 3B,但是能力不弱。
2. 私有云计算(Private Cloud Compute)
对于本地模型满足不了要求的,会传到云端运算。并且苹果在安全性上做了很多工作,对于每一次请求,用户的设备会和私有云计算集群建立一个端到端加密的连接。只有被选择的集群才能解密这些请求数据,数据在返回响应后不会被保留,Apple 也无法访问。
以苹果的口碑,对于这个安全架构我还是相信的。
3. 第三方 LLM
这个视频中没有提及,综合一些其他信息,像一些 Siri 的知识问答、聊天,是接入的外部模型,比如目前接入的有 OpenAI 的 GPT-4o,但未来肯定会接入更多家,并且不同国家地区的 LLM 服务商可能有所不能,比如国内肯定不会用 ChatGPT,至于哪一家还没有宣布。
- 微博 宝玉xp
其实12年前iPhone4还是4s时代就可以通话录音了,只要越狱后在Cydia里搜索到AudioRecorder就可以通话录音了,只不过不越狱的IOS没这个功能。
相比之下,当然是安卓更方便,毕竟开源,各家开启的方式都很方便,像魅族Flyme是可以自动开启录音,还可以指定联系人才开启录音,iPhone现在有通话录音了,问题居然还会通知对方,那多尴尬啊???
- 即刻 科技数码秀
这个memotrace太好用了,我刚才试了一下,备份一个1.4G的微信群聊,四分钟,导出所有文本、图片、表情包和系统信息后只有18M,然后RAR压缩后只有2M!就是说其他99.8%的微信空间都是垃圾冗余。而且导出之后的HTML是按照页面总数和月份分类好的,占用内存非常小,可以在任何浏览器上读取。
github.com/LC044/WeChatMsg/releases
- 微博 失眠狸
如果你昨夜看了如期开源的Stable Diffusion 3 Medium,会发现Model Card上3个名字,有2个似曾相识于中文区。Dango233和huoju都是亲身参与SD3训练的开发者,他们从Disco Diffusion时期(2021)开始参与图像生成,1000多天,见证社区一路波澜壮阔。
SD3能顺利开放的波折和他们的力争此刻按下不表,总之二位是开源真正的热爱和实践者。我们的Diffuseum也非常感谢他们作为创立成员,给我们以及中文社区提供的技术支持和信心。
- 微信 Latent Cat
媒体观察
在研究团队有限的测试中,吴恩达团队开源的翻译智能体有时能够与领先的商业提供商进行同等水平的竞争,有时则不如它们。但它仍提供了一个高度可控的翻译系统,只需简单更改 prompt,使用者就可以指定语气(正式 / 非正式)、地区变体(例如:使用者想要在西班牙本地说的西班牙语,还是在拉丁美洲说的),并确保术语的翻译一致性(通过提供词汇表)。这个应用程序虽然目前仍稍显稚嫩,但鉴于反思工作流已经展现出不错的成果,吴恩达认为智能体翻译仍有很大的提升空间。
- 机器之心
快牛云科技创始人周海鹏总结道:“需求侧本身能力还驾驭不了数字化,人才还需要升级。供给侧本身很多时候半懂不懂,为了大单不顾一切,反过来伤害了客户,加上现在甲方资金紧张。”这些因素的综合,成为当下国内头部软件厂商业绩惨淡的关键。
- 新浪科技
被马云反复强调的AI,正悄然开启阿里巴巴的新篇章。这不但体现在它正加速电商业务的AI变革,也体现在它对中国AI初创公司拔尖者包圆式的投资。业内甚至有句玩笑话:
“如果你想投资中国AI初创公司,最好的办法就是去买阿里巴巴的股票。”
- 华商韬略
“对于360此次图片使用之争,我希望该判例能够形成一个国内相关的指导意见。落实到个体上,如何在现有法律框架下保护原创,尊重知识产权,同时又不影响人工智能行业发展,是一个非常难的课题。”
- 新京报
声音打通的是无数个场,游戏的、带货的、教育的等等,最后抵达的是用户。在大模型时代,把声音功能前置是一种典型的产品思维,这意味着更低的门槛、更高效的交互方式以及更庞大的用户群体。
- 光子星球
已经很少有一个机会能让全球众多城市都跃跃欲试了。到底哪个城市能抓住机会?谁能抓到最大的机会?我们的初步调查表明,在这种全球影响力竞争中,区域竞争其实比全球竞争更激烈。在竞争全球用户之前,每个城市及其公司都需要先角逐人才。而在人才流动上,全球化仍然要让位于区域化。其次,对于学术资源深厚的城市,每个大厂都想去设办公室、抢夺人才,但这对当地城市不见得是好事。最后,基础技术不是一切,产业和文化具有多样性,才能支撑更繁荣的机会。
- 第一财经YiMagazine
美图试图在投入和盈利之间寻求平衡。“搞模型军备竞赛不是美图的核心战略,我们会在保证应用竞争力的前提下,控制模型的投入。”他还强调,过去很长时间美图都是常年亏损,所以会更看重落地场景和商业模式。”
- 界面
今日推荐
开源项目
![]()
https://github.com/skylot/jadx
JADX 是一个 Dex 到 Java 的反编译器,用于从 Android Dex 和 Apk 文件生成 Java 源代码。JADX 有命令行和 GUI 两个版本。
每日一博
IOC 和 AOP 是 Spring 中的两个核心的概念。
IOC(Inverse of Control)控制反转,也可以称为依赖倒置。所谓依赖,从程序的角度看,就是比如 A 要调用 B 的方法,那么 A 就依赖于 B,反正 A 要用到 B,则 A 依赖于 B。所谓倒置,你必须理解如果不倒置,会怎么着,因为 A 必须要有 B,才可以调用 B,如果不倒置,意思就是 A 主动获取 B 的实例:B b = new B (),这就是最简单的获取 B 实例的方法(当然还有各种设计模式可以帮助你去获得 B 的实例,比如工厂、Locator 等等),然后你就可以调用 b 对象了。所以,不倒置,意味着 A 要主动获取 B,才能使用 B;到了这里,就应该明白了倒置的意思了。倒置就是 A 要调用 B 的话,A 并不需要主动获取 B,而是由其它人自动将 B 送上门来。
AOP (面向切面编程)的目标就是分离关注点。什么是关注点呢?就是你要做的事,就是关注点。假如你是个公子哥,没啥人生目标,天天就是衣来伸手,饭来张口,整天只知道玩一件事!那么,每天你一睁眼,就光想着吃完饭就去玩(你必须要做的事),但是在玩之前,你还需要穿衣服、穿鞋子、叠好被子、做饭等等等等事情,这些事情就是你的关注点,但是你只想吃饭然后玩,那么怎么办呢?这些事情通通交给别人去干。在你走到饭桌之前,有一个专门的仆人 A 帮你穿衣服,仆人 B 帮你穿鞋子,仆人 C 帮你叠好被子,仆人 D 帮你做饭,然后你就开始吃饭、去玩(这就是你一天的正事),你干完你的正事之后,回来,然后一系列仆人又开始帮你干这个干那个,然后一天就结束了!
开源之声
用户观点
- 观点:1:宁愿折腾那玩意儿也不做去完善 android pc
- 观点 2:这个是好事,慢慢这个桌面化了。 arm windows 没它啥事了。 话说windows 是该灭亡了。
- 观点 3:不能用 apk 文件,什么都是扯淡
- 观点 5:我在ChromeOS用Android Studio安装apk 有的架构还是不兼容
- 观点 6:这系统竟然还有人用
- 观点 1:可惜现在树莓派既不价格低廉,也不开源开放
- 观点 2:社区不错,学生党做做毕设合适,就是经销商那副你不买有的是人买的嘴脸,对公采购就算了。
- 观点 3:原来普通的arm都能上太空
- 观点 4:现在的树莓派,高不成低不就的。在国产替代的大环境下,媒体要有作为的忽视。
- 观点 5:用别人的玩儿过,如果做硬件开发折腾和学习,价格不划算。如果用于桌面电脑,看高清视频卡顿,性能又跟不上。总之想玩儿一玩儿不如买个华强北山寨版orange派
- 观点 6:现在国产开发版一大把,价格低性能还更强
- 观点 7:老哥给推荐一个国产的,我整一个玩玩
- 观点 8:orangepi
- 观点 9:为啥看到留言都是吐槽的?我最近折腾了一个,感觉挺好的,Debian几乎就是原生 Debian,还没遇到软件问题
- 观点 10:以前:这个便宜,买这个。现在:这个性能好,买这个。
- 观点 11:树莓派以前还能夸两句,现在价格完全配不上,一开始还搞什么公益不公益的,现在还上市算是装都不装了。
- 观点 1:swift和rust为何不合并?
- 观点 2:swift支持Linux,那么就可以支持Android native了吗?
---END---
最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!
![]()