判别式 AI 与生成式 AI
本文摘选来自: AI 智能体开发指南
一、背景
为了解决不同的应用场景,在AI的发展过程中,机器学习模型逐步分化为 判别式(Discriminative)和生成式(Generative) 两各技术路线,从而形成了AI的两大派别。它们分别在分类、回归、模式识别以及数据生成等任务中发挥核心作用。
为了避免在AI技术选型过程中走弯路,为应用场景匹配不合适的AI,我们有必要了解两种AI的核心差异。
二、判别式AI:模式识别与分类任务的核心
判别式AI模型主要用于分类和预测任务,目标是建模输入(X)与输出(Y)之间的决策边界,即直接学习P(Y|X)。典型的判别式算法包括 逻辑回归(Logistic Regression)、支持向量机(SVM)、随机森林(Random Forest)、深度神经网络(DNN) 等。这类模型在计算机视觉、语音识别、自然语言处理等领域发挥了巨大作用。例如,2012年AlexNet在ImageNet挑战赛上大获成功,证明了深度卷积神经网络(CNN)在图像分类任务上的卓越能力。后续的ResNet、EfficientNet等模型进一步推动了判别式AI的发展,使其在目标检测、语音转文字、情感分析等任务上达到了接近人类水平的表现。
在自然语言处理领域,BERT等自监督学习的预训练模型也属于判别式AI的范畴。BERT的训练目标是通过 掩码语言模型(Masked Language Model, MLM) 预测缺失单词,其双向上下文理解能力极大提升了AI的文本理解能力,使其广泛应用于信息检索、情感分析、机器翻译等任务。
值得一提的是,判别式AI对硬件处理能力的要求更低,甚至可以在移动终端上运行,如图1。
基于AI技术的翻译机 (基于AI技术的翻译机)
三、生成式AI:从数据学习到创造新内容
与判别式模型不同,生成式AI的目标是学习数据的分布,并生成与训练数据相似的新样本,即建模P(X) 或 P(X|Z)(Z为隐变量,即没有预先定义的变量,隐变量的存在是判别式AI准确率缺陷的主要成因)。生成式模型不仅可以用于数据增强,还能在无标签数据环境下进行自监督学习,为AI带来了更广泛的应用场景。
生成式AI的早期探索始于隐马尔可夫模型(HMM)和玻尔兹曼机(Boltzmann Machines),但真正的突破出现在2014年,生成对抗网络(GANs) 的提出引发了AI在图像生成领域的革命。GAN由生成器(Generator) 和 判别器(Discriminator) 组成,通过博弈的方式不断优化,使生成的数据越来越接近真实样本。2017年,前文介绍的BERT/Transformer提出后,生成式AI进入快速发展阶段,OpenAI基于此架构推出的GPT系列(Generative Pre-trained Transformer)成为生成式AI的标志性成果。GPT-3、GPT-4等大规模语言模型能够基于大量文本数据进行预训练,并在下游任务中表现出极强的语言理解与生成能力。生成式AI不仅限于文本生成,还广泛应用于多模态领域,如文本生成图像(如图2)、音频合成、视频生成等。多模态生成式AI的进步,使得AI能够更自然地理解和创造内容,推动了艺术创作、设计自动化、游戏开发等多个行业的变革。 (图2:使用通义万象生成图片)
四、判别式 vs 生成式:优势、局限性与融合趋势
尽管判别式AI和生成式AI在建模方式和应用场景上有所不同,但二者在实践中往往相辅相成。判别式AI擅长分类、检测和回归任务,计算效率高、泛化能力强,在生产环境中更易部署。但其主要局限在于数据依赖性强、无法生成新数据,因此在低数据场景或创新内容生成方面能力有限。
相比之下,生成式AI的优势在于能够建模数据的分布并生成新样本,在低数据场景下仍能有效工作,适用于数据增强、仿真模拟、个性化内容创作等任务。然而,生成式AI往往计算成本较高,训练过程不稳定,并存在模式崩溃(Mode Collapse)、难以控制生成内容等问题。此外,由于生成式AI的内容高度依赖训练数据,其在真实性、可控性和伦理问题上也面临较大挑战。详细对比如图3所示。 (图3:判别式AI与生成AI对比)
随着AI技术的发展,判别式和生成式的融合趋势越来越明显。例如,GAN本身就结合了判别模型和生成模型的优势,而近年来的自监督学习(Self-Supervised Learning, SSL) 也开始采用生成式预训练+判别式微调的策略。GPT-4等大模型在预训练阶段采用自回归生成方式,但在推理过程中可以进行判别式优化,以提高模型的可靠性和稳定性。这种趋势表明,未来的AI系统可能不再严格区分判别式和生成式,而是结合二者的优点,实现更强的泛化能力和创造力。
五、典型应用场景示例
活字格低代码开发平台可引入判别式AI和生成式AI,加速新技术落地。
5.1 判别式AI:增强型OCR(快递面单识别)
需求概述:通过快递面单来自动解析出收发件人信息
核心能力:AI增强型OCR(插件:百度AI)
下载地址:https://marketplace.grapecity.com.cn/ApplicationDetails?productID=SP2309140002
5.2 生成式AI:文本生成workflow(文章撰写)
需求概述:基于用户提供的关键字自动编写对SEO友好的市场宣传用文章
核心能力:AI助手命令(内置插件)
工程地址:https://gitee.com/low-code-dev-lab/hzg-demo-web-api-ai-integration
本文摘选来自: AI 智能体开发指南

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
7 款让人“上头”的开源小游戏
好久没发开源游戏集合了,接下来我们就来下「js13kGames」比赛 2024、2023 年的获奖小游戏。 也许有些朋友是第一次听说「js13kGames」——这是一个每年举办的网页游戏编程竞赛,参赛者需要在一个月内开发一款大小不超过 13KB 的网页游戏。规则如下: 文件大小限制:提交的游戏压缩包(zip 格式),包含所有代码和资源,不得超过 13KB。 禁止外部依赖:不允许使用任何外部库、服务或资源,全部内容都要打包进 zip 文件。 入口文件 :压缩包内必须包含一个 index.html 文件,解压后直接打开就能玩。 源码分享:鼓励参赛者在 GitHub 上开源游戏代码。 地址:js13kgames.com 每年的 Js13k 比赛都能看到许多有趣、好玩的创意小游戏,下面就让我们一起「玩一玩」过去两年里那些令人惊艳的游戏吧! 一、令人害怕的数字 13 2024 年的主题是「Triskaidekaphobia」,意为"对数字 13 的恐惧或回避"。让我们一起来看看,围绕这个概念的 13KB 游戏长什么样吧! 1.1 13th Floor(第十三层) 这是一款潜行恐怖(Stealth...
- 下一篇
全面解析 Coco AI,一款开源、免费的智能搜索与知识库工具
在 AI 浪潮中,如何高效管理海量信息、实现智能搜索与知识共享,已成为个人与企业共同面临的挑战。Coco AI —— 一款完全开源、免费的智能搜索与知识库工具,成为面对这一挑战的利器。 Coco AI 能够轻松连接本地文件数据源、S3 对象存储、Google Workspace、Dropbox、GitHub、Notion、Yuque、Hugo 等多种数据源,实现本地与云端数据的统一搜索与管理。无论是文档、代码、项目管理工具,还是团队协作平台,Coco AI 都能一键整合,让企业数据“化零为整”,彻底打破信息孤岛的束缚。 Coco AI 采用了RAG 技术,结合传统检索和生成模型的优势,提供基于内容检索的生成式答案。它不仅能够精准匹配关键词,还能基于实际内容生成详细且高质量的回答。 这个开源搜索工具背后的公司,是国内一家初创企业——极限科技 / INFINI Labs。其创始人兼 CEO 曾勇现正带领团队专注于下一代实时搜索引擎与 AI 智能搜索相关技术的研发与创新。 5月23日,极限科技 / INFINI Labs 创始人兼 CEO 曾勇、高级解决方案架构师杨帆将做客开源中国《技术领航...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS6,CentOS7官方镜像安装Oracle11G
- Mario游戏-低调大师作品
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- 设置Eclipse缩进为4个空格,增强代码规范
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS关闭SELinux安全模块
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果