生成式AI
类别: DeepLearningAI GenerativeAI 标签: DeepLearningAI GenerativeAI目录
- 机器学习的方法
- LLM 的缺点
- LLM 是推理引擎(Reasoning Engine)
- 微调(Fine-tuning)
- 预训练(Pre-training)
- 选择模型
- LLM 如何遵循指令
- 代理(Agent)
- 任务分析
- 团队
- AI 担忧
- 参考资料
机器学习的方法
监督学习(Supervised Learning)
监督学习使用带有标签的训练数据来训练模型。这些标签是预先定义的输出,模型通过学习输入数据与这些输出之间的关系来进行预测。监督学习的任务通常分为两类:分类(预测离散的标签)和回归(预测连续的数值)。常见的监督学习算法包括决策树、逻辑回归、支持向量机(SVM)、神经网络等。监督学习广泛应用于图像识别、语音识别、医疗诊断等领域。
无监督学习(Unsupervised Learning)
无监督学习不依赖于标签数据,而是试图在没有明确指导的情况下发现数据中的结构和模式。它的主要任务包括聚类(将数据分组到不同的簇中)和降维(减少数据的复杂性,同时保留其主要特征)。无监督学习常用于市场细分、社交网络分析、异常检测等场景。算法示例包括K-means聚类、主成分分析(PCA)等。
自监督学习(Self-Supervised Learning)
自监督学习是一种无监督学习的形式,它通过从数据本身生成伪标签来创建监督信号。这种方法通常涉及到设计任务,使得模型能够从数据中学习有用的特征表示,而不需要人工标注。自监督学习在计算机视觉和自然语言处理中尤其流行,例如,通过预测图像的旋转角度或文本的下一个字来训练模型。这种方法有助于减少对大量标注数据的依赖,同时为下游任务提供预训练的模型。
生成式AI(Generative AI)
生成式AI的目标是创建能够生成新数据样本的模型,这些样本在统计上与训练数据相似。这类模型通常基于概率分布,试图学习数据的潜在表示。生成式对抗网络(GANs)和变分自编码器(VAEs)是生成式AI中的两个典型例子。生成式AI在艺术创作、游戏开发、数据增强等领域有着广泛的应用。
强化学习(Reinforcement Learning)
强化学习是一种让智能体通过与环境的交互来学习的方法。智能体在环境中执行动作,并根据其动作的结果获得奖励或惩罚。强化学习的目标是学习一种策略,以最大化累积奖励。这种方法在游戏、机器人控制、推荐系统等领域有着广泛的应用。强化学习的一个关键挑战是设计合适的奖励函数,以及处理可能的探索与利用的权衡。
LLM 的缺点
- 知识截止时间
- 幻觉
- 上下文限制
LLM 是推理引擎(Reasoning Engine)
- 理解上下文
- 逻辑推理
- 知识融合
微调(Fine-tuning)
- 任务定制
- 特定风格(写作、语气、业务需求)
- 任务难以在提示中定义
- 人物或角色
- 领域知识
- 专业术语
- 行业规范
- 专业技能
- 数据集只需求几百个样本
预训练(Pre-training)
- 大规模数据集
- 通用模型
- GPT-3
- Llama
- 特定领域模型
- BloombergGPT:金融大模型
- DeepSeek-Coder:编程大模型
选择模型
参数大小
- 1B
- 10B
- 100B
开源 vs 闭源
- 开源
- 完全掌控
- 隐私保护
- 数据访问控制
- 边端运行
- 社区支持
- 闭源
- 云 API
- 易用
- 功能强大
- 成本低
- 安全性低
LLM 如何遵循指令
- SFT (Supervised Fine-tuning)
- 微调以遵循指令并回答问题
- RLHF (Reinforcement Learning from Human Feedback)
- 人类反馈中进行强化学习,训练生成更好的回答
代理(Agent)
- 规划、行动
- 使用工具
任务分析
每个角色的工作一般由多个任务组成,需要先分解任务,然后对每个任务进行生成式人工智能潜力分析。
人工智能赋能任务的方式
- 增强
- 自动化
要完成使用人工智能来增强或自动化任务,需要考虑的主要因素:
- 技术可行性
-
业务价值
- 成本节省 -> 收入增长
- 改造工作流程
团队
- 软件工程师
- 负责产品的研发
- 提示工程
- 机器学习工程师
- 负责 AI 系统的研发
- 提示工程、微调、RAG
- 产品经理
- 负责产品
- 提示工程师
- 很少有专门设置这个岗位
- 数据工程师
- 负责数据的处理
- 负责数据的质量
- 负责数据的安全
- 数据科学家
- 负责数据的分析
- 指导项目或业务决策
- 项目经理
- 负责项目的管理
- 机器学习科学家(研究员)
- 负责开发先进的人工智能技术
- 将先进的人工智能技术应用到实际的业务场景中
AI 担忧
RLHF 已经证明可以使用 LLM 在性别、种族、宗教和其他人类特征方面不受偏见地生成文本。