目录

机器学习的方法

监督学习(Supervised Learning)

监督学习使用带有标签的训练数据来训练模型。这些标签是预先定义的输出,模型通过学习输入数据与这些输出之间的关系来进行预测。监督学习的任务通常分为两类:分类(预测离散的标签)和回归(预测连续的数值)。常见的监督学习算法包括决策树、逻辑回归、支持向量机(SVM)、神经网络等。监督学习广泛应用于图像识别、语音识别、医疗诊断等领域。

无监督学习(Unsupervised Learning)

无监督学习不依赖于标签数据,而是试图在没有明确指导的情况下发现数据中的结构和模式。它的主要任务包括聚类(将数据分组到不同的簇中)和降维(减少数据的复杂性,同时保留其主要特征)。无监督学习常用于市场细分、社交网络分析、异常检测等场景。算法示例包括K-means聚类、主成分分析(PCA)等。

自监督学习(Self-Supervised Learning)

自监督学习是一种无监督学习的形式,它通过从数据本身生成伪标签来创建监督信号。这种方法通常涉及到设计任务,使得模型能够从数据中学习有用的特征表示,而不需要人工标注。自监督学习在计算机视觉和自然语言处理中尤其流行,例如,通过预测图像的旋转角度或文本的下一个字来训练模型。这种方法有助于减少对大量标注数据的依赖,同时为下游任务提供预训练的模型。

生成式AI(Generative AI)

生成式AI的目标是创建能够生成新数据样本的模型,这些样本在统计上与训练数据相似。这类模型通常基于概率分布,试图学习数据的潜在表示。生成式对抗网络(GANs)和变分自编码器(VAEs)是生成式AI中的两个典型例子。生成式AI在艺术创作、游戏开发、数据增强等领域有着广泛的应用。

强化学习(Reinforcement Learning)

强化学习是一种让智能体通过与环境的交互来学习的方法。智能体在环境中执行动作,并根据其动作的结果获得奖励或惩罚。强化学习的目标是学习一种策略,以最大化累积奖励。这种方法在游戏、机器人控制、推荐系统等领域有着广泛的应用。强化学习的一个关键挑战是设计合适的奖励函数,以及处理可能的探索与利用的权衡。

LLM 的缺点

  • 知识截止时间
  • 幻觉
  • 上下文限制

LLM 是推理引擎(Reasoning Engine)

  • 理解上下文
  • 逻辑推理
  • 知识融合

微调(Fine-tuning)

  • 任务定制
    • 特定风格(写作、语气、业务需求)
    • 任务难以在提示中定义
    • 人物或角色
  • 领域知识
    • 专业术语
    • 行业规范
    • 专业技能
  • 数据集只需求几百个样本

预训练(Pre-training)

  • 大规模数据集
  • 通用模型
    • GPT-3
    • Llama
  • 特定领域模型
    • BloombergGPT:金融大模型
    • DeepSeek-Coder:编程大模型

选择模型

参数大小

  • 1B
  • 10B
  • 100B

开源 vs 闭源

  • 开源
    • 完全掌控
    • 隐私保护
    • 数据访问控制
    • 边端运行
    • 社区支持
  • 闭源
    • 云 API
    • 易用
    • 功能强大
    • 成本低
    • 安全性低

LLM 如何遵循指令

  • SFT (Supervised Fine-tuning)
    • 微调以遵循指令并回答问题
  • RLHF (Reinforcement Learning from Human Feedback)
    • 人类反馈中进行强化学习,训练生成更好的回答

代理(Agent)

  • 规划、行动
  • 使用工具

任务分析

每个角色的工作一般由多个任务组成,需要先分解任务,然后对每个任务进行生成式人工智能潜力分析。

人工智能赋能任务的方式

  • 增强
  • 自动化

要完成使用人工智能来增强或自动化任务,需要考虑的主要因素:

  • 技术可行性
  • 业务价值

  • 成本节省 -> 收入增长
  • 改造工作流程

团队

  • 软件工程师
    • 负责产品的研发
    • 提示工程
  • 机器学习工程师
    • 负责 AI 系统的研发
    • 提示工程、微调、RAG
  • 产品经理
    • 负责产品
  • 提示工程师
    • 很少有专门设置这个岗位
  • 数据工程师
    • 负责数据的处理
    • 负责数据的质量
    • 负责数据的安全
  • 数据科学家
    • 负责数据的分析
    • 指导项目或业务决策
  • 项目经理
    • 负责项目的管理
  • 机器学习科学家(研究员)
    • 负责开发先进的人工智能技术
    • 将先进的人工智能技术应用到实际的业务场景中

AI 担忧

RLHF 已经证明可以使用 LLM 在性别、种族、宗教和其他人类特征方面不受偏见地生成文本。

参考资料