9 篇文章带有标签 “人工智能”

惨痛的教训(The Bitter Lesson)

AI 的未来不在于将人类现有的经验硬塞给机器,而在于设计出能够利用无限算力进行搜索与学习的“元方法”。

回顾70年人工智能研究历程,最深刻的一条教训是:依托算力的通用方法,最终效果远超其他路径,且优势极其显著。究其根本,源于摩尔定律——或者更广义地说,单位计算成本持续呈指数级下降。绝大多数人工智能研究开展时,都默认智能体可使用的算力是恒定的(这种情况下,借助人类知识就成了提升性能为数不多的手段之一)。但只要研究周期稍长于普通科研项目,海量算力必然会成为现实。

研究者为追求短期见效的性能提升,往往试图融入自身对领域的人类认知;但从长远来看,真正起决定性作用的,只有对算力的充分利用。这两条路径本不必相互对立,现实中却常常冲突:投入在一方的时间,就无法用于另一方。研究者会在心理上执着于某一种研究思路;而依赖人类知识的方法,往往会让模型变得复杂,反而难以适配依托算力的通用优化路径。

人工智能研究者们屡屡迟来地领悟到这一惨痛教训,回顾其中几个典型案例,颇具启发意义。

在国际象棋领域,1997年击败世界冠军卡斯帕罗夫的算法,依靠的是大规模深度搜索。彼时,多数国际象棋计算机研究者对此倍感沮丧——他们此前一直钻研的,是融入人类对国际象棋特有棋局结构理解的方法。

分析基于边端电力设备的人工智能应用

这是一个非常前沿且具有实际意义的问题。简单直接的回答是:是的,在边端电力设备中引入人工智能(AI)处理报文,正在从“锦上添花”转变为“行业刚需”。

传统的电力报文处理主要依赖预设规则阈值报警,但在复杂的现代电网环境下,这种方式已显露疲态。

以下是为什么边端电力设备报文需要 AI 的核心原因及应用场景:

电力系统的故障处理通常要求在 到 内做出反应。

  • 传统痛点: 如果将海量报文上传到云端处理,网络延迟和带宽压力会导致响应滞后。
  • AI 优势: 在边缘侧部署轻量化 AI 模型(如卷积神经网络 CNN 或长短期记忆网络 LSTM),可以直接在设备端实时解析 GOOSE、SV 等协议报文,瞬间识别出瞬时故障并触发保护机制。

电力报文(如 IEC 61850、DNP3)往往缺乏复杂的加密,容易受到恶意篡改或重放攻击。

  • AI 应用: AI 可以学习正常报文的“行为基准”(流量特征、时间间隔、序列逻辑)。一旦黑客尝试通过异常报文操纵开关,AI 能基于异常检测算法识别出这种不符合常规逻辑的行为并阻断,这是静态规则防火墙难以做到的。

报文不仅是指令,还包含丰富的设备状态数据。

  • 应用场景: 通过对变压器、断路器上报的采样值(SV)报文进行深度挖掘,AI 可以捕捉到波形中极其细微的畸变或局部放电特征。
  • 价值: 在设备真正坏掉之前,AI 就能发现其性能衰减的趋势,从而实现**从“事后维修”到“预测性维护”**的转变。

国务院关于深入实施“人工智能+”行动的意见

《国务院关于深入实施“人工智能+”行动的意见》旨在推动人工智能与经济社会各领域深度融合,重塑生产生活范式,加速形成人机协同、跨界融合、共创分享的智能经济和智能社会新形态。意见以习近平新时代中国特色社会主义思想为指导,利用我国数据、产业、场景优势,提出到2035年全面步入智能经济社会的发展目标。

核心行动包括:科学技术(加速科学发现,如新型科研范式、科学大模型建设、基础科研平台智能化升级、高质量科学数据集、跨学科融合,并驱动技术研发创新);产业发展(培育智能原生新业态,推进工业、农业、服务业智能化转型);消费提质与民生福祉(拓展智能服务与产品消费,创造智能工作与学习方式,提升生活品质);治理能力(构建人机共生社会、多元共治安全与生态治理新格局);以及全球合作(推动人工智能普惠共享,共建全球治理体系)。

为支撑上述行动,意见强调强化八大基础支撑能力,涵盖模型基础能力、数据供给创新、智能算力统筹、应用发展环境优化、开源生态繁荣、人才队伍建设、政策法规保障及安全能力水平提升。组织实施上,由国家发展改革委牵头统筹协调,确保各项部署落地见效。

国务院关于深入实施“人工智能+”行动的意见

国发〔2025〕11号

各省、自治区、直辖市人民政府,国务院各部委、各直属机构:

为深入实施“人工智能+”行动,推动人工智能与经济社会各行业各领域广泛深度融合,重塑人类生产生活范式,促进生产力革命性跃迁和生产关系深层次变革

人工智能时代的软件 (Software in the era of AI) - Andrej Karpathy

主要介绍了软件开发领域正在经历的重大变革,将其分为软件1.0(传统手工编码)、软件2.0(基于神经网络权重训练)和软件3.0(通过自然语言提示编程大型语言模型)。演讲者将大型语言模型(LLMs)比作新型操作系统基础设施,指出它们既具备公用事业的性质(按量付费、集中式),也展现出类似芯片制造厂和操作系统的特征,且目前仍处于早期阶段(类似于1960年代的计算)。进一步探讨了LLMs的认知特性(如广博知识、幻觉、记忆局限),并强调了开发部分自主应用的重要性,这些应用能让人类通过图形用户界面自主性滑块有效监督AI。最后,演讲者提出,随着自然语言编程的兴起,人人皆可编程,并呼吁开发者为智能体优化数字基础设施和文档,预示着一个由人类与AI协作构建的 “钢铁侠战衣”式未来

Map of GitHub 是一个创新的数据可视化项目,旨在以交互式地图的形式展示 GitHub 上的开源项目生态。该项目由开发者 Anvaka 创建,通过复杂的算法和可视化技术,将超过 400,000 个 GitHub 仓库以节点和连接的形式呈现,帮助用户探索项目之间的关联、技术趋势以及开源社区的演变。

北京智源人工智能研究院(BAAI)

本文档概述了北京智源人工智能研究院 (BAAI),一个致力于推动人工智能原始创新的新型研发机构。它详细介绍了 BAAI 的发展历程,从2018年成立至今,以及其在大型人工智能模型领域取得的重大进展,包括推出 FlagOpen 开放平台。此外,来源还介绍了 BAAI具身智能生命科学等前沿领域的具体研究成果,例如 RoboOS 2.0OpenComplex2。整体而言,这份资料展现了 BAAI构建通用人工智能推动开放生态以及解决现实世界问题方面的努力和愿景。

LLM 推理在软件任务中扮演什么角色?

大型语言模型(LLM)的工作原理根植于模式匹配和对下一个词元的统计预测("随机鹦鹉")。从这种方法中产生的一个有些出人意料的能力是它们也能在一定程度上"推理"解决问题。有些模型的推理能力比其他模型更强,OpenAI的"o1"和"o3"模型是两个突出的推理模型,而DeepSeek的"R1"最近引起了很大轰动。但是当我们在编码任务中使用AI时,这种能力发挥什么作用呢?

剧透提醒:我还没有答案!但我有问题和想法。

我将从两个方面开始讨论,这两个方面在我的理解中是推理能力的限制,而且这些限制在编码环境中是相关的。然后我将分享我的想法,即推理在哪些编码任务中可能有用,在哪些任务中可能没用。

他们发现:

  1. 姓名和数字的变化会影响模型解决问题的性能。即使推理步骤完全相同(Sophie看她的侄子变成Anita看她的孙女,或者是12个毛绒玩具而不是8个),模型解决问题的性能也不一致,甚至比原始基准测试略有下降。
  1. 当问题的难度和规模增加时,性能进一步下降。
  1. 最后,他们发现在问题中添加无关信息对性能有很大的负面影响。

首先,这是一个很好的例子,说明为什么我们应该对LLM基准测试持保留态度。

在编码环境中,我发现最后一个发现特别有趣。

探索生成式人工智能

生成式人工智能和特别是大型语言模型(LLM)已迅速进入公众意识。像许多软件开发人员一样,我对其可能性感到好奇,但不确定它最终对我们的职业意味着什么。我现在在Thoughtworks担任一个角色,协调我们关于这项技术将如何影响软件交付实践的工作。我将在这里发布各种备忘录,描述我和同事们正在学习和思考的内容。

随着智能代理编码助手变得越来越强大,反应各不相同。有些人从最近的进步推断并声称,"一年后,我们将不再需要开发人员。"其他人则对AI生成代码的质量以及为初级开发人员准备应对这一变化的挑战表示担忧。

在过去几个月中,我定期使用Cursor、Windsurf和Cline中的智能代理模式,几乎完全用于更改现有代码库(而不是从头创建井字游戏)。总体而言,我对IDE集成的最新进展以及这些集成如何极大地提升工具辅助我的方式印象深刻。它们

  • 执行测试和其他开发任务,并尝试立即修复出现的错误
  • 自动识别并尝试修复代码检查和编译错误
  • 能够进行网络研究
  • 有些甚至集成了浏览器预览功能,可以捕获控制台错误或检查DOM元素

所有这些都带来了与AI令人印象深刻的协作会话,有时帮助我在创纪录的时间内构建功能和解决问题。

然而。

即使在那些成功的会话中,我也一直在干预、纠正和引导。而且我经常决定不提交更改。

生成式人工智能

生成式AI是指能够根据提示或指令创建新内容的AI系统。这些系统被训练于大量数据,学习识别模式并生成类似于训练数据的新输出。现代生成式AI多为基于神经网络架构的深度学习系统。

目前主导生成式AI讨论的是大型语言模型(LLMs)。这些是经过大量文本训练的模型,可以生成连贯的文本,预测给定上下文中最可能的下一个词。尽管基础架构可能很复杂,但我们可以将其视为一个复杂的自动补全系统。

LLMs展现出的能力远超过以前的生成系统,它们能够:

  • 以难以与人类创作区分的方式撰写文章、小说、诗歌或代码
  • 回答问题、提供建议、编写报告、总结文档
  • 理解上下文并保持对话连贯性
  • 同时处理多种语言
  • 理解代码并生成新代码

生成式AI已经在许多领域展示出其应用潜力:

开发人员正在使用生成式AI工具(如GitHub Copilot、Amazon CodeWhisperer和Google Duet AI)来加速编码过程。这些工具可以:

  • 生成样板代码
  • 提出完整函数和算法
  • 帮助编写测试
  • 解释现有代码
  • 重构代码以提高质量
  • 生成文档

生成式AI可以产生各种形式的内容:

  • 博客文章、社交媒体更新和营销文案
  • 个性化电子邮件和通信
  • 产品描述和目录
  • 视频脚本和广告文案

生成式AI正在改变企业与客户的互动方式:

  • 聊天机器人和虚拟助手
  • 智能响应建议
  • 自动票务分类和路由
  • 知识库生成和维护

从DALL-E到Midjourney等工具正在改变设计流程: 生成概念艺