评估模型投资分析能力:京东健康案例

优先使用:豆包Grok

基于京东健康上市后历年的财报,从价值投资的角度进行分析。

文件

  • 京东健康 2020 年度报告.pdf
  • 京东健康 2021 年度报告.pdf
  • 京东健康 2022 年度报告.pdf
  • 京东健康 2023 年度报告.pdf
  • 京东健康 2024 年度报告.pdf
  • 京东健康 2025 中期报告.pdf
下面是我使用提示词:“基于京东健康上市后历年的财报,从价值投资的角度进行分析。”对多个大语言模型进行的分析结果。你作为一个评判专家,请对比各模型的分析内容,给出你的综合评价。

综合AI助手,全面回答工作、学习、生活各类问题

千问系列中最强大的语言模型

Cursor 的上下文工程与编程智能体

《Context Engineering & Coding Agents with Cursor》(Cursor 的上下文工程与编程智能体),由 Cursor 团队成员 Lee 和 CEO Michael 主讲。视频深入探讨了软件开发的演变、Cursor 如何利用 AI 提升编程效率,以及未来编程智能体的发展方向。

  • Cursor Tab (代码补全)
  • Cursor 的 Tab 功能深受 GitHub Copilot 启发,但已从简单的“预测下一个词”进化为“预测下一个动作”甚至“预测光标去向”。
  • 强化学习:模型会根据用户的“接受”或“拒绝”操作进行实时在线强化学习(RL),在 30 分钟内即可更新模型行为。
  • 平衡性:Cursor 致力于在建议速度(不打断心流)和建议质量之间找到平衡点。
  • 混合检索策略
  • 字符串匹配:单纯依靠 grep (字符串匹配) 是不够的。
  • 语义搜索:Cursor 通过对代码库建立索引(embeddings),即使文件名不完全匹配(如 header.tsx vs "top navigation"),也能通过语义准确找到相关代码。
  • 结合 grep 和语义搜索能带来最佳的代码接受率。
  • Bugbot:Cursor 内部开发的一个用于代码审查的 AI 工具,能发现人类审查中遗漏的逻辑漏洞。
  • 长程任务与规划

让智能体在编写代码前先进行“规划”和“研究”,能显著提

DeepSeek Engram:类脑记忆存储与检索新范式

Engram 是一种旨在增强大语言模型性能的条件记忆(Conditional Memory)模块。传统的 Transformer 架构在处理静态知识检索时效率较低,往往需要通过复杂的计算来模拟记忆,而 Engram 通过现代化的 N-gram 哈希查找实现了常数级时间复杂度 O(1) 的知识获取。研究者揭示了一种 U 型缩放法则,证明在固定参数预算下,平衡条件计算(MoE)静态内存(Engram) 能显著提升模型在推理、代码及数学任务中的表现。实验分析表明,Engram 能减轻模型底层对基础模式的重复构建,从而释放更多算力用于处理全球上下文和深度推理。此外,Engram 的确定性寻址特性支持从主机内存预取数据,使其能在不增加硬件负担的情况下实现大规模参数扩张。最终,该技术为构建更高效、具备长文本处理能力的新一代稀疏模型提供了核心原语。

记忆内存的参数就像是图书馆书架上的一本本百科全书,记录着世界上的事实;而 Engram 模块的参数就像是一位经验丰富的图书管理员。管理员通过训练(学习),能够根据你当前提出的研究课题(隐藏状态),迅速判断哪些百科全书的条目是有用的,哪些是由于名字相似而找错的(哈希冲突),并帮你把这些知识翻译成你研究报告能用的语言(投影整合)。

该模块通过检索静态 N-gram 记忆,并利用上下文感知门控(context-aware gating)将其与动态隐藏状态融合

AI 编程的演进:从插件到原生 IDE 再到 CLI 工具

AI 编程的演进逻辑非常清晰:GitHub Copilot 作为插件,在传统 IDE 里为大众提供辅助;Cursor 则打破束缚,通过 AI 原生 IDE 实现了深度的体验跃迁;而 Claude Code 这类 CLI 工具,则是为追求极致自由与自动化的极客准备的——它摆脱了图形界面的繁琐,让开发者在命令行中,就能以‘操作指令’驱动 AI 完成从编码到部署的全流程。

维度 GitHub Copilot Cursor Claude Code
代表形态 IDE 插件 (Plugin) AI 原生 IDE (Forked) CLI 智能体 (Agent)
正式发布/爆发时间 2021年6月 (预览) / 2022年6月 (正式) 2023年 (起步) / 2024年底 (爆发) 2025年2月 (GA)
年营收 (ARR) 20亿+(2025Q3数据)20 亿+ (2025年Q3数据) 10 亿+ (2025年底估算) $10 亿+ (上线6个月即达成)
用户规模 2000万+ 开发者 100万+ 付费用户 爆发式增长中 (API驱动)
核心地位 行业标准与基建 效率工具的巅峰 自主编程的开端

登基时间: 2021-2022年。它是 AI 编程的开创者,利用 GitHub 庞大的生态系统,迅速完成了从 0 到 1 的教育。

NVIDIA CES 2026:物理 AI 时代来了

NVIDIA 正致力于打造全栈物理AI(Physical AI)平台,推动人工智能从数字领域向理解并交互物理世界跨越。该平台的核心由 Cosmos 世界模型、Omniverse 模拟环境以及针对机器人(GROOT)和自动驾驶(Alpamayo)的专属模型组成。

在硬件层面,NVIDIA 推出了突破性的 Vera Rubin 架构。其中,Rubin GPU 拥有 3360 亿个晶体管,其推理性能达到 Blackwell 的 5 倍;Vera CPU 则配备 88 个定制内核,显著提升了系统内存带宽。配合 BlueField-4 DPU 和 NVLink 6 技术,NVIDIA 构建了能够支持海量算力需求的 AI 基础设施。

NVIDIA Omniverse:是 NVIDIA 推出的、基于 OpenUSD 的实时 3D 开发与协作平台,核心用于构建大规模 3D 应用、工业数字孪生及物理 AI 仿真,依托 RTX 渲染与 GPU 加速,实现跨工具互操作、实时协作与高保真模拟,支持云边端灵活部署。 NVIDIA Cosmos:这是一款为物理 AI 设计的世界基础模型(World Foundation Model)。它能理解物理定律(如重力、惯性、碰撞),并能将合成数据(Synthetic Data)转化为训练 AI 的高质量数据,解决物理世界数据稀缺的问题。

分析基于边端电力设备的人工智能应用

这是一个非常前沿且具有实际意义的问题。简单直接的回答是:是的,在边端电力设备中引入人工智能(AI)处理报文,正在从“锦上添花”转变为“行业刚需”。

传统的电力报文处理主要依赖预设规则阈值报警,但在复杂的现代电网环境下,这种方式已显露疲态。

以下是为什么边端电力设备报文需要 AI 的核心原因及应用场景:

电力系统的故障处理通常要求在 到 内做出反应。

  • 传统痛点: 如果将海量报文上传到云端处理,网络延迟和带宽压力会导致响应滞后。
  • AI 优势: 在边缘侧部署轻量化 AI 模型(如卷积神经网络 CNN 或长短期记忆网络 LSTM),可以直接在设备端实时解析 GOOSE、SV 等协议报文,瞬间识别出瞬时故障并触发保护机制。

电力报文(如 IEC 61850、DNP3)往往缺乏复杂的加密,容易受到恶意篡改或重放攻击。

  • AI 应用: AI 可以学习正常报文的“行为基准”(流量特征、时间间隔、序列逻辑)。一旦黑客尝试通过异常报文操纵开关,AI 能基于异常检测算法识别出这种不符合常规逻辑的行为并阻断,这是静态规则防火墙难以做到的。

报文不仅是指令,还包含丰富的设备状态数据。

  • 应用场景: 通过对变压器、断路器上报的采样值(SV)报文进行深度挖掘,AI 可以捕捉到波形中极其细微的畸变或局部放电特征。
  • 价值: 在设备真正坏掉之前,AI 就能发现其性能衰减的趋势,从而实现**从“事后维修”到“预测性维护”**的转变。

深度网络连接范式演进:残差连接 → 超连接 (HC) → 流形约束超连接 (mHC)

深度神经网络架构的演进,本质上是在寻找梯度稳定性特征表达力的最优解:残差连接 通过恒等映射初步破解了深层网络的退化难题,但在缓解梯度消失与防止表征坍缩之间仍存在“跷跷板效应”;超连接(HC) 在此基础上打破了固定连接的束缚,通过引入可学习的深度连接与宽度连接,允许网络“自主学习最优连接强度”,显著提升了大模型训练的性能;流形约束超连接(mHC) 则通过将 HC 的连接矩阵投影至双随机流形,利用数学上的凸组合约束恢复了恒等映射的数值稳定性,并辅以算子融合、选择性重算和 DualPipe 通信重叠等工程优化,最终在大模型训练中实现了训练稳定性和显著降低延迟负载。

在深度学习中,梯度消失(Vanishing Gradient)梯度爆炸(Exploding Gradient) 是训练深层神经网络时经常遇到的两个核心障碍。

它们本质上是由于神经网络在反向传播过程中,梯度通过多层链式法则累积相乘导致的数值稳定性问题。

在反向传播时,我们需要计算损失函数对某一层权重的偏导数。根据链式法则,对于每一层,其梯度贡献项通常与激活函数的导数以及权重的数值有关。

梯度消失: 如果每一层的梯度项都小于 1(例如使用 Sigmoid 激活函数,其导数最大值仅为 0.25),经过 层连乘后,梯度会呈指数级衰减。当层数很多时,靠近输入层的梯度会变得接近于 0,导致权重无法更新,网络停止学习。

2026 年飞马图像生成

2026年新年来了,生成一张红色的飞马图像。以这个为基础写个生成图像的提示词

一只雄伟的飞马(天马)在绚烂的夜空中展翅翱翔,周围环绕着金色与橙红色的新年烟火,鬃毛与翅膀边缘散发柔和光芒,背景为深红色星空与闪烁的星光,风格融合奇幻艺术与节日喜庆,色彩以红色、金色为主,充满动态与希望感,4K高清,细节精致,史诗光影。

美团核心能力与护城河分析

美团历年财报2018年至2025年上半年)来看,其核心能力已从早期的 “Food + Platform” 演进为 “零售+科技” 战略。在2025年上半年对“美团优选”进行战略转型并撤出亏损区域后,美团的护城河更加聚焦于高效率的即时履约网络和强大的零售生态体系。

以下是基于财报的美团核心能力与护城河分析:

总结建议与比喻: 如果把本地商业市场比作一座特大型水利枢纽,美团的即时配送网络就是那条错综复杂但流量巨大的引水渠系。虽然早期渠道建设(如新业务探索)投入巨大且伴随亏损,但一旦建成并连接了庞大的水源(商家)与农田(用户),它便能产生稳定的电能(佣金与广告收入)。在2025年关闭亏损的社区团购(美团优选)业务后,美团将资源更多地引向即时零售(美团闪购)线上超市(小象超市),这使得整个水利系统的运行效率更高,壁垒也更加稳固。

2025 年大模型实践总结

这一阶段负责采集人类的原始动作数据。图中列出了两种主要技术:

  • PN Studio (惯性动捕): 利用惯性传感器套件。优点是成本低、易用、环境适应性强。
  • HybridTrack (光学动捕): 利用摄像头和标记点。优点是鲁棒性强、精度极高。

捕捉到的信号通过 Axis StudioHybrid Data Server 进行初步处理。

  • 数据类型: 包括高精度动捕数据、6DOF(六自由度)数据、原始加速度(ACC)和陀螺仪(GYRO)数据,以及同步时间戳。
  • 接口类型: 支持 MocapApi、VRPN 以及专门的 Isaac 插件。

这是将人类动作转化为机器人动作的关键步骤。

  • 输入格式: 常见的 3D 动画格式,如 .FBX.MBX.BVH 和数据格式 .CSV
  • 重定向 (Retargeting): 通过算法将人类的骨架运动映射到机器人的 URDF(统一机器人描述格式)模型上,确保动作符合机器人的物理结构约束。

展示了开发和仿真所使用的核心软件生态:

  • 编程语言: C++ 和 Python。
  • 中间件: ROS (Robot Operating System),用于机器人控制。
  • 仿真环境: NVIDIA ISAAC,一个强大的机器人仿真和人工智能训练平台。

最终的应用成果,分为两个方向:

硬件执行: 将动作应用到不同形态的机器人上,包括人形机器人、机械臂、灵巧手以及仿生机器人(如四足机器人)。

FunASR:多模型协同推理与语音处理全链路实践 (ASR, VAD, PUNC, SV)

本文详细介绍了 FunASR 这一基础语音识别工具包,它提供了一套完整的语音处理服务,涵盖了离线转写和实时听写两大核心功能。其技术核心在于 AutoModel 多模型协调引擎,能够将不同的组件,如语音活动检测(VAD)、自动语音识别(ASR)、标点恢复和说话人分离(SV),按序串联起来,实现复杂的音频转录任务。文档清晰展示了从原始音频输入到最终带说话人标签的转录结果的完整处理流程和数据流向。此外,本文不仅罗列了支持的多种中英文模型清单,还附带了音频格式转换指南和代码示例。最后,通过实验性能对比,文章论证了在不同硬件上,结合 VAD、PUNC 和 SV 等组件后对推理用时和处理准确性的影响。

模型名称 中文准确度 英文/混合识别 可读性 (标点) 附加功能 综合评分
Fun-ASR-Nano 极高 完美 极佳 生产环境级别 5.0
SenseVoiceSmall 较弱 (漏失) 较好 情感/事件检测 4.0
paraformer-zh (ASR) 一般 极差 原始数据 2.0
paraformer-zh (+VAD +PUNC) 中等 优秀 自动断句 4.5

建议

如果你的场景需要极致的准确率和排版,首选 Fun-ASR-Nano。 如果你的场景需要分析说话人的情绪,SenseVoiceSmall 是唯一的选择。

PowerShell 脚本示例

# 核心参数配置(无需修改,已按你的需求设定)
$targetMinDate = Get-Date "2024-06-01"  # 目标日期区间:开始
$targetMaxDate = Get-Date "2024-12-31"  # 目标日期区间:结束
$hourMin = 8                            # 限制最小小时(8点)
$hourMax = 21                           # 限制最大小时(21点,因22点不包含,实际最晚21:59:59)
$folderPath = "D:\test"                 # 要遍历的目录
$skipExtension = ".eml"                 # 需跳过的文件后缀
$logFilePath = "D:\log.txt"  # 日志文件路径(与脚本同目录)

# 生成目标区间内随机时间(限制8:00-22:00)的函数
function Get-RandomTargetDateTime {
    param(
        [datetime]$DateMin = $targetMinDate,
        [datetime]$DateMax = $targetMaxDate,
        [int]$HourMin = $hourMin,
// ...

该PowerShell脚本的核心功能是 批量筛选并修改指定目录下文件的修改时间,同时跳过特定类型文件、记录操作日

未来 5 年公司智算需求预测

用半精度浮点数(FP16)计算能力评估服务器的智能计算能力,服务器算力=处理器芯片数x每时钟周期执行单精度浮点运算次数x处理器主频x处理器核数。

截至 2025 年 3 月底,我国智算规模达 748EFLOPS(FP16),近五年平均增速达 49%

配置级别 硬件描述 FP16 峰值算力 备注
单卡 昇腾 910B4 (32GB) 280 TFLOPS 单卡 FP16 算力峰值
单机 Atlas 800I A2 服务器 (8 x 910B4) 2240 TFLOPS (2.24 PFLOPS2.24 \text{ PFLOPS}) 服务器搭载 8 张 910B4 卡
集群 5 台 Atlas 800I A2 服务器 11.2 PFLOPS 由 5 台服务器组成的集群
配置级别 硬件描述 FP16 峰值算力 备注
单卡 NVIDIA T4 65 TFLOPS 使用混合精度 Tensor Cores
单机 4 卡服务器 260 TFLOPS 服务器搭载 4 张 T4 卡
集群 4 台 4 卡服务器 1.04 PFLOPS 由 4 台服务器组成的集群
硬件平台 总算力 (FP16 峰值)
昇腾 910B4 集群 11.2 PFLOPS
NVIDIA T4 集群 1.04 PFLOPS
总计 12.24 PFLOPS

2025-12-01-reachy-mini

conda create -n reachy-mini python=3.10.9 -y
conda activate reachy-mini
pip install reachy-mini[mujoco]

智能会议系统 Jetson Thor 上部署模型服务指南

内网IP27.41.19.62

服务 说明 端口 模型 备注
whisperlivekit 实时语音识别服务 8000 Whisper
small (默认)
large-v3-turbo
说话人分离
FunASR 实时语音识别服务 8000 语音识别paraformer-zh
实时语音识别paraformer-zh-streaming
实时语音端点检测fsmn-vad
标点恢复ct-punc
文本逆规范化fst_itn_zh
实时与非实时一体化协同(2pass)服务模式
llama-server GGUF 模型推理服务 8080 Qwen3
Qwen3-8B-Q5_K_M.gguf
模型名:qwen3
上下文长度:32K
不思考
sudo nvpmodel -m 0
sudo jetson_clocks
sync && echo 3 | sudo tee /proc/sys/vm/drop_caches
tmux new -s wlk
docker run -it \
  --ipc=host \
  --net=host \
  --runtime=nvidia \
  -e MODEL=small \
  -e PORT=8000 \
  -e LANG=zh \
  -e DIAR=true \
  wangjunjian/whisperlivekit

FunASR - 基础语音识别工具包

FunASR 是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。

FunASR离线文件转写软件包,提供了一款功能强大的语音离线文件转写服务。拥有完整的语音识别链路,结合了语音端点检测、语音识别、标点等模型,可以将几十个小时的长音频与视频识别成带标点的文字,而且支持上百路请求同时进行转写。输出为带标点的文字,含有字级别时间戳,支持ITN与用户自定义热词等。服务端集成有ffmpeg,支持各种音视频格式输入。软件包提供有html、python、c++、java与c#等多种编程语言客户端。

FunASR实时语音听写软件包,集成了实时版本的语音端点检测模型、语音识别、语音识别、标点预测模型等。采用多模型协同,既可以实时的进行语音转文字,也可以在说话句尾用高精度转写文字修正输出,输出文字带有标点,支持多路请求。依据使用者场景不同,支持实时语音听写服务(online)、非实时一句话转写(offline)与实时与非实时一体化协同(2pass)3种服务模式。软件包提供有html、python、c++、java与c#等多种编程语言客户端。

  • 在线 CPU 版本

SenseVoice

SenseVoice 是具有音频理解能力的音频基础模型,包括语音识别(ASR)、语种识别(LID)、语音情感识别(SER)和声学事件分类(AEC)或声学事件检测(AED)。

SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测

  • 多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。
  • 富文本识别:
    • 具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。
    • 支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。
  • 高效推理: SenseVoice-Small 模型采用非自回归端到端框架,推理延迟极低,10s 音频推理仅耗时 70ms,15 倍优于 Whisper-Large。
  • 微调定制: 具备便捷的微调脚本与策略,方便用户根据业务场景修复长尾样本问题。
  • 服务部署: 具有完整的服务部署链路,支持多并发请求,支持客户端语言有,python、c++、html、java 与 c# 等。

  • 语音识别(ASR)
  • 语言识别(LID)
  • 语音情感识别(SER)
  • 音频事件检测(AED,比如笑声、掌声、背景音乐、咳嗽等)
  • 逆文本归一化(ITN)
git clone https://github.com/FunAudioLLM/SenseVoice
cd SenseVoice

SimulStreaming — 实时流式语音识别工具包

SimulStreaming 实现了 Whisper 模型的同步翻译和转录功能(在语音识别领域被称为流式传输)。SimulStreaming 采用了最先进的同步策略 AlignAtt,这使其具备极高的速度和效率。

git clone https://github.com/ufal/SimulStreaming
cd SimulStreaming
pip install -r requirements.txt

WhisperLiveKit - 实时语音识别

实时、完全本地化的语音转文本,带说话人识别功能

docker run -it \
    --ipc=host \
    --net=host \
    --runtime=nvidia \
    --name=whisperlivekit \
    -v ~/.cache:/root/.cache \
    -v /models:/models \
    nvcr.io/nvidia/pytorch:25.10-py3 \
    bash
mkdir -p .cert && cd .cert

openssl req -x509 -newkey rsa:4096 \
  -keyout key.pem \
  -out cert.pem \
  -days 365 \
  -nodes \
  -subj "/C=CN/ST=ShanDong/L=JiNan/O=LNSoft/OU=LNSoft/CN=localhost/emailAddress=wjj@163.com"
  • -x509:生成自签名证书
  • -newkey rsa:4096:新建 4096 位 RSA 密钥
  • -keyout key.pem:输出私钥文件
  • -out cert.pem:输出证书文件
  • -days 365:证书有效期 365 天
  • -nodes:不加密私钥(即无需输入密码)
  • -subj:直接指定证书主题,跳过交互式输入