3 篇文章带有标签 “edge-ai”

2026年6月4日星期四

端侧AI：Gemma 4 12B 创新架构与 LiteRT-LM 本地部署指南

Gemma 4 12B

Gemma 4 12B 是谷歌最新推出的一款原生、无编码器（Encoder-free）的统一多模态大模型。它的核心定位是将高水平的“智能体（Agentic）”和多模态能力直接带到用户的笔记本电脑等日常消费级硬件上。

以下是对 Gemma 4 12B 大模型的详细介绍：

1. 创新的统一架构：无编码器设计（Encoder-free）

与传统的多模态模型（通常需要使用独立的、冻结的视觉或音频编码器将数据转化为文本格式）不同，Gemma 4 12B 采用了统一的、仅解码器（Decoder-only）的 Transformer 架构。

视觉嵌入器（Vision Embedder）：仅有 35M 参数，取代了传统复杂的视觉 Transformer 层。它将 48x48 像素的原始图像块（Patches）通过单次矩阵乘法直接投影到大语言模型（LLM）的隐藏维度中，并利用 X 和 Y 矩阵的坐标查找技术，直接将空间位置信息附带在输入中。
音频波形投影（Audio Wave Projection）：完全取消了独立的音频编码器。它直接将 16 kHz 的原始音频信号切片为 40ms 的帧（每帧包含 640 个浮点数），并通过线性投影无缝输入到 LLM 的空间中。

2026-06-04 18:00

2026年1月10日星期六

分析基于边端电力设备的人工智能应用

基于边端电力设备的报文需要使用人工智能

这是一个非常前沿且具有实际意义的问题。简单直接的回答是：是的，在边端电力设备中引入人工智能（AI）处理报文，正在从“锦上添花”转变为“行业刚需”。

传统的电力报文处理主要依赖预设规则和阈值报警，但在复杂的现代电网环境下，这种方式已显露疲态。

以下是为什么边端电力设备报文需要 AI 的核心原因及应用场景：

1. 毫秒级的实时响应需求

电力系统的故障处理通常要求在到内做出反应。

传统痛点： 如果将海量报文上传到云端处理，网络延迟和带宽压力会导致响应滞后。
AI 优势： 在边缘侧部署轻量化 AI 模型（如卷积神经网络 CNN 或长短期记忆网络 LSTM），可以直接在设备端实时解析 GOOSE、SV 等协议报文，瞬间识别出瞬时故障并触发保护机制。

2. 网络安全与入侵检测

电力报文（如 IEC 61850、DNP3）往往缺乏复杂的加密，容易受到恶意篡改或重放攻击。

AI 应用： AI 可以学习正常报文的“行为基准”（流量特征、时间间隔、序列逻辑）。一旦黑客尝试通过异常报文操纵开关，AI 能基于异常检测算法识别出这种不符合常规逻辑的行为并阻断，这是静态规则防火墙难以做到的。

3. 故障预测与健康管理 (PHM)

报文不仅是指令，还包含丰富的设备状态数据。

应用场景： 通过对变压器、断路器上报的采样值（SV）报文进行深度挖掘，AI 可以捕捉到波形中极其细微的畸变或局部放电特征。
价值： 在设备真正坏掉之前，AI 就能发现其性能衰减的趋势，从而实现**从“事后维修”到“预测性维护”**的转变。

2026-01-10 08:00

电力边缘计算人工智能报文处理电力ai edge-ai 智能电网 onnx-runtime cnn lstm

2025年7月3日星期四

这些文档主要围绕着在 NVIDIA Jetson AGX Orin 开发者套件上部署 多模态大型语言模型 (LLMs) 所面临的 系统升级挑战。核心问题在于，当前系统的 JetPack、Ubuntu、CUDA 和 GPU 驱动版本 过低，无法满足 vLLM 和 Ollama 等主流推理框架对 更高 CUDA 和驱动版本 的要求。文章详细阐述了 升级至 JetPack 6.0 是解决兼容性问题的关键，但这将强制要求 将 Ubuntu 升级到 22.04，从而导致 需要重装系统 和 可能与 ROS1 产生兼容性问题 等一系列复杂挑战。此外，文档还探讨了 替代推理引擎和云端推理 等备选方案，但最终建议进行 系统全面升级 以实现长期兼容性和性能优化。

系统信息

硬件环境：ARM64 架构，具体为 NVIDIA Jetson AGX Orin 开发者套件。

当前系统配置

软件环境：
- Ubuntu版本：20.04
- GPU驱动版本：515
- JetPack版本：5.1.4
- CUDA版本：11.4
- Python版本：3.8
- 机器人操作系统：ROS1（Robot Operating System 1）

系统升级需求

Ubuntu版本：22.04
GPU驱动版本：535
JetPack版本：>=6.0
CUDA版本：>=12.2
Python版本: 3.9 - 3.12

2025-07-03 16:00

jetson jetson-agx-orin edge-ai multimodal vllm ollama cuda jetpack arm64 人形机器人

3 篇文章带有标签 “edge-ai”

2026年6月4日 星期四

端侧AI：Gemma 4 12B 创新架构与 LiteRT-LM 本地部署指南

2026年1月10日 星期六

分析基于边端电力设备的人工智能应用

2025年7月3日 星期四

Jetson AGX Orin大模型部署挑战与系统升级

2026年6月4日星期四

2026年1月10日星期六

2025年7月3日星期四