llm - 第 6 页 - 标签 - 军舰的日志

2024年5月10日星期五

使用大型语言模型进行命名实体识别

总结

Qwen 模型的指令遵循还是差强人意，这里使用的参数应该是 72B
大型语言模型发挥了它的生成能力，会在原文的基础上给你增加内容，如：济南市。
问题变化多样，示例也不可能覆盖所有的情况，写的越多占用的上下文长度越大。
在实验二中
- 明确说明Date实体类型的值，并没有很好的识别出来，如：3月识别为Month，一季度识别为Quarter，今年识别为Year。这个跟模型有关，ChatGPT就识别的不错。
在实验三中
- 明确说明不要增加实体类型，但还是增加了，如：County实体类型。
- 识别的实体有重叠文字，如：曹县，曹县供电公司。
- 位置很容易出错，一旦出错后面的实体位置都是错误的了。
使用XML标记方式比输出json结果方式效果更好。

代码 from langchain_core.output_parsers import StrOutputParser from langchain_core.prompts import PromptTemplate from langchain_core.runnables import RunnablePassthrough from langchain_community.chat_models.

2024-05-10 08:00

2024年5月8日星期三

Xorbits Inference: 模型服务变得更容易

macOS 上安装（M2）

conda create -n xinference python=3.10.9
conda activate xinference
pip install -U pip
pip install xinference

# GGML
CMAKE_ARGS="-DLLAMA_METAL=on" pip install llama-cpp-python

安装
- GGML 引擎

使用

运行 Xinference

2024-05-08 08:00

xinference xorbits-inference model-serving llm macos apple-silicon chatbox deployment python

2024年4月19日星期五

Meta Llama 3

Llama3

模型

Meta-Llama-3-8b: 8B 基础模型
Meta-Llama-3-8b-instruct: 8B 基础模型的指令调优版
Meta-Llama-3-70b: 70B 基础模型
Meta-Llama-3-70b-instruct: 70B 基础模型的指令调优版
Llama Guard 2: Llama Guard 2 是基于 Llama 3 8B 微调的，为生产环境设计的，能够对大语言模型的输入（即提示）和响应进行分类，以便识别潜在的不安全内容。

下载

数据集

HuggingFaceH4/no_robots

No Robots 是由熟练的人类注释者创建的包含 10,000 条指令和演示的高质量数据集。该数据可用于监督微调（SFT），使语言模型更好地遵循指令。 No Robots 是根据 OpenAI 的 InstructGPT 论文中描述的指令数据集进行建模的。

介绍 Llama 3 最大的变化是采用了新的 Tokenizer，将词汇表大

2024-04-19 08:00

llama-3 meta ollama llm langchain transformers hugging-face llamaguard responsible-ai open-source

2024年4月18日星期四

Anthropic Claude

Claude 3 模型

模型	模型名称	价格（MTok）	能力
Opus	claude-3-opus-20240229	Input: $15<br>Output:$ 75	处理复杂的分析、多步骤的长期任务，以及更高阶的数学和编码任务
Sonnet	claude-3-sonnet-20240229	Input: $3<br>Output:$ 15	适用于高效、高吞吐量的任务
Haiku	claude-3-haiku-20240307	Input: $0.25<br>Output:$ 1.25	执行轻量级操作，速度领先行业

MTok = million tokens.(百万 Token)
所有 Claude 3 模型都支持视觉和 200,000 个 Token 上下文窗口。

例子

2024-04-18 08:00

anthropic claude-3 langchain llm chatanthropic python machine-translation

2024年4月17日星期三

LangChain : SQL Chain & SQL Agent

SQL Chain

from datetime import datetime
from operator import itemgetter

from langchain.chains import create_sql_query_chain

from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import PromptTemplate
from langchain_core.runnables import RunnablePassthrough
from langchain_core.runnables import RunnableLambda

from langchain_community.chat_models.tongyi import ChatTongyi
from langchain_community.utilities import SQLDatabase
from langchain_community.tools.sql_database.tool import QuerySQLDataBaseTool


// ...

2024-04-17 08:00

langchain sql-chain sql-agent text2sql chattongyi sqlite llm database

2024年4月14日星期日

2024年4月13日星期六

DashScope 模型服务灵积

让大模型能力触达每位开发者

灵积模型服务建立在“模型即服务”（Model-as-a-Service，MaaS）的理念基础之上。

灵积通过灵活、易用的模型API服务，让各种模态模型的能力，都能方便的为AI开发者所用。通过灵积API，开发者不仅可以直接集成大模型的强大能力，也可以对模型进行训练微调，实现模型定制化。

通义千问大型语言模型

模型	描述	上下文长度	计量单价
qwen-turbo	通义千问超大型语言模型，支持中文、英文等不同语言输入。	8k	0.008元/1000 tokens
qwen-plus	通义千问超大型语言模型增强版，支持中文、英文等不同语言输入。	32k	0.02元/1000 tokens
qwen-max	通义千问千亿级别超大型语言模型，支持中文、英文等不同语言输入。	8k	0.12元/1000 tokens
qwen-max-longcontext	通义千问千亿级别超大型语言模型，支持中文、英文等不同语言输入。	30k	0.12元/1000 tokens
qwen-72b-chat	通义千问开源 720 亿参数大型语言模型	8k	0.02元/1000 tokens
qwen1.5-72b-chat	通义千问开源 720 亿参数大型语言模型	32k

通义千问大语言模型计量计费

LangChain 调用

2024-04-13 08:00

dashscope maas 模型即服务 qwen 通义千问 langchain chattongyi llm

2024年4月12日星期五

LangChain Text2SQL Agent

OpenAI Function Call (Extraction)

这个方法只有 OpenAI 的模型支持。

from langchain.agents import tool
from langchain.chat_models import ChatOpenAI
from langchain.tools.render import format_tool_to_openai_function

from langchain.pydantic_v1 import BaseModel, Field
from enum import Enum


# 省份、直辖市
class ProvinceEnum(str, Enum):
    山东省 = "山东省"
    # 其它省份


# 山东省地级市
// ...

OpenAI gpt-3.

2024-04-12 08:00

langchain text2sql agent function-calling chattongyi ollama dashscope qwen llm

2024年4月7日星期日

Continue - It’s time to collect data on how you build software

是时候收集关于你们如何构建软件的数据了。

It’s time to collect data on how you build software

Development data engine (开发数据引擎)

LLM more helpful with coding (LLM在编码方面更有帮助)
Developers use LLM while coding more (开发者在编码时更多地使用LLM)
Better data collected on how software is built (收集到更好的关于软件构建方式的数据)
Better LLM is trained or fine-tuned (训练或微调更好的LLM)

下一代开发者使用大型语言模型（LLMs）而不是谷歌搜索+ Stack Overflow。

随着时间的推移，开发者的偏好和使用的工具也在不断演进。当前一代的开发者正在用大型语言模型（LLMs）取代之前的Google和Stack Overflow，就像之前的一代人用Google和Stack Overflow取代了传统的参考手册一样。在这个过渡期中，能够保留和吸引开发者的组织将会：

首先，理解他们的开发者如何使用LLMs，并通过收集开发数据——即他们组织构建软件的方式——来展示使用LLMs的投资回报率（ROI）。

2024-04-07 10:00

continue llm development-data-engine software-engineering ai-coding-assistant data-collection open-source code-llm

Continue Code LLM Autopilot

Continue

注册 deepseek 的开发平台

OpenAI API

DeepSeek API 使用与 OpenAI 兼容的 API 格式，通过修改配置，您可以使用 OpenAI SDK 来访问 DeepSeek API，或使用与 OpenAI API 兼容的软件。

参数值 base_url https://api.deepseek.com/v1 api_key 申请 api_key

参数	值
base_url	https://api.deepseek.com/v1
api_key	YOUR_API_KEY

模型

模型	描述	上下文长度
deepseek-coder	擅长处理编程任务	16K
deepseek-chat	擅长通用对话任务	16K

安装 IntelliJ IDEA 插件 Continue

Continue

配置 deepseek-coder { "models": [ { "title": "deepseek api", "provider": "openai", "model": &quot

2024-04-07 08:00

continue deepseek code-llm ai-coding-assistant intellij-idea openai-api plugin llm

2024年4月6日星期六

Together AI - The fastest cloud platform for building and running generative AI

用于构建和运行生成式人工智能的最快云平台

注册 Together AI 的开发平台

Together AI Playground

速度非常快

Together AI Inference

OpenAI API from openai import OpenAI import os TOGETHER_API_KEY = os.environ.get("TOGETHER_API_KEY") client = OpenAI( api_key=TOGETHER_API_KEY, base_url='https://api.together.xyz/v1', ) chat_completion = client.chat.completions.create( messages=[ { "role": "system", "content": "You are an expert travel guide.", }, { "role": "user", "content": "Tell me fun things to do in San Francisco.

2024-04-06 08:00

together-ai llm inference cloud-platform openai-api rest-api generative-ai mixtral

2024年4月2日星期二

LLaMA Factory: Easy and Efficient LLM Fine-Tuning

LLaMA Factory

安装

pip

git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

python -m venv env
source env/bin/activate

pip install -e .[metrics]

conda

git clone https://github.com/hiyouga/LLaMA-Factory.git

conda create -n llama_factory python=3.10
conda activate llama_factory

cd LLaMA-Factory
pip install -r requirements.txt

使用 conda 第二次没有安装成功

使用

LLaMA Board

本地启动

CUDA_VISIBLE_DEVICES=0 USE_MODELSCOPE_HUB=1 python src/train_web.py

CUDA_VISIBLE_DEVICES=0: 指定 GPU
USE_MODELSCOPE_HUB=1: 使用魔搭社区的模型和数据集下载

浏览器访问

http://localhost:7860

微调模型

聊天

2024-04-02 08:00

llama-factory llm fine-tuning llama modelscope web-ui training-framework

2024年3月15日星期五

vLLM 部署 Qwen1.5 LLM

安装 vLLM

# (Optional) Create a new conda environment.
conda create -n vllm python=3.9 -y
conda activate vllm

# Install vLLM with CUDA 12.1.
pip install vllm

vLLM 帮助 vLLM 兼容 OpenAI 的 RESTful API 服务器。可选参数： -h, --help 显示此帮助信息并退出 --host HOST 主机名 --port PORT 端口号 --allow-credentials 允许凭证 --allowed-origins ALLOWED_ORIGINS 允许的来源 --allowed-methods ALLOWED_METHODS 允许的方法 --allowed-headers ALLOWED_HEADERS 允许的头部 --api-key API_KEY 如果提供，服务器将要求在头部中呈现此密钥。 --served-model-name SERVED_MODEL_NAME 在API中使用的模型名称。如果没有指定，模型名称将与huggingface名称相同。 --lora-modules LORA_MODULES [LORA_MODULES ...] LoRA模块配置，格式为名称=路径。可以指定多个模块。

2024-03-15 10:00

vllm llm qwen qwen1.5 deployment model-serving quantization tensor-parallelism gpu tesla-t4

2024年3月14日星期四

MLX: An array framework for Apple silicon

MLX 介绍

MLX 是一个为 Apple Silicon 芯片上的机器学习研究设计的 array 框架，由 Apple 机器学习研究团队提供。

熟悉的 API：MLX 拥有一个与 NumPy 紧密对应的 Python API。MLX 还拥有功能齐全的 C++、C 和 Swift API，这些 API 也紧密地反映了 Python API。MLX 拥有更高级别的包，如 mlx.nn 和 mlx.optimizers，它们的 API 紧密跟随 PyTorch，以简化构建更复杂模型的过程。
统一内存：MLX 与其他框架的一个显著区别在于其统一内存模型。MLX 中的数组存在于共享内存中。可以在任何支持的设备类型上执行 MLX 数组的操作，无需数据传输。
MLX 的设计受到了像 NumPy、PyTorch、Jax 和 ArrayFire 这样的框架的启发。

安装

pip

pip install mlx
pip install mlx-lm

conda

conda install -c conda-forge mlx
conda install -c conda-forge mlx-lm

2024-03-14 08:00

mlx llm mistral qwen quantization lora qlora fine-tuning apple-silicon inference

2024年3月13日星期三

Candle

克隆

git clone https://github.com/huggingface/candle
cd candle

Phi-2

CPU

2024-03-13 08:00

candle rust llm phi-2 mps metal inference machine-learning-framework

2024年3月10日星期日

生成式AI

机器学习的方法

监督学习（Supervised Learning）

监督学习使用带有标签的训练数据来训练模型。这些标签是预先定义的输出，模型通过学习输入数据与这些输出之间的关系来进行预测。监督学习的任务通常分为两类：分类（预测离散的标签）和回归（预测连续的数值）。常见的监督学习算法包括决策树、逻辑回归、支持向量机（SVM）、神经网络等。监督学习广泛应用于图像识别、语音识别、医疗诊断等领域。

无监督学习（Unsupervised Learning）

无监督学习不依赖于标签数据，而是试图在没有明确指导的情况下发现数据中的结构和模式。它的主要任务包括聚类（将数据分组到不同的簇中）和降维（减少数据的复杂性，同时保留其主要特征）。无监督学习常用于市场细分、社交网络分析、异常检测等场景。算法示例包括K-means聚类、主成分分析（PCA）等。

自监督学习（Self-Supervised Learning）

自监督学习是一种无监督学习的形式，它通过从数据本身生成伪标签来创建监督信号。这种方法通常涉及到设计任务，使得模型能够从数据中学习有用的特征表示，而不需要人工标注。自监督学习在计算机视觉和自然语言处理中尤其流行，例如，通过预测图像的旋转角度或文本的下一个字来训练模型。这种方法有助于减少对大量标注数据的依赖，同时为下游任务提供预训练的模型。

生成式AI（Generative AI）生成式AI的目标是

2024-03-10 08:00

generative-ai llm fine-tuning pre-training reinforcement-learning agent machine-learning 生成式人工智能大语言模型

2024年1月17日星期三

LLM 的基准测试

安装 FastChat & vLLM

安装 FastChat

安装 FlashAttention

FlashAttention-2 currently supports:

Ampere, Ada, or Hopper GPUs (e.g., A100, RTX 3090, RTX 4090, H100). Support for Turing GPUs (T4, RTX 2080) is coming soon, please use FlashAttention 1.x for Turing GPUs for now.
Datatype fp16 and bf16 (bf16 requires Ampere, Ada, or Hopper GPUs).
All head dimensions up to 256. Head dim > 192 backward requires A100/A800 or H100/H800.

Turing GPU T4 不支持，需要使用 FlashAttention 1.x，否则会报错 ❌：

2024-01-17 08:00

llm benchmarking 测速 fastchat vllm qwen wrk tesla-t4

2024年1月15日星期一

人工智能编码助手（AI Coding Assistant）

主要功能

代码完成（Code completion）：根据提示中输入的代码上下文建议接下来的几行。
代码生成（Code generation）：根据开发人员的自然语言提示生成代码。
代码聊天（Code chat）：允许开发人员与机器人对话，以获得调试、文档、学习新概念和其他与代码相关问题的帮助。

参考资料

2024-01-15 08:00

ai-coding-assistant code-completion code-generation code-chat github-copilot codefuse cody llm

2024年1月14日星期日

Sourcegraph Cody

Sourcegraph

代码搜索

Repositories

Cody

代码 AI 补全

AI 聊天

Cody 的代码 AI 补全的生命周期

代码补全的四个步骤

每一次 Cody 的代码补全都经历了四个步骤：

规划（Planning）：分析代码上下文以确定生成补全的最佳方法，例如：使用单行还是多行补全。
检索（Retrieval）：从代码库中找到相关的代码示例，为 LLM 提供最佳可能的上下文。
生成（Generation）：使用 LLM 基于提供的提示和上下文生成代码补全。
后处理（Post-processing）：精炼和过滤原始的 AI 生成的补全，以提供最相关的建议。

Cody 的目标是提供高质量的补全，无缝集成到开发者的工作流程中。

2024-01-14 08:00

sourcegraph cody ai-coding-assistant code-completion code-search tree-sitter latency-optimization llm

146 篇文章带有标签 “llm”

2024年5月10日星期五

使用大型语言模型进行命名实体识别

2024年5月8日星期三

Xorbits Inference: 模型服务变得更容易

2024年4月19日星期五

Meta Llama 3

2024年4月18日星期四

Anthropic Claude

2024年4月17日星期三

LangChain : SQL Chain & SQL Agent

2024年4月14日星期日

Automated Testing for LLMOps

LLMOps

2024年4月13日星期六

DashScope 模型服务灵积

2024年4月12日星期五

LangChain Text2SQL Agent

2024年4月7日星期日

Continue - It’s time to collect data on how you build software

Continue Code LLM Autopilot

2024年4月6日星期六

Together AI - The fastest cloud platform for building and running generative AI

2024年4月2日星期二

LLaMA Factory: Easy and Efficient LLM Fine-Tuning

2024年3月15日星期五

vLLM 部署 Qwen1.5 LLM

2024年3月14日星期四

MLX: An array framework for Apple silicon

2024年3月13日星期三

Candle

2024年3月10日星期日

生成式AI

2024年1月17日星期三

LLM 的基准测试

2024年1月15日星期一

人工智能编码助手（AI Coding Assistant）

2024年1月14日星期日

Sourcegraph Cody

146 篇文章带有标签 “llm”

2024年5月10日 星期五

2024年5月8日 星期三

2024年4月19日 星期五

2024年4月18日 星期四

2024年4月17日 星期三

2024年4月14日 星期日

2024年4月13日 星期六

2024年4月12日 星期五

2024年4月7日 星期日

2024年4月6日 星期六

2024年4月2日 星期二

2024年3月15日 星期五

2024年3月14日 星期四

2024年3月13日 星期三

2024年3月10日 星期日

2024年1月17日 星期三

2024年1月15日 星期一

2024年1月14日 星期日

2024年5月10日星期五

2024年5月8日星期三

2024年4月19日星期五

2024年4月18日星期四

2024年4月17日星期三

2024年4月14日星期日

2024年4月13日星期六

2024年4月12日星期五

2024年4月7日星期日

2024年4月6日星期六

2024年4月2日星期二

2024年3月15日星期五

2024年3月14日星期四

2024年3月13日星期三

2024年3月10日星期日

2024年1月17日星期三

2024年1月15日星期一

2024年1月14日星期日