shell

Qwen2 大型语言模型

Posted by eye on 07-30，2024

Qwen2

Qwen2是阿里云Qwen团队研发的大型语言模型系列

快速入门：基本使用及演示；
推理：使用 Transformer 进行推理的指导，包括批量推理、流式推理等；
本地运行：在 CPU 和 GPU 上本地运行 LLM 的说明，使用llama.cpp和等框架Ollama；
vLLM部署：演示如何使用、等框架部署 Qwen 进行大规模推理TGI；
量化：使用GPTQ、AWQ量化LLM的实践，以及如何制作高质量量化GGUF文件的指导；
训练：训练后说明，包括使用 Axolotl、LLaMA-Factory 等框架的 SFT 和 RLHF（TODO）。
框架：Qwen 与应用程序框架的使用，例如 RAG、Agent 等。
基准：推理速度和内存占用的统计数据。

介绍

经过数月的努力，我们很高兴地宣布从 Qwen1.5 进化到 Qwen2。这次，我们为您带来：

5 种尺寸的预训练和指令调整模型，包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和Qwen2-72B；
除英语和中文外，还接受过另外27 种语言的数据训练；
在大量基准评估中表现出最先进的性能；
编码和数学表现显著提高；
使用 Qwen2-7B-Instruct 和 Qwen2-72B-Instruct，扩展上下文长度支持高达128K 个令牌。