ChatGLM：集齐从GLM-130B到GLM-4 所有工具的一系列大型语言模型

ChatGLM代表了大型语言模型发展的重大飞跃，特别值得注意的是它在庞大的语料库中进行了全面的训练，主要包括了一万亿个标记，主要是中文和英文。由GLM团队编写，这一系列模型，特别是GLM-4系列，展示了令人印象深刻的能力，在各种基准测试中与GPT-4相媲美甚至有所超越。

ChatGLM的独特之处在于其多阶段的后训练对齐过程，经过人类反馈的微调，实现了高质量的语言对齐，特别是在中文方面。此外，GLM-4 All Tools模型旨在理解用户意图，并自主选择适当的工具，如网络浏览器或Python解释器，以有效完成复杂任务。

2023年在Hugging Face上超过1000万次下载的开源模型显示出这一系列模型的实用性，并表明团队致力于开放科学。对于那些对语言模型发展的前沿感兴趣，特别是关注双语能力和工具集成的人来说，ChatGLM是一篇引人入胜的文章。- ChatGLM是一个不断发展的大型语言模型家族，主要关注GLM-4系列。 - GLM-4系列包括GLM-4、GLM-4-Air和GLM-4-9B，是经过前三代ChatGLM的经验教训训练得到的最强大的模型。 - GLM-4模型已经在10万亿个标记中进行了预训练，主要是中文和英文，还包括来自24种语言的一小部分语料库。 - GLM-4模型通过多阶段的后训练过程实现了高质量的对齐，包括监督微调和从人类反馈中学习。 - 评估结果显示，GLM-4在一般指标上与GPT-4相媲美或超越，与GPT-4-Turbo在指令跟随方面接近，与GPT-4 Turbo（128K）和Claude 3在长篇上下文任务上匹配，以及在中文对齐方面超越GPT-4。 - GLM-4 All Tools模型进一步对齐以理解用户意图，并自主决定何时以及使用哪些工具来有效完成复杂任务。 - 在实际应用中，GLM-4 All Tools在通过网络浏览访问在线信息和使用Python解释器解决数学问题等任务上与甚至超过GPT-4 All Tools。 - ChatGLM-6B、GLM-4-9B、GLM-4V-9B、WebGLM和CodeGeeX等模型已经在2023年单独在Hugging face上吸引了超过1000万次下载。 - 可以通过https://github.com/THUDM和https://huggingface.co/THUDM访问这些开放模型。