介绍

背景

  • 2023年人工智能在openAI的出现涌现,同时也激起百模大战,群魔乱舞,不管是企业还是个人,都在不断的探索和尝试,希望能够在这场大战中脱颖而出。都希望从中分一杯梗,成为这场大战的赢家。在这里希望能给一些想要落地大模型技术的个人和企业一些参考和帮助。

目标

  • 本文档是关于LLM大模型工程化实践的介绍,主要包括LLM大模型的工程化实践的背景、目标、现状、挑战、解决方案等内容。

现状

  • 目前大模型的工程化实践还处于初级阶段,大多数企业和个人都还处于探索和尝试阶段,还没有形成一套完整的工程化实践体系。

挑战

  • 大模型的工程化实践面临着很多挑战,包括但不限于:数据、模型、算法、工程、部署、运维等方面的挑战。

解决方案

目前看来有以下几个方面的解决方案:

  • 初级玩家:提示词工程化实践,一些个人或企业通过套壳OPENAI模型服务接口,开发应用层服务为用户提供服务。
  • 中级玩家:开源大模型私有化部署,一些个人或企业通过开源大模型,自己训练模型,然后部署到自己的服务器上,提供服务。
  • 高级玩家:将私有化大模型与现有系统集成,基于Function Calling+Agent技术将大模型 + 业务系统进行集成,提供服务。
  • 顶级玩家:通过大模型微调技术将大模型与现有系统进行集成,提供服务。
  • 超级玩家:基于llama开源框架进行大模型预训练,然后进行微调,提供服务。