ChatGpt系列-模型介绍

发布时间 2023-08-21 10:08:57作者: link_ed

GPT4\GPT-3.5

多模态模型,就是自然语言处理模型,可以理解文本,而且很像人,不是常见的指令型的假模型,是有人味的一个模型,主要接收文本输入并输出文本

获得更好结果6项策略

写下清晰的说明

策略:

  • 要求模特采用角色(系统消息可用于指定模型在其回复中使用的角色,在我们落地应用时这个是必备的,将角色设置为我们自己的项目名称)
  • 使用分隔符清楚的指示输入的不同部分
  • 指定完成任务的步骤
  • 提供例子(比如做智能客服时,每次回答都尽量统一回复风格,可以提供示例实现)
  • 指定所需的输出长度

提供参考文字

策略

  • 指示模型使用参考文本回答

  • 指示模型通过引用参考文本来回答

将复杂的任务拆分为更简单的子任务

策略

  • 使用意图分类来识别与用户查询最相关的指令
  • 对于需要很长对话的对话应用,总结或过滤以前的对话
  • 分段总结长文档并递归构建完整摘要

给GPT时间思考

策略

  • 指示模型在急于得出结论之前找出自己的解决方案

  • 使用内心独白或一系列查询来隐藏模型的推理过程

  • 询问模型在之前的过程中是否遗漏了任何内容

使用外部工具

通过向GPT提供其他工具的输出来弥补GPT的弱点

策略

  • 使用基于Embeddings的搜索实现高效的知识检索(基于本地数据搜索的功能都可以利用Embeddings来实现,比如快速搭建起智能帮助中心、客服系统、问诊系统、保险推荐等)
  • 使用代码执行来执行更准确的计算或调用外部API
  • 授予模型访问特定功能的权限

系统的测试变更

需要有方法测试一个优化是否对系统是正向的改进,好的评估方法:

  • 代表现实世界的使用情况
  • 指定测试用例
  • 易于自动化或重复

策略:参考黄金标准答案评估模型输出

假设已知问题的正确答案应参考一组特定的已知事实。然后我们可以使用模型查询来计算答案中包含多少必需的事实。

DALL.E/DALL.E2

根据自然语言描述创建图像,

Whisper

语音识别模型,可以不用学外语了

例如可以自动生成会议纪要

Embeddings

Embedding 通常用于以下场景:

  • 搜索(结果按查询字符串的相关性进行排序)
  • 聚类(将文本字符串按相似性分组)
  • 推荐(推荐具有相关文本字符串的项目)
  • 异常检测(识别相关性较小的异常值)
  • 多样性测量(分析相似度分布)
  • 分类(文本字符串按其最相似的标签进行分类)

简单点说就是Embeddings可以将提供的数据转化为向量数据,然后应用于以上场景。

这个最直观的应用场景就是智能客服、智能推荐,应该是落地中比较容易实现可以很快立竿见影的场景。结合qdrant数据库(或者万金油Redis也可以),可以将本地数据通过Embeddings转化后存入qdrant实现本地搜索。

或者做用户画像,将用户数据通过Embeddings转化后,可以很容易的实现给用户自动打标签,一个人工智能版本的用户标签系统就完成了。继而赋能给其他系统(CRM、推荐系统等)。

同理可得,智能推荐系统通过Embeddings也能非常快速的实现。只需要调整参数,或者增加一些额外的代码逻辑,一个符合公司业务的智能系统就完成了。

Moderation

这个是我们最熟悉的了,审核模型,以后yyds这种拼音缩写的词也无处遁型了,真是yyds