共计 862 个字符,预计需要花费 3 分钟才能阅读完成。
引入
ChatGPT 问世到今,接触的人也来越多,随后也出现了 Prompts 给 AI 赋予更多的角色,而最近横空出世的 Dify 在角色的基础上集成了私有知识库的功能。
试想场景:
- 企业内部资料文档库:查找文档耗时,有些内容难以理解,现在只要向知识库提问
- 学生、员工、队员信息知识库
- 个人文件,学习资料等等
知识库搭建原理:
并不是将所有的文档全灌给了 GPT,而是将文档转成向量保存到向量数据库中,当用户发起提问时,将这个问题的向量去向量数据库里查,找到最相近的文本,给它取出来,并嵌入给 GPT,让 GPT 根据这段取出来的文字进行回答。
一. 项目地址
1.Github
2. 网页
二. 搭建步骤
1. 登入
提供了来两种登入方式,登入之后出现的是应用界面,暂时没有任何应用。
2. 创建应用
点击创建应用,输入名字,选择应用类型。
3. 应用概览
创建成功后会进入到应用概览,除了查看信息还提供了一个 网页版访问地址 ,一个 开发者 API 地址。
4. 创建私有数据集
点击数据集,上传你的私有数据,目前 Dify 的数据集已支持 TXT,HTML,Markdown,PDF,XLSX,一次只能上传一个文件,多个文件分开上传。
选择数据源。
选择文本分段及清洗,不会文本分割选择默认就好。
等待数据处理完成。
5. 提示词编排
数据集创建完成之后点击应用里的提示词编排页。
- 对话前提示输入简单的 Prompts 即可。
- 上下文选择刚刚创建的数据集。
- 还可以设置 开场白 及 下一步建议
- 之后点击 发布
6. 访问
访问之前提供的 网页版地址 即可进行对话
当然还有很多现成的知识库供你选择
7.API-KEY 配置
点击右上角用户,进入设置,选择模型供应商
- 默认提供 200 调用次数
- 可以配置自己的 API key 来使用
END
正文完