当前位置:首页 > 综合随写 > 正文内容

DeepSeek R1 + Cherry Studio 打造本地 AI 知识库:真的太香了!

admin2周前 (04-03)综合随写17

大家好,我是R哥。

今天继续聊聊 DeepSeek R1,不过这次我们要搭配 Cherry Studio 来打造一个本地知识库,让 AI 更懂你、更贴合你的需求。

相比于上一期的 DeepSeek R1 + ima 个人知识库,这次的方案更强大,支持的格式更多,还能方便地管理和检索你的知识内容,简直不要太香!

Cherry Studio 的介绍及安装使用看这篇:《DeepSeek R1 + Ollama + Cherry Studio 实现本地化部署 + 可视化访问,真的太香了!

1、知识库的痛点

在实际工作和学习中,我们经常需要查阅各种资料,比如技术文档、论文、书籍、博客等等。

如果这些资料散落在不同的文件夹分布在不同的云存储,甚至存储在各种笔记软件,查找起来就很麻烦。而且,如果这些知识点能跟 AI 结合,实现智能搜索和内容生成,那工作效率肯定会大大提升。

上一期的 DeepSeek R1 + ima 个人知识库,它知识库的文档全在云上,对于数据比较敏感的人/公司来说可能是个隐患,这时候搭建一个本地 AI 知识库就尤为重要了。

这就是我们今天要解决的问题:如何用 DeepSeek R1 + Cherry Studio 搭建一个本地 AI 知识库,让 AI 帮你管理和搜索你的知识!

2、Cherry Studio 知识库

介绍

Cherry Studio 目前已上线知识库功能,支持多种格式文件的导入和网页导入等来搭建个性化知识库。搭配 DeepSeek R1 之后,我们可以让 AI 在我们的知识库里搜索内容,并提供更加贴合个人需求的回答。

最最重要的是,Cherry Studio 数据本地储存,无需担心隐私泄露!

在 Cherry Studio 知识库中添加的数据全部存储在本地,不会上传到任何第三方服务器,在添加过程中会复制一份文档放在 Cherry Studio 数据存储目录,并且支持本地部署的模型调用。

知识库处理流程图如下:

知识库处理流程图

向量数据库:https://turso.tech/libsql

当文档被添加到 Cherry Studio 知识库之后,文件会被切分为若干个片段,然后这些片段会交给嵌入模型进行处理,当使用大模型进行问答的时候,会查询和问题相关的文本片段一并交个大语言模型处理

如果对数据隐私有要求,建议使用本地嵌入数据库和本地大语言模型。

配置模型

上面说到了,AI 知识库需要一个嵌入模型进行分段处理,所以它需要一个嵌入模型。

我们可以在 Ollama 中筛选嵌入模型:

https://ollama.com/search?c=embedding

然后我们以 bge-m3 为例进行下载:

ollama pull bge-m3

下载成功后可以使用 ollama list 列出模型:

$ ollama list
NAME               ID              SIZE      MODIFIEDbge-m3:latest      790764642607    1.2 GB    19 hours agodeepseek-r1:14b    ea35dfe18182    9.0 GB    4 weeks ago

然后回到 Cherry Studio 模型服务中,把推理模型和嵌入模型都添加进来:

创建知识库

比如,我添加一个文章知识库:

CherryStudio 支持多种添加数据的方式:

  • 文件夹目录: 可以添加整个文件夹目录,该目录下支持格式的文件会被自动向量化。

  • 网址链接: 支持网址 url。

  • 站点地图: 支持 xml 格式的站点地图。

  • 纯文本笔记: 支持输入纯文本的自定义内容。

我这里上传了一些我写的 DeepSeek 文章:

当文件等资料向量化完成后,即可进行搜索,点击下面的「搜索知识库」按钮可以搜索知识库:

基于知识库对话

在助手对话框中选择刚创建的「文章」知识库进行对话:

问它一个问题:

deepseek是什么,300字总结

如图所示,它参考了我们指定的文章知识库进行思考和输出内容:

3、总结

以上,我们通过 DeepSeek R1 + Cherry Studio,我们实现了一个本地 AI 知识库:

  • 读取本地文档(Markdown、PDF、Word、TXT)

  • 智能搜索知识点(基于 Cherry Studio)

  • AI 生成智能回答(基于 DeepSeek R1)

  • 完全本地化运行(数据安全,不依赖外网)

相比于之前分享的ima 云知识库方案,这种本地 AI 知识库既能保护数据隐私,又能让 AI 变得更懂你。

这样,我们可以把所有的文档、笔记、网站都添加到本地知识库中,方便我们进行搜索、总结、对话、写作等操作,真的太香了!

未完待续,公众号持续分享「DeepSeek」及 AI 实战干货,关注「AI技术宅」公众号和我一起学 AI。

最后,如果你还没用过 DeepSeek,清华大学出的《DeepSeek 从入门到精通》推荐你好好看看吧,质量非常高,从原理到应用实践,写得非常好。


扫描二维码推送至手机访问。

版权声明:本文由XIAKEM发布,如需转载请注明出处。

本文链接:https://xiakem.cn/?id=15

分享给朋友:

“DeepSeek R1 + Cherry Studio 打造本地 AI 知识库:真的太香了!” 的相关文章

SpringBoot Controller接收参数的几种常用方式

第一类:请求路径参数1、@PathVariable获取路径参数。即url/{id}这种形式。2、@RequestParam获取查询参数。即url?name=这种形式例子GEThttp://localhost:8080/demo/123?name=suki_rong对应的java代码:@GetMapp...

Mysql被黑客入侵及安全措施总结

Mysql被黑客入侵及安全措施总结

情况概述今天登陆在腾讯云服务器上搭建的 MySQL 数据库,发现数据库被黑了,黑客提示十分明显。MySQL 中只剩下两个数据库,一个是information_schema,另一个是黑客创建的PLEASE_READ,其中有一张info表,内容如下:Info: Your DB is Backed up...

跨境业务如何用代理IP

跨境业务如何用代理IP

代理IP对于做跨境的小伙伴来说,都是必不可少的工具,目前出海的玩法已经是多种多样,开店、账号注册、短视频运营、直播带货、网站SEO等等都是跨境人需要涉及到的业务。而国外代理!P的获取渠道非常多,那么做跨境到底应该用哪种代理!P呢?干净的IP又是怎么选到的?我们可以一起来看看代理IP的选择技巧代理IP...

如何定位 Druid & HikariCP 连接池的连接泄漏问题?

最近碰到一个 case,一个 Java 应用无法获取新的数据库连接,日志中出现了以下错误:com.alibaba.druid.pool.GetConnectionTimeoutException: wait millis 5001, active 20, maxActive&nb...

关于window版本nacos版本安装过程

关于window版本nacos版本安装过程

环境window10 16G 1TB下载地址window版本zip包 https://github.com/alibaba/nacos/releases/download/2.5.1/nacos-server-2.5.1.zipLinux版tar包 https://github.com/a...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。