ML - 首页 - 微博


今天看到一个有意思的视频,作者在本地搭建了一个类似于ChatGPT的应用,借助OpenAI和LangChain,将PDF中的文本调用embedding API处理成向量,然后将向量存储到Pinecone数据库,最后做成一个聊天机器人,通过机器人实现了对PDF的查询,整个效果还是挺不错的。

作者把代码都开源了:github.com/mayooear/gpt4-pdf-chatbot-langchain
如果你想本地运行需要有OpenAI的Key,还要注册Pinecone的服务器,按照文档的说明做一些调整,尤其是你如果没GPT-4的权限,要把模型改回3.5。测试了一下挺麻烦的。

如果你想了解其原理,可以参照我以前这篇微博:![](http://h5.sinaimg.cn/upload/2015/09/25/3/timeline_card_small_web_default.png)网页链接 还有这一篇:![](https://h5.sinaimg.cn/upload/2015/09/25/3/timeline_card_small_weibo_default.png)微博正文 ![](https://h5.sinaimg.cn/upload/2015/09/25/3/timeline_card_small_video_default.png)宝玉xp的微博视频收起

https://weibo.com/mygroups?gid=4021463604530306