META LLAMA 7B模型 本地部署,对比测试 ChatGPT&GPT3.5 turbo magnet:?xt=urn:btih:ZXXDAUWYLRUXXBHUYEMS6Q5CE5WA3LVA&dn=LLaMA baby状态的未finetune原始模型 windows下 用cpu 需要30+GB内存 响应一次30s左右 linux下用GPU 需要23G显存 响应一次4.5秒
https://www.bilibili.com/video/BV1R8411F7As/?spm_id_from=333.337.search-card.all.click