1)图像生成领域目前... - @蒋文明in南京的微博 - 微博

1)图像生成领域目前的情况是,各种层出不穷的 finetune+Lora+ControlNet,让纯 prompt 的价值变得越来越低。而 OpenAI - ChatGPT 0301 开放 API 的确可称为狂飙,但是目前来讲, 能自定义的部分少之又少,就文本生成而言,很多时间需要的是 embedding 而不是 finetune。前者 Stable Diffusion 的开源起到了加速,但完全指望 Llama 等 LLM 模型的开源方案其实有限(gpt_index 0225 改名为 LlamaIndex,殷切希望啊!),这是由语言的特性所决定的。
2)ChatGPT 的核心能力为理解(包括概括)与生成(基于检索),在这狂飙的一周,大量的应用涌现,主要集中在降维打击前期基于垂直任务的翻译、写作、总结、学习类的 App。其中,针对很多快速笔记、速读、一键总结类的应用,很快大家就开始反思,这玩意和