1)图像生成领域目前... - @蒋文明in南京的微博 - 微博


1)图像生成领域目前的情况是,各种层出不穷的 finetune+Lora+ControlNet,让纯 prompt 的价值变得越来越低。而 OpenAI - ChatGPT 0301 开放 API 的确可称为狂飙,但是目前来讲, 能自定义的部分少之又少,就文本生成而言,很多时间需要的是 embedding 而不是 finetune。前者 Stable Diffusion 的开源起到了加速,但完全指望 Llama 等 LLM 模型的开源方案其实有限(gpt_index 0225 改名为 LlamaIndex,殷切希望啊!),这是由语言的特性所决定的。
2)ChatGPT 的核心能力为理解(包括概括)与生成(基于检索),在这狂飙的一周,大量的应用涌现,主要集中在降维打击前期基于垂直任务的翻译、写作、总结、学习类的 App。其中,针对很多快速笔记、速读、一键总结类的应用,很快大家就开始反思,这玩意和各种神棍读书法不是一样吗?*读书关键是要把书中内容融入到自己已有的知识体系*。好的,那么先把你的知识库(阅读笔记)嵌入 ChatGPT,然后让你通过“情景式对话”来读书学习,这可以看做是 AI 版的翻转课堂。
3)所以,ChatGPT 是最让人有动力让渡隐私进行 UGC 的平台,是元宇宙虚实融合的真正加速器。既然定义为 AGI,那么这二十多年来所有的“大词”里未达到的那些部分,都会获得一些突破,这将是另一种形式的涌现。当然涌现的问题也会很多,比如去年讨论自动驾驶高精地图的政策法规时,我在想 NeRF 这样发展下去怎么办?

https://weibo.com/2371583494/Mw3SjsuD5?pagetype=groupfeed