卢志武和高一钊团队选择了与软通动力建立深度合作

投资人看不懂大模型

在 ChatGPT 走红之后,很多从业者也在反思中国为什么没有诞生和 OpenAI 类似的公司,投资人不懂技术和太擅长投资而更擅长“投机”,被认为是其中一个重要原因。

  记者:李京亚 肖芳

  去年下半年至今,中国人民大学高瓴人工智能学院教授卢志武和他的学生高一钊见了 150 多家 VC(风险投资机构)。以 ChatGPT 走红为分界点,他明显感觉到投资人对大模型创业的态度变得积极甚至是着急,但卢志武依然没拿到 VC 的投资。

  卢志武的多模态大模型项目源起智源,最开始由智源研究院注资 3000 万元。2021 年,他团队研发的多模态大模型项目雏形已现,急于寻找一笔融资支持大模型的深入研发。他曾对风险投资寄望很大,期待获得微软之于 OpenAI 那样的支持。

  在 ChatGPT 走红之前,卢志武需要反复跟投资人科普大模型是什么以及价值在哪,其中不乏朱啸虎这样的大佬级投资人,但没有人听得懂——他们不理解大模型百亿级别参数意味着什么,更难理解提前几年研发所带来的竞争优势。

  “VC 永远问我怎么盈利,怎么竞争得过大厂。”卢志武说,头部 VC 他几乎都见了,主投 TMT 的主投硬科技 VC 也见了,但感觉 VC 们做的功课很少。

  在 ChatGPT 走红之后,他终于不用向投资人科普大模型,但新的问题又来了:如果多模态大模型这么重要,那为什么 ChatGPT 是单模态的?

  卢志武不知道怎么回答。

  北京大学信息科学技术学院副教授、智能编程助手 aiXcoder 创始人李戈对此也感同身受。很多投资人在评估项目时都会向他质疑:既然 ChatGPT 已经有了程序生成功能,国内团队再做,有什么意义?

  很多投资人都会使用最简单的 python 实现贪吃蛇游戏作为测试用例,但在李戈看来,程序生成是很难的事情,涉及上下文环境,投资人总是把它过于简单化,他们的目光都盯在 nl2code(即自然语言转换成代码)上,输入个自然语言输出个代码,然后在那儿比来比去。“这个东西能比得出来谁好谁坏么?”

  兜兜转转见了上百个投资人,卢志武终于意识到,VC 们把大模型项目当成互联网项目去类比,围绕着商业模式和团队构建打转,“大模型有自己的特殊性,他们不理解,但却很早就达成了某种共识。”

  这种共识主要指投资人之间的小圈子文化。卢志武认为,投资人们喜欢交换看法,虽然很多看法大多是错误的,但这些投资人的态度却出奇的一致。

  “基金跨周期很难,找 benchmark(对标与基准线)是投资人的天性和习惯,所以在上个周期形成的共识范式往往会成为新周期绊脚石。在大模型这样晦涩难懂的前沿领域,当底层范式发生转变,简单地和过去类比没有意义,老一代范式的知识体系和判断标准会变成包袱,投资前沿科技需要开阔思路和技术信仰。”前沿科技基金 Capital O 的创始合伙人刘大卫这么解释这个现象。

  谈了几个月之后,卢志武不再想拿 VC 的投资,因为他们并不懂大模型。

  但还有很多大模型相关的创业者寄希望于通过 VC 的助力把项目继续下去。界面新闻了解到,红杉中国旗下的创业加速器 YUE 2 月 28 日开启报名之后,2000 个报名项目中有 400 个是 AIGC 主题,创下了历史。6 月 3 日,在奇迹创坛 2023 春季创业营路演上,60 家参与公司中有 41 家为人工智能主题,比去年翻番,其中有 39 家为大模型相关。

  记录屡屡刷新,但大模型创业者们首先需要面对的是投资人比以往都大的认知鸿沟。

  犹豫的投资人

一种 stereotype(刻板印象),一种倚老卖老。

  很多投资人听完大模型创业的项目之后,不是不想下手,而是不敢下手。

  今年春节前后,卢志武和高一钊见投资人的频率明显提升。他们感受到 ChatGPT 走红之后投资人急迫的心情,但也感受到了他们的犹豫。“很多投资人愿意听我们讲,但不给明确答复。我们催他们回复,