ChatGPT横空出世以来,“生成式人工智能未来会取代哪些工作”已经成了热议的关键社会议题。
高盛近期通过对900余个职业工种取样分析并撰写报告估算,美国约有三分之二的职业或在某种程度上受到生成式AI的影响。但报告同时指出,1940年至今约八十年期间,85%以上的就业增长来自于技术创新而产生的新职位。在医疗健康、智能制造等创新经济领域,人工智能将辅助人类,而非取代。
西湖心辰团队从2020年研发生成式大模型开始,就将“人工智能否成为心理咨询师”作为目标。西湖心辰最早从西湖大学工学院的深度学习实验室孵化而来,公司在2021年7月正式注册成立,同年12月拿到了第一笔近千万美元的天使轮融资,由蓝驰创投领投,主要研究“人工智能自然语言处理+心理咨询服务“的产品应用。
(资料图)
ChatGPT爆火带动了国产大模型的创业潮,西湖心辰分别在今年3月、4月接连完成了两笔融资。Pre-A轮获得了百度风投领投的数百万美元,最新的战略投资则引入了AIGC概念股公司汤姆猫(300459.SZ)成为最大的外部股东。
西湖大学的深度学习实验室正是由西湖心辰创始人蓝振忠组建。在谷歌研究院 (Google Research) 任职期间,他作为论文第一作者发布了谷歌BERT语言模型的轻量版本“ALBERT“(A Lite BERT )——与BERT的3亿参数相比,ALBERT用更少的参数实现了更好的表现——从2019年12月发表至今,该篇论文在Google Scholar平台上引用已经超过4600次。
与先前的技术路径相比,OpenAI的成功使得“越卷越多”的参数规模成为各家大模型竞逐的对象,动辄千亿级、万亿级的大参数变成标配。“扩大参数量目前是一个快速把模型变得更加智能、至今还没有探到底的好办法。它就像盖摩天大楼一样,盖一层后就知道如何盖两层、三层,最后把摩天大楼盖好。”蓝振忠接受界面新闻专访时表示,公司自研模型经过多轮迭代的参数量变化很大,小到60亿,大到1000亿,目前主要在用的是100多亿参数的模型。
2020年,蓝振忠回国作为特聘研究员全职加入西湖大学,担任博士生导师并着手组建深度学习实验室,起步阶段就把研究方向锚定在AI辅助心理咨询。他曾经在”TEDxChengdu“论坛上提到选择心理健康领域的初衷,与自己的一位同学在读博期间自杀有关。“心理咨询是目前比较好的防自杀方案,但一个重要问题是专业人才缺口巨大。按照世界卫生组织的建议,每1000人需要有一位心理咨询师。但是现在(2021年)全国也只有35万左右的从业者,中间差不多有140万的需求差距。”
根据世界卫生组织在2022年最新发布的《世界精神卫生报告:向所有人享有精神卫生服务转型》统计,大约一半的世界人口所在国家每20万或以上才有一名精神科医生。另一方面,新冠疫情大流行期间,焦虑症和抑郁症的发病率仅在第一年已经增加了25%。世卫组织认为,后疫情时代想要实现人人可享的精神健康服务,人工智能代表的数字化技术就成为了弥补治疗缺口的关键。
要教会自研的对话机器人“小天”学习心理咨询,西湖心辰团队先是找来了一批专业的人类心理咨询师,如同工程师训练语音助手一样,通过一条条拆解心理咨询的常见话术来让机器理解语言规律。但因为现实咨询的问题无限多但掌握有限,无法做到一一匹配。
团队尝试几个月没有成功后开始转换思路,不要求机器完全理解人类语言,只要求它去模仿咨询师。
模仿需要数据,训练数据的不同很大程度上决定了大模型的差异。团队为获取具有情感特征的语料,创建了一个名叫“心聆公益”的咨询平台,既做服务平台又做数据库,用户来做心理咨询的同时也在训练“小天”。
蓝振忠告诉记者,团队一开始在开发训练“小天“背后的语言模型时并不追求大而全,“因为ChatGPT及背后的GPT3.5模型定位在通用对话上,决定了它预训练的数据源主要偏向综合、中性。它就像是一个大型的Q&A系统,实际和用户对话中缺乏温度,大部分都是没有情感的说教。”
对标OpenAI,蓝振忠表示,如果按照GLUE、SQuaD、 RACE这样的公开测试数据集的量化标准去评价模型的综合表现,目前国产大模型绝大多数都还在追赶GPT3.5。定位在“情感”上的差异化是团队一直在做的事情,在紧锣密鼓融资的两个月,团队的工作重心仍是在改进情感大模型的对话质量与安全性。
大模型的爆火也给创业公司带来了更多商业化的思考。蓝振忠坦承目前心理咨询收费模式还很难走通。“小天”最初做的是公益咨询,为线上来访者提供免费的对话咨询服务,早期用户也为训练大模型贡献了重要的数据资源。西湖心辰目前通过AI作画工具“造梦日记”、AI写作工具“Friday”面向C端用户,还开放了API接口服务面向B端用户。这三款全部为收费产品,至今已经积累了数百万用户。
商业化的思考同时也反映在蓝振忠的身份转变上。他在2月份发的一条朋友圈里表示西湖心辰正在寻找CEO,现在已经以创始人的身份兼任CEO。蓝振忠认为,大模型的壁垒在于数据、工程复杂度和人才密度。“对外招聘CEO是考虑到自己长期都是在做科学家不适合管理。大模型的竞争已经趋近白热化,当时思考更多的是组建更强队伍来让公司跑得更快,眼下也正在主动适应新身份并学习摸索。”