撰文:Melissa
这次在硅谷前后呆了有六周,来时盛夏,离开时刚刚过了立秋。加州的阳光永远灿烂,在科技最前沿的这里,涌动着AI的浪潮。因为希望更深入地了解AI发展和方向,我见了不少人(包括大厂的朋友们、创业者和投资人),参加线上线下活动,真切感受到大潮初起时的澎湃。这里采撷几朵浪花,跟大家分享。
疫情过后:人力短缺和远程工作
【资料图】
疫情已成为过去时,不过也许因为我是初来乍到,看到三年留下的痕迹格外清晰。其中感触最深的是人力短缺和远程工作的影响。
人力短缺
硅谷人力短缺明显,加之近来通货膨胀,结果就是人工非常贵。有次我用Uber Eat叫了subway外卖,三明治本身8元,但是外卖费用林林总总加起来,一共17元,多了一倍还不止!我之前在西雅图生活多年,一直知道美国人工不比中国,但是看到这个还是吃了一惊。了解了下,一大原因是疫情期间,因为担心传染等,不少人离职或提前退休。加上前两年政府发钱,工作的人少了很多。跟一位做AI教育的创业者聊,他说教师的短缺非常严重。这是整个美国面临的问题,不知道将如何解决。
远程工作
而疫情期间开始的远程工作影响更大,尤其是新毕业的大学生们。有两位朋友自己创业,他们都分别跟我提及这个问题。疫情要求隔离,大学生在校时就没有机会去公司实习。毕业后工作又是远程,没有过跟同事相处的经历。这些导致他们不知道如何进行团队合作,lead也很难远程指导。他们招过很好学校的毕业生(包括斯坦福),学生潜力很好,因为不会合作最终都不得不让他们离开,很可惜。
现在大厂陆续开始要求员工来公司上班,不过还没有恢复到疫情前。多年前我在Expedia团队招的毕业生,现在是一家AI公司创始人。他觉得远程工作很影响效率。疫情期间,他不敢要求员工来,担心要求了员工离职。目前他在看大厂的节奏,等大厂明确要求了,他就会跟上。我在大厂和创业公司看到的实际情况,来办公室上班的人还是有限。跟朋友们讨论,大家对此的态度也不完全一致。总体上一个人管理的团队越大,对远程工作这个方式越不满。大家觉得慢慢会恢复到从前,但是也不太可能一蹴而就。
说个有趣的观察。Google、Meta等大厂都在Palo Alto和Mountain View,导致附近的房价很贵,远些的地方房子就便宜很多。因为远程工作不用来公司,结果这两年远些地方的房价也涨势甚好。
AI大潮:格局初定,非常早期
我关注的重点是AI。总结一下,这一个多月以来在硅谷关于AI的几点观察和判断。
大模型和GPU
大模型本身的行业格局初定。跟中国百模千模大战不同,硅谷有几个大模型胜出,闭源主要是OpenAI和Google,Anthropic也可以算上,开源是Meta Llama-2等。因为通用大模型的投入极高,需要大量人力、算力和资金,格局看上去基本确定,没有什么新的入场者。
GPU依然短缺,无论是大厂还是创业公司。大家都在找GPU。NVIDIA的学弟给我科普了GPU生产过程,是从准备矿砂讲起的。硬件不是我关注的重点,我了解有限。听上去由于生产周期很长,导致短期内GPU的短缺,长期应该ok。
AI非常早期
说起AI领域现状,一位投资人朋友形容得很生动。他说现在就像天还没亮,每个人都拿着个手电筒在四处照来照去,寻找方向。还没有到当年移动互联网真正兴起的情形。我跟不少朋友聊过,包括大模型开发者、使用大模型的大小公司、以及围绕大模型提供产品服务的Infra/工具的创业公司。总体的判断是大模型应用还在非常早期。
有个例子很有代表性。我有位朋友,之前是一家非常有名的上市公司的VP of Engineering;这几年出来创业,做eCommerce平台相关,有一百多员工,背后有美国几家知名基金投资。她的业务用得上大模型,最近她在探索怎么做,做了两个尝试。一是在MosaicML模型上,对私有数据进行fine tune。一是用GPT-4,把私有数据放在vector database,用search-retrieval把对应信息放到prompt里。两者对比,出乎她意料的是GPT-4居然比fine tune的结果要好。她很困惑,不知道fine tune应该怎么做才有效果。需要什么样的数据,用多少数据,如何finetune, 这些都不大清楚。而且,大模型是个黑盒,她觉得做大模型的人也未必对此很明白。另外,她说MosaicML用起来的体验并不好,不过也没有别的工具供选择。GPT-4虽然效果不错,她的私有数据又不可能公开,用来测试可以,正式产品是不行的。她觉得现有团队这方面的技术力量有限,接下来计划招AI工程师来解决这个问题。
我听了有点吃惊。因为她本人很资深,整个创业团队背景光鲜,技术实力不错。她如果还不清楚如何有效地fine tune,那其他公司可想而知。她的这个结果对比(fine tune不如GPT-4 search-retrieval),也不是特例,我听到多个类似的例子。我另一位朋友的创业公司是提供AI工具,服务大的企业客户。他说,大模型对大企业是全新的技术,他的客户们都是刚刚开始考虑,他们对于模型的精准度、速度、需要准备的数据质量和隐私问题,尤为关注。客户对于具体要用AI解决哪些业务问题,也在探索中。他判断至少要6-12个月大企业才可能在内部落地使用。
可见这一轮AI还处于非常早期的阶段,C端还没有看到killer app(除了ChatGPT), B端落地也需要时间,AI infra和工具层,应该还有很大的发展空间。比如Databricks花13亿美金收购MosaicML,就是希望尽快建立起AI能力赋能给客户。
这里我看到两个积极信息:
正是因为还在早期,工具不完善,大企业没有现成的技术可用,才给创业公司留出了空间。如果大公司马上就能用起来,他们有自己的数据和场景,创业公司的机会就少多了。这是跟硅谷徐老师Howie讨论时,他提的观点,我很有共鸣。
大企业迫切地想利用起AI,至少很有危机感。我了解到,针对这轮GenAI,很多企业内部都设立了专门的预算。钱既然准备好了,即便在早期发展慢些,AI的前景还是很光明,不太容易凉凉。
为什么感觉这两个月AI发展慢下来了?
不知道大家感觉如何,比起年初,最近两三个月我感觉AI领域的节奏明显慢下来了。为什么是这样?观察下来,大致如下:
跟OpenAI的策略有关。这波节奏主要是OpenAI引领,它之前一直在憋大招,把过去两三年的成果(比如GPT-3),从去年年底起用两三个月的时间都放出来,让人感觉目不暇接。经过这段时间追赶,Google成为强有力的对手,如今OpenAI也不敢随便推出没有ready的产品,否则得不偿失。所以,最近没有特别大的变化,感觉上可能比之前慢了。其实,我觉得这才是技术应有的节奏,本来就没有那么快。
创业者在埋头Build了。我在硅谷AI社区做了个讲座,谈到这个问题。社区的反馈,年初时创业者们忙着参加各种会议/讲座/meetup学习讨论,想弄明白GenAI是怎么回事。最近大家对大模型技术基本清楚了,开始忙着花时间构建自己的产品。外面看起来,好像没之前那么热闹了。
在研究领域,一篇篇论文还是在不断发表,并没有变慢。
一级市场的确慢下来
整体一级市场的投资节奏感觉有所减慢。主要跟大环境相关。人们觉得未来经济走势不明朗,而俄乌战争又增加了不确定性,影响人们投资的信心。另外,疫情期间政府大放水导致很多创业项目估值涨得很高,现在还在估值回调的过程中。在这个大背景下,AI领域的一级市场其实相对算好的。不过因为还在很早期,我观察到除了真正做大模型的有竞争力的项目(包括character.ai 其实也是在做大模型)拿到了很多钱,其他的AI创业项目,现在融资并不容易,投资人很多在观望。
大厂探秘:OpenAI,Google,NVIDIA
这波AI大潮中,OpenAI & Microsoft、Google和NVIDIA成为时代的弄潮儿。其中三家总部在硅谷,我特地去了解了下,总结下可以分享的信息。
OpenAI
OpenAI对信息保护非常在意,员工对此也很敏感。我了解到的不是很多,有几点印象相对深刻。
跟OpenAI合作的人都提到,他们的员工很能干,非常高效。它的系统性能和监控做得尤其好,工程能力很强。也许,Infra的工程能力 – 如何更高效地利用硬件、提升性能等,是它的一个核心壁垒。
OpenAI执着于AGI,这点我具体聊下来才真正有些体会。他们内部判断工作优先级,会看这个能不能帮助AGI发展。如果能够更好地训练模型,帮助模型学习,那会去做;否则不会花功夫。比如他们之前做过机器人,觉得受实际物理世界的制约很大,对AGI帮助有限,后来就停了。照此推断,它大概率不会去做垂直领域。
ChatGPT出现前,用户对LLM效果如何是没有感知的。让用户感知到是非常重要的。除了AGI,ChatGPT和API也是OpenAI的重点。
之前Google在AI推进上比较慢,除了跟广告业务冲突,还跟两件事相关。一是有位研究员觉得大模型有意识,被解雇。再之前,有位黑人女性员工因为发论文被拒,告Google。这些让Google对AI变得非常谨慎,减缓了AI的进度。
Google一直觉得自己是领先的,直到ChatGPT出现,给到Google很大的压力。12月份内部开始code red(最高优先级),是比较少见的。现在公司上下对GPT非常重视,有专门团队做GPT(DeepMind和Google Brain合并),也鼓励其他团队尽快把AI用上。我有不少朋友在Google,聊起来,他们对Google有信心,觉得这方面Google至少不会落后。
NVIDIA
这次LLM大潮,NVIDIA成了最大的赢家。我其实对这家公司一直关注不多,因为我的经历和兴趣都在软件方面。这次好好了解了一下,发现很有意思,这里多分享一些。
一个人的Startup
NVIDIA的风格,概括说,是老黄Jason一个人的创业公司。在那里工作的朋友对Jason非常佩服,我听下来感觉Jason是个Superman。Jason一直相信Compute,无论股价如何,从2012年开始坚持做,从来没犹豫过。Jason对技术懂得非常深,对项目实际情况了解,又平易近人。如果有的事情决定不了,大家都去问Jason,他做决策又快又好。
Jason很有同情心。比如疫情刚开始时,本来公司平时是9月份做员工评估,他决定提前做。结果3月份全公司完成了评估,提薪和奖金,让大家提前拿到钱。同时Jason有洞察力,也有危机感,很受员工欢迎。即便在之前股价不好的时候,员工对他的评价也很高。
强调技术,组织扁平
它的公司文化跟我了解的其他公司有明显差异。作为一家近3万人的公司,NVIDIA至今没有people manager(只管人的管理者)。公司强调技术能力,管理者无论级别高低,技术都非常强。
组织扁平。全公司好像只有Jason有个助理,其他人都没有。我问那团建之类怎么办。朋友说公司没有团建,没有圣诞节晚宴,只有全公司的大会。会上Jason一个人脱稿讲两个小时,是个段子手,讲完后不少员工上去跟他合影。
NVIDIA生态
听说已久NVIDIA生态做得好,我特地去问指的到底是什么,朋友讲得挺清楚:
提供完备的工具。芯片从下到上是个deep stack,需要有各种支持的工具,包括compiler、debugger、profiler等等。研发人员的需求各不相同,比如有人想做深度优化,这样仅仅把功能封装成API就不行。
系统的速度和易用性。
公司的内部和外部,横向沟通都做得很好。比如,公司有团队负责跟客户沟通,同时他们对内部技术也非常懂。客户有什么需求,他们很早就直接跟内部研发团队讨论。内部也如此。软件团队跟硬件部门密切合作,不是等硬件做好了再开发软件,而是在过程中及时交互配合。
华人企业国际化
中美关系的变化跟硅谷息息相关。我这次注意到两个明显的变化。创业者在市场选择上更专注,要么做美国市场,要么做中国市场,很少有人两边兼顾。国内一些好的创业者和基金也在这里寻找新的机会。
华人企业如何做好国际化是个大家普遍关心的问题。周末参加了一个闭门沙龙,讨论的主题就是这个,我觉得嘉宾挺有代表性:有做全球市场的华人上市公司CEO,有聚焦投资中国企业出海的基金合伙人,有管理中国和美国两边团队的创业者,我也是其中一位。大家分享了不少洞察。中国在研发成本、完备的供应链、互联网产品运营和勤奋度上有优势,但是出海面临着完全不同的挑战,涉及市场销售、产品、团队文化和管理等等。嘉宾有共鸣的一点,是要做国际化业务,创始人的思维首先要国际化。
我的感慨更多是在讨论之外。国际化这个话题我并不陌生,多年前讨论的,是美国企业如何拓展到中国。如今是反过来,讨论中国企业如何做国际市场。世界的重心在变,经过这些年的努力,中国真的强大了很多,让人自豪。
流动的硅谷
我一直非常羡慕硅谷的人才资源和自由交流的氛围。这里的人才密度大,我经常聊着聊着,发现是清华校友。我的大学本科班30人,其中6位在这里。周末参加一位好友组织的烧烤聚会,随便聊聊,发现好几位都谈吐不俗。再多问一句,原来是深藏不露的成功人士。
因为是硅谷,创业风气一直盛行。随之而来的是各种讲座、论坛等等。我刚来时,朋友给了我一个Google doc, 上面密密麻麻列了旧金山城里的AI线下活动,几乎每天都有。我进城不方便,只选择性地参加了几次。后来自己搜了下,对于感兴趣的话题,都找得到各种线上Webinar和社区讨论等等。后来熟悉了,发现湾区这边的活动也很多。无论线上还是线下,这些活动的质量普遍非常好,有大厂或头部创业公司核心成员,有年轻的创业者,分享的信息密度大、更新快,讲的人独立思考态度真诚技术前沿。我一向喜欢学习新东西,在这里过得兴致勃勃。
硅谷是流动的,流动的人才、流动的信息、流动的资金。这些流动带来了活力和创新,让每天都在变化,感觉永远年轻。
关键词: