流动的硅谷：AI 大潮、大厂探秘及华人国际化

撰文：Melissa

这次在硅谷前后呆了有六周，来时盛夏，离开时刚刚过了立秋。加州的阳光永远灿烂，在科技最前沿的这里，涌动着AI的浪潮。因为希望更深入地了解AI发展和方向，我见了不少人（包括大厂的朋友们、创业者和投资人），参加线上线下活动，真切感受到大潮初起时的澎湃。这里采撷几朵浪花，跟大家分享。

疫情过后：人力短缺和远程工作

【资料图】

疫情已成为过去时，不过也许因为我是初来乍到，看到三年留下的痕迹格外清晰。其中感触最深的是人力短缺和远程工作的影响。

人力短缺

硅谷人力短缺明显，加之近来通货膨胀，结果就是人工非常贵。有次我用Uber Eat叫了subway外卖，三明治本身8元，但是外卖费用林林总总加起来，一共17元，多了一倍还不止！我之前在西雅图生活多年，一直知道美国人工不比中国，但是看到这个还是吃了一惊。了解了下，一大原因是疫情期间，因为担心传染等，不少人离职或提前退休。加上前两年政府发钱，工作的人少了很多。跟一位做AI教育的创业者聊，他说教师的短缺非常严重。这是整个美国面临的问题，不知道将如何解决。

远程工作

而疫情期间开始的远程工作影响更大，尤其是新毕业的大学生们。有两位朋友自己创业，他们都分别跟我提及这个问题。疫情要求隔离，大学生在校时就没有机会去公司实习。毕业后工作又是远程，没有过跟同事相处的经历。这些导致他们不知道如何进行团队合作，lead也很难远程指导。他们招过很好学校的毕业生（包括斯坦福），学生潜力很好，因为不会合作最终都不得不让他们离开，很可惜。

现在大厂陆续开始要求员工来公司上班，不过还没有恢复到疫情前。多年前我在Expedia团队招的毕业生，现在是一家AI公司创始人。他觉得远程工作很影响效率。疫情期间，他不敢要求员工来，担心要求了员工离职。目前他在看大厂的节奏，等大厂明确要求了，他就会跟上。我在大厂和创业公司看到的实际情况，来办公室上班的人还是有限。跟朋友们讨论，大家对此的态度也不完全一致。总体上一个人管理的团队越大，对远程工作这个方式越不满。大家觉得慢慢会恢复到从前，但是也不太可能一蹴而就。

说个有趣的观察。Google、Meta等大厂都在Palo Alto和Mountain View，导致附近的房价很贵，远些的地方房子就便宜很多。因为远程工作不用来公司，结果这两年远些地方的房价也涨势甚好。

AI大潮：格局初定，非常早期

我关注的重点是AI。总结一下，这一个多月以来在硅谷关于AI的几点观察和判断。

大模型和GPU

大模型本身的行业格局初定。跟中国百模千模大战不同，硅谷有几个大模型胜出，闭源主要是OpenAI和Google，Anthropic也可以算上，开源是Meta Llama-2等。因为通用大模型的投入极高，需要大量人力、算力和资金，格局看上去基本确定，没有什么新的入场者。

GPU依然短缺，无论是大厂还是创业公司。大家都在找GPU。NVIDIA的学弟给我科普了GPU生产过程，是从准备矿砂讲起的。硬件不是我关注的重点，我了解有限。听上去由于生产周期很长，导致短期内GPU的短缺，长期应该ok。

AI非常早期

说起AI领域现状，一位投资人朋友形容得很生动。他说现在就像天还没亮，每个人都拿着个手电筒在四处照来照去，寻找方向。还没有到当年移动互联网真正兴起的情形。我跟不少朋友聊过，包括大模型开发者、使用大模型的大小公司、以及围绕大模型提供产品服务的Infra/工具的创业公司。总体的判断是大模型应用还在非常早期。

有个例子很有代表性。我有位朋友，之前是一家非常有名的上市公司的VP of Engineering；这几年出来创业，做eCommerce平台相关，有一百多员工，背后有美国几家知名基金投资。她的业务用得上大模型，最近她在探索怎么做，做了两个尝试。一是在MosaicML模型上，对私有数据进行fine tune。一是用GPT-4，把私有数据放在vector database，用search-retrieval把对应信息放到prompt里。两者对比，出乎她意料的是GPT-4居然比fine tune的结果要好。她很困惑，不知道fine tune应该怎么做才有效果。需要什么样的数据，用多少数据，如何finetune, 这些都不大清楚。而且，大模型是个黑盒，她觉得做大模型的人也未必对此很明白。另外，她说MosaicML用起来的体验并不好，不过也没有别的工具供选择。GPT-4虽然效果不错，她的私有数据又不可能公开，用来测试可以，正式产品是不行的。她觉得现有团队这方面的技术力量有限，接下来计划招AI工程师来解决这个问题。

我听了有点吃惊。因为她本人很资深，整个创业团队背景光鲜，技术实力不错。她如果还不清楚如何有效地fine tune，那其他公司可想而知。她的这个结果对比（fine tune不如GPT-4 search-retrieval），也不是特例，我听到多个类似的例子。我另一位朋友的创业公司是提供AI工具，服务大的企业客户。他说，大模型对大企业是全新的技术，他的客户们都是刚刚开始考虑，他们对于模型的精准度、速度、需要准备的数据质量和隐私问题，尤为关注。客户对于具体要用AI解决哪些业务问题，也在探索中。他判断至少要6-12个月大企业才可能在内部落地使用。

可见这一轮AI还处于非常早期的阶段，C端还没有看到killer app（除了ChatGPT）, B端落地也需要时间，AI infra和工具层，应该还有很大的发展空间。比如Databricks花13亿美金收购MosaicML，就是希望尽快建立起AI能力赋能给客户。

这里我看到两个积极信息：

正是因为还在早期，工具不完善，大企业没有现成的技术可用，才给创业公司留出了空间。如果大公司马上就能用起来，他们有自己的数据和场景，创业公司的机会就少多了。这是跟硅谷徐老师Howie讨论时，他提的观点，我很有共鸣。

大企业迫切地想利用起AI，至少很有危机感。我了解到，针对这轮GenAI，很多企业内部都设立了专门的预算。钱既然准备好了，即便在早期发展慢些，AI的前景还是很光明，不太容易凉凉。

为什么感觉这两个月AI发展慢下来了？

不知道大家感觉如何，比起年初，最近两三个月我感觉AI领域的节奏明显慢下来了。为什么是这样？观察下来，大致如下：

跟OpenAI的策略有关。这波节奏主要是OpenAI引领，它之前一直在憋大招，把过去两三年的成果（比如GPT-3)，从去年年底起用两三个月的时间都放出来，让人感觉目不暇接。经过这段时间追赶，Google成为强有力的对手，如今OpenAI也不敢随便推出没有ready的产品，否则得不偿失。所以，最近没有特别大的变化，感觉上可能比之前慢了。其实，我觉得这才是技术应有的节奏，本来就没有那么快。

创业者在埋头Build了。我在硅谷AI社区做了个讲座，谈到这个问题。社区的反馈，年初时创业者们忙着参加各种会议/讲座/meetup学习讨论，想弄明白GenAI是怎么回事。最近大家对大模型技术基本清楚了，开始忙着花时间构建自己的产品。外面看起来，好像没之前那么热闹了。

在研究领域，一篇篇论文还是在不断发表，并没有变慢。

一级市场的确慢下来

整体一级市场的投资节奏感觉有所减慢。主要跟大环境相关。人们觉得未来经济走势不明朗，而俄乌战争又增加了不确定性，影响人们投资的信心。另外，疫情期间政府大放水导致很多创业项目估值涨得很高，现在还在估值回调的过程中。在这个大背景下，AI领域的一级市场其实相对算好的。不过因为还在很早期，我观察到除了真正做大模型的有竞争力的项目（包括character.ai 其实也是在做大模型）拿到了很多钱，其他的AI创业项目，现在融资并不容易，投资人很多在观望。

大厂探秘：OpenAI，Google，NVIDIA

这波AI大潮中，OpenAI & Microsoft、Google和NVIDIA成为时代的弄潮儿。其中三家总部在硅谷，我特地去了解了下，总结下可以分享的信息。

OpenAI

OpenAI对信息保护非常在意，员工对此也很敏感。我了解到的不是很多，有几点印象相对深刻。

跟OpenAI合作的人都提到，他们的员工很能干，非常高效。它的系统性能和监控做得尤其好，工程能力很强。也许，Infra的工程能力 – 如何更高效地利用硬件、提升性能等，是它的一个核心壁垒。

OpenAI执着于AGI，这点我具体聊下来才真正有些体会。他们内部判断工作优先级，会看这个能不能帮助AGI发展。如果能够更好地训练模型，帮助模型学习，那会去做；否则不会花功夫。比如他们之前做过机器人，觉得受实际物理世界的制约很大，对AGI帮助有限，后来就停了。照此推断，它大概率不会去做垂直领域。

ChatGPT出现前，用户对LLM效果如何是没有感知的。让用户感知到是非常重要的。除了AGI，ChatGPT和API也是OpenAI的重点。

Google

之前Google在AI推进上比较慢，除了跟广告业务冲突，还跟两件事相关。一是有位研究员觉得大模型有意识，被解雇。再之前，有位黑人女性员工因为发论文被拒，告Google。这些让Google对AI变得非常谨慎，减缓了AI的进度。

Google一直觉得自己是领先的，直到ChatGPT出现，给到Google很大的压力。12月份内部开始code red（最高优先级），是比较少见的。现在公司上下对GPT非常重视，有专门团队做GPT（DeepMind和Google Brain合并），也鼓励其他团队尽快把AI用上。我有不少朋友在Google，聊起来，他们对Google有信心，觉得这方面Google至少不会落后。

NVIDIA

这次LLM大潮，NVIDIA成了最大的赢家。我其实对这家公司一直关注不多，因为我的经历和兴趣都在软件方面。这次好好了解了一下，发现很有意思，这里多分享一些。

一个人的Startup

NVIDIA的风格，概括说，是老黄Jason一个人的创业公司。在那里工作的朋友对Jason非常佩服，我听下来感觉Jason是个Superman。Jason一直相信Compute，无论股价如何，从2012年开始坚持做，从来没犹豫过。Jason对技术懂得非常深，对项目实际情况了解，又平易近人。如果有的事情决定不了，大家都去问Jason，他做决策又快又好。

Jason很有同情心。比如疫情刚开始时，本来公司平时是9月份做员工评估，他决定提前做。结果3月份全公司完成了评估，提薪和奖金，让大家提前拿到钱。同时Jason有洞察力，也有危机感，很受员工欢迎。即便在之前股价不好的时候，员工对他的评价也很高。

强调技术，组织扁平

它的公司文化跟我了解的其他公司有明显差异。作为一家近3万人的公司，NVIDIA至今没有people manager（只管人的管理者）。公司强调技术能力，管理者无论级别高低，技术都非常强。

组织扁平。全公司好像只有Jason有个助理，其他人都没有。我问那团建之类怎么办。朋友说公司没有团建，没有圣诞节晚宴，只有全公司的大会。会上Jason一个人脱稿讲两个小时，是个段子手，讲完后不少员工上去跟他合影。

NVIDIA生态

听说已久NVIDIA生态做得好，我特地去问指的到底是什么，朋友讲得挺清楚：

提供完备的工具。芯片从下到上是个deep stack，需要有各种支持的工具，包括compiler、debugger、profiler等等。研发人员的需求各不相同，比如有人想做深度优化，这样仅仅把功能封装成API就不行。

系统的速度和易用性。

公司的内部和外部，横向沟通都做得很好。比如，公司有团队负责跟客户沟通，同时他们对内部技术也非常懂。客户有什么需求，他们很早就直接跟内部研发团队讨论。内部也如此。软件团队跟硬件部门密切合作，不是等硬件做好了再开发软件，而是在过程中及时交互配合。

华人企业国际化

中美关系的变化跟硅谷息息相关。我这次注意到两个明显的变化。创业者在市场选择上更专注，要么做美国市场，要么做中国市场，很少有人两边兼顾。国内一些好的创业者和基金也在这里寻找新的机会。

华人企业如何做好国际化是个大家普遍关心的问题。周末参加了一个闭门沙龙，讨论的主题就是这个，我觉得嘉宾挺有代表性：有做全球市场的华人上市公司CEO，有聚焦投资中国企业出海的基金合伙人，有管理中国和美国两边团队的创业者，我也是其中一位。大家分享了不少洞察。中国在研发成本、完备的供应链、互联网产品运营和勤奋度上有优势，但是出海面临着完全不同的挑战，涉及市场销售、产品、团队文化和管理等等。嘉宾有共鸣的一点，是要做国际化业务，创始人的思维首先要国际化。

我的感慨更多是在讨论之外。国际化这个话题我并不陌生，多年前讨论的，是美国企业如何拓展到中国。如今是反过来，讨论中国企业如何做国际市场。世界的重心在变，经过这些年的努力，中国真的强大了很多，让人自豪。

流动的硅谷

我一直非常羡慕硅谷的人才资源和自由交流的氛围。这里的人才密度大，我经常聊着聊着，发现是清华校友。我的大学本科班30人，其中6位在这里。周末参加一位好友组织的烧烤聚会，随便聊聊，发现好几位都谈吐不俗。再多问一句，原来是深藏不露的成功人士。

因为是硅谷，创业风气一直盛行。随之而来的是各种讲座、论坛等等。我刚来时，朋友给了我一个Google doc, 上面密密麻麻列了旧金山城里的AI线下活动，几乎每天都有。我进城不方便，只选择性地参加了几次。后来自己搜了下，对于感兴趣的话题，都找得到各种线上Webinar和社区讨论等等。后来熟悉了，发现湾区这边的活动也很多。无论线上还是线下，这些活动的质量普遍非常好，有大厂或头部创业公司核心成员，有年轻的创业者，分享的信息密度大、更新快，讲的人独立思考态度真诚技术前沿。我一向喜欢学习新东西，在这里过得兴致勃勃。

硅谷是流动的，流动的人才、流动的信息、流动的资金。这些流动带来了活力和创新，让每天都在变化，感觉永远年轻。

关键词：