来源:新智元
图片来源:由无界 AI生成
在AI革命的浪潮中,谷歌为什么失去了领先地位?最近,NVIDIA科学家Jim Fan转发了Socratic公司创始人的一篇博客,为我们提供了一个难得的视角来了解谷歌的内部运作。
在当今的人工智能浪潮中,OpenAI这样的新兴公司引领了革命。
——而GPT的一些关键部分:Transformer、强化学习(AlphaGo ) 和 多模态(Flamingo)却都是由Google发明的。
那么为什么,作为科技领域巨无霸的Google,却在如今的群星闪耀中稍显黯淡?
最近,Jim Fan转发了Socratic公司创始人Shryans Bhansali的一篇博客,我们也许可以从Shryans的文字中一窥缘由。
Socratic创建于2013年,主要产品是一款「拍照搜题」的应用,公司在2018年被谷歌收购。
在那个互联网产业空前繁盛的年代,数不清的创业者心怀梦想、雄心勃勃,投身于浪潮之中。Shryans是其中之一,同时也是成功者之一。
而今天,我们谈论更多的,可能是经济形势、市场预期和求职情况。
同样的,当Socratic被谷歌收购,Shryans成为公司员工之后,他又是怎样看待自己的工作,并推进自己的梦想呢?
创业者的独白
2017年,当我们开始为Socratic筹集B轮融资时,我们很快意识到,以牺牲收入为代价来获取使用率的做法会让我们吃亏。
每家风险投资公司都要求我们提供货币化计划,于是我们得出结论,一个专注于没有信用卡的高中生的教育应用不会成为一个大企业。
公司的联合创始人Chris Pedregal曾在谷歌工作过,他重新联系了他过去的经理,我们对一个以学习为中心、由人工智能驱动的家庭教师的愿景是完全重合的。
也许是因为我们刚刚赢得了谷歌2017年度「最佳应用」,那次会面后不久,我们就启动了一个流程,最终,谷歌在2018年3月收购了Socratic。
我们与现有的一个同样规模的团队合并,该团队由多名长期在谷歌工作的人员组成。Chris和我成为产品和工程负责人,负责打造人工智能驱动的辅导员,并将这些功能引入谷歌最大的产品中。
在接下来的三年中,我们重建了Socratic,将其重新命名为 「Socratic by Google」,并且在搜索和Lens中提供了Socratic功能,还发布了数学求解器和逐步数学辅导原型等功能。
在谷歌工作
一路走来,我学到了一些东西:
在谷歌工作就像拥有了第二本护照。到世界上任何一个大城市,你的胸卡都能打开一个漂亮的办公室,里面有美味的食物、办公桌,还能高速连接谷歌20多万人网络中的每一个人。
包括访问他们的巨型monorepo,其中包含数十亿行代码,几乎涵盖了他们所有的产品。遍布全球的数据中心的实时状态。跨越二十年历史的战略文件。
谷歌以谷歌的方式做事。谷歌使用的几乎所有软件和基础设施都是在谷歌建立的,这是比大多数公司更早面对最棘手的工程问题的自然结果。
在谷歌这样的规模中,外部世界已不复存在,只有在极少数情况下,才会被小心翼翼地允许进入他们的围墙。
这意味着我们不可能保留现有的代码库。我们需要从头开始,与新团队一起重新开发我们的产品,然后在谷歌的堆栈上重建我们的应用程序。
我们的应用程序吉祥物 「Ceebo」打破了谷歌的固有模式。看看谷歌的应用程序图标集,你会发现只有四种颜色和简单的形状。这对他们来说是可行的,但对我们来说却是无趣的。
他们反对(「我们不会拟人化」),我们也反对(「你们安卓系统就会拟人化!」),直到最后我们终于如愿以偿,因为我们太小了,根本不重要。
Ceebo作为我们的应用程序图标继续存在,并在谷歌内部绽放光彩,谷歌已经为其设计了数十种变体,Ceebo也出现在谷歌的文档和网站中。
简单的事情重复做就会感觉很神奇。与搜索领域的资深人士一起重新构建我们的查询分类系统,让我们对搜索本身的构建过程有了更深入的了解。
一方面,信息检索工具的深度令人难以置信,而计算并为互联网上的每个页面添加新信号的能力也令人匪夷所思。
另一方面,我们发现大多数搜索改进都是由工程师通过「并排」比较新旧结果……在电子表格上进行人工审核的!
人们可能会认为谷歌的工程设计主要是实现博士级的算法,虽然有时确实如此,但搜索或人工智能工程师的大部分工作都涉及查看示例、发现模式、手工标注数据以及在杂乱的数据中进行分析。这似乎是最优秀的人工智能团队的普遍真实写照。
我注意到的一个模式是,优秀的人工智能研究人员愿意手动检查大量数据。不仅如此,他们还建立基础设施,使他们能够快速手动检查数据。手动检查数据虽然并不光彩,但却能为问题提供有价值的直觉。
大多数1000万至5000万用户的问题都不值得Google花时间,也不符合他们的战略。但对于那些符合其本质、战略和某人推广目标的问题,他们会花大力气去解决。
其中一个例子是:计算机视觉是Socratic界面的重要组成部分,特别是能够读取图像中的文字和数学。
作为一家初创公司,我们使用了第三方工具,但在谷歌内部使用该工具太困难了,因为会暴露敏感数据、对规模的期望以及复杂的供应商审查流程。
有时,收购一家公司将技术引进公司内部会更容易。还有一些时候,就像我们的情况一样,雇佣了一个顶尖的博士人才来研究这个问题,并在6个月内提供了一个世界级的数学识别API。
谷歌是一个目标和努力不断变化的网络。在谷歌,只要有合适的人关注,就有可能实现令人惊叹的成就。
一个能理解的副总裁,一个有相关章程的研究团队,或者一个与组织目标相匹配的人。处理好这些混乱的利益关系是项目经理的一半工作。然后,你还需要得到隐私、信任、安全和基础设施等审批者的支持。要知道一个想法是否可行,需要数十次对话,而要实现它,则需要数百次对话,但这个过程是快乐的。
团队目标在任何一个季度都可能发生变化,整个团队也可能在重组中消失,这种现象如此普遍,以至于谷歌人可以透过悲剧看到喜剧。
假设你解决了所有这些问题,一觉醒来,你可能还是会发现,当你在为自己的项目工作时,两个遥远的团队也在为同样的想法工作,现在到了一决雌雄的时候了,因为只有一个团队可以继续工作。
Googler们想做伟大的工作,但往往做不到。毫无疑问,有些人是为了吃饱饭,每天工作3小时,然后享受提前退休的待遇,但我遇到的所有人都是认真、勤奋、想做伟大工作的人。
打败他们的是审查的重重关卡、频繁的重新修订、过去失败留下的制度疤痕,以及在世界舞台上做简单事情的复杂性。初创公司可以忽略很多问题,而谷歌人却很少能做到。
人本身也是一个问题——所有聪明的人都能反驳任何事情,却不能支持某件事情;所有领导者都没有勇气说出令人不舒服的真相;所有被雇用的人都没有明确的工作项目,但仍然必须通过有晋升价值的虚构工作来留住他们。
头重脚轻的组织很难引导:一个由多名成功的联合创始人和在谷歌工作了10-20年的资深员工组成的团队,听起来可能是成就大事的秘诀,但也是陷入僵局的秘诀。
如果有多个领域需要探索,有明确的目标,并且有很强的自主性去追求这些道路,那么这种结构可能会奏效。
但如果你想开发一个统一的产品,就需要有一个明确的领导者,明确的方向,以及更多的实践者而不是思考者。与直觉相反的是,为早期项目增加人手并不会让项目进展得更快。
另外,技术债务是真实存在的。优秀的团队会定期在平静的日子里清理工作,从而偿还债务。
流程债务也是如此:因为发布出错而增加的审查、为防范可能的诉讼而新增的法律检查、在文档模板中添加一个部分。多年来,层层累积,直到一项新功能准备就绪数月后仍无法发布,因为它被卡在审核之间,出路不明。
谷歌最近改变了他们繁琐的绩效考核流程,从一年两次改为一次,问卷从长变短,希望能从占经理一年30%以上的时间减少到10%以下。
有时,外部威胁会迫使公司做出改变,或者促使公司走向衰落。谷歌发明了ChatGPT背后的技术,却并不是发布该产品的公司。现在,谷歌希望重新夺回在人工智能领域的领先地位,同时还需要防范一切可能的麻烦。
谷歌的「游戏」
在谷歌,只要你玩对了游戏,就有可能实现令人惊叹的成就。
谷歌曾经有一套内部价值观,他们称之为 「三个尊重」:尊重用户、尊重彼此、尊重机会。前两个很容易理解,但第三个却让大多数人感到困惑。
我的解释是:你在谷歌,这是一家利润丰厚、充满天才的企业。你收入丰厚,衣食无忧,生活在永恒春天的天堂硅谷。在这种疯狂的运气下,你能做的最好的事情是什么?
——你必须找到自己领域中最重要的问题,并不惜一切代价去解决它。
实际上,这意味着首先要完成交给你的工作。一旦这些工作都在掌控之中,你就必须深入到庞大的谷歌网络中,了解正在计划和发明的东西,凝聚一个清晰的未来形象,通过文档和演示使其成型,找到目标与这个形象一致的领导者,并尽可能坚持不懈地推销你的想法。
曾经,我们三个人花了几个月的时间,在新的数学求解器基础上制作了一个循序渐进的数学辅导演示。这个演示为我们的智能辅导愿景提供了一个具体的形式——它有一个链接,可以使用,可以分享。它使对话接地气,让人们做出一些具体的反应,并在我们团队之外传递,独立讨论,然后引导我们。
许多收购都以失败告终。Socratic的故事喜忧参半。一方面,我们成功地融合了两种截然不同的文化,我们的产品得以延续,并发展到每年为约50亿次查询提供服务,Socratic团队的事业也得到了蓬勃发展。
另一方面,Chris和我都离开了谷歌,创办了创业公司,而无论是Socratic团队还是整个谷歌,都还没有开发出与谷歌能力相匹配的人工智能辅导工具。不过,几个Socratic团队的谷歌员工可能会让它成为现实。
参考资料:
This article offers a rare view into the inner workings of Google, and sheds light on why OpenAI spearheaded the LLM revolution even though most of the foundation tech originated at Google.
Google is right in the thick of the Innovator's Dilemma. I am sure they know very well… pic.twitter.com/YT5tgVz8lt
— Jim Fan (@DrJimFan) November 13, 2023
https://shreyans.org/google