“我既喜欢这个东西,又擅长这个东西”。
早年在美国留学,李彦宏上过一门关于人工智能的课程,导师对人工智能的未来表示疑虑,让他们不要太痴迷。
毕业,李彦宏放弃攻读计算机博士,进入一家金融信息公司。他在那里开发了个实时的新闻检索系统。道琼斯后来买下这家公司,系统一直沿用。这是让李彦宏颇为得意的一件事。
不过更重要的,是他从那次开发中感受到搜索与数据的潜力,或许连他自己也没想到,三十年的成长路会由此划定。他回国创办百度,同时打造了个技术熔炉。
痴迷科技,用科技手段创业并成长壮大,并渴望在技术的浪潮里成为弄潮儿。这是李彦宏最重要的特点。
也许正因如此,李彦宏入选了《时代》周刊最近发布的首届“百大AI人物”榜单。他作为唯一登榜的中国企业家,与马斯克、黄仁勋等企业家一道,成为“全球AI领袖”。
榜单评语是:“他们的洞察力、愿望和不足将决定这一日益有影响力的技术的方向。”
从十一年前开始
2012年12月的一天,一场秘密拍卖会在美国内华达州一家赌场酒店里进行。百度的高管秘密参与了这场拍卖会。在这之前三个月,百度所有产品经理都收到了李彦宏的一封邮件,要求他们关注人工智能的最新进展“深度学习”。这个方向在那个时候还算不上主流。
李彦宏指派高管参与的拍卖,开启了深度学习从学术性研究走向产业界的大门。
拍卖人是有“深度学习之父”之称的杰夫·辛顿和他的两名学生。辛顿在全球首次提出了深度学习概念。竞价互不知情。作为最早的行动者,拍卖开始前,百度给出了1200万美元的报价。角逐到最后,微软和退出,百度和谷歌将价格抬到了4400万美元。这场争夺围绕的是辛顿及其学生的去留,更是对深度学习的先发优势。
AI的大幕自此拉开。半年后,在距离苹果总部不远的加州库比蒂诺,百度成立了深度学习研究院,李彦宏亲任院长。在这之后,AI研究院逐渐在国内科技圈开花。就做研究院这件事,李彦宏说“深度学习这一波起来之后,觉得是完全不一样的东西,需要在理论上、算法上,在很多方面有长远的布局和突破……去大规模吸引人才,去推进算法。”
李彦宏开始砸下真金白银。近十年,百度累计研发投入超1462亿元。百度2022核心研发费用214亿元,占百度核心收入比例达22.4%。百度有四万员工,其中有六成是研发工程师。2022年,百度研发投入233亿元,研发强度18.85%,全国工商联《2023中国民营企业500强调研分析报告》报告显示 ,百度在国内民营企业中研发强度排名第一。
本身,李彦宏是自然语言处理方面专家,搜索引擎无论从数据处理后面的算法,还是通过语言算法,到最后的评价系统,都是与语言大模型非常相关的一件事。
这也成为他较早看到AI趋势,并躬身入局快速作出反应的重要因素。
国内企业中,百度的技术基因众所周知。而企业家中,李彦宏的技术标签也最为鲜明。当年从美国穿云破雾回到中国,他怀揣着“超链技术分析”落地北京。李彦宏原本想像在硅谷一样,招有五年工作经验的工程师加入,但那时他才发现国内真正懂搜索引擎的人太少。
2021年3月,百度回港二次上市。李彦宏在致股东信中把技术人才在内部的培养比作“熔炉机制”。外部环境则起到了添一把柴加一把火的作用。他想通过人的输出,搭建起中国互联网的技术骨架,让更多企业看到技术的价值并重视对技术的投入。
他认为这件事意义非凡。十年下来,李彦宏也成了名彻头彻尾的“AI校长”。
百度AI,水大鱼大
2023年3月,百度对外发布了大语言模型“文心一言”。跟李彦宏一起出席发布会的,是百度的CTO王海峰。早年专注于自然语言处理和语音基础理论的王海峰是从百度内部起来的AI专家和高管,他2010年加入百度,牵头深度学习等领域。2018年底,王海峰被任命为了CTO。
王海峰在“文心一言”发布会上发言。图源:视觉中国
在此前的2017年,李彦宏整合内部AI资源,成立了百度AI技术平台体系。
今年接受《三联生活周刊》采访时,曾在百度做了五年总裁、现任清华智能产业研究院(AIR)院长的张亚勤讲,百度在2018年就开始做关于文心一言的大模型(ERNIN)。他也觉得百度在人工智能方面实力最强,投入时间也最长,有先发优势,“因为做搜索和推荐最需要AI,它也做各种各样的AI产品,比如小度、无人驾驶、智能云等,所以大模型背后的技术是它必然涉及的”。
在百度对外讲述中,有个常提的事情是,百度是全球唯一全栈布局四层架构的公司。
最早因为搜索应用需要,百度一直是买别人的芯片。李彦宏后来说“毕竟太贵了,所以自己开发了”。百度的昆仑芯已经有两代,量级在几万片;在芯片之上是框架层,也就是深度学习的框架,百度自研了目前市场份额排第一的飞桨,聚集的开发者数量有500多万;模型层除了文心一言,还有交通、能源等行业大模型;最上面即类似搜索等应用。
有技术及相关产品,做四层有什么好处呢?是可以端到端的优化,每一层能给其他层反馈。
这是李彦宏的雄心,背后有它的坚持。百度股价多年来沉寂,直到近两年逐渐划出一条相对陡峭的上升曲线。在《致股东信》中,李彦宏自己说多次徘徊在十字路口,受到质疑。他向内部给出的回复是:即便五年十年没有商业回报也要做,“我们能够做得起”。
百度也在利用AI技术积累向外延展,获取更多C端用户和交互数据。2018年3月,百度发布小度带屏智能音箱,价格由李彦宏亲自敲定,定价599元远低于市价。腾讯《深网》报道中称,李彦宏对智能硬件业务极为看重,会直接过问。
搜索之外,百度在应用层做得最多的与交通有关,其中一个是自动驾驶技术,如“萝卜快跑”;另一个是智能交通,通过调整红绿灯变灯时间,交通效率会有15%-30%的提升。
伴随AI扩张,是百度日益聚拢的AI人才体系,包括上述王海峰、张亚勤,及女性领导者吴甜等。这次和李彦宏一齐登榜“全球百大AI人物”的,还有吴恩达。吴曾负责“百度大脑”计划。百度的人工智能团队在短期内急速扩张,人数增长到了1300人。
水大鱼大。整个市场,AI的土壤肥沃起来。后来有不少从百度走出的人,成为AI各个领域的风云人物。李彦宏曾带些玩笑式地说,他不知道百度的无人驾驶技术是否会因此而无法保持领先。
百度跟学院机构合作已培养了300万AI人才。AI环境对工程师们保持着吸引力。
大模型的下一站
爆火之后,各大厂纷纷推出大模型应用。竞争趋向激烈。
3月16日文心一言发布,李彦宏出面做演示,他也受到了最多关注,有人说他紧张,他说后来回看了发布会实况,没觉得自己紧张。演示场景是他选的,别人的建议他也都看过。
李彦宏在“文心一言” 发布会上发言。图源:视觉中国
一个凑巧的事情是,在同一天上线了GPT-4。李彦宏并没有想到,“对于我们来说实际上也没有那么重要,我们能看到可提升的地方已经足够多了”。他原定发布时间是3月底,但3月17日是亚布力论坛,现场有政府领导、媒体、企业家们。他决定往前赶一点。
但一个更重要的原因,或许是他看到了市场需求。当时已经有不少厂家在询单。张亚勤说,大公司有时候由于搞不清市场接受度在哪里,比较谨慎。但他也认为,一个产品成熟起来的最好方式,就是让大家使用,用了之后,公司知道反馈,相当于帮这个产品做得更好。
李彦宏讲过一个“盲人魔方”的例子。一个盲人在没有外界反馈情况下需要137亿年才能还原魔方,而在有反馈条件下只需要两分半钟。2022年10月公司内部总监会,李彦宏完整讲述了创新理念——创新驱动增长,反馈驱动创新,创新不是凭空想象的,不是没有基础情况下就突然能造出一个摩天大楼,创新是市场不断地给反馈,才有机会往前走。
大模型的下一站是应用。“AI原生应用要能解决过去解决不了、解决不好的问题,应用才是大模型存在的意义。”文心一言发布后,李彦宏要求四万员工有意识培养AI原生应用的思维方式,把所有产品、服务和工作流重做一遍。他以强调口吻讲,不是整合,不是接入,是重做,重构。这是对内。对外,百度人工智能技术平台负责人吴甜认为,AI应用不仅仅是技术,还是行业与场景相结合,“今天发布的10个大模型里面,有7个模型是开源的”。
从因特尔到,开放是核心。大模型的基本要素有三个:算法、算力和数据。数据,尤其是行业性数据在未来会极为稀缺。对于用户和各企业平台来讲,如何使用AI以及如何教会人使用AI也是一个无法绕过的课题。在与媒体对话时,李彦宏称一个针对个人的提示是:不会面向AI写提示词(,人与机器进行交互的指令语言)的人会被淘汰。
人是目的,但AI不是。AI终要回归对人的辅助和效率的提升。
李彦宏想用科技让纷繁复杂的世界变得简化。他并不担心创新带来的不确定性。他觉得最大的危险和不可持续是不发明不创造不进步,惯性之下各种各样不可预知的风险。
互联网第一时代,某种程度实现的是“人与信息”和“人与人”之间的连接;到了移动互联时代,越来越多的服务被连接进来,连接“人与服务”开始变成主旋律;而人工智能之于互联网,乃至整个商业社会的意义,是能够极大加速和辅助“人与服务的连接”。
把“技术”两个字拆开看,技,左是手,右是支;术是方法,很早以前也做城邑中的道路来讲。这可以说是李彦宏这些年在做的事,寻找让人事物变得更简单高效的办法与途径。
这样讲,AI校长李彦宏也是个建路造桥的人。
——END——