摘要:李彦宏:搜索本质上就是在解决人工智能最终要解决的那个问题,就是机器要真正地理解人的意图,并且能够做出相应的回应。李彦宏:这肯定是值得百度努力的一个方向。其实当初创立百度时,我也不知道搜索引擎能赚钱。
对话:李彦宏与张晓峰
来源:正和岛(ID:zhenghedao)
近日,百度凭借全新大型模型项目文心一言,再次站在了人工智能革命的前线。 百度为什么能做到,为什么能做到,它是怎么做到的? 从三年前的一次采访中就已经预见到了这一点。
三年前,“互联网+100人”创始人张晓峰对百度创始人、董事长兼首席执行官李彦宏进行了深度采访。
采访核心要点:
1、智能经济已经到了一个断点,就是技术、数据、算力的积累已经到了这个地步。 正好这三个人此时都有爆发的能力。
2、百度的开放和生态理念体现在百度飞桨平台上。 欢迎任何人使用它,并且它是免费的。 阿波罗也是如此。 百度有自动驾驶平台,源码可以随意使用。
3、我们坚信全球化,走开放之路,但要发展关键环节自主可控技术,关键技术必须掌握在自己手里。
面试时间:2020年5月8日
全文收录于《智慧经济》后记。 现摘录如下,以飨读者。
张晓峰:书籍是人与外界对话的重要载体,也是一个很好的互动界面。 我相信《智慧经济》这本书对我们与外界的对话、与这个社会的对话、与未来的对话一定会有好处。
李彦宏:是的,我们就是开诚布公地交流,把心里的想法都表达出来。
搜索引擎的演变和未来
张晓峰:从您最早的超链接分析专利,到将更多以机器学习、深度学习、自然语言处理为核心的人工智能技术加载到整个搜索系统中,请期待智能搜索还将给普通用户带来什么。 多么新的体验啊。
李彦宏:搜索本质上是解决人工智能最终要解决的问题,就是机器必须真正理解人类的意图并能够做出相应的反应。
这就是搜索引擎从第一天起就一直在做的事情。 用户表达他的需求,我们使用机器来尝试理解人类的需求,然后做出响应。
早期的搜索技术并不是使用人工智能来实现的。 第一代搜索完全基于词频统计; 第二代是我发明的超链接分析,利用别人的引用来确认内容的全面性和相关性; 2010年左右,搜索技术已经完全转向AI技术,利用机器学习:哪些用户搜索了哪些词,他们点击了哪个结果,他们在那个结果上停留了多长时间等等。完全利用这些用户的行为来学习,最终回答新用户或新信息的需求。 这是一个进化的过程。
百度近十年来的研发投入,旨在让机器智能逐渐接近人类智能。 在这个过程中,搜索仍然是主要的应用方向。
未来,搜索将越来越准确地理解人们的意图,人们的各种需求能够得到更好的表达。 过去人们输入关键词搜索,但现在可以使用语音和图像作为输入。
再想一想,未来会出现一个类似小度音箱的助手,更接近人而不是工具,其拟人化能力也会逐渐显现。 如今,小杜已经被家里很多人当成了“人”。 因为它像人一样回答问题,有时还会发表诙谐的言论。 您可以通过多种方式询问天气情况,它也能理解您所问的内容。 也能满足用户的陪伴需求。
未来,搜索结果除了现在的文字、图片、语音、视频等之外,还将以新的形式呈现,比如直播也是一种形式。 如果你想了解白皮松移植,可能会被引导到植物学家直播间。 您可以直接询问并立即得到答复。 您的问题可以由直播间现场人员解答。 这是一个值得期待的场景。 这样的场景也考验着百度的匹配能力。
另一种是全息成像。 现在是二维、二维的表达,但未来可能是三维的表达:虚拟人一步步解释如何做事,让用户更容易理解。
未来的搜索将与今天有很大不同,并且将使用许多现在不可用的技术。 但这都是和Al有关的,和我们过去十年、二十年发展的技术息息相关。
开放平台的生态理念
张晓峰:如果从生态哲学的角度来看百度的生态和开放平台,您认为特别关注哪些点?
李彦宏:对于这个问题,我们其实经历了一个比较痛苦的思考过程。 在PC时代,整个互联网是完全开放的,这意味着我们面对的是同一个生态系统。 那时候只要百度把技术做好,所有外部内容都对我们开放,格式标准化,我们就做技术。
进入移动互联网时代后,各个App逐渐封闭。 此时百度收录信息时间,百度面临着更加艰难的选择。 如果我们仍然走完全开放的路线,当大应用关闭时,我们可以获得的信息量必然会越来越少; 如果我们自己也封闭的话,那就和我们不一样了。 概念之间存在冲突,我们需要建立自己的内容体系和标准格式。
经过几年的争论和探索,百度已经确定,它将长期保持开放,并拥抱任何对我们开放的事物。 同时百度收录信息时间,百度也需要打造自己必要的能力。 这与中国当前的国家战略类似——我们坚信全球化,走开放之路,但要在关键环节发展自主可控技术,要把关键技术掌握在自己手里。 百度今天的概念或者说生态,基本上就是基于这样一个概念。
张晓峰:智能经济在这个节点出现,是不是算力、算法、大数据的发展在这个节点是契合的?
李彦宏:是的,或者说已经到了一个突破点,就是技术的积累、数据的积累、算力的积累都到了这个地步。 正好这三个人在这个时间点都有爆发的能力。 。 人工智能技术进一步成熟,可应用于多个领域,极大提高效率,改变人们的生产生活方式。
我们现在所说的新基建,无论是创新基础设施、信息基础设施,还是一体化基础设施,其实都形象地描述了智慧经济的基本特征。 百度在这三个方向都有深厚的积累。
比如创新基础设施方面,我们有飞片平台,还有语义理解技术和平台文心。 与Google BERT相比,后者多项指标明显高于其,效果也优于其; 现在学术界很多人都在用ERNIE做实验、发表论文。 这就是产业影响力。
百度的开放和生态理念体现在百度有一个飞桨平台,欢迎任何人使用,而且是免费的。 阿波罗也是如此。 百度有自动驾驶平台,源码可以随意使用。 对方是与百度竞争还是合作伙伴,并不那么重要。 无论如何,每个人都可以使用它。 我觉得这种东西以后成为新基础设施的时候,它的迭代速度会更快。 这在概念上有点不同。
帮助人们成长:
立足人、服务人、成就人
张晓峰:2019年初,百度视觉发布。 其中有一个非常重要的观点引起了深刻的共鸣:“帮助人们成长”。 我相信这不是可以谈论或言说的事情。
为什么选择这个时候来发布你的愿景? 您帮助人们成长的总体结构和愿景是什么?
李彦宏:我们也研究过其他公司。 并不是每个公司都有完整且明确的使命、愿景、文化、价值观等,即使是一些大公司也是如此。
百度已有20年的历史。 早期,当百度以搜索为主要产品形态时,其使命是“让人们平等、便捷地获取信息,找到自己想要的东西”。 2017年,百度逐渐进入人工智能时代,希望凭借自身能力做更多事情,使命升级为“用技术让复杂的世界变得更简单”。
这一切完成后,世界会是什么样子? 使命变得雄心勃勃,我们需要所有员工朝着这个方向共同努力。 到那时,百度将成为什么样的公司?
2018年夏天,我认真思考过这个问题,依然希望百度“成为最懂用户、能帮助人成长的全球顶尖高科技公司”。
第一,百度有这个能力; 其次,如果我们继续履行我们的使命,我们最终将到达这一点。 如何体现“助人成长”? 或者当你遇到市场需要但不能“帮助人成长”的情况时,你是否应该放弃? 如何选择? 这是我们的使命、愿景和价值观发挥作用的时候。
例如,在搜索中,我们以新的愿景、使命和价值观为指导来创建广告托管页面。 商家介绍不再是商家想说什么就说什么。 它们必须符合百度的规范。 百度必须对广告或托管页面上的内容负责。 。 这是一种自我净化。 即使影响广告收入,也要坚决去做。 这是构建良好生态、建立信任所必需的。
再比如2017年推出的小度家居,这个设备的定义和定位是什么? 很多人通过小度在家学习、购买课程、获取知识; 有些还用它来玩游戏。 这样就会产生矛盾。
2019年,我们认定小度在家主要是一个帮助孩子学习和成长的设备,所以我们逐渐弱化了游戏,并持续强化其教育功能。 这是基于我们的使命和愿景的选择。 当百度每一个产品的未来发展都出现冲突时,使命、愿景、价值观帮助我们做出选择。
张晓峰:我理解并同意这个做法。 人是一切的基础、支撑和归宿。 尊重人,尊重人的成长,更好地理解人,技术帮助人成长,这个非常重要。
基于全息肖像的数字孪生,
更好的理解导致更准确的匹配
张晓峰:谈一些个人的观察和想法。 人是核心。 他们既是用户,又是合作伙伴。 它们可能是我们生态系统中的物种。 他们也可能是我们的沟通者、分享者,甚至是大规模合作伙伴关系中的合作伙伴。 他们的角色非常多样化。
百度很早就选择了开放,百度的生态拥有大量优质的生态合作伙伴,主体多样、种类多样。 我理解别人在做“产品”,而百度在做“社会”。 这个“社会”将映射每个人和每个IP。
李彦宏:百度确实有一些先天优势。 例如,用户数据是长期积累的,数亿用户拥有大量的行为数据。 更重要的是,百度的基因是技术基因。
你刚才说,有些公司可能对用户数据的掌握非常好,甚至超过了百度的数据; 但我理解他们的理念是人与人之间的交流,他们并没有试图用机器来理解人。
百度是真正连接人与机器的,所以我们一直在技术上投入,试图让机器更好地理解人。
有了这些数据,我们就有了人工智能时代的燃料,我们利用技术对其进行最深入的了解。 这反映在我们的愿景中,我们可以更好地联系、服务和帮助人们成长。 未来将会创造出数字孪生,甚至是“永生”。 这个人的肉身也许消失了,但他的思想和精神却永远存在。 他的思维逻辑以及对事物的判断和反应都可以通过AI计算出来。
张晓峰:未来,人与场景、人与人、机构、人与机器、人与组织的连接将呈指数级增长。 从这个意义上说,百度更有资格、有能力打造“超级界面”,成为每一个IP的“界面人”和“经纪人”。 未来,百度可能会成为人力资本银行。
李彦宏:这绝对是一个值得百度努力的方向。 搜索引擎和移动生态系统正在这样做。 在搜索引擎诞生之前,很难想象世界上如此广泛的知识能够在一秒钟内完全获得。
很多以前我们需要记住、记住的东西,现在已经不再需要了。 当您需要了解某事时,只需在百度上搜索即可立即得到结果。 展望未来,它可以回答更复杂的问题,即需要大量推理和计算的问题,而不仅仅是简单的知识点或信息点。
所以,归根结底,百度做的事情,无论是工具还是助手,都可以让人变得更强大,让过去需要很长时间才能完成的事情,现在可以在一秒钟内完成; 这使得过去的人几乎不可能做到这一点。 不能做的事,现在一个人就能做; 它不仅可以赋能个人,也可以赋能整个社会,成为社会的基础设施。
人的不同维度、不同属性、不同行为可以用数据来识别,用知识图谱来帮助学习,用AI方法来辅助成长,掌握学习曲线,引导未来发展的方向和领域。
当我们以大局观看待科技、经济、社会、人时,无论是今天百度努力的方向,还是整个社会的发展趋势,AI了解人类科技的发展,了解更多的人和物。现实社会在数字化之后,成为新的社会基础设施:
交通可以有交通基础设施,医疗可以有医疗基础设施,安全可以有安保基础设施,紧急情况可以有应急基础设施。 所有这些东西都是数字化的,有数字孪生,可以与人产生各种交互,这肯定会大大提高社会效率,增强人们的获得感,增加整体安全性。
新基建加速AI社会基础设施建设
张晓峰:未来社会需要听到百度在新基建方面的声音。 百度在新基建、智慧经济乃至智慧社会中如何定位自己?
李彦宏:国家发改委解释说,中央提出的新基建分为三类。 第一类是信息基础设施,包括人工智能、大数据、互联网等。第二类是综合基础设施,如智能交通、智能能源网络等。 第三类是创新基础设施,即支撑科学研究和技术发展的基础设施。
在融合基础设施方面,我们相对较少涉及能源网络,但百度在智能交通方面涉及非常多。 从我们的Apollo智能驾驶汽车:到后来的车路协同,再到现在的智能信息控制——我们在长沙、保定、海淀等地部署了智能控制红绿灯,进行协调,帮助提高交通效率。 利用AI方法和数字孪生可以将交通效率提高15%至30%,这对GDP增长也是一个很好的推动。
这只是不使用硬件、完全依赖软件的运输。 对于城市而言,数字孪生可以应用于医疗、教育、金融、交通、物流、安全、应急、综合管理等各个方向,大幅提高效率、降低风险、提高满意度。 当社会基础设施和人充分连接时,这将是一个完全不同的社会,它将改变我们的方方面面。
从创新基础设施来看,与我五年前在“两会”提案中提出的“中国大脑”基本类似。 百度有深度学习框架,完全开放、开源,让别人创新; 它有一个自然语言理解框架,让别人不再做纯粹的基础工作,这是中国完全自主可控的基础设施。
所以今天我们面临一个新的机遇,就是把人工智能打造成社会新的基础设施。 这与100多年前美国工业化时面临的机遇非常相似。
云必须智能化,智能云将无处不在
张晓峰:假以时日,百度的人工智能将成为智能基础设施的基础,成为智能社会的基础。 您最近对智能云有了新的需求。 是时候这样做了吗?
李彦宏:云确实还处于市场比较早期的阶段,大家的认识还不全面。 对于百度来说,我希望利用百度AI技术的优势,实现更多端到端的云融合,而不是简单地在基础云层面进行扩张,与别人竞争同质化。
张晓峰:知道了。 我们将其定义为智能云。 我们的AI能力是毋庸置疑的,所以称其为智能云也是合理的。 当然,我想微软也称之为智能云。 这个行业和服务必须是智能化的。 恐怕没有人会怀疑,但客户可能理解不清楚。 百度智能云是否已形成品牌认知度和市场差异化?
李彦宏:云其实是一个非常广阔的领域。 在很多领域,每个人都有发挥的空间。 百度目前的领先技术,如智能客服等,充分利用了百度在自然语言理解方面的优势。
比如与中国联通合作,手机客服无非就是套餐讲解、服务套餐修改等,用户需求很简单,但在过去依靠人工回复完全不经济。 使用百度的智能客服方式,可以大大提高沟通效率,给出更好的解决方案或者更准确的答案。 在这样的轨道上,我们已经领先了。
在金融服务场景中,与浦发银行合作的虚拟数字人为用户提供金融咨询服务,得到了用户的认可。 在医疗辅助诊疗方面,百度的技术正在逐步在多个县级医院推广。
面向长周期,
相信技术的企业必须有理想
张晓峰:听说你还有一个别名,叫艾先生。 百度在研发方面投入巨大,非常具有前瞻性。 一些应用程序会产生回报,但大多数需要长期投资。 我有一个观点,所谓“战略就是站在未来看现在做什么”。 百度最初的战略决策考虑的依据是什么? 是不是有很多内部和外部的质疑? 坚持下去很难吗?
李彦宏:压力确实很大。 毕竟你身边有很多人每天都在看股价,会告诉你别人做了什么特别受欢迎的事情。 但我们更愿意将这个时间线延长一点,以看到技术的价值。 如果你看三五年前的东西,你会面临很多诱惑。 但如果你看一个能持续30年、50年甚至更长时间的东西,你会发现坚持自己的理想还是很有价值的,而且最终会得到回报。
每个行业都有其兴衰。 我彻底经历了互联网的酸甜苦辣。 我1991年在美国接触互联网,互联网的商业化大约从1994年开始,直到2000年代初,互联网才迅速发展。 此后开始了相当长的一段时间的低迷。
如果我们看纳斯达克指数,2000年突破5000点,2001年可能超过1000点,用了十几年才回到2000年的水平。如果当时没有耐心放弃,后来的互联网繁荣与你无关。
人工智能也是如此。 几乎从2016年开始,就是AI快速发展和广泛认知和认可的阶段。 过了之后又会出现一次低迷,大量AI公司会倒闭。 因为没有赚快钱的机会,所以很多人都会怀疑并离开。
但随着时间的推移,这种基础技术的积累会对基础设施产生影响。 我想它的价值迟早会体现出来,也许五六年,也许七八年,也许十年。
我恰好是一个相信这个东西的人,所以无论面对多大的压力、诱惑、怀疑,我仍然坚持自己的判断,在这方面进行投入。
张晓峰:我们团队的支持怎么样?
李彦宏:这也是一个自然的选择。 如果他们不相信这一点,还有很多机会去其他公司。 百度的人才非常好,找到一份好工作并不难。 大多数留下来的人都和我一样相信这个东西。 不信的话,待在这里会很不舒服。
通过这样的自然选择,留下了一群志同道合的人。 那些真正相信技术可以改变世界、相信人工智能是像工业革命一样伟大的浪潮的人们将在这里一起做出伟大的事情。
张晓峰:这种毅力和冷静是了不起的。 我看了一些资料,发现我们整体研发投入一直稳定在15%左右?
李彦宏:这几年基本都是15%左右。 有时会高一点。 对于百度这样规模的公司来说,15%其实已经很高了。 但百度本身定位是一家高科技公司,我们应该维持这个投资。 而且,正如你所说,大量的投入需要耐心,两三年内不会有回报。 但如果你相信这个东西,你可以坚持投资七年、十年。
其实,我刚创立百度的时候,并不知道搜索引擎可以赚钱。 我只是觉得这个技术很酷,而且我了解这个技术,而且它可以对很多人有用。 那是2000年,搜索引擎还没有商业模式,大多数人并不看好。