本月正在香港大学陆佑堂做了一次演讲。这是港大经管学院陈坤耀非凡学人讲座的系列行动。传闻,17年前,马云曾站正在统一个舞台上。主办方称,这回演讲的报名速率创下记载:邮件发出两小时内,突出1200人报名。
![]()
美邦人何如算谁赢?看谁的大说话模子(Large Language Model)更强。即日是OpenAI领先,来日是Anthropic,后天大概是别人。但蔡崇信说,这个计分形式自己就有题目。
这个判别的底层逻辑是:AI的代价正在于排泄率(penetration rate)。中邦邦务院的AI策划就很务实——到2030年,AI代庖和设置的排泄率要到达90%。不讲形而上学,只讲普及。
为什么?由于15年前中邦就初步大界限投资电力传输本原办法。北方发的电要送到南方,新能源产地和用电需求地往往不重合,务必靠输电收集打通。中邦邦度电网每年血本支付900亿美元,美邦惟有300亿——三倍的差异。
结果是什么?中邦的电力装机容量是美邦的2.6倍,况且新增装机容量是美邦的9倍。这个差异还正在拉大。
蔡崇信提到一个风趣的数据:环球险些一半的AI科学家和商酌职员,都有中邦大学的学位——无论他们现正在正在美邦公司、中邦公司,照样寰宇任何地方劳动。
他还讲了个段子。比来社交媒体上有人吐槽,说我方正在Meta(Facebook)的AI团队里,同事们都正在用中文交换思法,他统统听不懂。
以前中邦公司出海,说话是劣势——正在意大利兴办公室,外地人不会说中文,中邦员工得用第二说话疏导。但正在AI范围,环球的华人工程师用中文分享思法、互换思绪,这反而成了音信上风。
锻练一个万亿参数的模子,倘使编制效果不高,GPU泯灭会卓殊可骇。中邦团队由于硬件受限,务必把编制优化做到极致。DeepSeek即是这么逼出来的——阿里的通义千问(Qwen)模子方才获得了一场为期两周的加密货泉和股票来往AI竞赛,DeepSeek排名第二。
蔡崇信的看法很直接:开源模子会击败闭源模子,不是由于开源更优秀,而是由于开源更契合环球大大批用户的好处。
他举了个例子。假设你是沙特阿拉伯,思发达AI,又思保留“AI主权”(sovereign AI)——意义是AI不受外邦统制。但你没有人才我方开荒模子。
这时辰你有两个选取:选取一:通过API行使OpenAI。付良众钱,况且数据要喂进去——你不懂得数据去了哪里,那是个黑箱(black box)。选取二:直接下载阿里的开源模子,摆设正在我方的私有云上。免费,况且数据统统可控。
阿里靠的是云估计打算。你用开源模子没题目,但你要跑模子,须要云本原办法——存储、数据收拾、安定、收集、容器(containers,他说这个词他我方也不太懂)。这些阿里都能供给。开源模子是流量入口,云办事才是利润来历。
这个形式原本很像当年的互联网公司:免费产物获客,增值办事变现。只然而界限和工夫门槛统统差异。
阿里1999年设置时,中邦还没参与WTO,邦际商业务必通过邦有商业公司。2001年入世之后,小企业能够直接和环球做生意了。阿里的B2B平台即是助这些小厂找买家——初版网站是英文的,面向海外。
厥后消费者电商起来了,就有了淘宝。买家和卖家互不信托,就发现晰付出宝(最初是个担保来往编制)。物流跟不上,就投资物流。
云估计打算也是一律的逻辑。16年前,没人计划云。但阿里的消费平台要照料海量数据,倘使不断用Dell的办事器、EMC的存储、Oracle的数据库,悉数利润都市交给这些供应商。
是以阿里云的开始是我方吃我方的狗粮(eat our own dog food)——先内部用,用好了再盛开给外部客户。
蔡崇信对年青创业者的创议也很了了:优先选取有机伸长(organic development),而不是并购。由于我方团队提拔出来的才略,DNA纯朴,文明结婚。阿里也做过并购,有些得胜,有些腐败得很惨。
第三,学会提问。蔡崇信稀少夸大这一点——提出准确的题目(ask the right questions),比找到谜底更紧急。
良众人说AI时期无须学编程了,用自然说话(natural language)就能指导机械。蔡崇信不协议。
数据科学(data science):原本即是统计学的新名字,但另日数据会爆炸式伸长,懂得收拾和说明数据的人永恒稀缺。
心思学和生物学:意会人脑何如运作。人脑已经是最高能效的机械,AI的良众安排思绪都来自对大脑的模仿。
质料科学(material science):寰宇现正在被比特(bits)主导,但让比特跑得更速的,是原子(atoms)。半导体范围会有大批改进,而半导体的主旨即是质料。
但他增补了一句更紧急的话:机遇是来找你的,不是你去找它的。你要做的是预备好(preparedness),云云机遇来的时辰能力捉住。
金融市集泡沫(financial market bubble):股票估值是不是太高?50倍市盈率合不对理?这是一门艺术,我不懂得。
他的判别是:AI大概存正在金融泡沫,但工夫自己是线月互联网泡沫瓦解,但互联网并没有没落——即日互联网比那时辰宏大得众。
蔡崇信具有NBA布鲁克林篮网队(Brooklyn Nets)、WNBA纽约自正在人队(New York Liberty)、NLL圣地亚哥队(San Diego Seals)和拉斯維加斯戈壁之犬队(Las Vegas Desert Dogs)等众家美邦职业运动队。本年篮网时隔六年重返中邦(澳门),这是他主动饱吹的。
但他做体育投资最用意思的片面,是一个训诲项目:每年选6-8个中邦初中生,送去美邦读高中、打篮球。
他说这是正在复制我方的始末——13岁脱离台湾去美邦念书。人与人的交换(people-to-people exchange),比任何官方渠道都紧急。
不是模子自己,而是让AI被普及行使的总共生态编制。电力本钱低40%、数据中央修理本钱低60%、环球一半AI人才有中邦粹历、资源匮乏逼出编制级改进——这些加正在一块,让中邦更有大概竣工AI的大界限普及。而普及率才是线:为什么开源形式会赢?
由于对环球大大批用户来说,开源同时处置了本钱、数据主权和隐私三个题目。闭源模子要付费,数据要喂进黑箱;开源模子免费,数据能够留正在当地。这不是工夫优劣之争,是好处方式使然。
学编程不是为了写代码,而是锻练逻辑思想;学统计(数据科学)是由于数据会爆炸;学心思学是由于要意会人脑这个最高效的机械;学质料科学是由于让比特跑得更速的是原子。更紧急的是,学会提出准确的题目——这比找到谜底更有代价。*