技术创新的漫漫长路,总有人上下求索,用执着和热情推动着技术的洪流滚滚向前。
在张林华十几年的职业生涯中,他始终保持着对新技术的敏锐嗅觉。从深圳中微电,到腾讯,再到洲明,一次次义无反顾地奔向新技术。始于计算机,涉猎嵌入式、SoC、操作系统、音视频、VR/AR、云计算、云渲染、XR虚拟制作,到如今炙热的数字人、大模型、生成式AI、MR、空间智能等。
这种探索求知欲,在幼时已有显现。小时候,他对新事物总是充满好奇,家里的闹钟、玩具、小霸王都会被他拆开研究,再小心翼翼地安装复原,以防被父母责备。
后来的一路经历和选择,从互联网大厂跳出舒适区,转投科技制造业,也正是源于他这股喜欢折腾、不安于现状的劲儿。
如今张林华最想做的,是打造出一款AI时代的现象级产品,结合算法、硬件、交互融合起来,让过去十年的沉淀在这个产品上绽放。
他说,这将是自己职业燃烧的起点和一生的追求,希望能找到更多志同道合的人一起把这件事做得有意义。
▋ 带着憧憬选择芯片创业公司
2012年是中国移动互联网爆发式增长的一年,移动网络从3G向4G升级,移动设备用户数超越台式电脑数。这一年,张林华也结束了在中科大的读研生活,进入一家芯片创业公司:深圳中微电,促使他来到这的理由主要是两个人:梅思行和周志德,中微电的两位创始人。
两位创始人(左:周志德 右:梅思行 )
梅思行是NVIDIA的主架构师之一,在硅谷有超过30年的半导体从业经验。他直接参与了数代NVIDIA图形处理器芯片中的流处理器架构和硬件设计,是芯片设计领域不折不扣的大牛。
而周志德是梅思行多年好友,世界著名的编译器专家,曾任MIPS首席工程师,也是编译界普遍采用的Open64编译器的首席架构师。处理器大牛加上编译器大牛,这个阵容深深吸引了张林华。
张林华在读研时选择了嵌入式方向。在他看来,软件与硬件作为计算机系统中相互依存的两部分,如同硬币的两面,自己都应该去学习。而嵌入式系统的核心正是在于软硬件的协同,能够找到最优解,实现更高效、更规范的系统运行。
从读研到就业看上去似乎一切都是水到渠成。在深圳中微电,他主要负责系统级音视频编解码相关工作,每天与行业前辈和技术大牛共事,他觉得很荣幸也很充实。
2014年至2017年期间,正值中微电成立以来面临最大的发展危机,团队濒临解散,大部分成员去了华为或创业。想起那段经历,张林华心中有些惋惜。中微电的技术很牛,在当时中国或许是唯一一个能做出GPU的公司,但缺少好的落地场景,也没有赶上AI的机会,技术的强大在当时未能转化为市场的成功。在经历了业务发展和团队变动的低谷后,中国电子注资入股。重整旗鼓的它,悄然调整了商业模式,如今再次绽放出国产处理器的光彩。
两年后的一天,他离开了。
▋智能语音人机交互
人生的轨迹总是从某个不知名的岔路口开始改变。
互联网公司腾讯正在悄然布局新兴领域,设立了一个新中心:智能设备创新中心。张林华本身与硬件打了多年交道,再加上对智能硬件的强烈兴趣,便在这个机缘下加入了腾讯。以微游戏主机miniStation首款智能硬件产品开启了腾讯职业生涯的起点。
紧接着来到了VR元年2016年,当时腾讯也开始着手头戴式虚拟现实设备研制,期间张林华有参与部分VR项目,最终因为技术瓶颈和VR内容匮乏,该赛道后来也进入了泡沫化。
有了智能硬件miniStation的技术沉淀,对标主流语音助手亚马逊Echo,他开启了腾讯听听智能助手序幕。很快团队着手搭建Demo,构建产品原型,把市面上所有产品都拿过来做测试对比,评测了市面上主流语音识别厂商,仔细分析它们的优缺点,力求找到最佳技术方案。
腾讯听听上线时,收到了不少正向的反馈。作为一个产品本身,腾讯听听是相对成功的,但这款产品最终未能实现规模化,张林华认为这与公司战略和市场环境有关。
从时间上,腾讯听听是2016年开始研发,比阿里的天猫精灵要早,但在定价策略上,腾讯选了一条更为保守的路线。后起之秀阿里天猫精灵以399的售价推出,并通过300元的补贴将实际售价压至99元,以此来打开市场局面,而腾讯听听未参与价格战。
很快正值云计算飞速发展浪潮,张林华经历智能语音助手项目后对云端AI发展趋势有了更深刻的理解,由此便与腾讯云AI产品团队结缘,以AI研究员身份投身于腾讯云产业互联网的浪涛中。
▋产业互联网:云计算+AI
如火如荼的安防工程愈演愈烈,从公安天眼系统到智慧零售门店支付,再到社保人脸核身都跟人脸识别、图像/视频识别有着紧密联系。AI技术让人们从繁琐的事务中解脱出来,并加速了工作流程,释放了生产力。
云计算就像一艘巨轮驶入各行各业,在AI赋能下企业业务也随之遍地开花。
张林华在这段职业过程中对人脸/文字/图像识别有着更多的认知,从人脸检测与分析、五官定位、人脸比对、人脸搜索到通用OCR及场景化文字结构化,进而到图像/视频分析与理解等深度参与了技术选型、工程化、产品化全流程,也积极探索了人脸支付/门禁等应用场景。同时对云计算三层服务也有更多的理解和实践,通过客户项目贯通了IaaS->PaaS->SaaS三层业务逻辑。
他说跟着AI学习最大的好处就是学会了跟AI一样的结构化能力,培养了结构化思维,确实对后续工作和生活带来莫大处理问题的能力。AI在学习人类的同时,人类也在学习AI。
在腾讯的第5年,张林华陷入了焦虑。
▋大厂内容AI中台
他很久没有感受到那种新技术带来的兴奋了,好像突然找不到目标,不知道要做什么了。
在别人眼里,他是一个非常自律,善于自我激励和做规划的人。但很多人不知道,他还有一个“奇葩”的习惯,阶段性的让自己“保持饥饿”。
“Stay hungry”在他身上,具象化了,适度的饥饿感让他更冷静,坚定。
也就是那会,腾讯发生了轰动业界的930变革。
2018年9月30日,腾讯进行了自成立以来的第三次重大组织架构调整,在原有七大事业群(BG)的基础上进行重组整合。原有七大事业群(BG)重组整合,新成立云与智慧产业事业群(CSIG)、平台与内容事业群(PCG)。
PCG的业务都是围绕内容做延伸的,腾讯的目的是想打造一个数字内容的大生态。这场变革不仅影响了腾讯的整体战略,也让张林华看到了一个新方向:内容AI中台。
当时,张林华以技术项目经理(TPM)的身份来到PCG应用研究中心,他过来最重要的工作是建设视频理解中台,围绕众多CV、Audio/Speech、NLP的AI技术,开展内容理解、内容增强、内容生成以及内容审核四大板块的AI能力协同输出,这些能力服务于PCG主要的C端业务,比如腾讯视频、微视、QQ小世界、企鹅号、腾讯看点、腾讯体育、腾讯新闻等。
进入到新的工作状态,焦虑感逐渐消退。在PCG三年,他对内容和AI技术有了更深刻的理解。他感触到数字内容的形式远远不止于文本,特别是抖音等短视频平台崛起后,信息的传递变得更加可视化、直观、多模态,图像和视频赋予了数字内容更强的传播力和影响力,而AI则不断加速内容制作全流程。
回顾在腾讯的八年,他走了一条不一样的职业路径,辗转于不同的部门和岗位,从MIG(移动互联网事业群)智能设备创新中心,到SNG(后演变为CSIG,云与智慧产业事业群),再到PCG(平台与内容事业群)应用研究中心TencentARC,一次次拓宽职业边界。腾讯职业生涯始于miniStation,止于AI中台,横跨了多个BG事业群。
当时,摆在他面前的一个机会是去大厂造车,造车涉及从硬件到软件到AI全流程,是一个难得的机会。如果不是一次偶然的机会遇见XR虚拟制作场景,他说不定真的会选择去造车。
▋通往光显AGI,遥望星空
站在巨大的屏幕前,张林华仿佛置身于另一个空间,眼前的奇异天空、无垠沙地、荒漠雪原,让他有一瞬间,忽略了面前的屏幕。LED虚拟制作的开山之作《曼达洛人》展示了其美丽。
《曼达洛人》全LED虚拟片场
他被这个场景震撼了,第一次知道用屏幕还能拍出这么真实的科幻视效。跟以前的绿幕抠图不同,三维LED巨幕能够实时把内容渲染出来,屏幕能够自由切换生成的场景,所见即所得。别说演员,就连自己也好像真的置身奇幻世界。如今得益于AI大模型智慧涌现,内容创意效率进一步得到提升,加速着3D Production Pipeline全流程进程。
经过腾讯PCG,张林华已经对数字内容拥有敏锐的感知力,内容无法脱离载体来呈现,而此刻,他看到了一个极佳的载体,短视频已成为广大用户习以为常获取信息和知识的主要媒介。生成式AI给数字内容带来了更多想象空间,极大丰富了LED和内容的供需关系。从过往技术栈来看,最大的区别:2D->3D,多了一维便有了空间想象力。
这一次他走进了一家科技制造企业,LED行业翘楚:洲明科技。
在洲明,张林华负责创新业务的产品研发,包括虚拟制作、3D数字人、多模态垂直模型、跨模态生成、空间感知、多模态AI交互等多个技术产品。基于LED应用场景需求布局虚拟制作、AI、数字人及技术生态,推动洲明“LED+AI”商业化落地。围绕洲明两大照明和显示业务板块,基于多模态生成式AI技术带来的全新交互范式变化,正向设计满足物理世界情境感知能力的硬件载体,使AI具备人类同源信息感知能力,全面释放光显AI的庞大潜力。
他发现虽然过去洲明卖了很多屏,但传统业务大多数停留在模组思维、工厂思维,事实上对客户来说,他们不想要一块冷冰冰的屏,而是场景化,是屏带来的价值和体验。
接触了LED行业发展史和市场应用场景,结合当下的AI技术,张林华脑海浮现出了一个新公式(如下图),围绕元宇宙八大要素:身份、社交、沉浸感、低延迟、多元化、随地、经济系统、文明,进而大胆构想了LED+AI三层服务IaaS(硬件即服务)、MaaS(模型即服务)、CaaS(内容即服务),并在洲明AI发布会的圆桌沙龙上做了探讨交流。通过算法端到端输出内容一步到位,给内容带来了无限的想象力和制作的时效性。
2024年洲明AI发布会
在他看来,近几年元宇宙概念不是弱化了,而是更具体化了,且在悄无声息演进中,LED+AI成为元宇宙重要且关键的推动力,生成式AI必然会加速填补元宇宙所需要的大量内容。
譬如位于杭州的全球首个王者荣耀IP电竞酒店,张林华团队全流程参与了该项目创意数字人互动方案,通过主题形象设计、IP互动装置以及NFC玩法的实施,实现了数字文化IP与线下空间的创意融合。在酒店的弧形LED屏幕互动区,住客们可以与虚拟数字人进行交互,了解酒店设施、王者荣耀以及KPL赛事等相关信息,让沉浸式电竞酒店达到了“Next Level”。
近期在德国的Adele阿黛尔慕尼黑演唱会,洲明ROE为舞台提供巨屏,并以“史上最大户外屏幕”的称号载入吉尼斯纪录,长220米,高20米,曲面屏。整个舞台如胶卷铺展,照亮慕尼黑这一隅星夜,把瞬间定格成永恒、让灵魂在此刻共鸣。光显给人们带来了视觉盛宴和美好回忆。
Adele阿黛尔慕尼黑演唱会现场
沙特打造的“利雅得狂欢季”也有洲明的参与。“利雅得狂欢季”是沙特一年之中规模最大的娱乐盛会,对于这个产业结构非常单一的石油王国来说,此举是为了促进经济社会多样性。每年盛会期间,全球的游客都会涌入这里。
乐园中最夺目的景观是一个直径高达35米、镶嵌在人工湖边缘的巨大光球。沙特旅游局在官方网站上郑重表示:这是世界上当时最大的LED球幕,它与人工湖一起,打破了吉尼斯世界纪录。
沙特“利雅得狂欢季”里的球型屏
一到晚上乐园里灯光点亮,热闹的夜生活就开始了。音乐会、足球比赛、戏剧表演、世界各地的美食,人们在此肆意游玩,尽情狂欢。
人间灯火天上月,光显场景久萦绕。张林华脑中突然出现了一个天马行空的想法:如果以后人类移民到外太空,那里是不是也需要一个光的乐园?
若真如马斯克所说,20年内,就可能实现一批人移民火星。那到时候,LED屏也可以作为一种建筑材料,搭上马斯克星舰送往外太空,构建人机赖以生存的光显空间。当屏幕全部铺开,它可以还原光线,可以模拟这个星球上所有不存在的东西,让冰冷的空间变得温暖,让人类平滑过渡到外太空生活。
他想,这可能是未来LED行业最大的增量空间和光显AGI最大的场景。
好文章,需要你的鼓励
“未来软件定义汽车”的设想也成为马丁当前运营路线的指导方针,且高度关注数据、零件和资产管理等议题。
AI科技正被应用于诸多复杂问题,其中自然也包括塑料污染。通过对多位科学家和初创企业创始人的采访,外媒InformationWeek整理了塑料垃圾治理工作中的艰难挑战,同时也了解到各方如何在这场抗争当中运用AI科技。