第15章 林!你知道吗?你正在改变世界
作者:云山雾罩的云雾   不朽从二零一四开始最新章节     
    马库斯听到林枫提到“改进网络结构”时,愣了一下。
    这话听起来似乎有些轻描淡写,在2014年,深度学习的结构问题是个热门话题,而大家都还在围绕如何改进已有的架构,比如cnn(卷积神经网络)和rnn(循环神经网络)展开讨论。
    大家都在想着要改进网络结构。
    可要说“改进网络结构”,得具体到什么程度才能真正解决梯度消失问题呢?
    他迟疑了一会儿,问道:“改进网络结构?你是说尝试新的层设计,还是在激活函数上进一步优化?”
    林枫微微一笑,显得胸有成竹。
    毕竟林枫关于人工智能的知识量截止到2024,而现在才刚刚2014。
    在2024年,解决梯度消失的核心技术已经有了突破性的进展,比如“残差网络”(resnet)的提出,在当时被认为是改写深度学习领域的一项技术。
    但在2014年,这个概念还远未被提出。
    林枫意识到自己可能正站在改变这一切的关键时刻。
    “激活函数的优化确实重要,”林枫淡淡说道,“但我说的改进,更多是指在网络层次的设计上。你有没有想过,深层网络的问题不只是梯度传递不下去,而是信息本身也无法有效传播?信号在一层层中传递时,逐渐丢失了原本的重要信息,等到最后几层时,网络几乎是在‘盲目学习’。”
    “这个道理我懂,”马库斯点了点头,“但我们已经尝试了很多调整,比如增加跳层连接、在特定层使用更强的正则化,甚至尝试了不同的初始化方法,效果依旧有限。”
    林枫暗自一笑,跳层连接?
    看样子马库斯已经有了些残差网络的雏形思想,但还没触及真正的核心。
    “你们是朝着正确的方向走的,”林枫说道,眼神中透着些许不易察觉的自信,“但或许你们忽略了一个更关键的概念。网络越深,信息传递的阻碍就越大,而如果我们在每几层之间构建直接的‘捷径’,让信息不必层层传递,而是能够跨越几层直接回到前面的层,这样就能有效解决梯度消失的问题。”
    “直接跨层?这……”马库斯有些困惑,“你的意思是跳过中间的层,让前面的输出直接输入到后面的层?这样网络的非线性特征不就被打破了吗?”
    “no,no,no”林枫轻轻摇头,“这种跨层连接并不是要完全替代中间层,而是让信息能够‘绕过’那些不必要的损失点,从而减少梯度消失的机会。中间的层依然存在,依然发挥作用,但跳过的这些连接能够保证信息传递的稳定性。你可以把它想象成是给网络‘加了一层保险’,避免重要信息在传递中被淹没。”
    马库斯听得眼前一亮,这个思路与他们之前讨论的跳层连接确实有些相似,但林枫描述的更为彻底。“跨层连接”和“跳层连接”不再只是简单的尝试,而是建立起一种全新的信息传递方式。
    这种方式听起来既能保留深度网络的复杂性,又能有效应对梯度消失的问题。
    “你说的这些……感觉像是网络中有个反馈机制,确保梯度和信息都能回流,维持学习的稳定性。”马库斯眼中闪过一丝兴奋,他直觉林枫正在讲述的东西,可能会是未来突破深层神经网络训练的关键。
    林枫笑了笑,点了点头。
    正是“反馈机制”的概念让残差网络得以解决深度神经网络中的许多瓶颈。
    林枫继续说道:“这套结构让信号能够通过短路或捷径返回到较浅的层,减少信息丢失,同时保持梯度的大小,确保网络不会在深度增加时失去学习能力。其实你们可以试着在更复杂的网络中引入这种结构,我相信会看到意想不到的效果。”
    马库斯默默点头,仿佛意识到了一条前所未有的道路。
    “不过你说的这些,”马库斯沉吟片刻,“听起来非常前卫。我们现在的技术,尤其是硬件算力的限制,可能还不足以支撑如此复杂的网络结构和跳跃式的连接方式。”
    “的确,”林枫对此并不感到意外,“当前的硬件环境还有限制,特别是gpu算力不足,限制了深度学习网络的规模。不过这些并不是问题,软件技术的发展会推动硬件的进步。
    随着并行计算技术的进步,未来会有专门为ai设计的硬件,比如tpu(张量处理单元),它们可以显着提升训练效率。”
    为了避免泄露过多,林枫只提到了张量处理器。
    其实未来的变化远不仅于此。
    在未来,还会有更多高效的优化算法,像adam优化器会成为主流……
    尽管林枫只是透露一点半点,以对未来猜测的形式说出来。
    但这已经足够让马库斯无比震惊了。
    “tpu?”马库斯皱眉,他从没听说过这个名词,“这是新的硬件架构?”
    林枫轻描淡写地补充道:“只是一种假设性的计算架构,未来可能会出现,专门针对深度学习任务,你不觉得针对人工智能深度学习有开发一种专门硬件的必要吗?”
    马库斯若有所思地点头,脑海中突然涌现出无数思考的路径。
    不得不承认,林说得确实有道理,而且从种种迹象来看,像是google确实是在致力于开发一种专门用于人工智能的硬件,至于是不是叫做张量处理器,马库斯就无从得知了。
    不过马库斯已经是受益匪浅了,虽然林枫描述的这种依托跳跃式连接对于普通的电脑来说肯定是做不到的,硬件跟不上。
    但对于实验室环境下实现硬件支持还真不是什么难事,一些美国高校能调动的资源超乎你想象。
    马库斯决定回去就实验一番。
    林枫看着马库斯那若有所思的郑重神情,心里忍不住暗笑。
    他清楚自己随口透露的这点信息,足以让这个时代的研究人员在未来几年迎来爆发式的进步。
    不过,对于林枫来说,这不过是习以为常的知识而已。
    但马库斯却无比正式地说道:“林!你知道吗?你正在改变世界!”