UU文学 通过搜索各大小说站为您自动抓取各类小说的最快更新供您阅读!

第312章 历景铄的神经网络模型进展

有了燧火这么一个趁手的算法工程工具,历景铄的神经网络算法研发进度可谓突飞猛进。

两个月前,经过多次尝试,他成功复现了当下学界比较流行的感知机神经网络训练结果,在手写数字识别任务上,已经达到了百分之七十的正确率。

这一成果在国内研究环境中,已然十分亮眼,但历景铄的目光并未就此满足,他深知前路漫漫,还有更多的未知等待探索,于是赶忙找到秦奕开始认真商量下一步的探索方向。

神经网络算法模型的研发有三大关键要素:数据、模型和优化算法。

在神经网络体系中,数据是极为重要的基础部分,数据的质量优劣、规模大小以及多样性程度,对模型的学习能力与泛化能力有着全面且关键的影响。

当数据足够多样时,模型便不会局限于学习某一类特定的数字特征,而是可以提炼出更具通用性、更普遍适用的特征模式,从而在面对从未见过的新数字样本时,也能准确识别。

但要是数据存在偏差,比如手写数字识别任务里的数据某些数字样本数量过多,而另一些过少,模型在学习时就会过度倾向于数量多的数字特征,使得对其他数字的识别能力大幅下降,严重损害泛化性能。

历景铄为了方便对比漂亮国学术界的研究成果,一开始没有去耗费大量精力构建自己独有的数据集,用的是漂亮国现成的数据集——漂亮国国家标准与技术研究院的公开 NISt 手写数字数据集。

这个数据集是前世被广泛应用于学术研究和工业实践中的手写数字识别领域基准测试数据集 mNISt 的前身,每个样本都是 28x28 像素的灰度图像,代表0 - 9之间的一个数字。

不过 mNISt 数据集包含六万个训练样本和一万个测试样本,而目前 NISt 数据集目前只有两万个训练样本和五千个测试样本。

随后,话题转到模型架构上,这是历景铄目前希望改进的重点。

他拿起一支笔,在纸上简单画了个神经网络结构草图,说道:“模型架构是神经网络的核心,具体分为网络结构和参数两大部分。”

“网络结构说白了,就是神经网络怎么组织,有几层,每层是什么类型,连接方式如何,信息又是怎么在各层之间流动,这是神经网络的‘骨架’,决定了网络的功能和适用场景。”

“网络参数呢,就是神经网络里要学习的权重和偏置,决定了网络怎么从输入数据里提取特征、做出预测。”

“现在学术界流行的多层感知机神经网络,是一种前馈神经网络,结构有输入层、隐藏层和输出层,神经元基本都是全连接。”

“我用的也是相同的结构,在处理 28x28 像素图像的时候,得把图像数据所有像素先展平成一维 784 长的向量数据,然后从输入层一层一层传到输出层,每层通过权重矩阵和激活函数做非线性映射。”

秦奕凭借前世的经验直接指出了当下多层感知机神经网络的缺点所在:“我觉得这个多层感知机这个神经网络目前至少有两个方面可以改进。”

“首先,它的每个神经元都得和上一层的所有神经元相连,这会导致整个神经网络的参数数量是网络层数的 784 倍,这么庞大的参数数量,会导致训练过程特别缓慢,还特别容易引发过拟合问题。”

“其次,因为它需要将所有像素展开成一维数据,这样会将原本图像数据中的笔画或者边缘这种特征丢失。”

历景铄听着,眼睛渐渐亮了起来,若有所思地说:“你是觉得我们可以适当减少不同层之间的网络连接,同时把保留输入数据的二维结构,接着在隐藏层里面针对二维矩阵进行学习?”

他突然一拍大腿,兴奋地说:“有了!我之前看到过瀛国科学家福岛邦彦的一篇论文,他好像就有差不多的思路!” 说着,他快步走到那堆论文文件夹前,手忙脚乱地翻找起来,嘴里还嘟囔着:“在哪呢,到底放哪了……”

找了好一会儿,终于翻出一篇题为? Neocognitron? 的论文,他连忙拿到秦奕面前,说:“秦哥,你看这篇名叫新认知机的论文,里面提出了局部感受野和层次化特征提取的思想。”

“他的网络结构包含 S 层和 c 层,S 层也就是简单细胞层用卷积操作提取局部的二维空间特征,c 层复杂细胞层则整合 S 层中一组简单细胞的输出,提取更高级的特征,这能在一定程度上减少网络里的参数。”

他赶紧去自己那一堆论文文件夹里面翻找了一番,然后拿出了一篇题为 ?Neocognitron? 的论文给秦奕看:“这篇名叫新认知机的论文里面就提出了局部感受野和层次化特征提取的思想。”

“他的网络结构包含 S 层和 c 层,其中 S 层也就是简单细胞层用卷积操作提取局部的二维空间特征,而 c 层的复杂细胞层,整合 S 层中一组简单细胞的输出,提取更高级的特征,这一定程度上能减少网络里面的参数。”

秦奕接过这篇远没有杨立昆 89 年发表的卷积神经网络出名的论文,快速略读了一遍。

读完后,他发现里面的网络结构设计确实是跟后来引入了卷积层和池化层的卷积神经网络基本一致,只是因为这篇论文用的是无监督学习所以难以处理复杂的分类任务。

无监督学习和有监督学习是机器学习的两种主要范式,有监督学习使用标注过的数据即输入数据和对应的输出标签来训练模型,模型的目标是学习输入与输出之间的映射关系,无监督学习使用未标注数据来训练模型,模型的目标是发现数据中的潜在结构或模式。

秦奕点了点头说道:“我觉得这确实是一个很好的网络结构设计思路,我们可以把有监督学习和他这个网络结合起来,说不定就能在手写数字识别任务上取得突破。”

“另外,神经网络虽说是借鉴生物结构,但网络层命名也没必要弄得这么像生物术语,简单细胞和复杂细胞听起来都不知道是做什么的,我建议直接用操作命名就行,做卷积操作的叫卷积层,做池化操作的叫池化层,这样交流起来方便。”

“可以。”历景铄应道,“另外优化算法方面我们这边也遇到了一些问题。”

UU文学推荐阅读:被人拉入相亲群,我无敌你们随意记忆审判:那一刻,全国为他痛哭港片:我还没出位,老大先出殡了皓月和正义重生18:从借钱炒期货开始暴富我的26岁总裁妻子收手吧系统!别再逼我做渣男小巷人家:守护庄家?开局成孤儿暗黑江湖总要爱上一个人,为什么不能是我四合院:从1958开始全球性闹鬼事件穿越到未来,我有最强升级系统年下!开局相亲姐姐闺蜜带着空间穿八零,领着家人奔小康四合院:从卫生员开始的快乐人生民间高手,从街头卖艺开始让我住在你的心里终极一班:我魅魔被美女们包围了世界大杂烩,主角大乱斗你都建国了,你说你是雇佣兵?是你要分手的,我走了你又哭啥?商海激情:触底反弹之超越剑御九霄:昆仑秘境传重生之打造属于我商业帝国三年出狱妻子出轨?一无所有的他原来手眼通天!被青梅竹马拒绝后被神明赐下权柄驭手撸铁三百万次,我成了女儿的英灵一首青花瓷,我,掀起了国风狂潮东星乌鸦兑变,注重武力和谋略!吃校花软饭的我,创建护庭十三队灵气复苏,从虚拟现实开始全民:开局觉醒无限虫巢!开局继承九重雷刀,我横推万族我把校花渣了,她还觉得我深情天灭真元重生在新婚夜,入赘当谭家姑爷妃礼勿视,王爷你也重生了特级保安山村尤物俏美妇都穿越了,谁还上班啊转职召唤师,开局十连SSS天赋四合院:傻柱偷偷结婚,众禽傻眼重生2003:互联网到科技大亨梦回小山村神豪的学霸生涯诸神来犯,我在现代重演神话医妃逆天:废柴大小姐都练纯阳功了,你给我婚书?
UU文学搜藏榜:重生之从做个好爸爸开始人在斗罗,开局被比比东活埋皇后成长手札不随心所欲能叫重生吗?掌欢完美战兵四合院:这个保卫员坏,痞,帅!梦游妈咪:谁是我爹地千树万树情话开疯狂从2000开始叫我女王(GL)赘婿之杀神回归县城青年之入世萌妻羞羞:BOSS,慢点撩!松小姐今天喝酒了吗千金大佬她slay全场小乞丐掀翻三界高武:刀镇星空故事无限我真不想当女主角都市霸道医仙人间凶狗直播:穿书炮灰反成人生赢家皇上今天掉马了吗重生七零我靠种田暴富了叶君临李子染全文免费阅读笔趣阁退婚后我嫁给了渣男他叔头条婚约都市崛起之开启万界交易序列为零东京泡沫后的文娱时代逍遥渔场妖孽男神在花都最废女婿战神她在娱乐圈杀疯了胭尘团宠寨主种田忙开局我被系统一直坑地府微信群军少,有点喜欢你娱乐之中年危机错婚试爱病娇惹不起重生2014:一个人的豪门想支持乡村教育,却成为商业大佬逍遥明星娶夫不易[穿书]重回1981从退婚开始不凡兵王我的篮球生涯养废青梅的我,只好负起责
UU文学最新小说:高考状元:开局获得神豪系统让你做农村大席,你美食拐走伴娘我想独自升级读者硬和我一起组队辞职后,我肝成了道法真君后悔?离婚后我舔别人,你选的嘛剑斩魔影:都市修真破案传说赤煞魔法戒终有幸奇门脑洞重回90,房子门面买买买买买买被迫虐女,我也很心痛啊丧尸?不好意思国道上撞大运了开局娶了首富的白月光重回80:从赶海开始狂飙重生穿越到柬埔寨天医狂龙:下山当天,和小姨子订婚!重生1986助力国家崛起新兵连,我被直招进特种部队饥荒年代:我靠空间发家致富!三年付出,最后一次背弃后我选择放手海钓失事后,我被富家千金赖上了重生65,从打猎带知情姐妹天天吃鸡肉我有一张小丑牌重生破烂王,干到世界500强各位,欢迎来到新世界时间迷局里的末日救赎秦河畔,她说不想官配打工岁月:隐藏在城市角落的秘密富婆别喂了,我真的不吃软饭吾乃剑圣转世神陨入世,废土新生重生救赎,狩猎致富宠爱小娇妻重生86:鉴宝发家,我把妻女宠上天四合院:我,娄小娥的靠山港片:黑丝小犹太,力挺方洁霞国士无双之炁贯八荒重生千禧年:官场之路从片警开始权力医途他于深渊孤寂,她以纯白相偎祁同伟:老婆陆亦可,侯亮平醋了神珠缘亮剑:李云龙有九营九连九排四合院:从广播员开始整顿禽兽全村啃窝头,我一天赚一万开局冰山美女总裁怀了我的孩子外卖员觉醒之路重生特种兵,我成了战友的心尖宠重生后边造国货边炒股成全球首富高武:反方向的钟,高冷校花直呼不要