UU文学 通过搜索各大小说站为您自动抓取各类小说的最快更新供您阅读!

第311章 燧火机器学习开发框架

燧火之名,源自燧人氏取火的古老神话传说,那是人类首次掌控的可控能源。

如今,历景铄希望它能成为机械智能的起源,开启一个全新的时代。

燧火框架主要涵盖了数据处理、模型构建、模型训练、模型评估这四大核心功能模块。

先说数据处理部分,数据加载环节至关重要,它具备从本地文件、网络文件系统和数据库等数据源读取数据的能力。当然,前世常见的各种大数据文件系统或者对象存储文件系统现在连影都没有,这个框架自然也不会有对应的加载处理能力。

数据从数据源里面读取进来之后,会被转化成与数据类型相适配的对应内存数据结构。

在秦奕的建议下,燧火里定义了一个和前世流行机器学习框架 pYtoRch 中的张量类似的基本数据类型来存储各种各样的数据,该数据类型是基于乾坤语言原生多维数组的一种对象,能够很方便的表示零维标量、一维向量、二维矩阵甚至更高维的数据。

历景铄做得是计算机视觉算法研究,最常用的便是表达一张图片的三维数组,三维分别是长、宽、颜色通道,颜色通道数值可以是 RGb 这种数字图像和视频处理的标准颜色表示方式也可以是 cmY 这种印刷行业标准的颜色模型,框架里提供了两种模型互相换算的能力。

在将数据读取进内存之后,用户就需要对现有的数据做预处理了,燧火框架提供了一系列数据清洗、归一化、标准化等预处理操作。

在数据清洗方面,框架提供了多种便捷的清洗能力。

面对文本数据中可能出现的乱码,框架会通过字符编码识别与转换算法,将其纠正为正确的字符格式。

若是数据中存在重复记录,比如数据库中可能因录入失误产生的完全相同的行,燧火框架会利用哈希算法对每条记录进行快速计算,对比哈希值来精准识别并删除重复数据。

对于缺失值,若是数值型数据,框架会依据数据的分布情况,采用均值、中位数或者众数填充法。

比如对于一组学生成绩数据,若某个学生的数学成绩缺失,会先计算其他学生数学成绩的均值,再用该均值填充缺失值;若是类别型数据,如学生的籍贯信息缺失,就会采用出现频率最高的籍贯类别进行填充。

在归一化操作上,燧火框架主要运用了两种常用方法。一种是最大 - 最小归一化,它将数据的取值范围映射到从零到一的双闭区间,另一种是 Z - score 归一化,它基于数据的均值和标准差进行转换,将数据转换为均值为 0,标准差为 1 的分布。

通过这样的归一化处理,不同特征的数据在数值范围上保持一致,避免因特征数值范围差异过大,导致模型训练时某些特征被过度重视或忽视。

标准化操作在燧火框架中也有便捷的实现方式,框架会对数据进行零均值化处理,即先计算数据的均值,然后将每个数据点减去均值,使得处理后的数据均值为 0,接着计算数据的方差,再将每个数据点除以方差的平方根,从而得到方差为 1 的数据分布。

历景铄在设计燧火框架时,精心打磨了这些功能,如此一来,用户便能利用燧火框架进行细致的清洗、归一化和标准化,让数据以最佳状态进入下一阶段。

在后面的模型构建、训练、评估三大功能模块,秦奕同样大幅度借鉴 pYtoRch 的设计来指导历景铄团队燧火框架的设计。

如此一来,在模型构建环节,用户可以轻松定义各种机器学习模型,不管是简单的线性模型,还是复杂的决策树、神经网络等都不在话下。

在训练方面框架也直接内置了经典的随机梯度下降算法等优化算法,用户只要写一行代码便可以以此来训练模型,不断调整模型的参数,以最小化损失函数。

这里不得不提到反向传播算法,它是模型训练中极为关键的一环,在神经网络中,正向传播负责将输入数据通过各个神经元层层传递,最终得到预测结果。

而反向传播则是在计算出预测结果与真实标签之间的误差后,从输出层开始,沿着与正向传播相反的方向,将误差信号依次向后传播。

在这个过程中,利用链式法则计算每个参数的梯度,梯度代表了参数在哪个方向上变化能最大程度减少误差。

例如,对于一个简单的包含输入层、隐藏层和输出层的神经网络,正向传播时输入数据经过隐藏层的权重矩阵和激活函数计算后得到输出,与真实标签对比得到误差。

反向传播时,从输出层的误差开始,根据激活函数的导数以及权重矩阵,逐步计算出隐藏层权重的梯度,进而更新权重,使得模型在下次预测时能更接近真实值。

最后在模型评估环节,燧火框架的评估指标计算功能能够精准计算各种评估指标,像准确率、召回率、均方误差等,这些指标能直观地反映模型的性能。

除了这几个核心功能之外,燧火框架还有一个十分实用的辅助功能 —— 可视化。

它能将模型训练的结果、数据的分布等以可视化的方式呈现出来,帮助用户更好地理解模型和数据,历景铄团队目前是基于乾坤语言的乾元绘卷图形接口库整合了一些绘制数据的散点图、模型的训练曲线等比较简单的图表绘制功能。

后续他们还会基于机器学习方面功能进一步开发出各种直观的可视化图表,从数据的初始分布,到模型训练过程中的变化,再到最终的评估结果,都能以清晰的图表形式展现,让复杂的数据和模型不再晦涩难懂。

有了这么一个趁手的开发框架,历景铄的人工智能项目在这一年来也已经取得了初步的进展。

UU文学推荐阅读:被人拉入相亲群,我无敌你们随意记忆审判:那一刻,全国为他痛哭港片:我还没出位,老大先出殡了皓月和正义重生18:从借钱炒期货开始暴富我的26岁总裁妻子收手吧系统!别再逼我做渣男小巷人家:守护庄家?开局成孤儿暗黑江湖总要爱上一个人,为什么不能是我四合院:从1958开始全球性闹鬼事件穿越到未来,我有最强升级系统年下!开局相亲姐姐闺蜜带着空间穿八零,领着家人奔小康四合院:从卫生员开始的快乐人生民间高手,从街头卖艺开始让我住在你的心里终极一班:我魅魔被美女们包围了世界大杂烩,主角大乱斗你都建国了,你说你是雇佣兵?是你要分手的,我走了你又哭啥?商海激情:触底反弹之超越剑御九霄:昆仑秘境传重生之打造属于我商业帝国三年出狱妻子出轨?一无所有的他原来手眼通天!被青梅竹马拒绝后被神明赐下权柄驭手撸铁三百万次,我成了女儿的英灵一首青花瓷,我,掀起了国风狂潮东星乌鸦兑变,注重武力和谋略!吃校花软饭的我,创建护庭十三队灵气复苏,从虚拟现实开始全民:开局觉醒无限虫巢!开局继承九重雷刀,我横推万族我把校花渣了,她还觉得我深情天灭真元重生在新婚夜,入赘当谭家姑爷妃礼勿视,王爷你也重生了特级保安山村尤物俏美妇都穿越了,谁还上班啊转职召唤师,开局十连SSS天赋四合院:傻柱偷偷结婚,众禽傻眼重生2003:互联网到科技大亨梦回小山村神豪的学霸生涯诸神来犯,我在现代重演神话医妃逆天:废柴大小姐都练纯阳功了,你给我婚书?
UU文学搜藏榜:重生之从做个好爸爸开始人在斗罗,开局被比比东活埋皇后成长手札不随心所欲能叫重生吗?掌欢完美战兵四合院:这个保卫员坏,痞,帅!梦游妈咪:谁是我爹地千树万树情话开疯狂从2000开始叫我女王(GL)赘婿之杀神回归县城青年之入世萌妻羞羞:BOSS,慢点撩!松小姐今天喝酒了吗千金大佬她slay全场小乞丐掀翻三界高武:刀镇星空故事无限我真不想当女主角都市霸道医仙人间凶狗直播:穿书炮灰反成人生赢家皇上今天掉马了吗重生七零我靠种田暴富了叶君临李子染全文免费阅读笔趣阁退婚后我嫁给了渣男他叔头条婚约都市崛起之开启万界交易序列为零东京泡沫后的文娱时代逍遥渔场妖孽男神在花都最废女婿战神她在娱乐圈杀疯了胭尘团宠寨主种田忙开局我被系统一直坑地府微信群军少,有点喜欢你娱乐之中年危机错婚试爱病娇惹不起重生2014:一个人的豪门想支持乡村教育,却成为商业大佬逍遥明星娶夫不易[穿书]重回1981从退婚开始不凡兵王我的篮球生涯养废青梅的我,只好负起责
UU文学最新小说:后悔?离婚后我舔别人,你选的嘛剑斩魔影:都市修真破案传说赤煞魔法戒终有幸奇门脑洞重回90,房子门面买买买买买买被迫虐女,我也很心痛啊丧尸?不好意思国道上撞大运了开局娶了首富的白月光重回80:从赶海开始狂飙重生穿越到柬埔寨天医狂龙:下山当天,和小姨子订婚!重生1986助力国家崛起新兵连,我被直招进特种部队饥荒年代:我靠空间发家致富!三年付出,最后一次背弃后我选择放手海钓失事后,我被富家千金赖上了重生65,从打猎带知情姐妹天天吃鸡肉我有一张小丑牌重生破烂王,干到世界500强各位,欢迎来到新世界时间迷局里的末日救赎秦河畔,她说不想官配打工岁月:隐藏在城市角落的秘密富婆别喂了,我真的不吃软饭吾乃剑圣转世神陨入世,废土新生重生救赎,狩猎致富宠爱小娇妻重生86:鉴宝发家,我把妻女宠上天四合院:我,娄小娥的靠山港片:黑丝小犹太,力挺方洁霞国士无双之炁贯八荒重生千禧年:官场之路从片警开始权力医途他于深渊孤寂,她以纯白相偎祁同伟:老婆陆亦可,侯亮平醋了神珠缘亮剑:李云龙有九营九连九排四合院:从广播员开始整顿禽兽全村啃窝头,我一天赚一万开局冰山美女总裁怀了我的孩子外卖员觉醒之路重生特种兵,我成了战友的心尖宠重生后边造国货边炒股成全球首富高武:反方向的钟,高冷校花直呼不要吻她闺蜜,冰山妻人设崩了哭唧唧练武太难,系统给我加点!为了英雄老婆,成为邪恶大反派重生75,换亲后,我靠打猎养活全家