第431节(2/3)

    “嗯,我的意思是,无损压缩算法嘛,这个极限压缩效率总是会受到信息熵的限制,你这个算法极限压缩效率大概能达到多少?”

    只是这部份手稿在四个人手中转了一圈之后,一时间几个人又不知道说些什么了,于是目光落到了马旭明身上。

    感触有很多,比如脑子有些不够用了。

本章尚未完结,请点击下一页继续阅读---->>>

    现在假设我们通过pca获得了一组特征向量{athbf{v}_1,athbf{v}_2,ldots,athbf{v}_k},这是数据的主要变化方向。

    “哦。”乔泽点了点头,然后看了身边的苏沐橙一眼,女人立刻进屋给乔泽拿了一叠稿纸出来。

    当然这就是个最简单的理论过程,豆豆在使用的时候,还需要考虑数据预处理、参数选择等问题,以确保算法的有效性和性能。不过这些都是细枝末节的东西,在乔泽看来,只要弄懂了理论,剩下的都是小事情,无非就是要花费些时间。

    甚至完全都能交给人工智能解决。

    “高维特征码的还原为什么不能无损?”乔泽疑惑的反问道。

    “只是超复数形式还真难不住我们,小乔啊,我跟你讲,这次我们都是有备而来,专门研究过你的乔代数几何。”一边的张明睿生怕乔泽误会了马明旭的态度,在旁边插了一句。

    接下来就能将数据投影到 pca提取的主要特征向量上,并保留前k个主要成分,以减少数据的维度。

    乔泽手书的速度很快,刚刚讲解完,也完成了包含着数据表示、分析和重构三个步骤的重要公式,然后将手中的稿纸递给了对面的马明旭。

    想开口再深问,突然又感觉不太好意思,只能默默的将公式记在脑海之后,然后抬头看了眼正歪着头瞅着稿纸的刘杰春,干脆的把乔泽这张手稿递了过去。

    马旭明刚想开口问问老友他看出些什么了,谁想到刘杰春将手稿递给身边的周良时,顺带着扭头冲他眨了眨眼。马旭明秒懂,然后在心里冷笑了两声,也懒得开口拆台了。

    马旭明深深的看了眼乔泽,这才接过他递来的稿纸,随后便被稿纸上三个公式所吸引。

    马旭明深吸了口气,然后问道:“嗯,这个……这个算法,能做到无损压缩?”

    压缩后的数据可以表示为athbf{y}=(athbf{y}_1,athbf{y}_2,ldots,athbf{y}_k),其中athbf{y}_i =athbf{x}cdot athbf{v}_i表示数据在第i个主成分上的投影。

    毕竟大家一起来的,算是一个整体,没必要在两个年轻人面前闹笑话。

    来之前大家的确是专门研究过超螺旋代数跟超越几何学,但时间还是太短了。

    本以为这家伙会一看一个不吱声,谁想到刘杰春竟然恍然大悟的说了句:“哦,原来是这样啊……”

    同理,当需要解压缩的时候,利用压缩后的数据athbf{y}和 pca提取的主要特征向量{athbf{v}_1,athbf{v}_2,ldots,athbf{v}_k}来重构原始数据。

    光看这些公式还真有些反应不过来。

    看他做什么?!

    然后将每个特征表示为超螺旋代数中的超复数形式x_i = a_i   b_i epsilon,这里的epsilon是超越单位。

    “通过公式可以算出来,极限压缩效率能做到与高维信息熵相当,如果你是说跟现有的压缩算法比的话,效率能提升两到三倍,未来如果能更进一步的话,甚至可能做到网络传输比卡车运输要快。

    既然懂压缩,又了解过超螺旋代数,那应该就能看懂这个简单的例子。

    豆豆都能完美的使用这套数据库,未来升级后的人工智能就更没问题了。

    重构的数据结构就是hat{athbf{x}}=su_{i=1}{k}athbf{y}_i athbf{v}_it。”

    研究过豆豆之后,马旭明也真觉得豆豆管理数据库的超高能力,跟一些新算法息息相关。

    “那我给你举个例子,你应该就明白了,先假设一个高维向量,athbf{x}=(x_1, x_2,ldots, x_n),其中x_i就是数据的第i个特征。

    听了这话,乔泽问道:“你来之前了解过超螺旋代数中关于超复数跟超二项式这些形式的具体描述吗?”


努力加载中,5秒内没有显示轻刷新页面!

  • 上一页

  • 返回目录

  • 加入书签

  • 下一页