
研究人员开发了一种新的机器学习技术,可以帮助计算机系统预测未来的数据模式,并优化信息的存储方式。他们发现,这些预测可以在现实世界的数据集上提供高达40%的速度提升。
在一篇发表在arXiv预印服务器上的论文中,来自卡内基梅隆大学和威廉姆斯学院的研究人员在2023年12月的神经信息处理系统会议(NeurIPS)上作为焦点提出,这种新方法可以带来更快的数据库和更高效的数据中心。
他们讨论了一种常见的数据结构,称为列表标记数组,它在计算机内存中按顺序存储信息。保持数据的排序可以让计算机快速找到它,就像按字母顺序排列一长串名字可以很容易地找到某人一样。
然而,在新数据进入时有效地维护排序顺序可能具有挑战性。到目前为止,计算机系统只能为最坏的情况做准备,不断地移动数据,为新项目腾出空间。这可能很慢,而且计算成本很高。
这种新的机器学习方法赋予了这些数据结构预测的能力。计算机通过分析最近数据中的模式来预测接下来可能发生的情况。
“这项技术允许数据系统窥探未来,并在飞行中优化自己,”该研究的合著者、卡内基梅隆大学泰珀商学院的博士生艾丁·尼帕拉萨特说。“我们展示了一个明确的权衡——预测越好,性能就越快。即使预测非常不准确,速度仍然比正常速度快。”
该软件可与与论文一起发布的补充材料一起使用;研究人员已经分享了他们的代码供其他人使用。
研究人员表示,这项工作为进一步在计算机系统设计中使用机器学习预测打开了大门。通过预测预期的数据模式,搜索树、散列表和图表等结构可以更智能、更快地工作。研究人员希望这能激发设计算法和数据管理系统的新方法。
“学习优化可以带来更快的数据库、更高的数据中心效率和更智能的操作系统,”泰珀学院副教授、研究报告的合著者本杰明·莫斯利(Benjamin Moseley)说。“我们已经证明,预测可以超越最坏情况的极限。但这仅仅是个开始,这一领域还有巨大的未开发潜力。”
更多信息:Samuel McCauley等人,在线列表标注与预测,arXiv(2023)。DOI: 10.48550 / arxiv.2305.10536
这是这篇论文的海报展示的链接。
卡内基梅隆大学泰珀商学院提供
引用:新的机器学习方法预测未来的数据模式,以优化数据存储(2024年2月15日)检索自https://techxplore.com/news/2024-02-machine-method-future-patterns-optimize.html本文档
作品受版权保护。除为私人学习或研究目的而进行的任何公平交易外,未经书面许可,不得转载任何部分。的有限公司
内容仅供参考之用。
点击分享到








