Computers in Biology and Medicine发表了由中国大连大学软件工程学院先进设计与智能计算教育部重点实验室王鹏、大连理工大学计算机科学与技术学院曹本、中国大连116024市第一医院脑功能研究科马涛、中国大连市第一医院脑功能研究室马涛撰写的文章。中国医科大学,110001,中国沈阳,先进设计与智能计算教育部重点实验室,大连大学软件工程学院,王斌,张强,116622,中国坎特伯雷大学会计与信息系统系,潘峥,8140,新西兰基督城。
摘要:“全球数据呈指数级增长,导致数据存储容量不足的问题。DNA储存是一种理想的储存方法,因为它的储存密度高,储存时间长。然而,DNA存储过程不可避免地存在错误,这些错误可能导致数据读取过程中集群冗余增加,进而影响数据读取的准确性。该文提出一种动态更新的DNA存储哈希索引(DUHI)聚类方法,该方法通过构建动态核心索引集和哈希查找对序列进行聚类。从整体可靠性评估和可视化评估两个方面对所提出的聚类方法进行了分析。结果表明,DUHI聚类方法可以减少聚类内10%以上的序列冗余,并将序列的重构率提高到99%以上。因此,该方法解决了DNA序列聚类后的高冗余问题,提高了数据读取的准确性,促进了DNA存储的发展。“