当前位置:K88软件开发文章中心办公应用办公应用07 → 文章内容

徐葳:生物医学影像处理、分布式系统与数据共享平

减小字体 增大字体 作者:华军  来源:华军资讯  发布时间:2019-2-21 2:30:37

片中找出一些规律?如果这个基因在这里表达,那么它是不是这三个pattern呢?其他基因也有这个pattern,这个pattern可能跟今后的器官发展有关吗?后来伯克利的团队使用非负矩阵分解的方法来处理这些图像,他们有很多的Factorization,每一种基因导致了Factorization有不同的线性组合,最终组合出如下图像。结果是一共产生21种pattern,这些pattern是有对应关系的,这些对应关系都具有物理含义。这个项目是由一个跨学科合作团队来承担。包含了统计、生物学以及计算机系统方向。这三个方向缺一不可。刚才他说的这个东西为什么复杂?为什么需要计算机系统的团队来协助? 我们认为有以下三个主要问题。第一个原因是数据的预处理。我们看图像处理或者计算机视觉的文章,它们一般会把预处理的部分省略掉。实际上这些文章的大部分时间是花在数据的与预处理上的,但是这些庞杂的预处理工作没有办法在文章上说。例如这个项目的另一个研究题目中,需要尝试不同的预处理用来找到superpixels。这个工作面对两个挑战:第一,太慢。第二,预处理的结果不能共享。第二个挑战是数据实验的管理。做过实验的人都知道,实验不是做一次就能成功的,每一个成功的实验背后都有无数次的尝试和结果的比对。哪个实验的结果更好是预先不知道的,这不但需要我们对每一组实验进行记录和标记,并且能够重现。例如上边讲的实验,里边的21是怎么来的?那是尝试了很多参数配置之后得出来的。如何管理这一次一次的实验,让这些实验变成可重复的,实验方法变成可重用可共享的?这也是我们需要解决的难题。第三点是我们需要,需要解决的问题是友好的交互界面。大家对比一下难学难用的大数据系统,和Excel的简洁界面,就不难看出为什么Excel真正的促进了跨学科跨领域以及商业上的交流了。现在大家所说的数据共享,基本上是指将数据放在一个平台上,大家都可以下载。这种数据的共享只是共享了数据,但是并没有共享数据处理的算法,比如说我可以下载一个APP,让这个APP能够提供数据处理的功能。不论哪个学科,他可以根据需要将不同算法组织起来,通过调整参数的方法解决数据处理的需求。另一个关键问题是共享的层次。要给什么人共享,算法的灵活的是多少,这些都是问题。这将决定共享的内容有哪些人喜欢,哪些人不喜欢。数据标签的共享也是非常重要的,这些标签能不能共享,标注的经验能不能积累,这也是需要考虑的问题。讲讲我们具体的解决方案。我们首先需要一个代码管理和数据管理的运行环境。数据的历史可以共享,代码的变化和数据的变化都需要记录,另外需要提供在线编辑的功能。第一,我们做系统的人希望做一个系统促进大数据领域的人互相交流。具体怎么交流是数据院的事,我提供技术的解决方案。第二,深度学习之前的时代和深度学习之后的时代,计算机的分析对系统的依赖是不同的,现在我们在探索深度学习的方法,也希望跟大家多沟通,看看需要什么样的系统架构的支持。往期精彩文章推荐,点击图片可阅读眼动追踪技术,揭秘男女看点差异动图,用Python追踪NBA球员的运动轨迹

上一页  [1] [2] 


徐葳:生物医学影像处理、分布式系统与数据共享平