搜索
查看: 216|回复: 0

图形化开放式生信分析系统开发 - 2 样本信息处理

[复制链接]

4

主题

4

帖子

103

积分

注册会员

Rank: 2

积分
103
发表于 2019-8-28 22:44:23 | 显示全部楼层 |阅读模式
本帖最后由 豆浆包子 于 2019-9-19 13:15 编辑

一、基于生信生产系统分析的需求,在下图中可以看出样本信息在整个软件中的作用

    看不到图点这里



样本信息用于数据拆分、运行运行流程、分析报告,是整个系统的基础数据之一。

下面来具体归纳一下样本信息在软件系统的作用并列出详细的数据字段:

1、用于标记分析运行状态的
序号
字段名称
数据类型
作用
1
样本编号
SampleID、${sn}
字符
系统内唯一编号,用于区别样本,为了便于识别,默认为样本编号内容设计了一套编码规则(非强制)

以样本编号:B1908280744FF 为例:
  • 前缀:B代表分析流程的代号,显示该样本用于哪个项目,与 项目编号 字段联动
  • 数字:190828,表示该样本录入系统的日期为2019年8月28日
  • 数字:0744为样本流水号,自动增加
  • 后缀:FF 表示样本类型为FFPE
还可以继续增加后缀内容,用于标记试验状态,如
L01表示第一次建库
D01表示该样本第一次提取

等等,可以根据实际需要自行定义。
2
项目编号
SampleProject
字符
分析流程的编号,表示样本的分析项目

3
优先级别
SamplePriority
整数
优先级别:数字1-9,数字越大优先级别越高
4
报告日期
SampleReport
日期
样本项目分析完毕,获得分析报告的日期;如果该字段为空,表示尚未分析,如果非空表示样本已经经过分析。
5
拆分状态
DemultiplexStatus
布尔
标记该样本测序仪下机数据是否已经完成拆分

2、分析报告上显示的信息,用于生物样本属性的数据
序号
字段名称
数据类型
作用
1
样本来源
SampleSource
字符
记录样本的来源,医院、实验室、等
2
样本类型
SampleType
字符
样本类型,为以下其中之一:
蜡块、血液、唾液、新鲜组织、冰冻组织、其它
3
取样位置
SamplePosi
字符
取样的位置:器官位置
4
取样方法
SampleMethod
字符
取样方法:穿刺、抽血、口腔刮棒?
5
取样日期
SampleCollect
日期
取样的日期
6
收样日期
SampleReceive
日期
收到样本的日期

3、分析报告上显示的患者的信息,属于隐私内容,但是在报告上有需要显示的
序号
字段名称
数据类型
作用
1
患者编号
PatientNumber
字符
系统内唯一编号,用于区别患者,为了便于识别,默认为患者编号内容设计了一套编码规则(非强制)

以样本编号:1908280834为例:
  • 数字:190828,表示该样本录入系统的日期为2019年8月28日
  • 数字:0834为患者流水号,自动增加

另外,可以根据实际需要自行定义。
2
患者姓名
PatientName
字符
患者姓名

3
患者性别
PatientGender
字符
患者性别
4
患者年龄
PatientAge
整数
患者年龄
5
诊断信息
PatientDiag
字符
患者来源于其它渠道的诊断信息
6
临床信息
PatientClinic
字符
患者来源于其它渠道的临床信息


4、用于和测序仪联动,生成SampleSheet文件,拆分数据
序号
字段名称
数据类型
作用
1
上机编号
RunID、${runid}
字符
对应于Illumina RunID的前两个字段,用于识别下机数据目录
2
测序平台
Instrument
字符
用于测序的平台,如:
MiSeq,Miniseq/NextSeq
3
I7 Index ID
I7_Index_ID
字符
I7 IndexID
4
Index序列
Index
字符
I7 IndexID实际碱基序列
5
I5 Index ID
I5_Index_ID
字符
I5 IndexID
6
Index2 序列
index2
字符
I5 IndexID实际碱基序列

技术实现:
基于以上数据,设计录入表单如下



一个样本信息就有二十几个个字段。如果一个一个录入,可能不是很好的体验。可以从以下几点缓解这个问题:
  • 设置必填项,可以看到经过筛选,必填项减少到5项。
  • 提供默认值,比如样本编号,患者编号,可以默认提供计算好的默认值;需要选择的下拉框,将最常用的值设置为默认值也可以提高效率。
搜索输入,并提供联动的数据填充选项,如下图红色部分:


D、批量导入,使用固定的excel格式来实现批量导入数据:

​​


按照以上设计,提升了使用体验,基本就完成了样本信息处理功能,为开发后续功能提供支撑。

欢迎加入QQ群讨论:853718264
PPT下载




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x



上一篇:基因芯片数据如何进行分析?
下一篇:R语言 GO/KEGG注释
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-9-21 09:32 , Processed in 0.038159 second(s), 27 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.