自动文本结构化技术是推动整个医疗流程(包括预防、就诊、评估等)自动化的关键。研究院将开发面向医疗领域的文本结构化算法,与深圳市卫健委、深圳市健研院合作,将积压的病例数据进行重构,自动转化为结构化数据,生成标准化的数据库,利用人工智能算法挖掘变量相关性,搭建医疗信息可视化系统和自动化的数据标注平台,对临床诊断提供专业的统计分析支持,帮助医生和医院在科研、治疗、服务、管理上提高效率,同时为后续大数据挖掘等信息产业化发展提供平台基础和技术支撑。
针对中文电子病历、医学图像、与多组学数据等三大医疗数据,开展关于数据收集、存储、安全性、信息抽取与数据处理流程标准化等研究工作,助力打通各医疗机构数据,提供优质的深圳市公共服务。具体包括针对中文电子病历的自动去隐私、语意理解、信息关联与标准电子病历生成等信息结构化的关键技术与基础理论;医学图像数据的存储、标准清洗流程、快速自动判读的关键技术与理论;多组学数据的清洗、标准化、特征提取及多组学数据整合的关键技术与理论;推动制定中文电子病历处理流程标准、医学图像的标签标注标准及多组学数据的处理标准、各类数据的质量审核及结果评估标准。