一、NHANES(美国国家健康与营养检查调查)
基本介绍:由美国疾控中心(CDC)主导,始于1960年代,1999年起转为持续项目,每年调查约5,000名美国代表性人群。
数据内容
访谈数据:人口统计、社会经济、饮食、慢性病史等。
体检数据:医学检查(血压、口腔健康)、生理测量(骨密度、体脂)、实验室检验(血液、尿液分析)。
重点疾病:糖尿病、心血管病、肥胖、环境暴露相关疾病等。
特点
全国代表性:采用分层抽样,过度覆盖老年人、非裔和西班牙裔群体。
数据访问:官网免费开放(XPT格式),可通过R、SAS等工具处理合并。
二、UK Biobank(英国生物样本库)
基本介绍:覆盖50万英国志愿者,历时15年收集基因组、生活方式及健康数据,2025年完成全球最大规模全身体成像项目(10万人)。
数据亮点
影像数据:超10亿张MRI/超声图像,涵盖脑、心脏、血管等器官7。
多模态整合:结合基因组、蛋白质组、电子健康记录,支持跨维度健康研究。
突破性应用
开发AI工具,将心脏扫描分析时间从15分钟缩短至1秒7。预测神经退行性疾病(如阿尔茨海默病)风险。
数据访问:研究者需申请,已支撑1,300+篇论文。
三、FAERS(FDA不良事件报告系统)
基本介绍:FDA用于监测上市后药品安全性的数据库,接收医疗专业人员/消费者的自愿报告。
数据结构
7类表格:患者信息(DEMO)、药物(DRUG)、不良事件(REAC)、治疗结果(OUTC)等。
术语标准化:采用MedDRA词典编码事件类型。
局限性
无法验证因果关系:报告仅反映疑似关联,需结合其他研究验证。
报告偏差:受药品知名度、媒体报道影响,非全面统计。数据访问:官网免费开放(TXT格式),含7个表(DEMO/DRUG/REAC等)。
四、GBD(全球疾病负担研究)
基本介绍:由华盛顿大学健康指标与评估研究所(IHME)主导,覆盖204个国家/地区、300+疾病、70+风险因素,数据追溯至1990年。
核心指标
DALY(伤残调整生命年):综合死亡与残疾的健康损失度量。
HALE(健康预期寿命):反映高质量生存年限。
优势
开源工具:提供GBD Compare可视化平台,支持趋势分析与预测。
科研产出:多篇《柳叶刀》论文涉及育龄妇女偏头痛、骨关节炎负担等主题。
数据访问
官网免费开放,可通过GBD Compare勾选参数(疾病、地区、年份、指标如DALY/死亡率),直接下载CSV文件。
五、FinnGen(芬兰基因组计划)
基本介绍:2017年启动的公私合作项目,整合50万芬兰人基因组与电子健康记录,利用芬兰人群遗传独特性(基因隔离)解析疾病机制。
数据进展
2023年冻结数据覆盖37.7万人,含20.2万个基因变异与2,272个疾病终点。
重点发现:单/双等位基因变异对疾病的差异影响(发表于《Nature》)。
独特价值
孟德尔随机化研究:通过遗传变异推断环境因素与疾病的因果关系。
数据共享:研究结果在1年保护期后向全球科学界开放。
数据访问
通过学术合作申请或等待1年保护期后公开(存于FinnGen Release Portal)。





