三、3步验真法:让“编出来的报告”现原形 ❶ 查“数字指纹”:3个必查项 - 文件元数据:用Excel“属性”查看创建/修改时间,PDF用“文件信息”检查编辑记录(造假报告常出现“创建时间晚于数据起始时间”的矛盾) - 时间逻辑:计算两次随访间隔(如某慢性病要求每3个月随访,却出现“2023.1.1→2023.5.1→2023.9.1”这种严格4个月间隔,反而是机器批量生成的痕迹) - 患者唯一性:通过身份证号后4位+手机号尾号交叉核对(造假者常重复使用同一患者数据,修改姓名后充当不同病例) ❷ 做“交叉验证”:数据不能自说自话 - 源文件追溯:要求提供原始随访登记表(纸质版需有患者签字+随访医生手写日期),电子版需带不可修改的时间戳(如用腾讯文档的协作记录) - 多维度印证:对比随访记录与门诊病历、检验报告的时间/结果(例:随访记录写“2023.6.1血糖正常”,但同期糖化血红蛋白报告显示10.2%,明显矛盾) - 统计规律检测:用SPSS计算数据离散度(如造假的血压数据标准差过小,呈现不自然的“整齐”) ❸ 盯“反常识细节”:真实世界充满“不完美” - 缺失数据标注:正规随访允许20%-30%数据缺失(如患者拒答某项问题),但造假报告常显示“100%完整填写” - 自然语言痕迹:真实随访记录会有医生批注(如“患者电话无人接听,下次随访优先联系家属”),而造假数据多是整齐的表格,缺乏动态追踪记录 - 地域逻辑:患者地址与随访地点需匹配(如某北京医院的随访记录中,出现大量新疆患者却无跨地域诊疗记录,可能是随机生成的虚假地址) 四、写给数据使用者:警惕“漂亮报告”陷阱 ❶ 评审时必问的3个问题 - “能否提供5份原始随访记录(隐去患者隐私)?”(造假者常以“数据保密”为由拒绝) - “失访率是多少?失访患者的基线数据是否与在访组有显著差异?”(避而不谈失访率的报告,数据可信度大打折扣) - “关键指标的测量方式是否在随访方案中提前约定?”(如临时修改“疗效评价标准”,可能为了凑数据) ❷ 科研/医疗从业者的底线原则 真实的随访记录可能“不好看”,但每一个缺失值、每一处矛盾,都是接近真相的线索。记住:用造假数据堆出的高分报告,最终会在真实世界里摔得粉碎。 #医疗
00:00 / 03:02
连播
清屏
智能
倍速
点赞0