📋通平台数据处理工具说明文档(沙其版本)

📋 目录导航

📋工具概述

通平台数据处理工具(沙其版本)是一个专业的医疗数据标准化处理系统,能够将多个医疗相关的Excel文件转换为标准化的目标表格,支持复杂的科室结构识别和医保编码匹配。本版本采用预定义的科室架构配置,确保科室分类的一致性和准确性。

🔧功能特点

1. 核心功能

2. 高级特性

预定义科室架构系统

采用固化的科室架构配置,包含582个科室记录

智能科室层级识别

支持主科室与亚专业科室的自动识别和分类

科室结构总表维护

自动维护桌面科室结构总表,确保科室ID一致性

医保编码智能匹配

通过药品编码精确匹配医保编码

前导零格式保护

确保科室ID保持正确格式(如029000而非29000.0)

新增科室高亮

新增科室在总表中自动标记为绿色高亮

3. 用户界面特性

🏥沙其版本特色:预定义科室架构

科室架构统计

120
主科室分组
582
详细科室记录
35
儿科亚专业
23
特需门诊

主要科室分类示例

门诊科室(带"+"标识的主科室)

儿科+

包含35个亚专业科室

  • 儿科(儿童肥胖)门诊
  • 儿科(小儿心血管系统)门诊

内分泌科+

包含21个亚专业科室

  • 内分泌科(糖尿病足)门诊
  • 内分泌科(甲状腺眼病)门诊

呼吸与危重症医学科+

包含17个亚专业科室

  • 呼吸内科(哮喘专病)门诊
  • 呼吸内科(肺癌与肺部小结节)门诊

皮肤科+

包含20个亚专业科室

  • 皮肤科(白癜风及色素性皮肤病)门诊
  • 皮肤科(激光及注射)门诊

住院科室(无"+"标识)

特殊科室分类

科室架构识别逻辑

1. 主科室识别

系统根据预定义的科室架构表自动识别主科室:

# 主科室示例 main_departments = [ "儿科+", "内分泌科+", "呼吸与危重症医学科+", "心血管内科", "神经内科", "肿瘤内科" ]

2. 亚专业科室识别

每个主科室下包含多个亚专业科室:

# 亚专业科室示例 sub_departments = { "儿科+": [ "儿科(儿童肥胖)门诊", "儿科(小儿心血管系统)门诊", "儿科门诊" ] }

3. 动态推断机制

对于架构表中未明确定义的科室,系统提供智能推断:

📁数据要求

必需文件(4个)

  1. 科室药品使用金额及使用量DDDs排名表
    • 格式:Excel文件(.xlsx/.xls)
    • 包含科室药品使用数据和DDDs排名信息
  2. 门诊病人指标文件
    • 格式:Excel文件
    • 包含门诊患者统计数据
  3. 住院病人指标文件
    • 格式:Excel文件
    • 包含住院患者统计数据
  4. 公立医疗机构药品目录
    • 格式:Excel文件
    • 用于医保编码映射和药品信息匹配

可选文件(2个)

  1. 住院患者静脉输液使用监测指标调查表
    • 用于计算平均住院天数和住院总人天数
  2. 科室结构总表
    • 自定义科室结构,不选择时使用桌面默认表

📊数据格式要求

科室药品使用数据表必须列

列名 说明 备注
排名药品排名信息必需
科室名称科室完整名称必需
科室药品总金额科室药品总费用必需
药品排名具体药品排名必需
药品名称药品完整名称必需
药品编码院内药品唯一标识码必需
医保编码国家医保统一编码必需
药品通用名药品通用名称必需
剂型药品剂型信息必需
规格药品规格描述必需
厂家生产厂家信息必需
使用量DDDsDDDs使用量数据必需
数量使用数量(支持"114+-120"等格式)必需
计价单位计价单位必需
单价药品单价可选(支持15列和16列格式)
总金额使用总金额必需

公立医疗机构药品目录格式

重要说明

沙其版本不支持简单的三列格式,需要通过智能列名识别自动匹配相应的列。

必需列(4个)

1. 医保编码列

必须包含以下关键词之一:

  • "医保编码"
  • "医保" + "编码"
  • "统一编码"
  • "国家编码"
  • "编码"
  • "医保"

2. 药品编码列

必须包含以下关键词之一:

  • "院内药品唯一码"
  • "药品唯一码"
  • "院内编码"
  • "药品编码"
  • "内部编码"
  • "唯一码"
  • "药品"

3. 产品名称列

必须包含以下关键词之一:

  • "产品名称"
  • "药品名称"
  • "通用名"
  • "名称"

4. 规格列

包含以下关键词之一:

  • "制剂规格"
  • "规格"
  • "包装规格"
  • "药品规格"

匹配逻辑说明

示例列名

✅ 有效的列名示例:

❌ 无效的列名示例:

科室名称格式要求

?? 多文件合并处理功能

系统现已支持同时处理多个时间段的数据文件,提高数据处理效率:

支持多文件上传的数据类型

仅支持单文件上传的数据类型

多文件命名与格式要求

数据合并流程

  1. 数据读取与预处理:系统读取多个文件,自动识别文件类型和时间信息,对每个文件进行标准化预处理
  2. 时间维度保留:合并后的数据会保留原始时间信息,在结果中可按时间段分别查看数据
  3. 科室匹配与数据关联:系统会根据科室ID和时间信息进行精确匹配,确保不同时间段的数据正确关联
  4. 人次数据匹配:门诊和住院人次数据会根据科室名称和时间进行匹配
  5. 住院天数计算:基于住院患者静脉输液监测表计算平均住院天数和总人天数,按科室和时间维度进行匹配计算

使用优势

注意事项

数据文件夹结构示例

数据根目录/ ├── 科室药品使用DDDs排名/ │ ├── 科室药品使用金额及使用量DDDs排名表2025.5.xlsx │ ├── 科室药品使用金额及使用量DDDs排名表2025.6.xlsx │ └── 科室药品使用金额及使用量DDDs排名表2025.7.xlsx ├── 门诊住院指标/ │ ├── 门诊/ │ │ ├── 门(急)诊病人指标(科室)2025.5.xlsx │ │ ├── 门(急)诊病人指标(科室)2025.6.xlsx │ │ └── 门(急)诊病人指标(科室)2025.7.xlsx │ └── 住院/ │ ├── 住(出)院病人指标(科室)2025.5.xlsx │ ├── 住(出)院病人指标(科室)2025.6.xlsx │ └── 住(出)院病人指标(科室)2025.7.xlsx ├── 静脉输液监测/ │ ├── 住院患者静脉输液使用监测指标调查表2025.5.xlsx │ ├── 住院患者静脉输液使用监测指标调查表2025.6.xlsx │ └── 住院患者静脉输液使用监测指标调查表2025.7.xlsx ├── 药品目录/ │ └── 公立医疗机构药品目录.xlsx └── 科室结构/ └── 科室结构总表.xlsx

推荐的数据文件夹结构

文件夹结构说明

科室药品使用DDDs排名

存放科室药品使用金额及使用量DDDs排名表的文件夹,按月份命名文件

门诊住院指标

包含门诊和住院两个子文件夹,分别存放门诊和住院病人指标文件

静脉输液监测

存放住院患者静脉输液使用监测指标调查表的文件夹,按月份命名文件

药品目录与科室结构

存放公立医疗机构药品目录和科室结构总表的文件夹

🔔 多文件合并处理功能

系统现已支持同时处理多个时间段的数据文件,提高数据处理效率:

支持多文件上传的数据类型

仅支持单文件上传的数据类型

多文件命名与格式要求

数据合并流程

  1. 数据读取与预处理:系统读取多个文件,自动识别文件类型和时间信息,对每个文件进行标准化预处理
  2. 时间维度保留:合并后的数据会保留原始时间信息,在结果中可按时间段分别查看数据
  3. 科室匹配与数据关联:系统会根据科室ID和时间信息进行精确匹配,确保不同时间段的数据正确关联
  4. 人次数据匹配:门诊和住院人次数据会根据科室名称和时间进行匹配
  5. 住院天数计算:基于住院患者静脉输液监测表计算平均住院天数和总人天数,按科室和时间维度进行匹配计算

使用优势

注意事项

数据文件夹结构示例

数据根目录/ ├── 科室药品使用DDDs排名/ │ ├── 科室药品使用金额及使用量DDDs排名表2025.5.xlsx │ ├── 科室药品使用金额及使用量DDDs排名表2025.6.xlsx │ └── 科室药品使用金额及使用量DDDs排名表2025.7.xlsx ├── 门诊住院指标/ │ ├── 门诊/ │ │ ├── 门(急)诊病人指标(科室)2025.5.xlsx │ │ ├── 门(急)诊病人指标(科室)2025.6.xlsx │ │ └── 门(急)诊病人指标(科室)2025.7.xlsx │ └── 住院/ │ ├── 住(出)院病人指标(科室)2025.5.xlsx │ ├── 住(出)院病人指标(科室)2025.6.xlsx │ └── 住(出)院病人指标(科室)2025.7.xlsx ├── 静脉输液监测/ │ ├── 住院患者静脉输液使用监测指标调查表2025.5.xlsx │ ├── 住院患者静脉输液使用监测指标调查表2025.6.xlsx │ └── 住院患者静脉输液使用监测指标调查表2025.7.xlsx ├── 公立医疗机构药品目录.xlsx ├── 科室结构总表.xlsx

推荐的数据文件夹结构

文件夹结构说明

🎯输出格式

输出文件结构

各工作表内容

  1. 医院药品信息:医院药品基础信息表
  2. 药品使用信息:详细的药品使用记录
  3. 科室信息:科室层级结构(包含单元格合并)
  4. 药费及人次:按科室汇总的费用和人次统计

⚙️特殊处理机制

智能列名检测

ID格式保护

数据类型兼容

🏥门诊/住院判断标准

判断逻辑(按优先级)

def determine_dept_type(dept_name): if pd.isna(dept_name): return '' dept_str = str(dept_name).strip() # 特殊情况:急诊科归类为门诊 if dept_str == '急诊科': return '门诊' # 1. 以"门诊"结尾的科室 → 门诊 if '门诊' in dept_str: return '门诊' # 2. 其他科室 → 默认为住院 else: return '住院'

具体判断标准

门诊科室识别

住院科室识别

🏗️科室架构集成处理

架构优先原则

沙其版本优先使用预定义的科室架构进行科室分类:

  1. 架构表查找:首先在预定义架构表中查找科室
  2. 精确匹配:对于架构表中的科室,使用预定义的主科室分类
  3. 智能推断:对于架构表外的科室,使用推断算法确定分类
  4. 动态更新:新识别的科室动态添加到分类系统中

科室分组逻辑

主科室分组

ID分配规则

# 混合科室(既有门诊又有住院) 门诊三级ID = f"{二级ID}0" # 如: 0010 住院三级ID = f"{二级ID}1" # 如: 0011 # 其他门诊组 三级ID = f"{二级ID}{计数器:03d}" # 如: 001001 # 其他住院组 三级ID = f"{二级ID}{计数器:03d}" # 如: 002001

🔧版本特性

通平台版本支持

1.4版本

使用"规格转换系数"列名

1.5版本

使用"规格转换系数(非包装转换比)"列名

动态切换

GUI界面支持版本选择

数据兼容性

🚀使用步骤

  1. 选择必需文件:选择4个必需的Excel文件
  2. 配置可选文件:根据需要勾选并选择可选文件
  3. 选择通平台版本:在下拉框中选择1.4或1.5版本
  4. 设置时间参数:输入时间(格式:2025年9月)
  5. 设置输出位置:选择输出文件的保存位置和名称
  6. 开始处理:点击"开始处理数据"按钮
  7. 等待完成:查看处理进度和日志信息

⚠️注意事项

🆕沙其版本特性

核心优势

固化科室架构

采用预定义的582个科室记录,确保分类准确性

智能科室识别

结合架构表和推断算法,提高科室分类准确率

版本兼容性

支持通平台1.4和1.5版本的差异化处理

数据格式兼容

支持多种DDS表格式,提高数据处理灵活性

架构管理

处理优化


版本: 2.0.0(沙其版本)

更新时间: 2025年

开发说明: 这个工具是基于预定义科室架构的医疗数据处理系统,具有强大的数据标准化和格式转换能力,特别适合需要标准化科室分类的医疗机构进行数据整理和上报工作。沙其版本通过固化科室架构配置,确保了科室分类的一致性和准确性。