当前位置:网站首页>读取pdf图片并识别内容
读取pdf图片并识别内容
2022-06-28 09:39:00 【Pert-】
import pdfplumber
import pandas as pd
import fitz
from PIL import Image
from aip import AipOcr
import re
import threading
import xlwt
import numpy as np
import pandas as pd
from PIL import ImageFile
import time
ImageFile.LOAD_TRUNCATED_IMAGES = True
pdf_name='../体检报告/刘志霞/体检报告(刘志霞)2021年5月25日.pdf'
error_list=[]
class Acqire:
def __init__(self):
self.APP_ID = ''
self.API_KEY = ''
self.SECRET_KEY = ''
### 改变图片尺寸
def ResizeImage(self,path2,width,height):
filein = path2
fileout = path2
img = Image.open(filein)
out = img.resize((width, height),Image.ANTIALIAS)
out.save(fileout)
img.close()
def get_file_content(self,filepath,num,width,height):
def printI():
# re_size=threading.Thread(target = self.ResizeImage(filepath,width,height))
# re_size.start()
# re_size.join()
self.ResizeImage(filepath,width,height)
client = AipOcr(self.APP_ID,self.API_KEY,self.SECRET_KEY)
with open(filepath, 'rb') as fp:
image = fp.read()
fp.close()
# 定义参数变量
options={
'detect-direction': 'true',
'language-type': 'CHN_ENG'
}
result = client.general(image, options)
fp=open('../txt/{}.txt'.format(num),'w')
# print(result)
try:
for word in result['words_result']:
# fp.write(word['words'])
# fp.write('\n')
f.write(word['words'])
f.write('\n')
except:
print(num)
error_list.append(num)
fp.close()
return printI
def func(self,doc,i):
imglist = doc.getPageImageList(i)
for j, img in enumerate(imglist[:1]):
xref = img[0]
pix = fitz.Pixmap(doc, xref) # make pixmap from image
if pix.n - pix.alpha < 4: # can be saved as PNG
pix.writePNG("../img/p%s-%s.png" % (i+1, j+1))
else:
pix0 = fitz.Pixmap(fitz.csRGB, pix)
pix0.writePNG("../img/p%s-%s.png" % (i+1, j+1))
pix0 = None # free Pixmap resources
pix = None # free Pixmap resources
doc=fitz.open(pdf_name)
print(len(doc))
##将pdf里的图片全部下载下来
for i in range(len(doc)):
locals()['thread_'+str(i)]=threading.Thread(target = Acqire().func(doc,i))
locals()['thread_'+str(i)].start()
# ##读取文字
# def read(_list,width=1500,height=2000):
# for x in _list:
# # x=17
# filepath='../img/p{}-1.png'.format(x)
# locals()['thread_'+str(x)]=threading.Thread(target = Acqire().get_file_content(filepath,num=x,height=height,width=width))
# locals()['thread_'+str(x)].start()
# locals()['thread_'+str(x)].join()
# time.sleep(0.5)
# f=open('../total.txt','w')
# primary=[x for x in range(11,32)]
# read(primary)
# if error_list:
# print(11111111111111)
# read(error_list,f,width=1200,height=1600)
# # print(error_list)
# doc.close()
# f.close()
import re
f=open('../total.txt','r')
content=''.join(f.readlines())
f.close()
# print(content)
###一般检查
a={}
###身高
a['身高']=re.findall('身高\n(.*)',content)[0]
###体重
a['体重']=re.findall('体重\n(.*)',content)[0]
###体重指数
a['体重指数']=re.findall('体重指数\n(.*)',content)[0]
###收缩压
a['收缩压']=re.findall('收缩压\n(.*)',content)[0]
###舒张压
a['舒张压']=re.findall('舒张压\n(.*)',content)[0]
print(a)
print('\n')
###内科
b={}
###病史
b['病史']=re.findall('病史\n(.*)',content)[0]
###家族史
b['家族史']=re.findall('家族史\n(.*)',content)[0]
###心率
b['心率']=re.findall('心率\n(.*)',content)[0]
###心率
b['心率']=re.findall('心率\n(.*)',content)[0]
###心律
b['心律']=re.findall('心律\n(.*)',content)[0]
###心音
b['心音']=re.findall('心音\n(.*)',content)[0]
###肺部听诊
b['肺部听诊']=re.findall('肺部听诊\n(.*)',content)[0]
###肝脏触诊
b['肝脏触诊']=re.findall('肝脏触诊\n(.*)',content)[0]
###脾脏触诊
b['脾脏触诊']=re.findall('脾脏触诊\n(.*)',content)[0]
###肾脏叩诊
b['肾脏叩诊']=re.findall('肾脏叩诊\n(.*)',content)[0]
###内科其它
b['内科其它']=re.findall('内科其它\n(.*)',content)[0]
print(b)
print('\n')
###外科
c={}
###皮肤
c['皮肤']=re.findall('皮肤\n(.*)',content)[0]
###浅表淋巴结
c['浅表淋巴结']=re.findall('浅表淋巴结\n(.*)',content)[0]
###甲状腺(外科)
c['甲状腺(外科)']=re.findall('甲状腺.*\n(.*)',content)[0]
###脊柱
c['脊柱']=re.findall('脊柱\n(.*)',content)[0]
###四肢关节
c['四肢关节']=re.findall('四肢关节\n(.*)',content)[0]
###外科其它
c['外科其它']=re.findall('外科其它\n(.*)',content)[0]
###初步意见
c['初步意见']=re.findall('初步意见(.*)',content)[0]
print(c)
print('\n')
###妇科
d={}
###手术史
d['手术史']=re.findall('单位\n手术史\n(.*)',content)[0]
###外阴
d['外阴']=re.findall('外阴\n(.*)',content)[0]
###阴道
d['阴道']=re.findall('阴道\n(.*)',content)[0]
###宫颈
d['宫颈']=re.findall('宫颈\n(.*)',content)[0]
###子宫
d['子宫']=re.findall('子宫\n(.*)',content)[0]
###附件
d['附件']=re.findall('附件\n(.*)',content)[0]
###妇科其它
d['妇科其它']=re.findall('妇科其它\n(.*)',content)[0]
print(d)
print('\n')
###眼科
e={}
###外眼
e['外眼']=re.findall('外眼\n(.*)',content)[0]
###眼科其它
e['眼科其它']=re.findall('眼科其它\n(.*)',content)[0]
###裂隙灯检查
e['裂隙灯检查']=re.findall('裂隙灯检查\n(.*)',content)[0]
###眼底镜检查
e['眼底镜检查']=re.findall('眼底镜检查\n(.*)',content)[0]
###左眼非接触性眼压
e['左眼非接触性眼压']=re.findall('左眼非接触性眼压\n(.*)',content)[0]
###右眼非接触性眼压
e['右眼非接触性眼压']=re.findall('右眼非接触性眼压\n(.*)',content)[0]
print(e)
print('\n')
# ###耳鼻咽喉科
f={}
###既往史
f['既往史']=re.findall('既往史\n(.*)',content)[0]
###外耳
f['外耳']=re.findall('外耳\n(.*)',content)[0]
###外耳道
f['外耳道']=re.findall('外耳道\n(.*)',content)[0]
###鼓膜
f['鼓膜']=re.findall('鼓膜\n(.*)',content)[0]
###鼻腔
f['鼻腔']=re.findall('鼻腔\n(.*)',content)[0]
###鼻中隔
f['鼻中隔']=re.findall('鼻中隔\n(.*)',content)[0]
###咽
f['咽']=re.findall('咽\n(.*)',content)[0]
###扁桃体
f['扁桃体']=re.findall('扁桃体\n(.*)',content)[0]
###耳鼻咽喉科其它
f['耳鼻咽喉科其它']=re.findall('耳鼻咽喉科其它\n(.*)',content)[0]
print(f)
print('\n')
###血常规
g={}
###白细胞计数
g['白细胞计数']=re.findall('白细胞计数\n.*\n(.*)',content)[0]
###红细胞计数
g['红细胞计数']=re.findall('红细胞计数\n.*\n(.*)',content)[0]
###血红蛋白
g['血红蛋白']=re.findall('血红蛋白\n(.*)',content)[0]
###红细胞压积
g['红细胞压积']=re.findall('红细胞压积\n.*\n(.*)',content)[0]
###平均红细胞体积
g['平均红细胞体积']=re.findall('平均红细胞体积\n.*\n(.*)',content)[0]
###平均红细胞血红蛋白含量
g['平均红细胞血红蛋白含量']=re.findall('平均红细胞血红蛋白含量\n.*\n(.*)',content)[0]
###平均红细胞血红蛋白浓度
g['平均红细胞血红蛋白浓度']=re.findall('平均红细胞血红蛋白浓度\n.*\n(.*)',content)[0]
###红细胞分布宽度变异系数
# g['红细胞分布宽度变异系数']=re.findall('红细胞分布宽度变异系数\n RDW-CV (.*)',content)[0]
g['红细胞分布宽度变异系数']=''
###血小板计数
g['血小板计数']=re.findall('血小板计数\n.*\n(.*)',content)[0]
###平均血小板体积
g['平均血小板体积']=re.findall('平均血小板体积\n.*\n(.*)',content)[0]
###血小板分布宽度
g['血小板分布宽度']=re.findall('血小板分布宽度\n.*\n(.*)',content)[0]
###淋巴细胞百分比
g['淋巴细胞百分比']=re.findall('淋巴细胞百分比\n.*%(.*)',content)[0]
###中性粒细胞百分比
g['中性粒细胞百分比']=re.findall('中性粒细胞百分比\n.*%(.*)',content)[0]
###淋巴细胞绝对值
# g['淋巴细胞绝对值']=re.findall('淋巴细胞绝对值\n.*LYMPH (.*)',content)[0]
g['淋巴细胞绝对值']=''
###中性粒细胞绝对值
g['中性粒细胞绝对值']=re.findall('中性粒细胞绝对值\n.*\n(.*)',content)[0]
###红细胞分布宽度标准差
# g['红细胞分布宽度标准差']=re.findall('红细胞分布宽度标准差\n.*RDW-SD (.*)',content)[0]
g['红细胞分布宽度标准差']=''
###血小板压积
g['血小板压积']=re.findall('血小板压积\n.*\n(.*)',content)[0]
###单核细胞百分比
g['单核细胞百分比']=re.findall('单核细胞百分比\n.*%(.*)',content)[0]
###单核细胞绝对值
g['单核细胞绝对值']=re.findall('单核细胞绝对值\n.*\n(.*)',content)[0]
###嗜酸性细胞百分比
g['嗜酸性细胞百分比']=re.findall('嗜酸性细胞百分比\n.*\n(.*)',content)[0]
###嗜酸性细胞绝对值
g['嗜酸性细胞绝对值']=re.findall('嗜酸性细胞绝对值\n.*\n(.*)',content)[0]
###嗜碱性细胞百分比
g['嗜碱性细胞百分比']=re.findall('嗜碱性细胞百分比\n.*%(.*)',content)[0]
###嗜碱性细胞绝对值
g['嗜碱性细胞绝对值']=re.findall('嗜碱性细胞绝对值\n.*\n(.*)',content)[0]
print(g)
print('\n')
###尿常规
h={}
###尿比重
h['尿比重']=re.findall('尿比重\n.*\n(.*)',content)[0]
###尿酸碱度
h['尿酸碱度']=re.findall('尿酸碱度\n.*\n(.*)',content)[0]
###尿白细胞
h['尿白细胞']=re.findall('尿白细胞\n.*\n(.*)',content)[0]
###尿亚硝酸盐
h['尿亚硝酸盐']=re.findall('尿亚硝酸盐\n.*\n(.*)',content)[0]
###尿蛋白质
h['尿蛋白质']=re.findall('尿蛋白质\n.*\n(.*)',content)[0]
###尿糖
h['尿糖']=re.findall('尿糖\n.*\n(.*)',content)[0]
###尿酮体
h['尿酮体']=re.findall('尿酮体\n.*\n(.*)',content)[0]
###尿胆原
h['尿胆原']=re.findall('尿胆原\n.*\n(.*)',content)[0]
###尿胆红素
h['尿胆红素']=re.findall('尿胆红素\n.*\n(.*)',content)[0]
###尿隐血
h['尿隐血']=re.findall('尿隐血\n.*\n(.*)',content)[0]
###尿抗坏血酸
h['尿抗坏血酸']=re.findall('尿抗坏血酸\n.*\n(.*)',content)[0]
###尿微量白蛋白定量
# h['尿微量白蛋白定量']=re.findall('尿微量白蛋白定量\n U-ALB\n(.*)',content)[0]
h['尿微量白蛋白定量']=''
###碳14-尿素呼气试验
# h['碳14-尿素呼气试验']=re.findall('碳14尿素呼气试验\n 14C-UBT (.*)',content)[0]
h['碳14-尿素呼气试验']=''
###便隐血
h['便隐血']=re.findall('便隐血\n(.*)',content)[0]
print(h)
print('\n')
###妇科
i={}
###白带清洁度
i['白带清洁度']=re.findall('白带清洁度\n(.*)',content)[0]
###念珠样菌
i['念珠样菌']=re.findall('念珠样菌\n(.*)',content)[0]
###滴虫
i['滴虫']=re.findall('滴虫\n(.*)',content)[0]
###宫颈TCT
i['宫颈TCT']=re.findall('宫颈TCT\n(.*)',content)[0]
print(i)
print('\n')
###实验室检查
j={}
###抗甲状腺过氧化物酶抗体
j['抗甲状腺过氧化物酶抗体']=re.findall('抗甲状腺过氧化物酶抗体\nAnti-TPO\n(.*)',content)[0]
###胃泌素17
j['胃泌素17']=re.findall('胃泌素.*\n(.*)',content)[0]
###丙氨酸氨基转移酶
j['丙氨酸氨基转移酶']=re.findall('丙氨酸氨基转移酶\nALT\n(.*)',content)[0]
###天门冬氨酸氨基转移酶
j['天门冬氨酸氨基转移酶']=re.findall('天门冬氨酸氨基转移酶\nAST\n(.*)',content)[0]
###γ-谷氨酰转移酶
j['γ-谷氨酰转移酶']=re.findall('Y-谷氨酰转移酶\nGGT\n(.*)',content)[0]
###碱性磷酸酶
j['碱性磷酸酶']=re.findall('碱性磷酸酶\nALP\n(.*)',content)[0]
###总胆汁酸
j['总胆汁酸']=re.findall('总胆汁酸\nTBA\n(.*)',content)[0]
###胆碱酯酶
j['胆碱酯酶']=re.findall('胆碱酯酶\nChE\n(.*)',content)[0]
###总胆红素
j['总胆红素']=re.findall('总胆红素\nTBIL\n(.*)',content)[0]
###直接胆红素
j['直接胆红素']=re.findall('直接胆红素\nDBIL(.*)',content)[0]
###间接胆红素
j['间接胆红素']=re.findall('间接胆红素\nIBIL\n(.*)',content)[0]
###总蛋白
j['总蛋白']=re.findall('总蛋白\nTP\n(.*)',content)[0]
###白蛋白
j['白蛋白']=re.findall('白蛋白\nALB\n(.*)',content)[0]
###球蛋白
j['球蛋白']=re.findall('球蛋白\nGLO\n(.*)',content)[0]
###白蛋白/球蛋白比值
j['白蛋白/球蛋白比值']=re.findall('白蛋白/球蛋白比值\nA/G\n(.*)',content)[0]
###尿素
j['尿素']=re.findall('尿素\nUREA\n(.*)',content)[0]
###肌酐
j['肌酐']=re.findall('肌酐\nCr\n(\d+\.*\d*)',content)[0]
###尿酸
j['尿酸']=re.findall('尿酸\nUA\n(.*)',content)[0]
###β2微球蛋白
j['β2微球蛋白']=re.findall('β2微球蛋白\nβ2-MG\n(.*)',content)[0]
###血清胱抑素C
j['血清胱抑素C']=re.findall('血清胱抑素C\n.*\n(.*)',content)[0]
###空腹血葡萄糖
j['空腹血葡萄糖']=re.findall('空腹血葡萄糖\nFBG\n(.*)',content)[0]
###糖化血红蛋白
j['糖化血红蛋白']=re.findall('糖化血红蛋白\nHBA1c\n(.*)',content)[0]
###胰岛素
j['胰岛素']=re.findall('胰岛素\nINS\n(.*)',content)[0]
###C肽
j['C肽']=re.findall('C.*肽\n.*\n(.*)',content)[0]
###总胆固醇
j['总胆固醇']=re.findall('总胆固醇\nTc\n(.*)',content)[0]
###甘油三酯
j['甘油三酯']=re.findall('甘油三酯\nTG\n(.*)',content)[0]
###高密度脂蛋白胆固醇
j['高密度脂蛋白胆固醇']=re.findall('高密度脂蛋白胆固醇\nHDL-C\n(.*)',content)[0]
###低密度脂蛋白胆固醇
j['低密度脂蛋白胆固醇']=re.findall('低密度脂蛋白胆固醇\nLDL-C\n(.*)',content)[0]
###载脂蛋白A1
j['载脂蛋白A1']=re.findall('载脂蛋白A1\n.*\n(.*)',content)[0]
###载脂蛋白B
j['载脂蛋白B']=re.findall('载脂蛋白B\nApo-B\n(.*)',content)[0]
###脂蛋白(a)
j['脂蛋白(a)']=re.findall('脂蛋白.*\n.*LP.*\n(.*)',content)[0]
###磷酸肌酸激酶
j['磷酸肌酸激酶']=re.findall('CK\n(.*)',content)[0]
###磷酸肌酸激酶同工酶
j['磷酸肌酸激酶同工酶']=re.findall('磷酸肌酸激酶同工酶\n.*\n(.*)',content)[0]
###乳酸脱氢酶
j['乳酸脱氢酶']=re.findall('乳酸脱氢酶\nLDH\n(.*)',content)[0]
###超敏C反应蛋白
j['超敏C反应蛋白']=re.findall('超敏C反应蛋白\nHS-CRP(.*)',content)[0]
###同型半胱氨酸
j['同型半胱氨酸']=re.findall('同型半胱氨酸\n(.*)',content)[0]
###全血粘度1
j['全血粘度1']=re.findall('全血粘度1\n(.*)',content)[0]
###全血粘度5
j['全血粘度5']=re.findall('全血粘度5\n(.*)',content)[0]
###全血粘度30
j['全血粘度30']=re.findall('全血粘度30\n(.*)',content)[0]
###全血粘度200
j['全血粘度200']=re.findall('全血粘度200\n(.*)',content)[0]
###血浆粘度
j['血浆粘度']=re.findall('血浆粘度\n(.*)',content)[0]
###血沉
j['血沉']=re.findall('血沉\n(.*)',content)[0]
###压积
j['压积']=re.findall('压积\n(.*)',content)[0]
###全血高切相对指数
j['全血高切相对指数']=re.findall('全血高切相对指数\n(.*)',content)[0]
###全血低切相对指数
j['全血低切相对指数']=re.findall('全血低切相对指数\n(.*)',content)[0]
###血沉方程K值
j['血沉方程K值']=re.findall('血沉方程K值\n(.*)',content)[0]
###红细胞聚集指数
j['红细胞聚集指数']=re.findall('红细胞聚集指数\nAgrbc\n(.*)',content)[0]
###全血低切还原粘度
j['全血低切还原粘度']=re.findall('全血低切还原粘度\n(.*)',content)[0]
###全血高切还原粘度
j['全血高切还原粘度']=re.findall('全血高切还原粘度\n(.*)',content)[0]
###红细胞刚性指数
j['红细胞刚性指数']=re.findall('红细胞刚性指数\n.*\n(.*)',content)[0]
###红细胞变形指数
j['红细胞变形指数']=re.findall('红细胞变形指数\n(.*)',content)[0]
###类风湿因子
j['类风湿因子']=re.findall('类风湿因子\nRF\n(.*)',content)[0]
###抗链球菌溶血素“0
j['抗链球菌溶血素“0']=re.findall('抗链球菌溶血素.*\n.*\n(.*)',content)[0]
###乳酸脱氢酶
j['乳酸脱氢酶']=re.findall('乳酸脱氢酶\nLDH\n(.*)',content)[0]
###HPV16型
j['HPV16型']=re.findall('HPV16型\n(.*)',content)[0]
###HPV18型
j['HPV18型']=re.findall('HPV18型\n(.*)',content)[0]
###HPV31型
j['HPV31型']=re.findall('HPV31型\n(.*)',content)[0]
###HPV33型
j['HPV33型']=re.findall('HPV33型\n(.*)',content)[0]
###HPV35型
j['HPV35型']=re.findall('HPV35型\n(.*)',content)[0]
###HPV39型
j['HPV39型']=re.findall('HPV39型\n(.*)',content)[0]
###HPV45型
j['HPV45型']=re.findall('HPV45型\n(.*)',content)[0]
###HPV51型
j['HPV51型']=re.findall('.*PV51型\n(.*)',content)[0]
###HPV52型
j['HPV52型']=re.findall('HPV52型\n(.*)',content)[0]
###HPV53型
j['HPV53型']=re.findall('HPV53型\n(.*)',content)[0]
###HPV56型
j['HPV56型']=re.findall('HPV56型\n(.*)',content)[0]
###HPV58型
j['HPV58型']=re.findall('HPV58型\n(.*)',content)[0]
###HPV59型
j['HPV59型']=re.findall('HPV59型\n(.*)',content)[0]
###HPV66型
j['HPV66型']=re.findall('HPV66型\n(.*)',content)[0]
###HPV68型
j['HPV68型']=re.findall('HPV68型\n(.*)',content)[0]
###HPV6型
j['HPV6型']=re.findall('HPV6型\n(.*)',content)[0]
###HPV11型
j['HPV11型']=re.findall('HPV11型\n(.*)',content)[0]
###HPV43型
j['HPV43型']=re.findall('HPV43型\n(.*)',content)[0]
###HPV42型
j['HPV42型']=re.findall('HPV42型\n(.*)',content)[0]
###HPV73型
j['HPV73型']=re.findall('HPV73型\n(.*)',content)[0]
###HPV81型
j['HPV81型']=re.findall('HPV81型\n(.*)',content)[0]
###HPV83型
j['HPV83型']=re.findall('HPV83型\n(.*)',content)[0]
###HPV82型
j['HPV82型']=re.findall('HPV82型\n(.*)',content)[0]
###EB病毒抗- VCAIgA
j['EB病毒抗- VCAIgA']=re.findall('EB病毒抗.*\n(.*)',content)[0]
###甲胎蛋白(T-12)
j['甲胎蛋白(T-12)']=re.findall('甲胎蛋白.*\nAFP\n(.*)',content)[0]
###癌胚抗原(T-12)
j['癌胚抗原(T-12)']=re.findall('癌胚抗原.*\nCEA\n(.*)',content)[0]
###细胞角蛋白19片段(T-12)
j['细胞角蛋白19片段(T-12)']=re.findall('细胞角蛋白19片段.*\nCYFRA21-1(.*)',content)[0]
###糖类抗原19-9(T-12)
j['糖类抗原19-9(T-12)']=re.findall('糖类抗原19-9.*\nCA19-9\n(.*)',content)[0]
###糖类抗原242(T-12)
j['糖类抗原242(T-12)']=re.findall('糖类抗原242.*\nCA242\n(.*)',content)[0]
###神经元特异性烯醇化酶(T-12)NSE
j['神经元特异性烯醇化酶(T-12)NSE']=re.findall('神经元特异性烯醇化酶\n.*\nNSE\n(.*)',content)[0]
###糖类抗原15-3(T-12)
j['糖类抗原15-3(T-12)']=re.findall('糖类抗原15-3.*\nCA15-3(.*)',content)[0]
###糖类抗原125(T-12)
j['糖类抗原125(T-12)']=re.findall('糖类抗原125.*\n.*\n(.*)',content)[0]
###PGl/PGIl(T-12)
j['PGl/PGIl(T-12)']=''
###胃蛋白酶原(T-12)
j['胃蛋白酶原(T-12)']=re.findall('胃蛋白酶原.*\n.*\nPG I\n(.*)',content)[0]
###胃蛋白酶原Ⅱ(T-12)
j['胃蛋白酶原Ⅱ(T-12)']=''
###人绒毛膜促性腺激素游离β亚基
j['人绒毛膜促性腺激素游离β亚基']=''
###乳酸脱氢酶
j['乳酸脱氢酶']=re.findall('乳酸脱氢酶\nLDH\n(.*)',content)[0]
###鳞状上皮细胞癌相关抗原(T-12)
j['鳞状上皮细胞癌相关抗原(T-12)']=re.findall('鳞状上皮细胞癌相关抗原.*\nSCC\n(.*)',content)[0]
###三碘甲状腺原氨酸
j['三碘甲状腺原氨酸']=re.findall('三碘甲状腺原氨酸\n(.*)',content)[0]
###游离三碘甲状原氨酸
j['游离三碘甲状原氨酸']=re.findall('游离三碘甲状原氨酸\n(.*)',content)[0]
###甲状腺素
j['甲状腺素']=re.findall('甲状腺素\nT4\n(.*)',content)[0]
###游离甲状腺素
j['游离甲状腺素']=re.findall('游离甲状腺素\nFT4\n(.*)',content)[0]
###促甲状腺激素
j['促甲状腺激素']=re.findall('促甲状腺激素\nTSH\n(.*)',content)[0]
###抗甲状腺球蛋白抗体
j['抗甲状腺球蛋白抗体']=re.findall('抗甲状腺球蛋白抗体\nTG-Ab\n(.*)',content)[0]
###孕酮
j['孕酮']=re.findall('孕酮\n(.*)',content)[0]
###雌二醇
j['雌二醇']=re.findall('雌二醇\n.*\n(.*)',content)[0]
###卵泡刺激素
j['卵泡刺激素']=re.findall('卵泡刺激素\n.*\n.*\n(.*)',content)[0]
###促黄体生成激素
j['促黄体生成激素']=re.findall('促黄体生成激素\n.*\n(.*)',content)[0]
###睾酮
j['睾酮']=re.findall('睾酮\n.*\n(.*)',content)[0]
###泌乳素
j['泌乳素']=re.findall('泌乳素\nPRL\n(.*)',content)[0]
###免疫球蛋白A
j['免疫球蛋白A']=re.findall('免疫球蛋白A\nIgA\n(.*)',content)[0]
###免疫球蛋白G
j['免疫球蛋白G']=re.findall('免疫球蛋白G\n.*\n(.*)',content)[0]
###免疫球蛋白M
j['免疫球蛋白M']=re.findall('免疫球蛋白M\n.*\n(.*)',content)[0]
###免疫球蛋白E
j['免疫球蛋白E']=re.findall('免疫球蛋白E\n(.*)',content)[0]
###补体C3
j['补体C3']=re.findall('补体C3\nC3\n(.*)',content)[0]
###补体C4
j['补体C4']=re.findall('补体C4\nC4\n(.*)',content)[0]
###血清Ⅲ型前胶原
j['血清Ⅲ型前胶原']=re.findall('血清.型前胶原\nPCII\n(.*)',content)[0]
###血清Ⅳ型胶原
j['血清Ⅳ型胶原']=re.findall('血清.型胶原\nCIV\n(.*)',content)[0]
###血清层粘连蛋白
j['血清层粘连蛋白']=re.findall('血清层粘连蛋白\nLN\n(.*)',content)[0]
###血清透明质酸
j['血清透明质酸']=re.findall('(.*)\n.*\n血清透明质酸',content)[0]
print(j)
print('\n')
###心电图室
k={}
###心电图
k['心电图']=''.join(list(re.findall('心电图\n(.*)',content)[0]))
print(k)
print('\n')
###超声室检查
l={}
###肝
l['肝']=re.findall('肝\n(.*?)\n胆',content,re.S)[0]
###胆
l['胆']=re.findall('胆\n(.*?)\n胰',content,re.S)[0]
###胰
l['胰']=re.findall('胆\n.*?(胰.*)\n胰',content,re.S)[0]
###脾
l['脾']=re.findall('脾\n(.*?)\n双肾',content,re.S)[0]
###双肾
l['双肾']=re.findall('双肾\n(.*?)\n子宫',content,re.S)[0]
###子宫
l['子宫']=re.findall('双肾\n.*?\n子宫\n(.*?)\n附件',content,re.S)[0]
###附件
l['附件']=re.findall('双肾\n.*?\n子宫\n.*?\n附件(.*?)\n爱康',content,re.S)[0]
###乳腺
l['乳腺']=re.findall('乳腺\n(.*?)\n甲状腺',content,re.S)[0]
###甲状腺
l['甲状腺']=''.join(list(re.findall('(甲状腺.*?)\n甲状腺\n(.*\n大淋巴结)',content)[0]))
###颈动脉
l['颈动脉']=''.join(list(re.findall('甲状腺\n.*\n大淋巴结.*\n(.*)\n.*\n(.*\n.*)',content)[0]))
###心脏
l['心脏']=re.findall('检查所见.*\n(1.*?)\n膀胱',content,re.S)[0]
###膀胱
l['膀胱']=re.findall('膀胱\n(.*)',content)[0]
print(l)
print('\n')
###CT
m={}
m['头颅']=''.join(list(re.findall('(.*)\n头颅.CT.\n(.*)\n(.*)',content)[0]))
m['胸部']=re.findall('胸部.CT.\n(.*?)初步意见',content,re.S)[0]
print(m)
print('\n')
###骨密度
n={}
n['骨密度']=re.findall('骨密度\n(.*)',content)[0]
print(n)
print('\n')
###动脉硬化检测室
o={}
o['动脉硬化检测']=re.findall('动脉硬化检测\n(.*)\n经颅多普勒检查室',content,re.S)[0]
o['经颅多普勒']=re.findall('经颅多普勒检查室.*?单位\n(.*?)\n初步意见',content,re.S)[0]
print(o)
print('\n')
###乙肝检测报告
p={}
p['乙型肝炎病毒表面抗原']=re.findall('乙型肝炎病毒表面抗原\n.*\n.*\n.*\n(.*)',content)[0]
p['乙型肝炎病毒表面抗体']=re.findall('乙型肝炎病毒表面抗体\n.*\n(.*)',content)[0]
p['乙型肝炎病毒e抗原']=re.findall('乙型肝炎病毒e抗原\n.*\n.*\n(.*)',content)[0]
p['乙型肝炎病毒e抗体']=re.findall('乙型肝炎病毒e抗体\n.*\n(.*)',content)[0]
p['乙型肝炎病毒核心抗体']=re.findall('乙型肝炎病毒核心抗体\n.*\n(.*)',content)[0]
print(p)
print('\n')
_list=['一般检查','内科','外科','妇科','眼科','耳鼻咽喉科','血常规','尿常规','妇科','实验室检查','心电图室','超声室检查','CT','骨密度','动脉硬化检测时','乙肝检测报告']
_list2=[a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p]
total={x:y for x,y in zip(_list,_list2)}
# print(total)
total_list=[]
for x in _list2:
_list3=[]
for key,value in x.items():
_list3.append([key,value])
total_list.append(_list3)
writer=pd.ExcelWriter("刘志霞爱康报告.xlsx")
for index,x in enumerate(total_list):
data=np.array(x)
df=pd.DataFrame(data)
df.to_excel(writer, sheet_name=_list[index], header=False, index=False)
writer.save()
边栏推荐
- The concept of "tree structure" perfectly interprets the primary and secondary of things
- PMP考试重点总结八——监控过程组(2)
- The constructor is never executed immediately after new()!!!!!
- Stutter participle_ Principle of word breaker
- new URL(“www.jjj.com“)
- Key summary IV of PMP examination - planning process group (2)
- 纵观jBPM从jBPM3到jBPM5以及Activiti
- 异常处理4种方法
- Write a simple timeline
- PMP examination key summary VIII - monitoring process group (2)
猜你喜欢
随机推荐
1181: integer parity sort
Settings of gift giving module and other custom controls in one-to-one video chat system code
Installing redis under Linux and windows (ultra detailed graphic tutorial)
Instant messaging and BS architecture simulation of TCP practical cases
A classic JVM class loaded interview question class singleton{static singleton instance = new singleton(); private singleton() {}
详解final、finally和finalize
P2394 yyy loves Chemistry I
PHP curl forged IP address and header information code instance - Alibaba cloud
异常处理4种方法
Unity 从服务器加载AssetBundle资源写入本地内存,并将下载保存的AB资源从本地内存加载至场景
How to reduce the risk of project communication?
Ingersoll Rand panel maintenance IR Ingersoll Rand microcomputer controller maintenance xe-145m
Au revoir! Navigateur ie, cette route Edge continue pour IE
For the development of short video app, the elder warned me to choose the open source code
线程和进程
Decorator
Thread lifecycle
Composite pattern
The private attribute of this class can be used directly? New() in use!!!
优秀笔记软件盘点:好看且强大的可视化笔记软件、知识图谱工具Heptabase、氢图、Walling、Reflect、InfraNodus、TiddlyWiki








