当前位置:网站首页>读取pdf图片并识别内容

读取pdf图片并识别内容

2022-06-28 09:39:00 Pert-

import pdfplumber
import pandas as pd
import fitz
from PIL import Image
from aip import AipOcr
import re
import threading
import xlwt
import numpy as np
import pandas as pd
from PIL import ImageFile
import time

ImageFile.LOAD_TRUNCATED_IMAGES = True

pdf_name='../体检报告/刘志霞/体检报告(刘志霞)2021年5月25日.pdf'
error_list=[]

class Acqire:
	def __init__(self):
		self.APP_ID = ''
		self.API_KEY = ''
		self.SECRET_KEY = ''

	### 改变图片尺寸
	def ResizeImage(self,path2,width,height):
	    filein = path2
	    fileout = path2
	    img = Image.open(filein)
	    out = img.resize((width, height),Image.ANTIALIAS)
	    out.save(fileout)
	    img.close()
	    

	def get_file_content(self,filepath,num,width,height):
		def printI():
			# re_size=threading.Thread(target = self.ResizeImage(filepath,width,height))
			# re_size.start()
			# re_size.join()
			self.ResizeImage(filepath,width,height)
			client = AipOcr(self.APP_ID,self.API_KEY,self.SECRET_KEY)
			with open(filepath, 'rb') as fp:
				image = fp.read()
			fp.close()
		    # 定义参数变量
			options={
				'detect-direction': 'true',
		        'language-type': 'CHN_ENG'
			}
			result = client.general(image, options)
			fp=open('../txt/{}.txt'.format(num),'w')
			# print(result)
			try:
				for word in result['words_result']:
					# fp.write(word['words'])
					# fp.write('\n')
					f.write(word['words'])
					f.write('\n')
			except:
				print(num)
				error_list.append(num)
			fp.close()
		return printI

	def func(self,doc,i):
		imglist = doc.getPageImageList(i)
		for j, img in enumerate(imglist[:1]):
			xref = img[0]
			pix = fitz.Pixmap(doc, xref)   # make pixmap from image
			if pix.n - pix.alpha < 4:      # can be saved as PNG
				pix.writePNG("../img/p%s-%s.png" % (i+1, j+1))
			else:
				pix0 = fitz.Pixmap(fitz.csRGB, pix)
				pix0.writePNG("../img/p%s-%s.png" % (i+1, j+1))
				pix0 = None                # free Pixmap resources
			pix = None                     # free Pixmap resources

doc=fitz.open(pdf_name)
print(len(doc))
##将pdf里的图片全部下载下来

for i in range(len(doc)):
	locals()['thread_'+str(i)]=threading.Thread(target = Acqire().func(doc,i))
	locals()['thread_'+str(i)].start()


# ##读取文字
# def read(_list,width=1500,height=2000):
# 	for x in _list:
# 	# x=17
# 		filepath='../img/p{}-1.png'.format(x)
# 		locals()['thread_'+str(x)]=threading.Thread(target = Acqire().get_file_content(filepath,num=x,height=height,width=width))
# 		locals()['thread_'+str(x)].start()
# 		locals()['thread_'+str(x)].join()
# 		time.sleep(0.5)

# f=open('../total.txt','w')
# primary=[x for x in range(11,32)]
# read(primary)


# if error_list:
# 	print(11111111111111)
# 	read(error_list,f,width=1200,height=1600)
	
# # print(error_list)
# doc.close()
# f.close()





import re

f=open('../total.txt','r')
content=''.join(f.readlines())
f.close()
# print(content)
###一般检查
a={}

###身高
a['身高']=re.findall('身高\n(.*)',content)[0]

###体重
a['体重']=re.findall('体重\n(.*)',content)[0]

###体重指数
a['体重指数']=re.findall('体重指数\n(.*)',content)[0]

###收缩压
a['收缩压']=re.findall('收缩压\n(.*)',content)[0]

###舒张压
a['舒张压']=re.findall('舒张压\n(.*)',content)[0]

print(a)
print('\n')

###内科
b={}
###病史
b['病史']=re.findall('病史\n(.*)',content)[0]

###家族史
b['家族史']=re.findall('家族史\n(.*)',content)[0]

###心率
b['心率']=re.findall('心率\n(.*)',content)[0]

###心率
b['心率']=re.findall('心率\n(.*)',content)[0]

###心律
b['心律']=re.findall('心律\n(.*)',content)[0]

###心音
b['心音']=re.findall('心音\n(.*)',content)[0]

###肺部听诊
b['肺部听诊']=re.findall('肺部听诊\n(.*)',content)[0]

###肝脏触诊
b['肝脏触诊']=re.findall('肝脏触诊\n(.*)',content)[0]

###脾脏触诊
b['脾脏触诊']=re.findall('脾脏触诊\n(.*)',content)[0]

###肾脏叩诊
b['肾脏叩诊']=re.findall('肾脏叩诊\n(.*)',content)[0]

###内科其它
b['内科其它']=re.findall('内科其它\n(.*)',content)[0]

print(b)
print('\n')

###外科
c={}

###皮肤
c['皮肤']=re.findall('皮肤\n(.*)',content)[0]

###浅表淋巴结
c['浅表淋巴结']=re.findall('浅表淋巴结\n(.*)',content)[0]

###甲状腺(外科)
c['甲状腺(外科)']=re.findall('甲状腺.*\n(.*)',content)[0]

###脊柱
c['脊柱']=re.findall('脊柱\n(.*)',content)[0]

###四肢关节
c['四肢关节']=re.findall('四肢关节\n(.*)',content)[0]

###外科其它
c['外科其它']=re.findall('外科其它\n(.*)',content)[0]

###初步意见
c['初步意见']=re.findall('初步意见(.*)',content)[0]

print(c)
print('\n')

###妇科
d={}
###手术史
d['手术史']=re.findall('单位\n手术史\n(.*)',content)[0]

###外阴
d['外阴']=re.findall('外阴\n(.*)',content)[0]

###阴道
d['阴道']=re.findall('阴道\n(.*)',content)[0]

###宫颈
d['宫颈']=re.findall('宫颈\n(.*)',content)[0]

###子宫
d['子宫']=re.findall('子宫\n(.*)',content)[0]

###附件
d['附件']=re.findall('附件\n(.*)',content)[0]

###妇科其它
d['妇科其它']=re.findall('妇科其它\n(.*)',content)[0]

print(d)
print('\n')

###眼科
e={}

###外眼
e['外眼']=re.findall('外眼\n(.*)',content)[0]

###眼科其它
e['眼科其它']=re.findall('眼科其它\n(.*)',content)[0]

###裂隙灯检查
e['裂隙灯检查']=re.findall('裂隙灯检查\n(.*)',content)[0]

###眼底镜检查
e['眼底镜检查']=re.findall('眼底镜检查\n(.*)',content)[0]

###左眼非接触性眼压
e['左眼非接触性眼压']=re.findall('左眼非接触性眼压\n(.*)',content)[0]

###右眼非接触性眼压
e['右眼非接触性眼压']=re.findall('右眼非接触性眼压\n(.*)',content)[0]


print(e)
print('\n')


# ###耳鼻咽喉科

f={}

###既往史
f['既往史']=re.findall('既往史\n(.*)',content)[0]

###外耳
f['外耳']=re.findall('外耳\n(.*)',content)[0]

###外耳道
f['外耳道']=re.findall('外耳道\n(.*)',content)[0]

###鼓膜
f['鼓膜']=re.findall('鼓膜\n(.*)',content)[0]

###鼻腔
f['鼻腔']=re.findall('鼻腔\n(.*)',content)[0]

###鼻中隔
f['鼻中隔']=re.findall('鼻中隔\n(.*)',content)[0]

###咽
f['咽']=re.findall('咽\n(.*)',content)[0]

###扁桃体
f['扁桃体']=re.findall('扁桃体\n(.*)',content)[0]

###耳鼻咽喉科其它
f['耳鼻咽喉科其它']=re.findall('耳鼻咽喉科其它\n(.*)',content)[0]

print(f)
print('\n')

###血常规
g={}

###白细胞计数
g['白细胞计数']=re.findall('白细胞计数\n.*\n(.*)',content)[0]

###红细胞计数
g['红细胞计数']=re.findall('红细胞计数\n.*\n(.*)',content)[0]

###血红蛋白
g['血红蛋白']=re.findall('血红蛋白\n(.*)',content)[0]

###红细胞压积
g['红细胞压积']=re.findall('红细胞压积\n.*\n(.*)',content)[0]

###平均红细胞体积
g['平均红细胞体积']=re.findall('平均红细胞体积\n.*\n(.*)',content)[0]

###平均红细胞血红蛋白含量
g['平均红细胞血红蛋白含量']=re.findall('平均红细胞血红蛋白含量\n.*\n(.*)',content)[0]

###平均红细胞血红蛋白浓度
g['平均红细胞血红蛋白浓度']=re.findall('平均红细胞血红蛋白浓度\n.*\n(.*)',content)[0]

###红细胞分布宽度变异系数
# g['红细胞分布宽度变异系数']=re.findall('红细胞分布宽度变异系数\n RDW-CV (.*)',content)[0]
g['红细胞分布宽度变异系数']=''

###血小板计数
g['血小板计数']=re.findall('血小板计数\n.*\n(.*)',content)[0]

###平均血小板体积
g['平均血小板体积']=re.findall('平均血小板体积\n.*\n(.*)',content)[0]

###血小板分布宽度
g['血小板分布宽度']=re.findall('血小板分布宽度\n.*\n(.*)',content)[0]

###淋巴细胞百分比
g['淋巴细胞百分比']=re.findall('淋巴细胞百分比\n.*%(.*)',content)[0]

###中性粒细胞百分比
g['中性粒细胞百分比']=re.findall('中性粒细胞百分比\n.*%(.*)',content)[0]

###淋巴细胞绝对值
# g['淋巴细胞绝对值']=re.findall('淋巴细胞绝对值\n.*LYMPH (.*)',content)[0]
g['淋巴细胞绝对值']=''

###中性粒细胞绝对值
g['中性粒细胞绝对值']=re.findall('中性粒细胞绝对值\n.*\n(.*)',content)[0]

###红细胞分布宽度标准差
# g['红细胞分布宽度标准差']=re.findall('红细胞分布宽度标准差\n.*RDW-SD (.*)',content)[0]
g['红细胞分布宽度标准差']=''

###血小板压积
g['血小板压积']=re.findall('血小板压积\n.*\n(.*)',content)[0]

###单核细胞百分比
g['单核细胞百分比']=re.findall('单核细胞百分比\n.*%(.*)',content)[0]

###单核细胞绝对值
g['单核细胞绝对值']=re.findall('单核细胞绝对值\n.*\n(.*)',content)[0]

###嗜酸性细胞百分比
g['嗜酸性细胞百分比']=re.findall('嗜酸性细胞百分比\n.*\n(.*)',content)[0]

###嗜酸性细胞绝对值
g['嗜酸性细胞绝对值']=re.findall('嗜酸性细胞绝对值\n.*\n(.*)',content)[0]

###嗜碱性细胞百分比
g['嗜碱性细胞百分比']=re.findall('嗜碱性细胞百分比\n.*%(.*)',content)[0]

###嗜碱性细胞绝对值
g['嗜碱性细胞绝对值']=re.findall('嗜碱性细胞绝对值\n.*\n(.*)',content)[0]


print(g)
print('\n')


###尿常规
h={}

###尿比重
h['尿比重']=re.findall('尿比重\n.*\n(.*)',content)[0]

###尿酸碱度
h['尿酸碱度']=re.findall('尿酸碱度\n.*\n(.*)',content)[0]

###尿白细胞
h['尿白细胞']=re.findall('尿白细胞\n.*\n(.*)',content)[0]

###尿亚硝酸盐
h['尿亚硝酸盐']=re.findall('尿亚硝酸盐\n.*\n(.*)',content)[0]

###尿蛋白质
h['尿蛋白质']=re.findall('尿蛋白质\n.*\n(.*)',content)[0]

###尿糖
h['尿糖']=re.findall('尿糖\n.*\n(.*)',content)[0]

###尿酮体
h['尿酮体']=re.findall('尿酮体\n.*\n(.*)',content)[0]

###尿胆原
h['尿胆原']=re.findall('尿胆原\n.*\n(.*)',content)[0]

###尿胆红素
h['尿胆红素']=re.findall('尿胆红素\n.*\n(.*)',content)[0]

###尿隐血
h['尿隐血']=re.findall('尿隐血\n.*\n(.*)',content)[0]

###尿抗坏血酸
h['尿抗坏血酸']=re.findall('尿抗坏血酸\n.*\n(.*)',content)[0]

###尿微量白蛋白定量
# h['尿微量白蛋白定量']=re.findall('尿微量白蛋白定量\n U-ALB\n(.*)',content)[0]
h['尿微量白蛋白定量']=''

###碳14-尿素呼气试验
# h['碳14-尿素呼气试验']=re.findall('碳14尿素呼气试验\n 14C-UBT (.*)',content)[0]
h['碳14-尿素呼气试验']=''

###便隐血
h['便隐血']=re.findall('便隐血\n(.*)',content)[0]

print(h)
print('\n')


###妇科
i={}

###白带清洁度
i['白带清洁度']=re.findall('白带清洁度\n(.*)',content)[0]

###念珠样菌
i['念珠样菌']=re.findall('念珠样菌\n(.*)',content)[0]

###滴虫
i['滴虫']=re.findall('滴虫\n(.*)',content)[0]

###宫颈TCT
i['宫颈TCT']=re.findall('宫颈TCT\n(.*)',content)[0]

print(i)
print('\n')

###实验室检查
j={}

###抗甲状腺过氧化物酶抗体
j['抗甲状腺过氧化物酶抗体']=re.findall('抗甲状腺过氧化物酶抗体\nAnti-TPO\n(.*)',content)[0]


###胃泌素17
j['胃泌素17']=re.findall('胃泌素.*\n(.*)',content)[0]

###丙氨酸氨基转移酶
j['丙氨酸氨基转移酶']=re.findall('丙氨酸氨基转移酶\nALT\n(.*)',content)[0]

###天门冬氨酸氨基转移酶
j['天门冬氨酸氨基转移酶']=re.findall('天门冬氨酸氨基转移酶\nAST\n(.*)',content)[0]

###γ-谷氨酰转移酶
j['γ-谷氨酰转移酶']=re.findall('Y-谷氨酰转移酶\nGGT\n(.*)',content)[0]

###碱性磷酸酶
j['碱性磷酸酶']=re.findall('碱性磷酸酶\nALP\n(.*)',content)[0]

###总胆汁酸
j['总胆汁酸']=re.findall('总胆汁酸\nTBA\n(.*)',content)[0]

###胆碱酯酶
j['胆碱酯酶']=re.findall('胆碱酯酶\nChE\n(.*)',content)[0]



###总胆红素
j['总胆红素']=re.findall('总胆红素\nTBIL\n(.*)',content)[0]

###直接胆红素
j['直接胆红素']=re.findall('直接胆红素\nDBIL(.*)',content)[0]

###间接胆红素
j['间接胆红素']=re.findall('间接胆红素\nIBIL\n(.*)',content)[0]

###总蛋白
j['总蛋白']=re.findall('总蛋白\nTP\n(.*)',content)[0]

###白蛋白
j['白蛋白']=re.findall('白蛋白\nALB\n(.*)',content)[0]

###球蛋白
j['球蛋白']=re.findall('球蛋白\nGLO\n(.*)',content)[0]

###白蛋白/球蛋白比值
j['白蛋白/球蛋白比值']=re.findall('白蛋白/球蛋白比值\nA/G\n(.*)',content)[0]

###尿素
j['尿素']=re.findall('尿素\nUREA\n(.*)',content)[0]

###肌酐
j['肌酐']=re.findall('肌酐\nCr\n(\d+\.*\d*)',content)[0]

###尿酸
j['尿酸']=re.findall('尿酸\nUA\n(.*)',content)[0]

###β2微球蛋白
j['β2微球蛋白']=re.findall('β2微球蛋白\nβ2-MG\n(.*)',content)[0]

###血清胱抑素C
j['血清胱抑素C']=re.findall('血清胱抑素C\n.*\n(.*)',content)[0]

###空腹血葡萄糖
j['空腹血葡萄糖']=re.findall('空腹血葡萄糖\nFBG\n(.*)',content)[0]

###糖化血红蛋白
j['糖化血红蛋白']=re.findall('糖化血红蛋白\nHBA1c\n(.*)',content)[0]

###胰岛素
j['胰岛素']=re.findall('胰岛素\nINS\n(.*)',content)[0]

###C肽
j['C肽']=re.findall('C.*肽\n.*\n(.*)',content)[0]

###总胆固醇
j['总胆固醇']=re.findall('总胆固醇\nTc\n(.*)',content)[0]

###甘油三酯
j['甘油三酯']=re.findall('甘油三酯\nTG\n(.*)',content)[0]

###高密度脂蛋白胆固醇
j['高密度脂蛋白胆固醇']=re.findall('高密度脂蛋白胆固醇\nHDL-C\n(.*)',content)[0]

###低密度脂蛋白胆固醇
j['低密度脂蛋白胆固醇']=re.findall('低密度脂蛋白胆固醇\nLDL-C\n(.*)',content)[0]

###载脂蛋白A1
j['载脂蛋白A1']=re.findall('载脂蛋白A1\n.*\n(.*)',content)[0]

###载脂蛋白B
j['载脂蛋白B']=re.findall('载脂蛋白B\nApo-B\n(.*)',content)[0]

###脂蛋白(a)
j['脂蛋白(a)']=re.findall('脂蛋白.*\n.*LP.*\n(.*)',content)[0]

###磷酸肌酸激酶
j['磷酸肌酸激酶']=re.findall('CK\n(.*)',content)[0]

###磷酸肌酸激酶同工酶
j['磷酸肌酸激酶同工酶']=re.findall('磷酸肌酸激酶同工酶\n.*\n(.*)',content)[0]



###乳酸脱氢酶
j['乳酸脱氢酶']=re.findall('乳酸脱氢酶\nLDH\n(.*)',content)[0]

###超敏C反应蛋白
j['超敏C反应蛋白']=re.findall('超敏C反应蛋白\nHS-CRP(.*)',content)[0]


###同型半胱氨酸
j['同型半胱氨酸']=re.findall('同型半胱氨酸\n(.*)',content)[0]


###全血粘度1
j['全血粘度1']=re.findall('全血粘度1\n(.*)',content)[0]


###全血粘度5
j['全血粘度5']=re.findall('全血粘度5\n(.*)',content)[0]


###全血粘度30
j['全血粘度30']=re.findall('全血粘度30\n(.*)',content)[0]


###全血粘度200
j['全血粘度200']=re.findall('全血粘度200\n(.*)',content)[0]




###血浆粘度
j['血浆粘度']=re.findall('血浆粘度\n(.*)',content)[0]


###血沉
j['血沉']=re.findall('血沉\n(.*)',content)[0]


###压积
j['压积']=re.findall('压积\n(.*)',content)[0]


###全血高切相对指数
j['全血高切相对指数']=re.findall('全血高切相对指数\n(.*)',content)[0]


###全血低切相对指数
j['全血低切相对指数']=re.findall('全血低切相对指数\n(.*)',content)[0]


###血沉方程K值
j['血沉方程K值']=re.findall('血沉方程K值\n(.*)',content)[0]


###红细胞聚集指数
j['红细胞聚集指数']=re.findall('红细胞聚集指数\nAgrbc\n(.*)',content)[0]


###全血低切还原粘度
j['全血低切还原粘度']=re.findall('全血低切还原粘度\n(.*)',content)[0]


###全血高切还原粘度
j['全血高切还原粘度']=re.findall('全血高切还原粘度\n(.*)',content)[0]


###红细胞刚性指数
j['红细胞刚性指数']=re.findall('红细胞刚性指数\n.*\n(.*)',content)[0]


###红细胞变形指数
j['红细胞变形指数']=re.findall('红细胞变形指数\n(.*)',content)[0]

###类风湿因子
j['类风湿因子']=re.findall('类风湿因子\nRF\n(.*)',content)[0]


###抗链球菌溶血素“0
j['抗链球菌溶血素“0']=re.findall('抗链球菌溶血素.*\n.*\n(.*)',content)[0]

###乳酸脱氢酶
j['乳酸脱氢酶']=re.findall('乳酸脱氢酶\nLDH\n(.*)',content)[0]

###HPV16型
j['HPV16型']=re.findall('HPV16型\n(.*)',content)[0]


###HPV18型
j['HPV18型']=re.findall('HPV18型\n(.*)',content)[0]


###HPV31型
j['HPV31型']=re.findall('HPV31型\n(.*)',content)[0]


###HPV33型
j['HPV33型']=re.findall('HPV33型\n(.*)',content)[0]


###HPV35型
j['HPV35型']=re.findall('HPV35型\n(.*)',content)[0]

###HPV39型
j['HPV39型']=re.findall('HPV39型\n(.*)',content)[0]

###HPV45型
j['HPV45型']=re.findall('HPV45型\n(.*)',content)[0]

###HPV51型
j['HPV51型']=re.findall('.*PV51型\n(.*)',content)[0]

###HPV52型
j['HPV52型']=re.findall('HPV52型\n(.*)',content)[0]

###HPV53型
j['HPV53型']=re.findall('HPV53型\n(.*)',content)[0]

###HPV56型
j['HPV56型']=re.findall('HPV56型\n(.*)',content)[0]

###HPV58型
j['HPV58型']=re.findall('HPV58型\n(.*)',content)[0]

###HPV59型
j['HPV59型']=re.findall('HPV59型\n(.*)',content)[0]

###HPV66型
j['HPV66型']=re.findall('HPV66型\n(.*)',content)[0]

###HPV68型
j['HPV68型']=re.findall('HPV68型\n(.*)',content)[0]

###HPV6型
j['HPV6型']=re.findall('HPV6型\n(.*)',content)[0]

###HPV11型
j['HPV11型']=re.findall('HPV11型\n(.*)',content)[0]

###HPV43型
j['HPV43型']=re.findall('HPV43型\n(.*)',content)[0]

###HPV42型
j['HPV42型']=re.findall('HPV42型\n(.*)',content)[0]

###HPV73型
j['HPV73型']=re.findall('HPV73型\n(.*)',content)[0]

###HPV81型
j['HPV81型']=re.findall('HPV81型\n(.*)',content)[0]

###HPV83型
j['HPV83型']=re.findall('HPV83型\n(.*)',content)[0]

###HPV82型
j['HPV82型']=re.findall('HPV82型\n(.*)',content)[0]

###EB病毒抗- VCAIgA
j['EB病毒抗- VCAIgA']=re.findall('EB病毒抗.*\n(.*)',content)[0]

###甲胎蛋白(T-12)
j['甲胎蛋白(T-12)']=re.findall('甲胎蛋白.*\nAFP\n(.*)',content)[0]

###癌胚抗原(T-12)
j['癌胚抗原(T-12)']=re.findall('癌胚抗原.*\nCEA\n(.*)',content)[0]


###细胞角蛋白19片段(T-12)
j['细胞角蛋白19片段(T-12)']=re.findall('细胞角蛋白19片段.*\nCYFRA21-1(.*)',content)[0]


###糖类抗原19-9(T-12)
j['糖类抗原19-9(T-12)']=re.findall('糖类抗原19-9.*\nCA19-9\n(.*)',content)[0]


###糖类抗原242(T-12)
j['糖类抗原242(T-12)']=re.findall('糖类抗原242.*\nCA242\n(.*)',content)[0]


###神经元特异性烯醇化酶(T-12)NSE
j['神经元特异性烯醇化酶(T-12)NSE']=re.findall('神经元特异性烯醇化酶\n.*\nNSE\n(.*)',content)[0]


###糖类抗原15-3(T-12)
j['糖类抗原15-3(T-12)']=re.findall('糖类抗原15-3.*\nCA15-3(.*)',content)[0]


###糖类抗原125(T-12)
j['糖类抗原125(T-12)']=re.findall('糖类抗原125.*\n.*\n(.*)',content)[0]


###PGl/PGIl(T-12)
j['PGl/PGIl(T-12)']=''


###胃蛋白酶原(T-12)
j['胃蛋白酶原(T-12)']=re.findall('胃蛋白酶原.*\n.*\nPG I\n(.*)',content)[0]


###胃蛋白酶原Ⅱ(T-12)
j['胃蛋白酶原Ⅱ(T-12)']=''


###人绒毛膜促性腺激素游离β亚基
j['人绒毛膜促性腺激素游离β亚基']=''


###乳酸脱氢酶
j['乳酸脱氢酶']=re.findall('乳酸脱氢酶\nLDH\n(.*)',content)[0]


###鳞状上皮细胞癌相关抗原(T-12)
j['鳞状上皮细胞癌相关抗原(T-12)']=re.findall('鳞状上皮细胞癌相关抗原.*\nSCC\n(.*)',content)[0]


###三碘甲状腺原氨酸
j['三碘甲状腺原氨酸']=re.findall('三碘甲状腺原氨酸\n(.*)',content)[0]


###游离三碘甲状原氨酸
j['游离三碘甲状原氨酸']=re.findall('游离三碘甲状原氨酸\n(.*)',content)[0]


###甲状腺素
j['甲状腺素']=re.findall('甲状腺素\nT4\n(.*)',content)[0]


###游离甲状腺素
j['游离甲状腺素']=re.findall('游离甲状腺素\nFT4\n(.*)',content)[0]

###促甲状腺激素
j['促甲状腺激素']=re.findall('促甲状腺激素\nTSH\n(.*)',content)[0]

###抗甲状腺球蛋白抗体
j['抗甲状腺球蛋白抗体']=re.findall('抗甲状腺球蛋白抗体\nTG-Ab\n(.*)',content)[0]


###孕酮
j['孕酮']=re.findall('孕酮\n(.*)',content)[0]


###雌二醇
j['雌二醇']=re.findall('雌二醇\n.*\n(.*)',content)[0]


###卵泡刺激素
j['卵泡刺激素']=re.findall('卵泡刺激素\n.*\n.*\n(.*)',content)[0]


###促黄体生成激素
j['促黄体生成激素']=re.findall('促黄体生成激素\n.*\n(.*)',content)[0]


###睾酮
j['睾酮']=re.findall('睾酮\n.*\n(.*)',content)[0]


###泌乳素
j['泌乳素']=re.findall('泌乳素\nPRL\n(.*)',content)[0]


###免疫球蛋白A
j['免疫球蛋白A']=re.findall('免疫球蛋白A\nIgA\n(.*)',content)[0]


###免疫球蛋白G
j['免疫球蛋白G']=re.findall('免疫球蛋白G\n.*\n(.*)',content)[0]


###免疫球蛋白M
j['免疫球蛋白M']=re.findall('免疫球蛋白M\n.*\n(.*)',content)[0]


###免疫球蛋白E
j['免疫球蛋白E']=re.findall('免疫球蛋白E\n(.*)',content)[0]


###补体C3
j['补体C3']=re.findall('补体C3\nC3\n(.*)',content)[0]


###补体C4
j['补体C4']=re.findall('补体C4\nC4\n(.*)',content)[0]


###血清Ⅲ型前胶原
j['血清Ⅲ型前胶原']=re.findall('血清.型前胶原\nPCII\n(.*)',content)[0]


###血清Ⅳ型胶原
j['血清Ⅳ型胶原']=re.findall('血清.型胶原\nCIV\n(.*)',content)[0]


###血清层粘连蛋白
j['血清层粘连蛋白']=re.findall('血清层粘连蛋白\nLN\n(.*)',content)[0]


###血清透明质酸
j['血清透明质酸']=re.findall('(.*)\n.*\n血清透明质酸',content)[0]


print(j)
print('\n')


###心电图室
k={}

###心电图
k['心电图']=''.join(list(re.findall('心电图\n(.*)',content)[0]))

print(k)
print('\n')

###超声室检查
l={}


###肝
l['肝']=re.findall('肝\n(.*?)\n胆',content,re.S)[0]

###胆
l['胆']=re.findall('胆\n(.*?)\n胰',content,re.S)[0]

###胰
l['胰']=re.findall('胆\n.*?(胰.*)\n胰',content,re.S)[0]

###脾
l['脾']=re.findall('脾\n(.*?)\n双肾',content,re.S)[0]

###双肾
l['双肾']=re.findall('双肾\n(.*?)\n子宫',content,re.S)[0]

###子宫
l['子宫']=re.findall('双肾\n.*?\n子宫\n(.*?)\n附件',content,re.S)[0]

###附件
l['附件']=re.findall('双肾\n.*?\n子宫\n.*?\n附件(.*?)\n爱康',content,re.S)[0]

###乳腺
l['乳腺']=re.findall('乳腺\n(.*?)\n甲状腺',content,re.S)[0]

###甲状腺
l['甲状腺']=''.join(list(re.findall('(甲状腺.*?)\n甲状腺\n(.*\n大淋巴结)',content)[0]))

###颈动脉
l['颈动脉']=''.join(list(re.findall('甲状腺\n.*\n大淋巴结.*\n(.*)\n.*\n(.*\n.*)',content)[0]))

###心脏
l['心脏']=re.findall('检查所见.*\n(1.*?)\n膀胱',content,re.S)[0]

###膀胱
l['膀胱']=re.findall('膀胱\n(.*)',content)[0]

print(l)
print('\n')


###CT
m={}

m['头颅']=''.join(list(re.findall('(.*)\n头颅.CT.\n(.*)\n(.*)',content)[0]))

m['胸部']=re.findall('胸部.CT.\n(.*?)初步意见',content,re.S)[0]


print(m)
print('\n')

###骨密度
n={}

n['骨密度']=re.findall('骨密度\n(.*)',content)[0]

print(n)
print('\n')

###动脉硬化检测室
o={}

o['动脉硬化检测']=re.findall('动脉硬化检测\n(.*)\n经颅多普勒检查室',content,re.S)[0]

o['经颅多普勒']=re.findall('经颅多普勒检查室.*?单位\n(.*?)\n初步意见',content,re.S)[0]

print(o)
print('\n')


###乙肝检测报告
p={}

p['乙型肝炎病毒表面抗原']=re.findall('乙型肝炎病毒表面抗原\n.*\n.*\n.*\n(.*)',content)[0]

p['乙型肝炎病毒表面抗体']=re.findall('乙型肝炎病毒表面抗体\n.*\n(.*)',content)[0]

p['乙型肝炎病毒e抗原']=re.findall('乙型肝炎病毒e抗原\n.*\n.*\n(.*)',content)[0]

p['乙型肝炎病毒e抗体']=re.findall('乙型肝炎病毒e抗体\n.*\n(.*)',content)[0]

p['乙型肝炎病毒核心抗体']=re.findall('乙型肝炎病毒核心抗体\n.*\n(.*)',content)[0]



print(p)
print('\n')


_list=['一般检查','内科','外科','妇科','眼科','耳鼻咽喉科','血常规','尿常规','妇科','实验室检查','心电图室','超声室检查','CT','骨密度','动脉硬化检测时','乙肝检测报告']

_list2=[a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p]

total={x:y for x,y in zip(_list,_list2)}

# print(total)

total_list=[]

for x in _list2:
	_list3=[]
	for key,value in x.items():
		_list3.append([key,value])
	total_list.append(_list3)




writer=pd.ExcelWriter("刘志霞爱康报告.xlsx")

for index,x in enumerate(total_list):
	data=np.array(x)
	df=pd.DataFrame(data)
	df.to_excel(writer, sheet_name=_list[index], header=False, index=False)

writer.save()

原网站

版权声明
本文为[Pert-]所创,转载请带上原文链接,感谢
https://blog.csdn.net/s_frozen/article/details/125374921