监督分类(收集5篇)
监督分类篇1
一、强化政府主导的旅游管理体制。
在欧洲许多国家,市场化管理高度成熟,基本上不存在政府、民间机构、企业之间的相互矛盾,但政府对市场的管理方式不尽相同。如德国与法国对旅游业的管理方式就不同,德国的旅游业不是很发达,因此也没有国家旅游局;而法国是全球最大的旅游目的地之一,因此法国有国家旅游局。故在旅游发达国家,政府的主导仍然是有效的。英国政府主导的公共服务,以《公共服务协议》形式提供服务,并进行量化管理,使旅游工作更加务实,目标清晰,标志着旅游业已进入一个较高层次,值得借鉴。
在我国目前的国情下,政府主导下的旅游业发展仍然是有效的,包括制定相关法规、制定行业标准以及实施和监督。
二、在行业内部建立监督检查体系。
许多国家在各级政府的旅游行政管理机构内单独设监督检查机构,有的虽未单设,但也赋予某些机构以监督检查职能。一些旅游发达国家的旅游协会、旅行社协会、旅游饭店协会等民间旅游组织,既担负着大量的旅游行业管理工作,又按照协会章程对旅游企业和从业人员实施监督检查工作。如埃及旅游部下设旅游监督署,负责监督检查旅游法规、旅游价格、旅游税收等政策的实施;英国旅行人协会,实际上不仅行使官方机构的权力,还对违章经营进行严格的监督,对违法者给予终止和取消会员资格的处罚。
三、建立官方或民间的类似于旅游警察的执法队伍。wWw.133229.CoM
安全的旅游环境是旅游得以发展的最根本前提和保障。每当重要节假日期间,国内一些景区、景点就会出现“秘密监督员”之类的执法人员,对旅游服务质量明察暗访。不过,由于“秘密监督员”没有处理权,要想迅速有效地化解旅游纠纷,还要有一支能够迅速解决投诉的队伍。由旅游部门统一组建一支旅游执法队伍,依法监督管理旅游市场,使之逐步完善是十分必要的。旅游执法队伍在接受游客投诉,及时有效处理旅游纠纷,维持旅游市场的正常秩序,以及发挥行政执法的监督管理职能等方面会起到实质的作用。在这方面,国内旅游界可以学习一些国家设立旅游警察的办法,为游客的正当合法权益提供保障,防范外界非安全因素对旅游业所造成的影响。世界上有不少国家和地区都已设立旅游警察。
阿根廷为争创旅游大国,联邦警察局于2002年11月成立了旅游警察分局。2008年6月,俄罗斯在圣彼得堡内务部成立了旅游警察分队。马来西亚于1998年在吉隆坡设立了旅游警察。埃及政府于1997年建立了旅游警察总局,并在主要游览区设有分局,编制属公安部,业务由公安部和旅游部双重领导。希腊早在1975年,为了保护游客的安全就开始实施旅游警察制度。肯尼亚政府为保护游客的人身安全,在2003年6月组建了旅游警察部队,隶属于肯尼亚旅游部。泰国于1976年建立了旅游巡察小组,1983年正式划归国际警察总署管辖。意大利威尼斯设立有“威尼斯及其历史公民和生态环境价值保护委员会”,下辖“风纪纠察队”,专门针对“没有教养、肮脏及衣冠不整的旅客,使他们严格遵守市容规定”。马尼拉香港人质劫持事件发生后,菲律宾的旅游环境安全问题成为全球瞩目的焦点。2010年10月底,菲律宾首批旅游警察在各主要旅游景点正式投入工作,履行保护游客人身安全、预防各类犯罪活动的职责。设立旅游警察并不是说当地有危险,相反,旅游警察的存在可以让游客意识到自己随时处在保护中,是对游客的友善和礼遇,也是旅游法制健全的表现。
四、将旅游行政管理部门及其公务员纳入行政监督系统之内。
监督分类篇2
[关键词]公共场所;卫生监督;分级量化;档案管理;利用
[中图分类号]R197.32[文章标识码]A[文章编号]
卫生部明确规定,各地公共场所量化分级管理制度要分步实施,稳步推进。2009年各地要重点在住宿业推行量化分级管理制度。至2009年12月底,各省会城市要对辖区内不少于50%的住宿业,其他城市要对辖区内不少于40%的住宿业实施量化分级管理。
1公共场所量化分级档案管理的重要性
公共场所卫生监督的分级量化档案同人事、财务、病历、其他卫生监督档案一样至关重要,同时也是档案管理工作的重要组成部分。卫生部明确规定公共场所量化分级管理工作的目标及实施方案,建立健全其档案是顺利开展此项工作不可缺少的一环,卫生监督机构管理好、利用好这一资料,有助于实现对公共场所卫生监督的动态监管、合理分配监督资源提供第一手资料。
2公共场所分级量化档案管理
2.1公共场所分级量化档案管理主要的内容
公共场所分级量化档案,按照公共场所行业经营范围不同的特点分类,如住宿业、美容美发业、洗浴业、文化娱乐业等,每类应按公共场所卫生信誉度等级分为A、B、C、D四级,每级内应一户一档,具体保存每户的基本信息、卫生许可证信息、经营范围、经营场所、经营者类型、卫生监督量化分级评分表、卫生监督意见书、公共用品用具检测报告单、卫生监测评价报告等内容。
2.2公共场所分级量化档案的收集
《公共场所卫生监督量化分级管理指南》规定,公共场所量化分级制度适用于已获得卫生许可证的公共场所的日常卫生监督检查。对新申办公共场所卫生许可证的经营单位,在对其核发公共场所卫生许可证时根据量化评分结果评定的卫生信誉度等级归档。对已经获得公共场所卫生许可证的经营单位,在规定时间内完成卫生信誉度等级评定后按类别等级归案。公共场所卫生信誉等级发生变化后将原有档案撤除,按新评定等级分类归档。并随时将各类场所监督、监测信息、现场监督笔录、卫生监督意见书、收集、填充到相对应的公共场所业户管理档案中。
3公共场所分级量化档案的利用
档案工作是一项卫生监督的信息工程,档案的收集整理开发最终的目的都是为了利用。公共场所分级量化管理的档案资料是对这一场所比较真实客观的记录,通过查阅公共场所分级量化管理的档案资料,可以及时高效地查询到每户公共场所的基本情况,对加强公共场所卫生监督管理、建立长效监管机制,解决了信息支撑和技术保障,为实施公共场所动态管理提供了有效的科学手段,推动了公共场所卫生监管工作朝着信息化管理的方向迈进。另外,一系列完整、准确、系统和客观及时的档案资料无疑将会为监管提供便利的条件,更好地创造其经济效益和社会效益。
监督分类篇3
关键词:遥感图像;图像分类;meanshift;锚点
中图分类号:TN957.52?34;TP79文献标识码:A文章编号:1004?373X(2016)22?0092?0
0引言
遥感图像具有较高的光谱分辨率,在航天、地质勘探、农业等领域获得了越来越多的应用,遥感图像分类在遥感图像应用中具有重要的作用。但对遥感图像分类也面临以下难题:其一是如果采用传统的非监督方法对遥感图像直接分类,因遥感图像的复杂性和特殊性,很难获得比较满意的结果;其二采用监督方法,需要运用大量的训练样本才能获取较好的分类结果,而标记样本的获取代价高昂,也容易出现分类器过拟合与训练样本的问题。
半监督学习[1]可以很好地解决上述问题,首先大量的廉价的无标记样本也包含样本特征信息,其次遥感图像中标记样本的获取十分昂贵。半监督学习可以利用少量的已标记样本,结合大量的无标记样本建立分类器完成学习任务。基于图的半监督图像分类在近年来图像研究领域成为了一个研究热点,此方法结合图理论,能够充分利用图像中的无标记样本信息,分类性能较好,且目标函数优化简单,因此更加高效,目前也有许多基于图的半监督分类方法[2?6]。
基于图的半监督图像分类方法是建立在图理论的基础上,但算法计算速度依赖于所构建图的规模大小,当数据规模过大时,如果还是每一个图节点代表一个样本点,图规模就会很庞大,计算的时间复杂度会很高,例如线性近邻传递算法(LinearNeighborhoodPropagation)、局部与全局一致性算法(LocalandGlobalConsistency),其计算复杂度为[O(n3)],[n]为样本个数。为了降低算法的复杂度,Blum和Chawla提出了图的最小割(Mincut)算法,并将其时间复杂度降低到了[O(cn2)],这里[c]为类别数。但最小割算法可能存在多个解,得到不同的分类结果。
2010年Liu等提出基于锚点建图的半监督分类方法[7](AnchorGraphRegularization,AGR)。首先采用K?means算法对数据聚类,将聚类中心作为锚点得到锚点集,其次利用锚点与已标记样本建图,缩小了图规模,时间复杂度降为[Om2n,m?n],[n]为样本总数,[m]为聚类个数。但K?means聚类算法消耗时间过长,且遥感图像混合像元问题使部分像元很难进行非此即彼的划分,部分区域地物类别边界是过渡性的,没有明显边界划分,因此K?means不适宜对遥感图像聚类。针对上述问题,本文采用meanshift聚类算法代替K?means算法对遥感图像聚类,缩短了聚类时间,meanshift算法对噪声也有一定的鲁棒性,可以解决噪声点带来的干扰,提高聚类的有效性。其次在每个聚类中随机选取一个点作为锚点,得到锚点集,并与标记样本集建立图。该方法不仅降低了算法复杂度,可以处理大规模图像分类问题,同时在遥感图像分类中具有较好的分类结果。
1AGR图像分类方法
设样本数据集为[x=xini=l?Rd],共有[n]个样本,[l]个是已标记样本,剩余的为未标记样本。为了解决大规模数据问题,将标记预测函数定义为一个对锚点的加权平均函数,当得到锚点的类别信息后,就可以通过映射关系得到与锚点密切相关的无标记样本的类别信息。将锚点加权平均函数表示为:[UA=ukmk=1?Rd],其中[uk]代表锚点,标记预测函数为:
[f(xi)=k=1mZikf(uk)](1)
在这里定义两个向量[f=[f(x1),f(x2),…,f(xn)]T]和[a=[f(u1),f(u2),…,f(um)]T];[a]为锚点的软标签预测矩阵;[m]为锚点个数。式(1)可以写成:
[f=Za,Z∈Rn×m,m?n](2)
其中Z是一个权值矩阵,表示了锚点与所有样本点的线性关系:
[Zik=Kh(xi,uk)k'∈Kh(xi,uk'),?k∈](3)
这里使用的是高斯核函数[Kh(xi,uk)=][exp-xi-uk22h2]。[?[1:m]]是一个保存[xi]的[s]个最近邻锚点的索引,为了提高计算效率,规定每一个样本[xi]只与[s]个[Zik]中值最大的锚点具有连接关系,其他连接均为0。
由Z矩阵可以得到邻接矩阵:
[W=ZΛ-1ZT](4)
式中,[Λ∈Rm×m]是一个对角矩阵:
[Λkk=i=1nZik](5)
由[s]的取值可以知道,所有的样本点都只与部分近邻锚点存在连接关系,所以矩阵W是稀疏的。Zhu提出稀疏图对算法的性能的影响优于全连通图[1]。因为全连通图中,每个样本的邻接信息中含有大量重复的、干扰的信息,而稀疏图在连接不同样本时含有较少的错误信息,对算法结果有正确的指导。由式(4)定义的邻接矩阵所构造的图就是AnchorGraph。最后AnchorGraph的图拉普拉斯矩阵为:
[L=D-W=I-ZΛ-1ZT](6)
式中:D为对角线矩阵,[Dii=j=1nWij]。
2本文方法流程
假设已标记样本[xi(i=1,2,…,l)],其标记信息为[yi∈{1,2,…,c}],[c]为类别个数。用[Y=[y1,y2,…,yc]∈Rl×c]表示已标记样本的标记信息,如果[yi=j],[Yij=1],否则[Yij=0]。用meanshift聚类算法对遥感图像进行聚类,得到各个类别的聚类中心,把每个聚类中心作为一个锚点,得到AGR方法中的锚点集合。此时就需要求得锚点的标签预测矩阵[A=[a1,a2,…,ac]∈Rm×c]。选择被广泛应用的图拉普拉斯正则化项[ΩG(f)=12fTLf],可得到半监督学习框架:
[minA=[a1,a2,…,ac]Γ(A)=12j=1cZlaj-yj2+γj=1cΩG(Zaj)=12ZlA-Y2F+γ2tr(ATZTLZA)](7)
式中:[Zl∈Rl×m]是[Z]矩阵的子矩阵,只包含标记样本;[・F]是Frobenius范数;取[γ>0],为正则化参数。那么缩小后的拉普拉斯矩阵为:
[L=ZTLZ=ZT(I-ZΛ-1ZT)Z=ZTZ-(ZTZ)Λ-1(ZTZ)](8)
缩小后的拉普拉斯矩阵存储空间更小,易于计算,空间复杂度为[O(m2)],时间复杂度为[O(m3+m2n)]。这时,目标函数[Γ(A)]进一步简化为:
[Γ(A)=12ZlA-Y2F+γ2tr(ATLA)](9)
最后,就可以得到全局最优解:
[A*=(ZTlZl+γL)-1ZTlY](10)
得到了锚点的标记信息,那么未标记样本的标记信息就可以通过下式得到:
[yi=argmaxj∈{1,2,…,c}Ziajλj,i=l+1,l+2,…,l+n](11)
式中:[Zi∈Rl×m]表示Z矩阵的第i行。[λj=ITZaj]表示归一化因子,作用是平衡倾斜的类分布。
具体的算法步骤如下:
输入:已标记样本[xi(i=1,2,…,l)],标记信息[yi∈{1,2,…,c}]
输出:图像分类结果
(1)用meanshift算法对遥感图像进行聚类,得到m个类,从每一个聚类中选取一个点作为锚点;
(2)选择合适的[γ];近邻锚点个数s取3;
(3)计算Z矩阵,根据式(4)计算邻接矩阵W;
(4)根据式(6)计算图拉普拉斯矩阵L;
(5)根据式(10)计算锚点标签预测矩阵[A*];
(6)根据式(11)计算未标记样本的标记。
3算法复杂度分析
基于图的半监督分类方法,大多数方法中是每个样本作为一个图节点建立图,所以计算复杂度为[O(n3)],其中[n]是样本个数。本文方法中,meanshift的计算复杂度是[O(dn2t)],其中[d]是数据的空间维度,[t]是迭代次数;基于锚点的算法的计算复杂度[7]是[O(m2n)],所以本文方法的计算复杂度是[O(dn2t)]+[O(m2n)],且m是聚类后得到的聚类中心个数,[m?n],所以本文方法的计算复杂度是远小于原始基于图的半监督分类方法的计算复杂度[O(n3)]。
4实验结果与分析
本文在MatlabR2012a下计算机内存为2GB,CPU为IntelCorei3,频率为2.53GHz的机器上运行实验。实验采用的遥感图像是IKONOS卫星图像,IKONOS卫星图像包含一个全色波段,分辨率为1m,四个多光谱波段,分辨率为4m。图像大小为400×400,实验中对四个多光谱波段构成的遥感图像进行分类,3个RGB多光谱波段构成的真彩色图像如图1所示。根据实验区的特点,具体样本分类类别如表1所示。
图1中最左侧两片颜色灰白的区域是水泥建筑场地,右上侧灌木林中间的一个蓝色区域是一个房屋,这两片区域在本文实验中都归为“公路居民区”类别。因此本次实验样本类别个数为:“农田”像元点数32433,“荒裸地”像元点数41825,“植被”像元点数67978,“公路居民区”像元点数17764。
原文方法采用K?means聚类算法,不适应对遥感图像聚类,所以本文对遥感图像的分类结果并未与原文方法进行对比,而与遥感图像处理平台ENVI自带的监督支持向量机(SVM)方法进行对比。
本文实验SVM方法参数取值:核类型(KernelType)选择Polynomial,核心多项式的次数取4,ClassificationProbabilityThreshold取0,其他参数采用默认值。
本文实验中标记样本均为人工选取,实验分四次,四次实验中每类标记样本个数分别为5,20,50,100,每一次实验中所有实验方法均采用相同的标记样本,且每次实验都在上次已有标记样本的基础上添加新的标记样本。本文对实验结果的评价采用了Kappa系数和像元分类正确率(PixelClassificationRate,PCR):
[PCR=正确分类像元数图像总像元数](12)
图2和图3分别为每类标记样本为50和100时,本文方法和监督SVM方法的实验结果。遥感图像中样本分为四类,红色代表“荒裸地”的样本点,绿色代表“植被”的样本点,蓝色代表“农田”的样本点,黄色代表“公路居民区”的样本点。对比图2和图3,可以发现,本文方法优于监督SVM方法,图4中区域标号图像为1的区域是农田和没有农作物荒裸地区域,没有灌木植被,本文方法明确地分为农田和荒裸地两类,而SVM方法中将一部分样本错分为植被;在标号为2的区域与右上角的空白区域一样均为裸地,本文方法分类效果很好,而SVM方法分类效果显然较差,部分样本错分为农田类别;标号为3的区域中,有一排灌木植被在农田中间,即右侧的很少一部分还属于农田,可以看到还有农作物存在,SVM方法中将此少部分农田错分为裸地,本文方法大部分样本分类正确;在标号4的区域,可以看到是农田和裸地的分界处,而可以明显看到此处属于农田,只不过左侧部分不存在农作物,所以归为裸地类别,在SVM方法分类结果中许多样本点被错分为植被,而本文方法只有极少量样本分错,这是因为半监督学习的流形假设,处于很小局部区域内的样本可能具有相似的标记,此处的样本明显与邻近的农田相似性更大。
对遥感图像的分类精度的评价指标是以分类结果的混淆矩阵为基础,总体分类精度和Kappa系数都要通过混淆矩阵计算得到,而为了更直观地评价两种方法的分类效果和优缺点,本文列出了每类标记样本数为100的分类结果的混淆矩阵:两种方法在每类标记样本为100时的分类结果见表2和表3。
混淆矩阵中每行的总和为每一类样本的真实样本数,每一列的总和为分类结果中每一类的总样本数,括号内的值为混淆矩阵对角线的和,即分类正确的样本总数。漏分误差即每类真实样本中没有被正确识别出来的样本比例;错分误差为分类结果中其他类别样本被错分为此类的样本占总和的比例。
通过混淆矩阵的数字可以直观地看到,本文方法的每一类样本的错分误差都小于SVM方法的错分误差;本文方法对“植被”类别的分类正确率不如SVM方法的分类结果,但本文方法对细节处的分类效果更优于SVM方法,例如在图4中右侧的灌木林,本文方法的分类结果中,琐碎的极少量的裸地都被分出来;“荒裸地”和“农田”类别的样本分类正确率都明显优于SVM方法;而“公路居民”类别正确率低于SVM方法,由混淆矩阵可以看到是错分为“荒裸地”的样本较多,这是因为图4中最左侧的居民区建筑因为曝光太强,错分为“荒裸地”;“公路居民区”类别和“农田”类别样本差别明显,本文方法把“公路居民区”错分为“农田”的样本数为零,而SVM方法的错分数是9,本文方法对类别“公路居民区”和“农田”之间的区分更优;本文方法总体精度和Kappa系数也明显高于监督SVM的。具体的分类结果统计如表4所示。
从表4可以看出,本文方法分类结果明显优于监督SVM方法,而监督SVM方法是ENVI软件的监督分类方法中效果最优的方法[8],且监督SVM方法在小样本时具有良好的分类效果。但半监督的学习方法,结合无标记样本,优于监督学习方法,提高了分类性能。如标记样本数较少,为5和20时,无标记样本作用明显,分类精度和Kappa系数提高较大。通过观察图像和实验发现,本此实验的遥感图像中样本比较复杂,地物交错比较严重,边界过度不明显,不同于城市居民区边界清晰,这就给分类增加了难度,这也是分类精度不是很高的原因之一。实验结果验证了本文方法在遥感图像分类中的有效性,相比监督SVM方法获得了更好的分类效果。
本文方法在图像聚类选取锚点时采用meanshift聚类算法,聚类样本数160000,平均用时9.4s。原文[9]方法采用K?means聚类算法选取锚点,文中给出了两次实验结果中的聚类时间,7291个样本聚类时间是7.65s;630000个样本聚类时间是195.16s。因此meanshift聚类算法相比K?means算法缩短了聚类时间。
5结语
基于图的半监督图像分类方法通常因为数据规模大而导致内存空间不足和分类时间过长,而遥感图像通常规模较大且地物复杂、信息量大,所以影响了其在遥感图像分类中的应用。本文首先采用meanshift算法对遥感图像聚类得到锚点集,利用锚点集和标记样本集建图,缩小了图规模,降低了计算复杂度,其次通过分类方法得到锚点的类别信息,最后映射还原到整个样本集,得到遥感图像分类结果。AGR方法解决了大规模图像分类,本文采用meanshift算法缩短了锚点选取时间。实验结果表明,本文方法在遥感图像分类中获得了较好的分类结果,验证了其对遥感图像分类的有效性。
参考文献
[1]HUANGG,SONGS,GUPTAJ,etal.Asecondorderconeprogrammingapproachforsemi-supervisedlearning[J].Patternrecognition,2013,46(12):3548-3558.
[2]XIEW,LUZ,PENGY,etal.Graph?basedmultimodalsemi?supervisedimageclassification[J].Neurocomputing,2014,138:167?179.
[3]BLUMA,CHAWLAS.Learningfromlabeledandunlabeleddatausinggraphmincuts[C]//Proceedingsof2001InternationalConferenceonMachineLearning.SanFrancisco:ACM,2001:19?26.
[4]WANGF,ZHANGC.Labelpropagationthroughlinearneighborhoods[J].IEEEtransactionsonknowledgeanddataengineering,2008,20(1):55?67.
[5]ZHOUD,BOUSQUETO,LALTN,etal.Learningwithlocalandglobalconsistency[J].Advancesinneuralinformationprocessingsystems,2004,16(4):321?328.
[6]ZHUXJ,GHAHARMANIZ,LAFFERTYJ.Semi?supervisedlearningusingGaussianfieldsandharmonicfunctions[C]//Proceedingsof20thInternationalConferenceonMachineLearning.MenloPark:AAAI,2003:912?919.
[7]LIUW,HEJ,CHANGSF.Largegraphconstructionforscalablesemi?supervisedlearning[C]//Proceedingsofthe27thInternationalConferenceonMachineLearning.Haifa:ACM,2010:679?686.
[8]闫琰,董秀兰,李燕.基于ENVI的遥感图像监督分类方法比较研究[J].北京测绘,2011(3):14?16.
[9]YUG,ZHANGG,DOMENICONIC,etal.Semi?supervisedclassificationbasedonrandomsubspacedimensionalityreduction[J].Patternrecognition,2012,45(3):1119?1135.
[10]CHENGY.Meanshift,modeseeking,andclustering[J].IEEEtransactionsonpatternanalysisandmachineintelligence,1995,17(8):790?799.
监督分类篇4
关键词:岭澳二期工程;制造质量监督;趋势分析;偏差分析
1前言
岭澳核电站二期工程(以下简称:岭澳二期工程)是中广核集团继大亚湾核电站和岭澳一期核电站成功建设和运营后,按照国务院“以核养核、滚动发展”的方针,在广东地区建设的第三座大型商用核电站。也是我国“十五”期间唯一开工的核电项目,是国家核电自主化的依托项目。项目采用中广核集团具有自主品牌的中国改进型压水堆核电技术路线CPR1000,建设两台百万千瓦级压水堆核电机组,总装机容量216万千瓦,主体工程于2005年12月15日开工,一号机组于2010年9月20日正式商业运行,二号机组预计2011年5月建成投入商业运行。按照国家提出的“自主设计、自主制造、自主建设、自主运行”目标,岭澳二期工程管理由中广核工程有限公司总承包,工程设计、设备采购、质量监督、工程施工、系统调试与技术服务等均由国内企业为主承担。
在岭澳二期工程设备制造过程中,质量监督工作对确保设备制造质量起到至关重要的作用。通过对岭澳二期工程设备制造过程中出现的各种质量问题进行分类、统计形成质量趋势分析报告,该报告按项目每季度一次,为设备制造过程中各层次的质量管理工作提供经验反馈和决策依据。岭澳二期工程设备制造质量趋势分析工作从2005年第二季度开始,每季度编制一次,至2010年第一季度结束,前后共编制20期。在这20期质量趋势分析报告的基础上,结合整个岭澳二期工程设备制造质量监督工作相关各类报告的汇总、统计和分析,探讨设备制造质量趋势分析工作对岭澳二期工程及后续核电工程设备制造质量监督工作的指导意义。
2设备制造质量趋势分析体系
在岭澳二期工程设备制造质量监督过程中,针对发现的各种质量问题,监督员编写不满意的监督行动报告向总部汇报,同时向供应商观察意见单要求其对较为重要的质量问题采取整改措施,制造厂不符合项报告来正式处理违反了合同及其技术附件要求的质量问题。
核电站设备种类繁多,数量庞大,可按核级、非核级来划分设备类型,也可按专用设备、整理设备来划分。为体现核电站设备特点,在设备制造质量趋势分析过程中,结合核安全性和可用性来划分,将核电站的各类设备划分为核岛主设备、常规岛主设备和BOP设备(核电站其他设备):
核岛主设备,主要包括反应堆压力容器、蒸汽发生器、稳压器、安注箱、硼注箱、堆内构件、控制棒驱动机构、主泵、主管道等重要的核级设备;
常规岛主设备,主要包括汽轮机、发电机、励磁机、汽水分离再热器、除氧器、高加、低加、常规岛主给水泵等重要的非核级设备;
BOP设备,包括环吊、板式热交换器、管道、阀门、泵、小型起吊设备、电气仪控类设备等核电站其他核级、非核级设备。
首先,从宏观上分析核岛主设备、常规岛主设备和BOP设备每季度监督行动报告不满意率、观察意见单发生数及不符合项报告的发生数。然后,针对核岛主设备、常规岛主设备和BOP设备产生的不符合项报告,按“人”、“机”、“料”、“法”、“环”和“测”六大要素划分的偏差来进行统计和分析。
对设备制造过程中反馈的质量问题以偏差的形式进行划分,根据导致质量问题的具体原因,结合“人”、“机”、“料”、“法”、“环”相关要素,划分为六大类偏差,每大类可再细化为若干小类:
“人”类偏差,包括项目管理问题、供应商内部QC不力、人员资质和操作失误;
“法”类偏差,包括工艺过程中出现的问题和文件包括设计文件、图纸、程序及报告缺陷;
“机”类偏差,包括机具问题等;
“料”类偏差,材料化学成分、组织、性能、尺寸、外观等不满足技术要求;
“环”类偏差,主要是环境条件影响,由于外界条件不适宜造成设备质量不确定,如焊接时穿堂风、雨水、焊材贮存条件不当、探伤条件不具备等;
“测”类偏差,包括检验器具问题等。
3监督行动报告及其不满意率
在岭澳二期设备制造质量监督过程中,累计编制监督行动报告26061份,其中不满意的监督行动报告为551,总体不满意率为2.1%。每季度通过统计核岛主设备、常规岛主设备和BOP设备产生的监督行动报告的季度不满意率和总体不满意率来反应设备制造质量监督的总体状况,其中季度统计曲线以每季度三个月的数据为计算基准,体现当季度的监督不满意程度;趋势统计曲线以截止本期报告的所有数据为计算基准,体现对整个设备制造质量监督的不满意程度。
在岭澳二期核岛主设备制造质量监督过程中产生了监督行动报告14704份,其中不满意的监督行动报告数为217份,总体不满意率为1.5%,其监督行动报告不满意率趋势图见图1。
在岭澳二期常规岛主设备制造质量监督过程中产生了监督行动报告3543份,不满意的监督行动报告76份,总体不满意率为2.1%,其监督行动报告不满意率趋势图见图2。
在岭澳二期BOP设备制造质量监督过程中产生了监督行动报告7814份,不满意的监督行动报告258份,总体不满意率为3.3%,其监督行动报告不满意率趋势图见图3。
通过对比和分析岭澳二期工程核岛主设备、常规岛主设备和BOP设备监督行动报告的季度不满意率和总体不满意率,在设备制造初期的一年内(四个季度),监督行动报告的季度不满意率和总体不满意率都在高位运行,并由高向底逐步回落,从第五个季度开始,季度不满意率和总体不满意率区域平稳,并保持在一定水平,核岛主设备总体不满意率维持在1.4%~1.6%、常规岛主设备总体不满意率维持在2.1%~2.2%,BOP设备总体不满意率维持在3.3%~3.5%,其主要原因有以下两点:
在设备制造初期,供应商存在的各种问题逐步暴露,监督员的不满意的监督行动报告相对较多;在工程公司的管理和要求下,问题一一解决,到设备制造中后期,供应商设备制造质量管理体系逐步提高和完善,出现的质量问题相对固定,主要是工艺过程中出现的问题;
在核电站设备中,核岛主设备决定了核电站的核安全性和可用性,工程公司和制造厂投入的资源最大,出现的问题相关最少,总体不满意率最低;常规岛主设备决定了核电站的可用性,工程公司和制造厂投入的资源相对较大,其总体不满意率居中;BOP设备与核电站的核安全性和可用性相关,但不起决定性作用,工程公司和制造厂投入资源相对较少,其总体不满意率最高。
4设备制造观察意见单
在岭澳二期设备制造质量监督过程中,累计产生观察意见单322份。
通过对比和分析岭澳二期工程核岛主设备、常规岛主设备和BOP设备观察意见单数量的按季度分布图,主体工程开工后第一年为核岛主设备观察意见单为第一次集中发生期,第三年为核岛主设备观察意见单为第二次集中发生期、常规岛主设备和BOP设备观察意见单为的集中发生期。主要与设备制造高峰期相关:
核岛主设备锻件等原材料的制造活动从2004年开始,先于主体工程开工日期,从2005年第二季度就开始产生观察意见单;到2009年第二季度,核岛主设备基本都已发货,不再发生观察意见单;从2006年至2008年,即主体工程开工后三年内为其制造高峰期,也是核岛主设备观察意见单集中发生时期;
常规岛主设备制造期间产生的观察意见单数量相对较少,从2007年至2009年,及主体工程开工后第二至第四年为其制造高峰期,也是常规岛主设备观察意见单集中发生时期;
BOP设备观察意见单主要发生在2008年,即主体工程开工后第三年为其制造高峰期。
5设备制造不符合项
5.1设备制造类外部不符合项数趋势分布
在岭澳二期设备制造质量监督过程中,共产生制造类外部不符合项866个。
核岛主设备制造类外部不符合项293个,其趋势分布详见图7。
通过对比和分析岭澳二期工程核岛主设备、常规岛主设备和BOP设备制造外部不符合项数量的按季度分布图,2008年至2009年,即主体工程开工后第三年为外部不符合项集中发生期,与观察意见单集中发生期基本吻合,这至少体现了以下两点:
主体工程开工后第三年至第四年为岭澳二期工程设备制造的高峰期,外部不符合项的数量与设备制造活动的数量成正比,这就要求质量监督部门在设备制造高峰期投入更多人力,每个质量监督人员也应投入更多精力,及时发现设备制造质量问题;
质量监督人员在实施设备制造质量监督过程中及时发现问题,以观察意见单等形式要求供应商开出外部不符合项来处理质量问题,体现了质量监督人员的价值和设备制造质量监督活动的重要性。
5.2设备制造类外部不符合项偏差分析
设备制造外部不符合项用于处理违反合同及其技术附件要求的质量问题,每一个外部不符合项的产生都可以归结为与“人”、“机”、“料”、“法”、“环”六元要素相关的偏差;而且引起每个不符合项的原因可能是一元要素,也可能是多元要素;这里主要抓住其中最关键的一元要素来统计和分析,具体偏差情况的统计表详见表1。
在导致设备制造外部不符合项产生的各大要素中,“法”类偏差占据近四分之三,“人”类偏差占据近四分之一,“机”类偏差、“料”类偏差和“测”类偏差合计不到百分之三,而“环”类偏差没有发生。
“法”类偏差和“人”类偏差是导致设备制造外部不符合项产生的主要要素,这是设备制造质量监督工作关注和分析的重点,结合对这两类偏差的定义,进一步细分这两项偏差,详细统计见表2。
在“法”类偏差中主要是“工艺过程中出现的问题”,在“人”类偏差中主要是“操作失误”,这两类偏差占据了总偏差的百分之九十一。“工艺过程中出现的问题”主要是工艺过程控制不严或工艺方法不合理造成的,需加强对工艺实施过程的控制和改进工艺方法。“操作失误”主要是操作人员责任心不强造成的,需要通过培训和教育等方式提高其责任心。
6总结
通过岭澳二期工程核岛主设备、常规岛主设备和BOP设备监督行动报告的不满意率、观察意见单数和外部不符合项数按季度分布的宏观分析,以及外部不符合项相关偏差的统计与分析结果,体现了质量监督人员的价值和设备制造质量监督活动的重要性:
在设备制造初期,监督员的不满意的监督行动报告相对较多,供应商存在的各种问题逐步暴露;在工程公司的管理和要求下,问题一一得到解决,到设备制造中后期,供应商设备制造质量管理体系逐步提高和完善;
主体工程开工后第三年至第四年为岭澳二期工程设备制造的高峰期,也是设备制造观察意见单和外部不符合项发生的高峰期,这就要求质量监督部门在设备制造高峰期投入更多人力,每个质量监督人员也应投入更多精力,及时发现设备制造质量问题,供应商/制造厂及时采取有效措施处理这些质量问题;
设备制造外部不符合项产生的原因主要是“法”类偏差和“人”类偏差,集中体现在“工艺过程中出现的问题”和“操作失误”,需加强对工艺实施过程的控制和改进工艺方法,并通过培训和教育等方式提高操作人员的责任心和质量意识。
随着核电事业大发展,核电站核岛主设备和常规岛主设备的供应商/制造厂逐步增加并趋于稳定,通过开展对这些供应商的定期质量趋势分析和总结工作,帮助供应商找出产生质量问题的根源所在,并结合供应商各自的特点采取有效的整改措施,从而促进核电站设备供应链的长足发展和设备国产化能力的逐步提升。
参考文献:
[1]朱成虎,段旭珍.国产化设备制造QC监督管理与实施[A].岭澳核电工程实践与创新-设计自主化与设备监造卷[C].北京:原子能出版社,2003.
监督分类篇5
关键词:支持向量机;信息熵;半监督学习;去噪;欧氏距离
中图分类号TP181文献标识码:A文章编号:1009-3044(2013)25-5705-03
随着互联网的发展,网络上的数据呈几何指数增长,而这些数据大部分是未标记的。已标记数据非常有限,如网络上存在的新闻报道,面对海量的新闻种类,获取有标记样本十分困难,未标记数据不能为学习算法提供有效帮助。其他如图像处理,文本分类,语音识别等领域,也存在这样的情况。
监督学习利用一组足够多的已标记的样本来发现属性和类别之间的联系,使其可以达到理想的关联模式,并用这些模式来观测未知数据的类别属性,但是大量的有标记样本是非常难获得的。无监督学习事先没有明确的关联模式,而是通过某种算法发现数据中存在的内在结构,典型的算法有聚类。半监督[1]学习是一种新的学习问题,结合了监督学习和无监督学习优点,适合已标记样本小,具有大量未标记样本的分类问题,它讨论如何将庞大的未标记样本和少量的已标记样本结合起来从而提高学习器的泛化能力[2]。
现有的分类算法主要有支持向量机[3]、决策树[4]、贝叶斯[5]、最近邻[6]、神经网络[7]和基于关联规则[8]的分类等。支持向量机是Vapnik提出的一种新学习方法,根据结构风险最小化原则,以最大化分类间隔构造最优分类超平面,非常好的解决了数据中存在的非线性、高维性、局部极小点等问题。
分类后样本可能含有噪声数据,把这些数据加入有标识样本重新训练,一是会加大训练时间,二是噪声样本会影响分类精度,在半监督分类模式下,循环加入有噪声样本会加剧降低预测准确率。
本文采用半监督支持向量机算法来训练分类器,在已标记样本少的情况下,用大量的未标记样本提高分类器性能,并对分类后的数据提出了加权去噪的方法,建立了最优分类器。
1支持向量机的构建
支持向量机通过确定最优分类面实现数据分类,可分别对线性和非线性数据进行分类,对于非线性的数据,需要通过核函数把数据映射到高维空间,让数据在高维空间线性可分,从而实现对数据进行类别预测,实现分类。
以两个类别的训练样本数据为例,设给定的样本数据集D为[(X1,Y1),(X2,Y2),…,(XD,YD)],其中[Xi]是训练元组,[yi]是相关联的类标号,[yi∈{+1,-1},i=1,2,...,n]代表样本类别,[K(?)]为核函数。
2噪声过滤机制
2.1噪声数据的影响
由于受到噪声的干扰,影响支持向量机的性能。为获得高精度的分类结果,必须减少噪声干扰,提高训练样本正确率,消除噪声因素对分类结果的影响。在此基础上,提出了对预测好的样本去噪的方法,减少数据中存在的噪声样本数量,避免对重新生成的分类器有较大影响,提高分类准确率。
在所有算法中,新产生的已标识数据直接加入到已标识样本集合中,会加入正确的数据,同样也会给训练集带来噪声数据,随着循环次数不断增加,积累的噪声数据会影响更新后的分类器的性能[9]。在已标识样本少的情况下,分类器不是最优的,机器自动分类时,可能会错分未标记样本,把分类后的样本直接加入到训练集重新训练,会使分类器精度下降。引入噪声过滤机制,提高分类精度。
2.2基于信息熵权值的确定
2.4基于加权欧氏距离的去噪方法
每个类为一个簇,分类后结果簇内的相似度高,而簇间的相似度低。基本思想是:选择[k]个对象为初始点,每个初始对象代表一个簇的中心或平均值,对于剩余的对象,用加权欧氏距离计算每个对象到簇中心的距离,最小的属于该簇则分类正确,如果距离大于到其他簇中心的距离,则该对象不属于该簇即分类错误,是噪声数据。
传统的方法中,没有考虑对象中每个属性所体现的不同作用,而是将它们等同看待,用欧氏距离只能计算数据间相隔的远近,不能准确地表示簇间相似度,因为相似不仅依赖样本间的相近程度,而且还依赖于样本间的内在性质[10]。
3实验结果
实验所用数据从UCI标准数据集中选取,选用四个数据集来进行实验,为了避免不平衡数据对分类性能的影响,在每个数据集的类别中选取两类样本数据,样本数目平衡且比较多,对构造的支持向量机分类器训练和测试。所用实验详细数据集如表1所示:
分别选取每个数据集中大致选取80%的样本作为训练集,剩余20%数据作为测试集。用支持向量机构建分类器,做测试时,把每个数据集分为N等份。在80%的训练集中首先选取20%作为初始已标识样本用来训练分类器,剩余60%数据分为6等分。把类标号去掉,作为训练时的未标识样本。数据集Abalone有1323个数据,选取324个数据作为初始训练集,把其中800个数据分为4分作为训练分类器时所用数据,留取200个数据作为测试集。在数据集bank有1042个数据,选取242个作为已标识样本训练分类器,在训练过程中,每次对100个数据进行分类,对分类后的数据进行加权去噪后加入训练集,直到未标识样本分类完成。对20%的数据测试后加入人工反馈的方法,把分类错误的样本数据人为的加入正确的类别。表2给出了支持向量法算法在加权去噪前后的比较。
实验结果表明用加权去噪的半监督支持向量机训练方法提高了分类精度,优于只使用支持向量机算法,初始已标记样本少的情况下,在训练分类器过程中用去噪的半监督思想多次加入未标识样本来扩大训练集,优化分类器性能,提高分类精度。
4结论
该文提出一种信息熵加权去噪的方法,删除分类有误的数据,现实数据中,存在大量的未标识数据,而已标识数据较少的情况下,不利于对数据进行分类,该文用半监督思想,先用已标识样本训练分类器,然后用大量的未标识样本来提高分类器性能,由于分类后的样本中可能存在噪声数据,用基于加权欧氏距离算法对样本进行去噪,选取置信度较高的样本加入训练集重新训练。在四个UCI数据集上的实验结果表明,该文提出的方法效果明显,具有良好的预测精度。
参考文献:
[1]DavidRAnderson,DennisJSweeney.Statisticsforbusinessandeconomics[M].Beijing:ChinaMachinepress,2010:327-330.
[2]门昌骞,王文剑.一种基于多学习器标记的半监督SVM学习方法[J].广西师范大学学报,2008,26(1).
[3]ZhangXuewen,LiYangjun.Self-adjustedparticleswarmoptimizationalgorithmbasedeconomicloaddispatchofpowersystem[J].PowerSystemTechnology,2006,30(18):8-13.
[4]BissantzN,HagedornJ.Datamining[J].BusinessandInformationSystemsEngineering,2009(1):118-122.
[5]JingY,PavlovicV,RehgJ.BoostedBayesiannetworkclassifiers[J].MachineLearning,2008,73(1):155-184.
[6]陈黎飞,郭躬德.最近邻分类的多代表点学习算法[J].模式识别与人工智能,2011,24(6).
[7]JanssensD,WetsG,BrijsT,etal.Improvingtheperformanceofamulti-agentrule-basedmodelforactivitypatterndecisionsusingBayesiannetworks[J].JournaloftheTransportationResearchBoard,2004,1894(1):75-83.
[8]张扬,周子勇.基于关联规则的面向对象高分辨率影像分类[J].遥感技术与应用,2012,27(3).




