养猪网首页 行情 - 财经 - 猪价 - 人才 - 招聘 - 求职 - 社区 - 协会 - 电子杂志 - 技术 - 猪病 - 商城 - 视频 - 访谈 - 人物 - 专题 - 图库 - 博览会 - 兽药GSP - 新闻

如何评估生长测定系统所获得的数据可信度

  • 点击:
  • 日期:2016-08-23 09:52
  • 来源:养猪信息网

随着对育种的重视,行业内对种猪生猪性能自动测定系统的运用也越来越多。但对测定数据真正进行分析前,还需要进行“数据的可信度”的验证。

本文提出了数据可信度进行验证的必要性,再详细提出数据链完整率、异常增多或减少的采食量和体重量、设备粘连引起的采食量和体重量的影响和测定期投料DPC校准值的完整和波动进行验证。

具体包括每批测定数据的可信性验证和单头猪的测定数据可信性验证。验证的目的是用来后续猪生长性能分析的数据是可信的,不至于对生产和育种造成数据上的误导。 

目前我国装有自动生长性能测定系统(以下简称“测定站”)的猪场较多,尤其是国家生猪核心育种场的覆盖率更高。

为了运行自动测定系统后得到符合质量要求的数据,关键是平时要按照规范的测定操作规程进行操作,和按照规程进行设备维护、数据维护进行操作,只有保证每一天中的每一个数据质量,才能有效地保证最终的数据质量,即希望得到的数据可信度。那如何来评估测定系统获得的整体数据可信性呢?

以本公司拥有的奥饲本FIRE测定系统为例,阐述目前所认可的方法。鉴于目前还没有成形的测定系统数据可信度评估方法,本文提出的方法仅作为抛砖引玉,希望能得到同仁的更多研究信息。

1 对每批整体测定数据进行可信性验证

1.1 为什么要对每批的所有测定数据进行可信性验证?

虽然是“自动化测定设备”,但在其工作过程中必然受到多种因素的影响(见图1):①设备的工作原理;②设备的机械结构;③电气和电子元件的性能和系统的限制;④运行软件对数据的冗余处理;⑤测定猪的采食和活动习性的差异;⑥人为的管理因素等等诸多影响,这些都会影响到每个测定数据的准确性和精确性。而每批测定时的设备状况都是与上次测定时是不同的,⑤和⑥两个因素也是变化了的。所以每批次测定后都要对其数据进行可信性验证。

有的误差或错误是明显能发现的,如开始入测时由于猪只没习惯进测定站采食,体重会突然增加将近2倍,这很可能是一头猪在采食时,后面一头猪也硬挤进测定站内所导致的。

有的是软件本身程序引起的,如,一般的软件中把猪在一次性采食超过1.5公斤的采食量作为出错数据而过滤掉了,但实际上有的猪的采食行为确实是这样的(或有的程序会把上面提到的突增体重值也会过滤掉)。

还有的是需要仔细分析才能发现测定数据的误差,如由于DPC值虚高(尤其是断料时和断料后)使测定站误判多“放”(只是在数据库中)了一些饲料。

可见,每一个测定数据受到各种各样的因素影响,每一个数据也是这些因素影响后的结果,所以,在对猪进行综合性能等性状分析前,先要对测定得到的数据进行数据可信性的验证,即对其系统整体运行的可信度先作评估。只有数据达到要求的可信度,由此分析得出的结论才是相关的,也是可信的。

1.2  数据可信度的定义和目的

目前的定义是:用统计数学的观点,按95%置信度时误差小于1%(有的指标)的数据比较可信。我们现在向这个指标努力。

验证的目的是:用来后续猪生长性能分析的数据是可信的,不至于对生产和育种造成数据上的误导。

1.3  进行数据可信度验证的内容

结合现场的测定实践,目前从数据链的完整、异常增多或减少的采食量和体重量、设备粘连引起的采食量和体重量的影响、测定期投料DPC校准值的完整和波动等几个方面进行数据的可信度分析。

1.3.1 数据链的完整率

比如一栏内所有的测定猪在定义的时间段内没有数据或部分内容的数据,这就是数据链的不完整。

计算公式如下:

数据链的完整率(%)= 1- 数据量缺损率            (公式1)

一般来讲,缺损数据的主要原因是系统故障引起的,或没有记录或没有被传输;部分内容的数据缺损,往往是设备的某个功能失效而引起的。解决的主要方法是在每次传输数据时按照“测定站的操作规程”检查传输后的数据质量,有问题后马上进行设备维护和数据维护。

至于是数据缺损率在多少的范围内,才不至于影响整批的测定数据质量,目前还没有得到一个相应的标准(范围)。还有待于继续进行观察和统计分析。

1.3.2  异常增多的采食量和(或)体重量

这又可分为DPC值的异常变化和按软件中的最大采食量设定引起的虚假增多的采食量和(或)体重量(本文只分析采食量,体重量可以用一样的方法进行分析)。

①缺料后设备继续运行引起的虚假增多的采食量:这部分采食量所造成的基本原因是由于测定站的料斗在断料的时间段内补充投料所产生的虚假采食量。

如一头猪在采食的时候,猪还没离开,但设备测试到料槽内的饲料低于设定值,设备就马上自动补料。

如果料斗的饲料中断供应,但设备还是在按已有的设置继续运行投料功能(实际并没有饲料被投放到料槽内),那么设备的记录上还是会“加上”刚才所“下”的饲料量,这就是虚假的采食量。

②缺料和粘连导致DPC值的变化而引起的异常采食量:当设备在粘连故障时,有时会计算出异常的投料校准值;如果产生了异常投料校准值,而且又在这个时间段内对测定猪的采食量进行补投,那么设备就会按此值计算了异常的采食量,这也是虚假的采食量。

③按软件中的最大采食量设定引起的虚假增多的采食量:一般的软件中把猪在一次性采食超过1.5公斤的采食量作为出错数据而直接过滤掉,但实际上是有这样的采食行为的猪。见表1。

由于最大采食量的限定,经软件统计出来的采食量就少于实际的采食量。一般认为这部分的采食总量占测定期总采食量少于1%,可以认为数据结果是可信的。否则,需要对这部分数据进行维护,甄别出真实的数据,并补回去。

进一步也会发现(在其他的数据中),情况1.3.2.1和1.3.2.3中的采食数据有不少是重叠的。

1.3.3  粘连引起的采食量误差率

设备的称量机构由于没有调整好而产生的机械摩擦,或由于一些饲料和垃圾的阻塞造成了摩擦甚至卡住,这就是粘连,它会引起采食量的误差。这是因为设备是精确设备,极轻微的摩擦力会被放大上百倍),目前一般认为,较大的负采食量(FIRE定义为-300克/次)才被认为是由粘连引起的出错数据,如果希望得到准确性更高的数据,按我们的实践认为还应该小于该值。这部分引起的粘连采食量误差率由公式2进行计算。

 粘连采食量误差率(%)=粘连所引起的采食量总和(Kg)/记录的总采食量(Kg) *100%(公式2)

1.4  测定期投料DPC校准值的完整和波动

见图2,对每一个站的所有DPC出现的次数和差值变化做出的图表:横坐标是所有DPC的记录次数,次数越多说明纠偏的次数也越多;纵坐标是所有的DPC值。红色表示DPC的校准值,蓝色箭线表示由粘连、断料等引起的DPC波动范围。

图2中的红色线条都在正常范围内,这表示DPC值波动正常。少量的蓝色箭线反应出在测试期间有出现中途缺料和/或粘连情况。至于确切的DPC值的差值变化幅度对数据的可信度产生多大程度的影响,也还有待于进行进一步的观察和分析。

2 对单头猪的测定数据的可信度验证

在对整个测定系统的数据可信度评估后,再具体到对单头测定猪的测定数据进行评估。对单头测定猪的采食数据的连续性、最大采食量和最少采食量等方面进行数据的质量评估。因为这是只对选留的少数猪只再作的数据复评,所以这时工作量已经不大了。

3  小结

从测定系统所获得的原始数据,需要对所有数据和每头猪的数据可信度进行验证。达到95%的置信度和1%(有的指标)的误差率,才能采用该批数据和每头猪的数据。否则,数据本身所造成的偏差或误差会大于育种需要的公猪选留率等,这样测定站的作用就适得其反了;或者只能采取增加选留率和增加选育成本的方法来弥补了。

这里只是提出一个控制数据质量的参考标准,具体的范围还有待于同仁的继续观察和分析。在达到范围定义的共识后,再编制相应的监测和检测程序,数据判别和分析的效率也就大大提高了。

可见,围绕测定数据的可信度验证,还需要做大量的分析,待研究透彻后,定下明确的范围,对种猪的选择等操作才能提供真正有正效应的依据。

作者:福建一春农业发展有限公司 楼平儿

    (编辑:盼盼)
    如何评估生长测定系统所获得的数据可信度-分享到手机扫一扫分享到手机
    顶一下
    (1)
     
    100%
    踩一下
    (0)
     
    0%
    新闻排行