-
近年来,有不少学者利用牛顿万有引力定律和运动定律的思想解决图像分类问题[1-3]。这些图像分类方法在实际工作中取得了一定的效果,但这类方法提出的数据颗粒、数据元素、数据质量、数据重心、数据引力等新概念,计算复杂。针对此情况,本文提出了一种建立在数据引力基础上的计算简便的图像分类方法。该方法的基本思想是:假定有3种不同类别的图像分别组成3类训练图像集,求得每类训练图像集的特征均值和一幅待检验图像的特征值,利用每类训练图像集的特征均值和一幅待检验图像特征值,分别求得待检验图像与每类训练图像集的引力,其中引力最大的类别即为待检验图像的类别。
-
假设有3组不同类别的图像,第一类图像有n1幅,第二类图像有n2幅,第三类图像有n3幅,从每一类图像中分别选出部分图像作为相应类别的训练图像集,假定第一类训练图像集有w1幅,第二、三类训练图像集分别有w2,w3幅。3个类别训练图像集的特征均值分别为m1,m2,m3,一幅待检验图像j的特征值为tmj。每个类别训练图像集与一幅待检验图像j之间的引力计算公式为:
$$ {f_{1j}} = \frac{{{w_1} \times {m_1}}}{{\left| {{m_1}-{t_{{m_j}}}} \right|}} $$ (1) $$ {f_{2j}} = \frac{{{w_2} \times {m_2}}}{{\left| {{m_2}-{t_{{m_j}}}} \right|}} $$ (2) $$ {f_{3j}} = \frac{{{w_3} \times {m_3}}}{{\left| {{m_3}-{t_{{m_j}}}} \right|}} $$ (3) 式中,f1j、f2j、f3j分别表示1、2、3类别训练图像集(即训练数据颗粒)与待检验图像j(即待检验数据颗粒j)之间的引力;w1×m1、w2×m2、w3×m3分别表示1、2、3类别训练数据颗粒的质量;|m1-tmj|、|m2-tmj|、|m3-tmj|分别表示训练数据粒1、2、3与待检验数据颗粒j之间的距离。
由式(1)~(3)求得待检验数据颗粒j与3个类别的训练数据颗粒之间引力最大者fcj的类别c,即为待检验数据颗粒j所属的类别:
$$ {f_{cj}} = \max \left( {{f_{1j}}, {f_{2j}}, {f_{3j}}} \right), c = 1, 2, 3 $$ (4) 接下来对本文使用的两个数据颗粒之间引力公式作进一步分析说明,文献[2]使用数据颗粒之间引力公式为:
$$ F = \frac{{{m_1}{m_2}}}{{{r^2}}} $$ (5) 式中,m1和m2是两个数据颗粒的质量;r是两个数据颗粒在欧氏空间中的距离。
式(1)~(3)与式(5)相比,形式上不完全相同,内容上也有差别。本文使用的数据颗粒质量是图像的特征(譬如图像的分形维),每一类别训练图像集的图像特征是采用训练图像集中几幅图像特征的均值,几幅图像特征的均值与其中一幅图像特征值的份量不一样。为了考虑这一情况,本文对训练图像集的特征均值采用加权特征均值,用训练图像集像幅数wi作为它的权,所以在式(1)~(3)中分子部分,3个训练图像集的质量分别为w1×m1、w2×m2、w3×m3。而待检验数据颗粒是原子数据颗粒,其质量为1,所以式(1)~(3)中只有训练数据颗粒的质量,没有待检验原子数据颗粒的质量。式(1)~(3)的分母部分反映两个数据颗粒特征之间差异的绝对值,差值越小,彼此引力越大,两个数据颗粒集越相似。本文公式分母与式(5)分母的差别是后者使用两颗粒“距离”的平方,前者使用“特征差异的”一次方,而不是平方。这是因为本文使用的图像特征值是小值,图像特征值之间的差值绝对值都为小于1的值,小于1的数值的平方值就更小,这样小的值放在引力计算公式的分母,会使求得的引力值很大。
下面用一个例子说明用本文方法进行图像分类的情况。假设有灌木、居民地、水田3类训练数据颗粒,对5个待检验数据颗粒(即5幅图像)进行分类,相应数据列在表 1中。
表 1 对5个待检验数据颗粒分类的举例
Table 1. Samples of Classification of Five Data Particles for Inspection
待检验颗粒数据编号 引力类别 灌木f1j 居民地f2j 水田f3j 1 981.38 120.79 146.66 2 763.55 112.79 128.37 3 451.22 572.68 250.42 4 287.22 1 236.14 121.62 5 916.73 248.85 4 304.86 表 1中待检验数据颗粒共有5个,第2列表示待检验颗粒与灌木颗粒的引力,第3、4列表示待检验颗粒与居民地、水田颗粒的引力。从表 1中第1、2行数据可见,1、2号待检验颗粒与灌木的引力最大,分别是f11=981.38和f12=763.55,可知1、2号待检验颗粒的类别都是灌木。表 1中第3、4行数据是3、4号待检验颗粒与灌木、居民地、水田的引力,其中居民地与3、4号待检验颗粒的引力最大,分别是f23=572.68,f24=1 236.14,由此可知3、4号待检验颗粒的类别都是居民地。表 1中最后一行是5号待检验颗粒与3个训练数据颗粒之间的引力。其中5号待检验数据颗粒与水田的引力最大,f35=4 304.86。5个待检验数据颗粒的类别按表 1中给出的相应的最大引力确定。
-
实验中使用5种不同类别的图像,分别是灌木(52幅)、居民地(23幅)、河流(35幅)、山地(20幅)、水田(13幅)。每类图像中选取1/3的图像作为各类图像的训练图像集(即训练数据颗粒)。计算每个训练数据颗粒的特征均值mi和标准差si,用这两个数据来选择每一类训练数据颗粒集的图像和用于图像分类的训练数据颗粒集的组合。
确定每一类训练数据颗粒集和用于数据颗粒分类的训练数据颗粒集组合的原则如下。
1) 以第i类训练数据颗粒集为例,该类别中任一训练数据颗粒的特征值为mk,应满足以下不等式:
$$ \left| {{m_i}-{m_k}} \right| \le 1.5{s_i} $$ (6) 式中,mi和si分别表示第i类训练数据颗粒集的特征均值和标准差;mk表示该类训练数据颗粒集中任一颗粒k的特征值。如果第k个颗粒满足式(6)条件,则继续下一个颗粒。如果不满足式(6)条件,在这一轮检查结束后,对不合要求的颗粒在同类别中选择其他颗粒替换,组成该类新的训练颗粒集,重新计算mi和si,再按式(6)检查第i类训练颗粒集中每个颗粒,直到满足要求为止。继续下一个类别的检查,如此确定每一类训练颗粒集。
2) 为了得到较好的分类效果,需选择由3个类别组成的合理组合。实验中得到这样的经验:在每个组合中3个类别训练颗粒集的特征均值之间的差异尽可能地大一些,差异太小容易产生错分类情况。
-
每一类别图像的总数和每一类别使用的训练数据颗粒数(即用作训练的图像数)分别列于表 2。
表 2 每类图像的总数和用作训练图像数/幅
Table 2. Number of Each Kind of Images and Number of Training Images
图像数 山地 居民地 水田 河流 灌木 总数 20 23 13 35 52 用作训练图像数 6 8 5 12 17 实验中3个组合的图像分类的情况如下。
1) 第一组合:山地、居民地、水田图像分类(见表 3)。表 3中第1行数据分别是山地、居民地、水田3类别训练颗粒的特征均值,第2行是每个类别正确分类数,第3行是未正确分类数。从表 3可知,山地被正确分类20幅,未正确分类0幅;居民地被正确分类22幅,未正确分类1幅;水田被正确分类11幅,未正确分类2幅。
表 3 山地、居民地、水田组合图像分类
Table 3. Image Classification of Mountainous Region, Residental Area, Paddy Field
分类结果 山地(20幅) 居民地(23幅) 水田(13幅) 训练颗粒特征均值 1.478 1 1.545 2 1.511 0 正确分类/幅 20 22 11 未正确分类/幅 0 1 2 2) 第二组合山地、河流、居民地图像分类情况(见表 4)。比较表 3、表 4的分类情况,山地与居民地在两个表中都有,但是分类的结果不完全相同,山地在表 3中全部正确分类,而在表 4中有一幅未正确分类,居民地也有类似情况。表 3、表 4中都有居民地,它们的训练颗粒特征均值不一样,表 3中为1.545 2,表 4中为1.550 1。两个组合的训练颗粒总数没有变,而训练颗粒的像片更换了,像这样的更换也会影响分类的结果。
表 4 山地、河流、居民地组合图像分类
Table 4. Image Classification of Mountainous Region, River, Residental Area
分类结果 山地(20幅) 河流(35幅) 居民地(23幅) 训练颗粒特征均值 1.478 1 1.501 7 1.550 1 正确分类 19 34 23 未正确分类 1 1 0 3) 第三组合灌木、居民地、水田图像分类情况(见表 5)。
表 5 灌木、居民地、水田组合图像分类
Table 5. Image Classification of Shrub, Residental Area, Paddy Field
分类结果 灌木(52幅) 居民地(23幅) 水田(13幅) 训练颗粒特征均值 1.464 0 1.545 2 1.511 0 正确分类 52 22 11 未正确分类 0 1 2 用本文提出的基于数据引力的图像分类方法分类的最后结果列在表 6中。本文分类结果与其他方法分类结果的对比见表 7。
表 6 用本文方法图像分类的结果
Table 6. Results of Image Classification by the Proposed Method
分类结果 灌木 居民地 水田 山地 河流 $ \frac{{正确分类数}}{{像幅总数}}$ $ \frac{{52}}{{52}} = 1$ $ \frac{{23}}{{23}} = 1$ $ \frac{{11}}{{13}} = 0.85$ $\frac{{20}}{{20}} = 1 $ $ \frac{{34}}{{35}} = 0.97$ 表 7 本文方法分类结果与其他方法的对比
Table 7. Comparison of Results Between Classification Method the Proposed and Other Methods
从表 7中4种方法图像分类结果对比的情况可以看出,基于数据引力的图像分类结果仅次于带有确定度模糊分类的方法。但要指出的是,数据引力的图像分类方法的特点是计算简单。然而如何得到每类图像的训练图像集及如何得到合理类别组合进行分类仍然是值得进一步深入研讨的问题。
-
摘要: 提出了一种建立在数据颗粒引力基础上的图像分类方法,此方法使用的数据颗粒质量是图像的特征(如图像的分形维)。对于每一类别训练数据颗粒集,图像特征采用训练数据颗粒集中几幅图像特征的均值mi,用训练数据颗粒集的像幅数wi作为它的权重,那么第i个训练数据颗粒集的质量为wi mi,而待检验数据颗粒是原子数据颗粒,其质量为1。假定待检验一幅图像数据颗粒j的特征为tmj,那么第i个训练数据颗粒集与待检验一幅图像的数据颗粒j之间的距离为|mi-tmj|。假定有3种不同类别的图像,从各类别中取出一部分图像组成3类训练数据颗粒集,求得每类数据颗粒集特征的均值和一幅待检验数据颗粒的特征值,按公式计算每类数据颗粒集对待检验数据颗粒的引力,3个引力中具有最大引力的类别即为待检验数据颗粒的类别。实验结果表明,基于数据引力的图像分类方法具有一定的优势。Abstract: We put forward a method for image classification based on data gravitation. The quality of the data particles we use is the feature of the images(such as the fractal dimension of the image). For each kind of training data particle set, we use the mean of several image characteristics mi in the set to be the image characteristic, and the number of images wi to be its weight. So the quality of the i-thtraining data particle set is wi mi, and the data particle for inspection is atomic data particle with the mass of 1. Assuming that the characteristic of the image data particle for inspection j is tmj, the distance between the i-th training data particle set and the data particles for inspection j of the image is |mi-tmj|. Assuming that there are three different catagories of images, we choose the part of images from all kinds in order to compose three kinds of training data particle set, then work out the characteristic mean of data particle set of each kind and characteristic value of a data particle for inspection, which can be used to calculate the gravitation between data particle set of each kind and characteristic value of data particle for inspection. The kind with largest gravitation is the one of data particle for inspection. It is proved by the experimental result that the method for image classification based on data gravitation has a certain advantage.
-
Key words:
- data gravitation /
- data particle /
- image classification
-
表 1 对5个待检验数据颗粒分类的举例
Table 1. Samples of Classification of Five Data Particles for Inspection
待检验颗粒数据编号 引力类别 灌木f1j 居民地f2j 水田f3j 1 981.38 120.79 146.66 2 763.55 112.79 128.37 3 451.22 572.68 250.42 4 287.22 1 236.14 121.62 5 916.73 248.85 4 304.86 表 2 每类图像的总数和用作训练图像数/幅
Table 2. Number of Each Kind of Images and Number of Training Images
图像数 山地 居民地 水田 河流 灌木 总数 20 23 13 35 52 用作训练图像数 6 8 5 12 17 表 3 山地、居民地、水田组合图像分类
Table 3. Image Classification of Mountainous Region, Residental Area, Paddy Field
分类结果 山地(20幅) 居民地(23幅) 水田(13幅) 训练颗粒特征均值 1.478 1 1.545 2 1.511 0 正确分类/幅 20 22 11 未正确分类/幅 0 1 2 表 4 山地、河流、居民地组合图像分类
Table 4. Image Classification of Mountainous Region, River, Residental Area
分类结果 山地(20幅) 河流(35幅) 居民地(23幅) 训练颗粒特征均值 1.478 1 1.501 7 1.550 1 正确分类 19 34 23 未正确分类 1 1 0 表 5 灌木、居民地、水田组合图像分类
Table 5. Image Classification of Shrub, Residental Area, Paddy Field
分类结果 灌木(52幅) 居民地(23幅) 水田(13幅) 训练颗粒特征均值 1.464 0 1.545 2 1.511 0 正确分类 52 22 11 未正确分类 0 1 2 表 6 用本文方法图像分类的结果
Table 6. Results of Image Classification by the Proposed Method
分类结果 灌木 居民地 水田 山地 河流 $ \frac{{正确分类数}}{{像幅总数}}$ $ \frac{{52}}{{52}} = 1$ $ \frac{{23}}{{23}} = 1$ $ \frac{{11}}{{13}} = 0.85$ $\frac{{20}}{{20}} = 1 $ $ \frac{{34}}{{35}} = 0.97$ -
[1] Rashedi E, Nezamabadi-Pour H, Saryazdi S. GSA:A Gravitational Search Algorithm[J]. Information Sciences, 2009(179):2232-2248 http://d.wanfangdata.com.cn/Periodical/zgdjgcxb201419005 [2] Peng Lizhi, Yang Bo, Chen Yuchui, et al. Data Gravitation Based Classification[J]. Information Sciences, 2009(179):809-819 http://d.wanfangdata.com.cn/Periodical/jsjgcysj201602021 [3] Bahrololoum A, Nezamabadi-Pour H, Bahrololoum H, et al. A Prototype Classifier Based on Gravitational Search Algorithm[J]. Applied Soft Computing, 2012(12):819-825 http://www.academia.edu/5483124/A_prototype_classifier_based_on_gravitational_search_algorithm [4] 郑肇葆, 郑宏.带有确定度的模糊图像分类[J].武汉大学学报·信息科学版, 2016, 41(4):482-486 http://ch.whu.edu.cn/CN/abstract/abstract5418.shtml Zheng Zhaobao, Zheng Hong. Fuzzy Image Classi-fication with a Certain Degree[J]. Geomatics and Information Science of Wuhan University, 2016, 41(4):482-486 http://ch.whu.edu.cn/CN/abstract/abstract5418.shtml [5] 郑肇葆, 潘励, 郑宏.应用图像关联度的图像模糊分类[J].武汉大学学报·信息科学版, 2015, 40(5):574-577 http://ch.whu.edu.cn/CN/abstract/abstract3247.shtml Zheng Zhaobao, Pan Li, Zheng Hong. Application of Image Correlation Degree to Image Fuzzy Classification[J]. Geomatics and Information Science of Wuhan University, 2015, 40(5):574-577 http://ch.whu.edu.cn/CN/abstract/abstract3247.shtml [6] 郑肇葆.产生最佳"Tuned"模板的蜜蜂交配算法[J].武汉大学学报·信息科学版, 2009, 34(4):387-390 http://ch.whu.edu.cn/CN/abstract/abstract1217.shtml Zheng Zhaobao. Honey-Bee Mating Optimization Algorithm for Producing Better "Tuned" Masks[J]. Geomatics and Information Science of Wuhan University, 2009, 34(4):387-390 http://ch.whu.edu.cn/CN/abstract/abstract1217.shtml [7] Peng L Z, Chen Y H, Yang B, et al. A Novel Classification Method Based on Data Gravitation[C]. International Conference on Natural Networks and Brain, Beijing, China, 2005 http://ieeexplore.ieee.org/xpls/icp.jsp?arnumber=1614719 -