文章信息
- 张春森, 吕佩育, 郭丙轩
- ZHANG Chunsen, Lv Peiyu, GUO Bingxuan
- 基于控制点约束影像的密集匹配及其在考古发掘中的应用
- Based GCP-SGM Algorithm and Its Application in Scene 3D Reconstruction of Archaeological Excavation Site
- 武汉大学学报·信息科学版, 2015, 40(12): 1575-1581
- Geomatics and Information Science of Wuhan University, 2015, 40(12): 1575-1581
- http://dx.doi.org/10.13203/j.whugis20130510
-
文章历史
- 收稿日期: 2015-03-23
2. 武汉大学测绘遥感信息工程国家重点实验室, 湖北 武汉, 430079
2. State Key Laboratory of Information Engineering in Survey, Mapping and Remote Sensing, Wuhan University, Wuhan 430079, China
基于密集匹配的三维重建是在恢复影像序列方位元素的基础上,通过获取逐像素的视差值,根据已知的方位元素逐像素地恢复三维位置信息,生成密集三维点云,最终实现景物三维重建。该过程可根据影像的彩色信息生成彩色点云,能更加逼真地实现目标物数字地面模型(DEM)或数字表面模型(DSM)的获取以及模型的建立。因此,采用序列影像生成三维彩色点云数据不失为一种理想的三维重建方式。近年来,虽然三维激光扫描(LiDAR)技术迅速发展,得到了广泛的关注和研究[1, 2],但其系统价格昂贵,并且当场景范围较大时,一个完整的场景往往需要几十次乃至上百次的扫描,受扫描范围大小的限制。而点云噪声的存在,使点云拼接及与数字影像的配准误差大量累积,导致所建三维模型的精度大大降低,或者因误差过大不可能进行三维建模。
在考古发掘过程中,根据需要,遗址中一些重要的迹象需有计划地去除。传统方法使用绘图、照相、摄像和文字记录等手段纪录遗迹、遗址的几何信息和三维形态,无法保证其精确性,也不能为后来的研究、展示等提供必要的资料。如何保留遗迹在不同阶段的信息资料,又不影响发掘、研究工作的继续进行,一直是考古工作者探索的课题[3]。
针对考古调查与发掘的特点,本文以秦陵百戏俑坑现场考古发掘为例,利用数字近景摄影测量方法,对采用非常规方式获取的发掘现场序列影像进行基于控制点约束序列影像密集匹配,在此基础上计算其三维空间坐标,生成三维彩色点云数据,实现挖掘现场文物景观三维重建。实验结果表明:采用本文方法进行考古发掘现场三维重建,可达到与三维激光扫描方法相同的视觉效果;并且能够在进行文物形态三维重建的同时,获取挖掘现场文物分布的正射影像平面图、文物矢量等值线图等数据。这为准确提供挖掘现场文物分布位置、密度等情况,以及考古发掘、调查、遗址保护规划编制等研究提供科学依据。
1 研究思路与流程本文所用的考古挖掘现场序列影像数据采用非常规方式获取,所得影像与常规摄影测量序列影像相比,存在基高比,影像倾角较大,姿态不稳定。较大的地物高差变化会导致影像匹配的视差范围较大。若直接利用整幅影像的视差范围进行密集匹配,不但会造成大量的冗余计算,还会影响匹配结果的质量,容易产生更多错误匹配。因此,本文在对半全局匹配(semi-global matching,SGM)算法研究的基础上,提出了一种适合考古挖掘现场序列影像密集匹配的附加控制点约束的半全局立体匹配(ground control point based semi-global stereo matching,GCP-SGM)算法,根据在挖掘现场坑底布设的控制点,通过空中三角测量解算,得到精确的影像外方位元素。将稀疏匹配中的特征提取和匹配技术用于提取初始特征,并利用这些初始特征转化的同名特征点GCP生成视差空间影像中的视差控制点GCP。利用视差控制点作为先验知识,将一定的权值引入能量函数最小化的求解过程中,实现基于控制点约束的半全局密集匹配。通过计算影像的视差图,生成三维点云。在此过程中,为加快计算速度,将影像序列分块,在满足分块间重叠度的条件下,利用 GCP-SGM 方法对每一对分块影像进行处理,得到分块视差图。随后依据一定的合并原则对分块影像进行合并,根据完整视差图和原始影像的纹理信息,最终得到整个挖掘现场的三维彩色点云。
2 附加控制点约束的SGM方法Scharstein[4]对几种常见的密集匹配算法进行了分类和评价,将密集匹配算法分为局部算法和全局算法。
本文在Hirschmüller[5, 6, 7, 8]提出的半全局立体匹配的基础上进行研究和改进,试图给出一种适合考古挖掘现场序列影像立体密集匹配的方法。SGM方法基于逐像素匹配的互信息思想,用大量一维约束逼近一个全局的二维平滑约束,逐像素计算代价函数值,实施多方向动态规划,拟合和逼近二维路径的最小代价值,从而获得最优视差值的密集匹配方法。其基本步骤包括匹配代价计算、匹配代价聚合、视差估计及视差精化。
2.1 匹配代价计算代价函数是对应像素间匹配相似度的度量值。在密集匹配算法中,匹配代价值的计算覆盖每个像素在视差范围内的各个视差值,产生视差空间影像。实验证明,单一的代价函数并不能适用于所有的场景结构。考虑到考古挖掘现场场景的复杂性,采用绝对差分(absolute difference,AD)和互信息(mutual information,MI)结合的方法作为代价函数。这是因为,AD方法计算简单,速度快,是一种独立于场景的代价函数,但它不能抵抗辐射变化,对采样和噪声敏感,且只能考虑当前像素的颜色值,缺乏整体性;MI方法是一种基于概率的匹配代价函数,能够抵抗影像的辐射变化,对记录和光照变化不敏感,对重复纹理区域处理效果较好。
AD方法由一对待匹配像素的灰度值相减再取绝对值实现,而MI方法则根据两幅影像的联合灰度分布来计算匹配代价[9, 10]。在分别计算两个匹配代价CAD和CMI后,将它们规划到各自的范围内(本文CAD范围为0~256,CMI范围为0~1 024),然后线性加和:
式中,ω为权值,本文设为0.5。利用式(1),可以综合两种匹配代价函数的优点,使匹配结果不单一依赖于某一种代价函数。
由于MI方法的计算结果依赖于初始视差,为了提高MI方法的准确度,本文采用分层迭代方式计算匹配代价[11]。即在金字塔影像的每一层计算MI时,都利用上一层的结果视差图作为初始值,在金字塔影像的最顶层,即第一次迭代时,初始视差图采用AD方法计算。
2.2 附加控制点约束的多方向动态规划由于影像噪声以及其他因素的影响,匹配代价有时并不能完全反映两个像素的匹配程度,常会出现错误视差的匹配代价优于正确视差的匹配代价的情况,从而影响视差估计。因此,要得到准确的最优的视差值,就需要进行匹配代价聚合,提高匹配代价的准确性。SGM 算法通过多个方向的动态规划求解在图像二维关系中寻找最优路径的问题。但对于考古挖掘现场序列影像,实验中仍存在匹配结果中的“一对多”或者“多对一”的病态问题。
为此,本文给出附加控制点约束的多方向动态规划策略,其基本思想是通过控制点的视差,自适应地确定动态规划过程中不同区域的视差搜索范围,以此减少搜索代价及增加对应问题的求解约束。在搜索过程中,将控制点的视差约束引入全局能量函数的计算当中,消除路径代价中的累加噪声,提供匹配指导,获得正确的唯一解。即在SGM算法的代价聚合基础上附加控制点约束,把控制点当作一个附加约束,帮助引导视差选择。其中,控制点主要来源于空三过程由特征点或者特征线匹配获得的同名像对。将空三过程匹配的影像连接点换算到核线影像上,若所得匹配点的上下视差小于一个像素,则可以作为密集匹配的控制点。为了避免硬性地加入控制点约束带来的误匹配,采取加权的方式来衡量控制点的可靠性,用特征点在序列影像中出现的次数来定义控制点的权值。当在视差图的某个像素处出现控制点时,能量函数的第二项根据控制点的权值适当减小,即让该像素上的最终视差选择尽量趋近控制点所表达的视差值。
控制点作为一种额外的约束来强化求解的条件,降低了匹配过程中的二义性。控制点越可靠,该点上代价计算对于邻域信息的依赖程度越低。
2.3 视差估计及精化本文采用胜者为王(winner take all,WTA)方法来进行视差估计,逐像素地选择最小的聚合代价,并将匹配代价最小的视差作为该像素的最优视差:
式中,dp为当前视差;C′(p,d)代表像素p在视差d下的匹配代价。
由此得到的视差图有可能由于遮挡或者误匹配而存在错误的视差。为此,可通过视差精化去除改正这些错误视差,进而得到最终视差图。此处的视差精化又包括显著性检验、左右一致性检验及子像素估计等内容。
显著性检验就是检查每一个像素的所有视差中,最小代价与次小代价相比是否足够小;若否,则将该像素的视差设为无效[12, 13]。为消除由于遮挡和噪声造成的错误匹配,分别以左影像和右影像为基准计算两幅视差图,若视差正确,左右影像的视差应该正好对应。因此,可以通过左右一致性检验找出错误的视差,逐像素比较对应像素的视差,若视差相差超过一个像素则设为无效值[14]。需要指出的是,通过以上过程得到的视差值是整数,然而整数视差通常不足以表达精确的匹配关系,由此生成的点云变化可能不连续,会出现断层或分层现象。因此还需要进行子像素估计[15],将像素视差精确到子像素级。整个算法流程如图 1所示。
3 影像分块处理及点云数据生成对照常规摄影测量获取影像时的摄影高度,本文所获考古挖掘现场序列影像,存在坑底地物高差变化较大的问题;因此,本文获取的考古挖掘场景序列影像较之航高,其地物的高差变化较大,导致影像匹配的视差范围过大。若利用这个视差范围进行密集匹配,会造成大量的冗余计算,影响匹配质量。同时,由于视差范围过大,作为中间结果的视差空间影像(DSI)也会过大,可能导致计算过程中内存不足,计算缓慢,甚至死机等现象。
为了解决上述问题,本文采用影像分块的策略,将原始大核线影像分成若干对小核线影像,然后进行密集匹配。由于本文数据拍摄区域的高差变化规律比较明显,视差分布很有规律(坑底的视差较小,顶部视差大),影像分块所得的小块核线影像的视差范围一般都比大影像的视差范围小很多。因此,对于每一对小核线影像,利用小影像内的控制点重新估算视差范围,再根据这个视差范围进行密集匹配,以达到减少冗余计算、提高计算效率、改善计算结果的目的。
影像分块方法具体如下[16]:对于左影像,以第一行最小视差列的像素(0,dmin)作为第一小块影像的第一个像素,取1 000 像素×1 000 像素的小块影像(小块影像的大小可以根据实际情况调整,本文取1 000 像素×1 000 像素)。然后沿水平和竖直两个方向依次取小块影像,为了保证匹配结果的小块视差图之间不产生空隙,每个相邻小块影像之间要有一定的重叠范围(本文重叠范围固定为300像素)。对于右影像,通过左片小块影像范围内的控制点估计新的视差范围,利用该视差范围的最小视差找到对应右片小块影像的范围,取同样大小的影像作为对应的右片小块影像。这样就可以将一对大核线影像分成若干对小核线影像,且每对影像之间有一定的重叠区域。
在影像分块以后,分别对每一对分块核线影像进行密集匹配,得到对应的分块视差图。然后将这些视差图进行合并,即可得到大核线影像的视差图,其中视差图重叠部分的视差可以用几个视差值的平均值代替,也可以通过带权相加的方式得到。
在完成密集匹配得到核线影像的视差图后,逐对像素地进行前方交会,计算得到物方点三维坐标[17]。从左核线影像上取对应像素的颜色值,并赋给相应物点,即可得到单对影像的三维彩色点云。将所有单对影像的三维点云合并,生成整个测区的三维点云。
4 实验与分析基于控制点约束序列影像密集匹配大场景考古挖掘现场三维重建包括场景序列影像获取,非量测相机检校,基于控制点约束序列影像密集匹配场景三维重建及正射影像制作等内容。
本文以秦陵百戏俑坑3号过洞挖掘现场为例。该俑坑范围长约20.5 m,宽约3.2 m,深约4.5 m。事先在坑底均匀布设一定数量的控制点,在距坑底位置高度大约6 m的悬空缆绳上安装非量测数码相机,遥控拍照获取挖掘现场序列影像。拍摄共分三个航带摄取整个俑坑影像,摄影相片航向重叠度约90%,旁向重叠度约85%。整个测区共拍摄像片83张。挖掘现场如图 2所示,获取序列影像如图 3所示。
相机检校采用检校精度高、稳定性好的三维检校控制场进行,以基于稀疏矩阵的自检校光束法平差为相机检校模型。影像相关数据及相机检校结果如表 1、表 2所示。其中,k1~k3,p1~p3分别为相机镜头径向与切向畸变差系数。
焦距/mm | x0/mm | y0/mm | k1 | k2 | k3 | p1 | p2 |
25.6 | -0.004 114 539 | -0.173 427 54 | 3.188 3×10-5 | 1.487 74 ×10-8 | 8.339 79 ×10-12 | 2.610 44 ×10-6 | -4.368 48 ×10-6 |
利用挖掘坑底控制点信息对序列影像进行空三解算,计算影像间的空间位置关系,生成成对的核线影像及其他密集匹配所需信息。采用本文所给GCP-SGM方法进行影像密集匹配,最终生成三维彩色点云。图 4为局部匹配视差图及点云效果图,图 5为3号过洞坑底三维彩色点云效果图。
实验发现,在坑底密集匹配所得的点云密度足以表达陶俑的形态,但是对于坑壁这样垂直于基线方向的面,由于像素个数有限,生成的点云比较稀疏。图 5真实反映了考古开挖现场文物提出前的文物分布状况,其效果与三维激光扫描系统所得数据视觉效果相当。借助事先在坑底布设的控制点对三维重建结果精度进行分析,总体精度在3 cm范围之内。在进行文物形态三维重建的同时,利用密集匹配结果生成DSM,进而获取挖掘现场文物分布的正射影像平面图[18]。图 6为在获取的挖掘现场正射影像图上勾绘得到的文物提取前坑底的陶俑遗迹平面图。图 6在一定程度上能准确提供文物挖掘现场文物分布位置、密度等情况,为后续考古研究和文物遗迹的保护提供必要的基础信息资料。
5 结 语本文以秦陵百戏俑坑3号过洞挖掘现场为例,采用非常规摄影测量方式,利用考古挖掘现场序列影像,基于数字近景摄影测量方法,给出了一种适合考古挖掘现场序列影像密集匹配的、附加控制点约束的半全局立体匹配算法。该算法在空三提取的同名点特征的基础上,转化出视差影像空间中的视差控制点,以此作为一种可靠约束,提高密集匹配精度。同时,针对所处理影像,给出了影像分块处理策略。将原始大核线影像分成若干对小核线影像,提高了计算效率;另外,由于分块匹配可为每个影像块单独计算匹配的视差范围,既避免了整体计算使用同一个视差范围造成计算冗余,也在一定程度上减少了匹配的二义性。实验结果表明,本文给方法较好地解决了所给影像存在的基高比及影像倾角大,姿态不稳定,以及地物高差相对航高变化大等不利于影像匹配的问题。从生成的三维彩色点云所表达的挖掘现场三维重建效果看,该方法达到了三维激光扫描方法所得数据相同的视觉效果。在进行三维重建的同时,采用该方法还可获取挖掘现场文物分布的正射影像图,进而得到文物提取前坑底的陶俑遗迹平面图,为后续考古研究和文物遗迹的保护提供必要的基础信息资料。本文创造性地将数字近景摄影测量应用于大场景考古挖掘现场三维重建及正射影像制作中,极大地拓展了数字考古技术手段,同时也大大地拓宽了数字近景摄影测量的应用领域,具有一定的推广价值。
[1] | Liu Jiangtao.3D Laser Scanning Technology in the Application of Archaeological Exploration[D].Beijing:Capital Normal University,2007(刘江涛. 三维激光扫描技术在考古勘探中的应用[D]. 北京:首都师范大学,2007) |
[2] | Wei Wei,Qian Wei.Review on the Application of 3D Laser Scanning in Conservation and Archaeology[J]. Sciences of Conservation and Archaeology, 2013,25(1):96-107(魏薇, 潜伟. 三维激光扫描在文物考古中应用述评[J]. 考古技术与应用,2013,25(1):96-107) |
[3] | Feng Enxue.The Field of Archaeology[M]. Changchun:Jilin University Press,2008(冯恩学. 田野考古学[M]. 长春:吉林大学出版社,2008) |
[4] | Scharstein D, Szeliski R. A Taxonomy and Evaluation of Dense Two-frame Stereo Correspondence Algorithms[J]. International Journal of Computer Vision,2001,47(1):7-42 |
[5] | Hirschmüller H, Scharstein D. Evaluation of Stereo Matching Costs on Images with Radiometric Differences[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009,31(9) :1 528-1 599 |
[6] | Hirschmüller H. Stereo Vision in Structured Environments by Consistent Semi-global Matching[C]. IEEE Computer Conference on Computer Vision and Pattern Recognition (CVPR'06), New York, USA,2006 |
[7] | Gao Bo. Research on 3D Scene Reconstruction from Binocular Stereo Pairs─Semi-global Stereo Matching Algorithm Combined with Structure Constraint[D]. Shanghai :Shanghai Jiaotong University,2007(高波. 从双目立体图像中恢复三维信息的研究——加入结构约束的半全局匹配算法的研究与实现[D].上海:上海交通大学,2007) |
[8] | Hirschmüller H, Bucher T. Evaluation of Digital Surface Models by Semi-global Matching[J]. DGPF, 2010,19:571-580 |
[9] | Hirschmüller H. Accurate and Efficient Stereo Processing by Semi-global Matching and Mutual Information[C]. IEEE Conference on Computer Vision and Pattern Recognition (CVPR'05), San Diego, CA, USA,2005 |
[10] | Hirschmüller H. Stereo Processing by Semi-global Matching and Mutual Information[J]. IEEE Trans.Pattern Analysis and Machine Intelligence, 2008,30(2):328-341 |
[11] | Lv Peiyu.Research on Segment-based Dense Matching Algorithm and Its Realization in UAV Images[D]. Xi'an: Xi'an University of Science and Technology,2013(吕佩育. 基于影像分割的无人机影像密集匹配算法研究与应用[D]. 西安:西安科技大学,2013) |
[12] | Hu Xiaoyan, Mordohai P. A Quantitative Evaluation of Confidence Measures for Stereo Vision[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012,34(11): 2 121-2 133 |
[14] | Mei X, Sun X, Zhou M, et al. On Building an Accurate Stereo Matching System on Graphics Hardware[C]. IEEE International Conference on Computer Vision Workshops(ICCV 2011),Spain,2011 |
[15] | Yang Q,Wang L, Yang R,et al. Stereo Matching with Color-weighted Correlation, Hierarchical Belief Propagation and Occlusion Handling[J]. IEEE TPAMI, 2009,31(3):492-504 |
[16] | Pan Fei. Research on Control Point Constraints-Based Dense Matching Algorithm and Its Realization in UAV Images[D]. Wuhan :Wuhan University,2012(潘飞. 基于控制点约束的无人机影像密集匹配算法研究与应用[D]. 武汉:武汉大学,2012) |
[17] | Zhang Chunsen, Guo Bingxuan, Lv Peiyu. Application of Digital Close-range Photogrammetry During Archaeological Excavation of the Acrobatic Figurines Pit at the Qinshihuang Mausoleum Site[J]. Sciences of Conservation and Archaeology, 2014,26(2):90-95(张春森, 郭丙轩, 吕佩育. 数字近景摄影测量在秦始皇陵百戏坑考古中的应用研究[J]. 文物保护与考古科学, 2014,26(2):90-95) |
[18] | Haala N, Hastedt H, Wolf K, et al. Digital Photogrammetric Camera Evaluation-generation of Digital Elevation Models[J]. Photogrammetrie Fernerkundung Geoinformation, 2010,2:99-115 |
[19] | Gao Bo, Ma Lizhuang. Semi-global Stereo Matching Combined with Structure Constraint[J]. Computer Applications and Software, 2009,26(2):90-95(高波,马利庄. 加入结构约束的半全局立体匹配方法[J]. 计算机应用与软件,2009,26(2):90-95) |