📍 バースマークの高速比較
🗣 研究概要
大量のプログラムからソフトウェアの盗用を発見するために,ソフトウェアバースマークが提案されている. バースマークは,プログラム中の特徴を抽出し比較を行い盗用を発見する技術である. 従来のバースマークで想定している対象のプログラム数は数百から数千程度であり,それを超えて比較する場合,現実的な時間では比較できない場合もある. そこで本稿では,対象となるプログラムの大幅なスケールアップかつ,盗用検出に要する処理時間の短縮を目的とする. そのために,対象プログラムの比較の前に,精度は高くないが高速に比較できる手法を用いて,無関係なプログラムを除外することを考える. これを絞り込み段階として,従来の抽出段階,比較段階の間に導入する.
提案手法に基づき,バースマーク絞り込みシステム\mituba を構築し,実験を行った. 評価項目は所要時間,絞り込み率,誤検出,検出漏れ,精度,そして,保存性の6項目である. 結果は,盗用か否かを判定するための閾値が$0.2$のとき,所要時間は従来の40%以下に抑えられ,80%以上のプログラムが無関係と判定された. 残ったプログラムのうち,誤検出は90%程度と非常に高いものの,検出漏れは0%であり,精度も70%以上となっている. また保存性評価においても,一番強力な難読化が施された場合であっても80%以上のプログラムを見つけ出せ,良好な結果を示している. これらの結果を元に最適な閾値を議論した結果,標準的には$0.6$程度の閾値が最適であるが, ユーザの問題設定によっては,閾値が$0.2$でも本手法は有効であることを示した.
(中村 潤, 玉田 春昭, “大量のソフトウェアを対象にしたソフトウェアバースマークによる盗用検出 〜全文検索システムを用いた検査対象の絞り込み手法〜”, 情報処理学会論文誌, Vol. 61, No. 2, Feburary, 2020. 概要)