3.2.2 テキスト:削除時オプションの指定

3-2-第2項テキスト:オプションの指定

狙い・効果

削除する文字の重なり割合テキストが矩形とどれくらい重なっていたら削除対象とするかを指定します。

処理の概要

テキストが矩形とどれくらい重なっていたら削除対象とするか数値を指定し、3.2.1 テキスト:矩形内の文字を削除と同様にして指定矩形内のテキストを削除します。

PDF Tool APIの主な機能

PtlParamSetMask.APIsetTextOverlapRatio(float overlapRatio): テキストが矩形とどれくらい重なっていたら削除対象とするかを設定

数値は0.0より大きく1.0以下の数値で指定します。指定しない場合は0.3が指定されたとみなされます。

プログラム例

package cookbook;

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.io.IOException;

import jp.co.antenna.ptl.*;

public class RemoveTextSetOverlapRatio {

    // そのクラスのusageを表示する関数
    private static void printUsage() {
            System.out.println("usage: java RemoveTextInMask in-pdf-file out-pdf-file" +
                               " page-num overlap-ratio");
    }

    /**
     * @param args the command line arguments
     */
    public static void main(String[] args) {
        if (args.length < 3) {
            printUsage();
            return;
        }

        // コマンドライン引数の取得
        float overlapRatio = Float.parseFloat(args[3]);
        if((overlapRatio <= 0) || (1 < overlapRatio)) {
            System.out.println("overlap-ratio は0から1の間の小数値を指定してください。");
            printUsage();
            return;
        }

        try (PtlParamInput inputFile = new PtlParamInput(args[0]);
             PtlParamOutput outputFile = new PtlParamOutput(args[1]);
             PtlPDFDocument doc = new PtlPDFDocument();
             BufferedReader br = new BufferedReader(new InputStreamReader(System.in))) {
            // PDFファイルをロード
            doc.load(inputFile);

            // コマンドライン引数の判定
            int pageToEdit = Integer.parseInt(args[2]);
            int numPages = doc.getPageCount();
            System.out.println("ページ数:" + numPages);
            if((numPages < 0)||(numPages < pageToEdit))
            {
                System.err.println("page-numは入力PDFの全ページ数よりも小さい正の値を" +
                                   "指定してください。");
                return;
            }

            try (PtlPages pages = doc.getPages()) {// ページコンテナの取得
                // ページコンテナが空かどうか
                if (pages.isEmpty()) {
                    System.out.println("ページコンテナが空\n");
                    return;
                }

                // ページの取得(パラメータindexは0が先頭のため1を引く)
                try (PtlPage page = pages.get(pageToEdit - 1);
                     PtlParamSetMask paramSetMask = new PtlParamSetMask();
                     // 矩形の形を指定
                     PtlRect rect = new PtlRect(setRectCoordinate(br))) {

                    // マスク設定
                    paramSetMask.appendRect(rect);
                    paramSetMask.setRemoveElement(PtlParamSetMask.REMOVE_TEXT);
                    paramSetMask.setTextOverlapRatio(overlapRatio);
                    paramSetMask.setOpacity(0.3f);
                    page.setMask(paramSetMask);
                }
            }

            // ファイルに保存します。
            doc.save(outputFile);
        }

	...【ExtractText.javaと同じ処理のため省略
	 ・エラーメッセージ処理と出力】...

    }

    /**
     * 矩形の各値を入力してその座標値をもつ矩形を返す関数。
     * 原点はPDFの左下端。
     * bottomよりtopが大きい、leftよりもrightが大きいなどの矛盾した数値は入力できない。
     * 特に外部からの呼び出しを想定しないためprivateとする。
     * 
     * @param br BufferedReader。数値の読み取りに使う。
     * @return 指定したleft, bottom, right, topの数値を持つPtlRect
     */
    private static PtlRect setRectCoordinate(BufferedReader br)
        throws IOException, PtlException, Exception, Error {

	...【SetMaskColor.javaと同じ処理のため省略】...

        }                   
        return outputRect;
    }
}

プログラムファイル名

RemoveTextSetOverlapRatio.java

入出力操作の例

C:\samples>java cookbook.RemoveTextSetOverlapRatio 
usage: java RemoveTextInMask in-pdf-file out-pdf-file page-num overlap-ratio

C:\samples>java cookbook.RemoveTextSetOverlapRatio removetextoverlap.pdf removetextoverlapout.pdf 1 0.5 
ページ数:1
配置矩形の各数値を入力してください。
top (mm) : 160
bottom (mm) : 55
left (mm) : 65
right (mm) : 200
-- 完了 --

指定した矩形の内部、および周辺で50%重なっているテキストを削除します。

3-2-2テキスト:オプションの指定(例)