PDFTool
6.0
|
テキスト抽出処理のパラメータを表現したクラスです。 More...
#include <PtlParamExtractText.h>
Public Member Functions | |
int | getHandle () const |
PtlParamExtractText () | |
コンストラクタ More... | |
PtlParamExtractText (const PtlParamExtractText &obj) | |
コピーコンストラクタ More... | |
‾PtlParamExtractText () | |
デストラクタ | |
PtlParamExtractText & | operator= (const PtlParamExtractText &obj) |
コピーオペレータ More... | |
void | appendRect (const PtlRect &rectMM) |
テキスト抽出する矩形を追加。 More... | |
void | setIgnoreActualText (bool ignoreActualText) |
ActualTextを無視するかを設定。 More... | |
void | setTextOverlapRatio (float overlapRatio) |
テキストが矩形とどれくらい重なっていたら抽出対象とするか。 More... | |
テキスト抽出処理のパラメータを表現したクラスです。
PdfTk::PtlParamExtractText::PtlParamExtractText | ( | ) |
コンストラクタ
PtlException |
PdfTk::PtlParamExtractText::PtlParamExtractText | ( | const PtlParamExtractText & | obj | ) |
void PdfTk::PtlParamExtractText::appendRect | ( | const PtlRect & | rectMM | ) |
テキスト抽出する矩形を追加。
テキストを抽出する矩形を設定しないとページ全体のテキストが取得されます。
rectMM | 抽出矩形。 表示矩形(ViewBox)上の座標値をmm単位で指定してください。 |
PtlException |
PtlParamExtractText& PdfTk::PtlParamExtractText::operator= | ( | const PtlParamExtractText & | obj | ) |
コピーオペレータ
obj | コピー元オブジェクト。 |
void PdfTk::PtlParamExtractText::setIgnoreActualText | ( | bool | ignoreActualText | ) |
ActualTextを無視するかを設定。
ActualTextを無視するかを設定します。 文字がU+9D0EとなっていてもActualTextの設定がありU+9DD7となっていたらU+9DD7でしかヒットしません。
setIgnoreActualTextでtrueを設定するとU+9D0Eでヒットします。
※ 設定しない場合はデフォルト値としてfalseが設定されます。
ignoreActualText | [in] ActualTextを無視する場合はtrueを指定します。 |
void PdfTk::PtlParamExtractText::setTextOverlapRatio | ( | float | overlapRatio | ) |
テキストが矩形とどれくらい重なっていたら抽出対象とするか。
テキストが矩形とどれくらい重なっていたら抽出対象とするかを割合でセットします。 設定しない場合は、0.3が設定されたとみなされます。
overlapRatio | [in] テキストが矩形とどれくらい重なっていたら抽出対象とするかをセットします。(0<overlapRatio<=1) |