|
Antenna House PDF Tool API (.NET) 8.0
|
#include <NetParamExtractText.h>


公開型 | |
| enum class | TEXT_TYPE { TEXT_RAW = 1 , TEXT_SORT = 2 } |
| enum class | UNI_FLAG { UNI_C0_CONTROLS = 0x00000001 , UNI_SPACE = 0x00000002 , UNI_NO_BREAK_SPACE = 0x00000004 , UNI_SOFT_HYPHEN = 0x00000008 , UNI_SPACES = 0x00000010 , UNI_IDEOGRAPHIC_SPACE = 0x00000020 , UNI_VARIATION_SELECTOR = 0x00000040 , UNI_REPLACEMENT_CHARACTER = 0x00000080 , UNI_ALL = 0x0FFFFFFF } |
公開メンバ関数 | |
| PdfTk::PtlParamExtractText * | getNative () |
| PtlParamExtractText () | |
| コンストラクタ | |
| PtlParamExtractText (PtlParamExtractText^ obj) | |
| コピーコンストラクタ alias copy | |
| ~PtlParamExtractText () | |
| デストラクタ | |
| !PtlParamExtractText () | |
| ファイナライザ。 | |
| PtlParamExtractText | operator= (PtlParamExtractText^ obj) |
| コピーオペレータ alias copy | |
| void | setTextType (TEXT_TYPE type) |
| 抽出するテキストのタイプを設定。 | |
| void | appendRect (PtlRect^ rectMM) |
| テキスト抽出する範囲の矩形を追加。 | |
| void | setIgnoreActualText (bool ignoreActualText) |
| ActualTextを無視するかを設定。 | |
| void | setTextOverlapRatio (float overlapRatio) |
| テキストがテキスト抽出する範囲の矩形とどれくらい重なっていたら抽出対象とするか。 | |
| void | setOverlapAsLine (float overlap) |
| 文字と文字がどれだけ重なっていると同じ行とみなすかの設定。 | |
| void | setSameTextOmitRatio (float overlap) |
| 同じ文字が重なっている場合、文字と文字がどれだけ重なっていると取り除くかの設定。 | |
| void | setDifferentTextOmitRatio (float overlap, bool applyAtDifferentColor) |
| 違う文字が重なっている場合、文字と文字がどれだけ重なっていると取り除くかの設定。 | |
| void | setUnicodeToSpace (UNI_FLAG flag) |
| 指定のUnicodeをSpaceに置き換えるか設定。 | |
| void | setUnicodeToSpace (wchar_t uni) |
| 指定のUnicodeをSpaceに置き換えるか設定。 | |
| void | setUnicodeToRemove (UNI_FLAG flag) |
| 指定のUnicodeを削除するか設定。 | |
| void | setUnicodeToRemove (wchar_t uni) |
| 指定のUnicodeを削除するか設定。 | |
| void | setInsertReturn (bool insert) |
| 改行を挿入するか設定。 | |
限定公開変数類 | |
| PdfTk::PtlParamExtractText * | m_native |
ページコンテントからのテキスト抽出処理のパラメータを表現したクラスです。
|
strong |
|
strong |
削除、若しくはスペース(U+0020)に変換するユニコード。
| PdfTkNet::PtlParamExtractText::PtlParamExtractText | ( | ) |
コンストラクタ
| PtlException |
| PdfTkNet::PtlParamExtractText::PtlParamExtractText | ( | PtlParamExtractText^ | obj | ) |
| PdfTkNet::PtlParamExtractText::~PtlParamExtractText | ( | ) |
デストラクタ
| PdfTkNet::PtlParamExtractText::!PtlParamExtractText | ( | ) |
ファイナライザ。
| void PdfTkNet::PtlParamExtractText::appendRect | ( | PtlRect^ | rectMM | ) |
テキスト抽出する範囲の矩形を追加。
| rectMM | 抽出矩形。 表示矩形(ViewBox)上の座標値をmm単位で指定してください。 ViewBoxの詳細については PtlPage#getViewBoxを参照してください。 |
| PtlException |
| PdfTk::PtlParamExtractText * PdfTkNet::PtlParamExtractText::getNative | ( | ) |
| PtlParamExtractText PdfTkNet::PtlParamExtractText::operator= | ( | PtlParamExtractText^ | obj | ) |
コピーオペレータ alias copy
| obj | コピー元オブジェクト。 |
| void PdfTkNet::PtlParamExtractText::setDifferentTextOmitRatio | ( | float | overlap, |
| bool | applyAtDifferentColor ) |
違う文字が重なっている場合、文字と文字がどれだけ重なっていると取り除くかの設定。
違う文字が重なっている場合、文字と文字がどれだけ重なっていると取り除くかの割合を設定します。
※ 設定しない場合はデフォルト値として0.0が設定されます。重なっていても取り除きません。
この設定はsetTextTypeでTEXT_SORTが設定された場合のみ有効です。
| overlap | [in] 文字の重なり具合を割合でセットします。 |
| applyAtDifferentColor | [in] 色が違う場合にのみ適用するか設定します。 |
| PtlException |
| void PdfTkNet::PtlParamExtractText::setIgnoreActualText | ( | bool | ignoreActualText | ) |
ActualTextを無視するかを設定。
ActualTextを無視するかを設定します。
※ 設定しない場合はデフォルト値としてfalseが設定されます。
ActualTextの具体例
文字がU+9D0EとなっていてもActualTextの設定がありU+9DD7となっていたらU+9DD7で抽出されます。
setIgnoreActualTextでtrueを設定するとU+9D0Eで抽出されます。
※ 注意事項
PDFではActualTextが2箇所で使われています。
1つはコンテントのマーク付きコンテントで設定されているActualText。こちらは文字の置き換え用途で使われます。ActualTextの具体例で示したもの。
もう1つはタグの要素に付けられているActualText。こちらは画像などにつけて読み上げの時に読み上げられる名前です。
この関数で言うActualTextは前者です。
| ignoreActualText | [in] ActualTextを無視する場合はtrueを指定します。 |
| PtlException |
| void PdfTkNet::PtlParamExtractText::setInsertReturn | ( | bool | insert | ) |
改行を挿入するか設定。
※ setTextTypeでTEXT_SORTを設定した場合のみ有効
| insert | 挿入するならtrue。 |
| void PdfTkNet::PtlParamExtractText::setOverlapAsLine | ( | float | overlap | ) |
文字と文字がどれだけ重なっていると同じ行とみなすかの設定。
文字と文字がどれだけ重なっていると同じ行とみなすかの割合を設定します。
※ 設定しない場合はデフォルト値として0.7が設定されます。7割が重なっていると同じ行とみなされます。
この設定はsetTextTypeでTEXT_SORTが設定された場合のみ有効です。
| overlap | [in] 文字の重なり具合を割合でセットします。 |
| PtlException |
| void PdfTkNet::PtlParamExtractText::setSameTextOmitRatio | ( | float | overlap | ) |
同じ文字が重なっている場合、文字と文字がどれだけ重なっていると取り除くかの設定。
同じ文字が重なっている場合、文字と文字がどれだけ重なっていると取り除くかの割合を設定します。
※ 設定しない場合はデフォルト値として0.0が設定されます。重なっていても取り除きません。
この設定はsetTextTypeでTEXT_SORTが設定された場合のみ有効です。
| overlap | [in] 文字の重なり具合を割合でセットします。 |
| PtlException |
| void PdfTkNet::PtlParamExtractText::setTextOverlapRatio | ( | float | overlapRatio | ) |
テキストがテキスト抽出する範囲の矩形とどれくらい重なっていたら抽出対象とするか。
テキストがテキスト抽出する範囲の矩形とどれくらい重なっていたら抽出対象とするかを割合でセットします。 設定しない場合は、0.3が設定されたとみなされます。
| overlapRatio | [in] テキストが矩形とどれくらい重なっていたら抽出対象とするかをセットします。(0<overlapRatio<=1) |
| void PdfTkNet::PtlParamExtractText::setTextType | ( | TEXT_TYPE | type | ) |
抽出するテキストのタイプを設定。
抽出するテキストのタイプを設定します。
※ 設定しない場合はデフォルト値としてTEXT_RAWが設定されます。
| type | [in] 検索するテキストのタイプを指定します。 |
| PtlException |
| void PdfTkNet::PtlParamExtractText::setUnicodeToRemove | ( | UNI_FLAG | flag | ) |
指定のUnicodeを削除するか設定。
指定されたUnicodeを削除するか設定します。
※ 設定しない場合は削除しません。
| flag | 削除フラグ。UNI_XXXで指定。 |
| void PdfTkNet::PtlParamExtractText::setUnicodeToRemove | ( | wchar_t | uni | ) |
指定のUnicodeを削除するか設定。
指定されたUnicodeを削除するか設定します。
※ 設定しない場合は削除しません。
| uni | Unicode。 |
| void PdfTkNet::PtlParamExtractText::setUnicodeToSpace | ( | UNI_FLAG | flag | ) |
指定のUnicodeをSpaceに置き換えるか設定。
指定されたUnicodeをSpace(U+0020)に置き換えるか設定します。
※ 設定しない場合はSpaceに置き換えません。
| flag | 置換フラグ。UNI_XXXで指定。 |
| void PdfTkNet::PtlParamExtractText::setUnicodeToSpace | ( | wchar_t | uni | ) |
指定のUnicodeをSpaceに置き換えるか設定。
指定されたUnicodeをSpace(U+0020)に置き換えるか設定します。
※ 設定しない場合はSpaceに置き換えません。
| uni | Unicode。 |
|
protected |