PDFTool
7.0
|
コンテント内のテキストを検索する為のパラメータを表現したクラスです。
すべてのテキスト検索のパラメータを表現したクラスのベースクラスです。
More...
#include <PtlParamSearchText.h>
Public Types | |
enum | TEXT_TYPE { TEXT_RAW = 1, TEXT_SORT = 2 } |
テキスト検索タイプ。 More... | |
Public Member Functions | |
int | getHandle () const |
PtlParamSearchText () | |
コンストラクタ More... | |
PtlParamSearchText (const PtlParamSearchText &obj) | |
コピーコンストラクタ More... | |
‾PtlParamSearchText () | |
デストラクタ | |
PtlParamSearchText & | operator= (const PtlParamSearchText &obj) |
コピーオペレータ More... | |
void | appendText (const PtlParamString &text) |
検索するテキストを追加。 More... | |
void | setCompareCase (bool compareCase) |
大文字と小文字を区別するかを設定。 More... | |
void | setIgnoreActualText (bool ignoreActualText) |
ActualTextを無視するかを設定。 More... | |
void | setTextType (TEXT_TYPE type) |
検索するテキストのタイプを設定。 More... | |
void | setOverlapAsLine (float overlap) |
文字と文字がどれだけ重なっていると同じ行とみなすかを設定。 More... | |
Protected Attributes | |
int | m_dataParamSearchText |
コンテント内のテキストを検索する為のパラメータを表現したクラスです。
すべてのテキスト検索のパラメータを表現したクラスのベースクラスです。
PdfTk::PtlParamSearchText::PtlParamSearchText | ( | ) |
コンストラクタ
PtlException |
PdfTk::PtlParamSearchText::PtlParamSearchText | ( | const PtlParamSearchText & | obj | ) |
void PdfTk::PtlParamSearchText::appendText | ( | const PtlParamString & | text | ) |
検索するテキストを追加。
半角と全角は区別されているので注意してください。
半角,全角に関わらず検索したい場合は、両方とも追加してください。
(例) MSとMS,*と*
似たような文字でもユニコードが違えば検索されないの注意してください。
(例) U+FF51(全角チルダ)とU+301C(波ダッシュ)
リガチャが存在していてもリガチャとして検索できませんので注意してください。
(例) リガチャであるU+FB01はU+FB01として検索できません。U+0066+U+0069の"fi"でしかヒットしません。
text | 検索するテキスト。 |
PtlException |
PtlParamSearchText& PdfTk::PtlParamSearchText::operator= | ( | const PtlParamSearchText & | obj | ) |
コピーオペレータ
obj | コピー元オブジェクト。 |
void PdfTk::PtlParamSearchText::setCompareCase | ( | bool | compareCase | ) |
大文字と小文字を区別するかを設定。
大文字と小文字を区別するかを設定します。
※ 設定しない場合はデフォルト値としてfalseが設定されます。
compareCase | [in] 大文字と小文字を区別する場合はtrueを指定します。 |
void PdfTk::PtlParamSearchText::setIgnoreActualText | ( | bool | ignoreActualText | ) |
ActualTextを無視するかを設定。
ActualTextを無視するかを設定します。
※ 設定しない場合はデフォルト値としてfalseが設定されます。
ActualTextの具体例
文字がU+9D0EとなっていてもActualTextの設定がありU+9DD7となっていたらU+9DD7でヒットします。
setIgnoreActualTextでtrueを設定するとU+9D0Eでヒットします。
※ 注意事項
PDFにはActualTextが2箇所で使われています。
1つはコンテントのマーク付きコンテントで設定されているActualText。こちらは文字の置き換え用途で使われます。ActualTextの具体例で示したもの。
もう1つはタグの要素に付けられているActualText。こちらは画像などにつけて読み上げの時に読み上げられる名前です。
この関数で言うActualTextは前者です。
ignoreActualText | [in] ActualTextを無視する場合はtrueを指定します。 |
void PdfTk::PtlParamSearchText::setOverlapAsLine | ( | float | overlap | ) |
文字と文字がどれだけ重なっていると同じ行とみなすかを設定。
横書きで文字と文字の座標が縦方向にどれだけ重なっていると同じ行とみなすかの割合を設定します。
※ 設定しない場合はデフォルト値として0.7が設定されます。7割が重なっていると同じ行とみなされます。
この設定はsetTextTypeでTEXT_SORTが設定された場合のみ有効です。
overlap | [in] 文字の重なり具合を割合でセットします。 |
void PdfTk::PtlParamSearchText::setTextType | ( | TEXT_TYPE | type | ) |
検索するテキストのタイプを設定。
検索したテキストのタイプを設定します。
※ 設定しない場合はデフォルト値としてTEXT_RAWが設定されます。
TEXT_SORTを設定した場合、リガチャは検索できません。
type | [in] 検索するテキストのタイプを指定します。 |