CHANGELOG
LICENSE
README
指定したコンテンツ文字列の正規化および正規化した文字列から特定の情報を抽出する 手段を提供します。
使用例:
Rinza_IE_Scraper __construct( [string $pString = NULL], [string $pEncoding = 'UTF-8'], [ $pHtmlRange = TRUE])
オブジェクトの設定
string getHTMLComments( )
コンテンツ文字列が正規化されていない場合には,正規化を行う
array getListOfLinks( [string $pURL = NULL], [integer $pOpt = RINZA_IE_SCRAPER_LINK_INFO_A])
array getListOfScriptSrc( [string $pURL = NULL])
string getNormarizedString( )
正規化:コンテンツ文字列に含まれる次のコードを空白1文字に変換
array getPartialBlock( string $pStart, string $pEnd, integer $pOffset)
コンテンツ文字列が正規化されていない場合には,正規化を行う 指定文字列に対する抽出において,大文字・小文字の区別はしない
array getRelatedLinks( array $pLinks, array $pTargetKey, array $pExceptKey)
指定キーワードに対する検索において,大文字・小文字の区別はしない
string getRemoveHTMLComments( )
string getRemoveTags( [boolean $pInTag = FALSE])
string getString( )
string getTagElement( [string $pTag = NULL])
コンテンツ文字列が正規化されていない場合には,正規化を行う tag_nameの大文字・小文字の区別はしない
void setString( [string $pString = NULL])