Element index for package Rinza_IE
[ g ]
[ r ]
[ s ]
[ u ]
[ _ ]
top
g
- getAbsoluteURL
- in file Util.php, method Rinza_IE_Util::getAbsoluteURL()
ページURLとページ内リンクURLからリンクの絶対URLを取得
- getContentHistories
- in file Spider.php, method Rinza_IE_Spider::getContentHistories()
取得コンテンツ履歴を得る
- getHTMLComments
- in file Scraper.php, method Rinza_IE_Scraper::getHTMLComments()
コンテンツ文字列からのHTMLのコメント部分のみの文字列の取得
- getListOfLinks
- in file Scraper.php, method Rinza_IE_Scraper::getListOfLinks()
コンテンツ文字列からのすべてのリンク情報の取得
- getListOfScriptSrc
- in file Scraper.php, method Rinza_IE_Scraper::getListOfScriptSrc()
コンテンツ文字列からの外部スクリプトファイルのリンク情報を取得
- getNormarizedString
- in file Scraper.php, method Rinza_IE_Scraper::getNormarizedString()
Scraperに渡されているコンテンツ文字列の正規化文字列の取得
- getPartialBlock
- in file Scraper.php, method Rinza_IE_Scraper::getPartialBlock()
コンテンツ文字列から2つの指定文字列で挟まれる部分を抽出した文字列および抽出終了位置の取得
- getRelatedLinks
- in file Scraper.php, method Rinza_IE_Scraper::getRelatedLinks()
getListOfLinks()で得られたリンク情報のうち,指定キーワードに関わるリンク情報の取得
- getRemoveHTMLComments
- in file Scraper.php, method Rinza_IE_Scraper::getRemoveHTMLComments()
コンテンツ文字列からのHTMLのコメント部分をすべて除いた文字列の取得
- getRemoveTags
- in file Scraper.php, method Rinza_IE_Scraper::getRemoveTags()
コンテンツ文字列からのタグ部分("<"と">"で挟まれる部分)をすべて除いた文字列の取得
- getSignificantContent
- in file Spider.php, method Rinza_IE_Spider::getSignificantContent()
現在のコンテンツ取得先URLを起点に有意なコンテンツを取得する
- getString
- in file Scraper.php, method Rinza_IE_Scraper::getString()
Scraperが現在処理対象としているコンテンツ文字列の取得
- getTagElement
- in file Scraper.php, method Rinza_IE_Scraper::getTagElement()
コンテンツ文字列からの指定タグ要素("<tag_name"と"</tag_name>"で挟まれる部分)文字列の取得
- getTargetURL
- in file Spider.php, method Rinza_IE_Spider::getTargetURL()
最も新しく取得したコンテンツのURLを得る
top
top
top
top
|
|