Information Extraction

Information Extraction 開発サイトでは,様々な電子文書,電子データから特定の情報を抽出し,構造化された形で提示することを目的としたツールを試作・提供していきます。

Webページからの情報抽出

プログラムソースコードからの情報抽出

PDFファイルからの情報抽出

お知らせ

最近のサイト内の出来事については タイムライン をご覧ください。

  • 2008/11/13 AthanorEX 1.0.0 を公開しました。
  • 2008/09/26 Athanor 3.2.0 for CCFinderX を公開しました(詳細は,チケット#21, #22 , #23, #24, #25, #26, #27, #28 を参照してください)。
  • 2008/05/09 Athanor for CCFinderX のバージョン2.0.0以降において,「コードクローンに基づくファイル間類似度算出機能」の不具合が発見されました(詳細は,チケット#20 を参照してください)。athanor.php の修正版は,リポジトリからチェックアウトできます(チェックアウト方法:開発者向け情報を参照してください)。
  • 2008/05/07 Athanor for CCFinderX のバージョン2.2.0以降において,「類似コード断片検索ツール(athsearcher)」の不具合が発見されました(詳細は,チケット#19 を参照してください)。 athsearcher.php の修正版は,リポジトリからチェックアウトできます(チェックアウト方法:開発者向け情報を参照してください)。
  • 2008/04/18 Athanor 3.1.1 for CCFinderX を公開しました(詳細は,チケット#17 & #18 を参照してください)。
  • 2008/03/04 Athanor 3.1.0 for CCFinderX で提供している ath_script 用の設定ファイルに不具合がありました。
    詳細および対処方法については,チケット#17 を参照してください)
  • 2008/02/25 Athanor 3.1.0 for CCFinderX を公開しました(詳細は,チケット#16 を参照してください)。
  • 2007/12/28 Athanor 3.0.3 for CCFinderX を公開しました(詳細は,チケット#14 & #15 を参照してください)。
  • 2007/12/26 Athanor 3.0.2 for CCFinderX を公開しました(詳細は,チケット#12 & #13 を参照してください)。
  • 2007/12/07 Athanor 3.0.1 for CCFinderX を公開しました(詳細は,チケット#10 & #11 を参照してください)。
  • 2007/12/04 Athanor 3.0.0 for CCFinderX において,「コードクローンに基づくソフトウェア検診結果」の項目名表記に誤りがありました(詳細は,チケット#10 を参照してください)。関連ファイル(ath_report-j.xsl/ath_report-e.xsl)の修正版は,リポジトリからチェックアウトできます(チェックアウト方法:開発者向け情報を参照してください)。
  • 2007/12/03 Athanor 3.0.0 for CCFinderX を公開しました(詳細は,チケット#6 & #8 & #9 を参照してください)。
  • 2007/11/09 IE APIs 1.1.4 を公開しました(詳細は,チケット#7 を参照してください)。
  • 2007/11/08 Web情報集約の第3弾:国内外 観光情報集約トライアル powered by WebIA を公開しました。
  • 2007/10/11 Athanor for CCFinderX(10.1.X) 2.2.0 を公開しました(詳細は,チケット#5 を参照してください)。
  • 2007/10/03 Web情報集約の第2弾:都道府県 防災・災害情報集約トライアル powered by WebIA を公開しました。
  • 2007/07/09 Athanor for CCFinderX(10.1.X) 2.1.1 を公開しました(ディレクトリ境界表示不正対応)。
  • 2007/07/06 Athanor for CCFinderX(10.1.X) 2.1.0 に一部不具合がありました(詳細は,チケット#3 および #4 を参照してください)。
    修正版の実行スクリプトファイルは,リポジトリからチェックアウトできます(チェックアウト方法:開発者向け情報を参照してください)。
    修正版を含むダウンロードパッケージは後日公開します。
  • 2007/06/28 Athanor for CCFinderX(10.1.X) 2.1.0 を公開しました(コードクローン散布図を画像ファイルとして出力する機能を追加)。
  • 2007/05/11 Athanor for CCFinderX(10.1.X) 2.0.1 を公開しました。
  • 2007/03/29 国内大学Web情報集約トライアル powered by WebIA における大学名一覧を更新しました(2007年度開設大学に対応)。
  • 2007/03/02 CodeCloneSetSummary の後継ツールである Athanor for CCFinderX(10.1.X) 2.0.0 を公開しました。

過去のお知らせ

ライセンス

ソースコード形式、バイナリコード形式を問わず
Information Extraction に関連して公開しているソフトウェアのプログラムコード・関連資料の全部あるいは一部を入手する場合には、
  「Rinza公衆使用許諾契約書」
の内容を受諾する必要があります。

ダウンロード

Web情報抽出APIライブラリ IE APIs

類似コード片検索ツール AthanorEX

コードクローン情報編成ツール Athanor

コードクローン位置情報出力ツール CodeCloneSetSummary

  • 後継ツール「コードクローン情報編成ツール Athanor」をダウンロードしてください。

文書差分情報抽出ツール DEXdocs

財務諸表データ抽出ツール IE4FS

トライアル

Web情報集約アプリケーション簡単構築ツール WebIA

バグ報告/要望

Information Extraction に関連して公開しているソフトウェアに関するバグ報告や新機能の要望などはページ上部の「チケットの作成」にて登録してください。

チケット登録やコメントは誰でも行えますので、ご利用ください。 その際、画面上部のメニューバーから「ユーザ設定」を選択してユーザ名(ハンドル名)を登録しておくことをお勧めします。

メールアドレスはチケット内に表示されます。メールアドレスの登録はリスクを認識した上でお願いいたします。記入しない場合は他の方と区別が付くようにハンドル名を入力していただけると幸いです。このサイトにおいてハンドル名により個人が特定されることはありません。

問合せ

ご意見・ご質問は 「お問合せフォーム」をご利用ください。

添付ファイル